Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains
Hugging Face Blog564 字 (约 3 分钟)
90
JetBrains 发布 12B MoE 架构模型 Mellum2,每 token 仅激活 2.5B 参数,推理速度超同类模型 2 倍以上,专为代码与文本任务优化,支持私有部署和 RAG 等高频低延迟场景。
入选理由:Mellum2 是 12B 参数 MoE 模型,每 token 仅激活 2.5B 参数,推理效率提升 2x+,适合高吞吐生产环境。
精选文章#MoE#JetBrains#大模型#代码生成#RAG英文

