模型

Mellum2

traeai 已收录 2 篇与 Mellum2 相关的内容。最新一篇是「Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains」，由 Hugging Face Blog 发布。

别名：Mellum 2

JetBrains开源的12B参数AI模型，采用MoE架构，专为软件工程环境设计，推理速度比同类模型快50%。

已跟踪 2 条高相关材料

TraeAI 观察

Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains

Hugging Face Blog · 9 分

JetBrains 发布 12B MoE 架构模型 Mellum2，每 token 仅激活 2.5B 参数，推理速度超同类模型 2 倍以上，专为代码与文本任务优化，支持私有部署和 RAG 等高频低延迟场景。

Mellum2 Goes Open Source: A Fast Model for AI Workflows

The JetBrains Blog · 8.5 分

Mellum2是JetBrains开源的12B参数AI模型，采用MoE架构使每token仅激活2.5B参数，推理速度比同类模型快50%，专为软件工程环境设计，适用于路由、RAG管道和私有AI部署等场景，显著降低生产环境的延迟和成本。

Hugging Face Blog6月1日564 字 (约 3 分钟)

入选理由：Mellum2 是 12B 参数 MoE 模型，每 token 仅激活 2.5B 参数，推理效率提升 2x+，适合高吞吐生产环境。

精选文章#MoE#JetBrains#大模型#代码生成#RAG英文

The JetBrains Blog6月2日606 字 (约 3 分钟)

Mellum2是JetBrains开源的12B参数AI模型，采用MoE架构使每token仅激活2.5B参数，推理速度比同类模型快50%，专为软件工程环境设计，适用于路由、RAG管道和私有AI部署等场景。

入选理由：Mellum2采用MoE架构，12B参数模型每token仅激活2.5B参数，推理速度比同类模型快50%，显著降低生产环境延迟和成本

精选文章#AI#模型#Mellum2#MoE#软件工程中文

回答基于：Mellum2 相关 2 条材料