T
traeai
登录

模型

Mellum2

别名:Mellum 2

JetBrains开源的12B参数AI模型,采用MoE架构,专为软件工程环境设计,推理速度比同类模型快50%。

相关材料

已收录 2 条与 Mellum2 相关的内容,按评分排序。

Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains

Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains

Hugging Face Blog564 字 (约 3 分钟)
90

JetBrains 发布 12B MoE 架构模型 Mellum2,每 token 仅激活 2.5B 参数,推理速度超同类模型 2 倍以上,专为代码与文本任务优化,支持私有部署和 RAG 等高频低延迟场景。

入选理由:Mellum2 是 12B 参数 MoE 模型,每 token 仅激活 2.5B 参数,推理效率提升 2x+,适合高吞吐生产环境。

精选文章#MoE#JetBrains#大模型#代码生成#RAG英文
Mellum2 Goes Open Source: A Fast Model for AI Workflows

Mellum2 开源:适用于AI工作流的快速模型

The JetBrains Blog606 字 (约 3 分钟)
85

Mellum2是JetBrains开源的12B参数AI模型,采用MoE架构使每token仅激活2.5B参数,推理速度比同类模型快50%,专为软件工程环境设计,适用于路由、RAG管道和私有AI部署等场景。

入选理由:Mellum2采用MoE架构,12B参数模型每token仅激活2.5B参数,推理速度比同类模型快50%,显著降低生产环境延迟和成本

精选文章#AI#模型#Mellum2#MoE#软件工程中文

跨材料问答 · Mellum2

回答基于:Mellum2 相关 2 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容