T
traeai
Sign in

公司

Allen AI

别名:Allen Institute for AI、AI2

美国人工智能研究机构,致力于通用人工智能与可解释模型研究。

已跟踪 1 条高相关材料

TraeAI 观察

最近变化

2026-05-08 · EMO 使用14B总参数、1B活跃参数,仅激活1/8专家即达近全模型性能。

为什么值得关注

Allen AI 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。

AI ResearchLLMMixture of ExpertsModularityPretraining

相关材料

已收录 1 条与 Allen AI 相关的内容,按评分排序。

EMO: Pretraining mixture of experts for emergent modularity

EMO: Pretraining Mixture of Experts for Emergent Modularity

Hugging Face Blog1748 字 (约 7 分钟)
90

EMO is a mixture-of-experts model that achieves modular structure emergence through end-to-end pretraining, retaining near-full-model performance with only 12.5% of experts activated.

入选理由:EMO 使用14B总参数、1B活跃参数,仅激活1/8专家即达近全模型性能。

FeaturedArticle#Mixture of Experts#Modularity#Large Language Model#AI Research#Pretraining中文

跨材料问答 · Allen AI

回答基于:Allen AI 相关 1 条材料
    0 / 500

    AI may generate inaccurate information. Please verify important content.