T
traeai
登录

模型

DeepSeek V3

DeepSeek的第三代模型,采用first_k_dense策略。

已跟踪 2 条高相关材料

TraeAI 观察

最近变化

2026-05-15 · DeepSeek V4采用hash routing替代first_k_dense策略

为什么值得关注

DeepSeek V3 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。

AIMoE中国开源机器学习

相关材料

已收录 2 条与 DeepSeek V3 相关的内容,按评分排序。

How open model ecosystems compound

开放模型生态系统的复合效应

Interconnects AI1141 字 (约 5 分钟)
85

中国开放的AI生态系统通过减少重复研发计算成本,提高了模型开发的效率和可持续性。

入选理由:中国AI生态系统的开放性减少了重复的研发计算成本,使实验室能够持续更长时间。

精选文章#AI#机器学习#开源#中国中文
DeepSeek V4的tid2eid是怎么来的?

DeepSeek V4的tid2eid是怎么来的?

科学空间3057 字 (约 13 分钟)
75

文章探讨了DeepSeek V4模型中tid2eid映射表的生成机制。

入选理由:DeepSeek V4采用hash routing替代first_k_dense策略

精选文章#深度学习#模型架构#MoE中文

跨材料问答 · DeepSeek V3

回答基于:DeepSeek V3 相关 2 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容