T
traeai
Sign in

模型

DeepSeek V3

DeepSeek的第三代模型,采用first_k_dense策略。

已跟踪 2 条高相关材料

TraeAI 观察

最近变化

2026-05-15 · DeepSeek V4采用hash routing替代first_k_dense策略

为什么值得关注

DeepSeek V3 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。

AIMoE中国开源机器学习

相关材料

已收录 2 条与 DeepSeek V3 相关的内容,按评分排序。

How open model ecosystems compound

How open model ecosystems compound

Interconnects AI1141 字 (约 5 分钟)
85

China's open AI ecosystem reduces redundant R&D compute costs, enhancing model development efficiency and sustainability.

入选理由:中国AI生态系统的开放性减少了重复的研发计算成本,使实验室能够持续更长时间。

FeaturedArticle#AI#Machine Learning#Open Source#China中文
DeepSeek V4的tid2eid是怎么来的?

How is the tid2eid in DeepSeek V4 Generated?

科学空间3057 字 (约 13 分钟)
75

The article explores the generation mechanism of the tid2eid mapping table in the DeepSeek V4 model.

入选理由:DeepSeek V4采用hash routing替代first_k_dense策略

FeaturedArticle#Deep Learning#Model Architecture#MoE中文

跨材料问答 · DeepSeek V3

回答基于:DeepSeek V3 相关 2 条材料
    0 / 500

    AI may generate inaccurate information. Please verify important content.