T
traeai
登录

模型

什么是 DeepSeek V3

DeepSeek的第三代模型,采用first_k_dense策略。

📰 DeepSeek V3 最新动态

已收录 2 篇与「DeepSeek V3」相关的 AI 资讯和分析。

How open model ecosystems compound

开放模型生态系统的复合效应

Interconnects AI1141 字 (约 5 分钟)
85

中国开放的AI生态系统通过减少重复研发计算成本,提高了模型开发的效率和可持续性。

入选理由:中国AI生态系统的开放性减少了重复的研发计算成本,使实验室能够持续更长时间。

精选文章#AI#机器学习#开源#中国中文
DeepSeek V4的tid2eid是怎么来的?

DeepSeek V4的tid2eid是怎么来的?

科学空间3057 字 (约 13 分钟)
75

文章探讨了DeepSeek V4模型中tid2eid映射表的生成机制。

入选理由:DeepSeek V4采用hash routing替代first_k_dense策略

精选文章#深度学习#模型架构#MoE中文

与「DeepSeek V3」经常一起出现的 AI 术语。

💡 想追踪「DeepSeek V3」的长期趋势?去 实体雷达 · DeepSeek V3 查看详细分析和跨材料问答。

AI 可能会生成不准确的信息,请核实重要内容