DeepSeek V4 最近有什么新动态？

traeai 已收录 23 篇与 DeepSeek V4 相关的内容。最新一篇是「DeepSeek V4芯模协同背后，国产算力生态开始飞轮加速」，由量子位发布。

模型

DeepSeek V4

Q: 什么是 DeepSeek V4？

参数量级相近的竞品大模型

别名：DeepSeek

参数量级相近的竞品大模型

已跟踪 23 条高相关材料

TraeAI 观察

如果只读 3 篇

DeepSeek V4芯模协同背后，国产算力生态开始飞轮加速

量子位 · 9.2 分

DeepSeek V4标志着国产算力生态从“芯片适配模型”转向“芯模协同”，昇腾CANN开源后开发者可自主解决问题，70+主流大模型发布即适配，AIGCode实现65% MFU、中科大LU求解器达200倍加速，金融级系统已上线核心风控，鲲鹏/昇腾开发者超410万，飞轮效应正式形...

体验完腾讯发布的 Marvis 助手，我发现个人 AI 的尽头是操作系统

爱范儿 · 8.7 分

腾讯Marvis助手通过操作系统级AI代理架构，实现对PC与手机的深度控制与语义理解，首次让普通用户能用自然语言直接操作文件、系统设置与跨端应用，突破了传统AI助手仅限对话的局限。

美团发布 LongCat-2.0 了，1.6T 参数 MoE 架构，激活参数 48B，上下文窗口 1M（最大输出 128K），采用 5-6 万张中国国产加速卡训练，训练推理全程零英伟达依赖。三项关...

meng shao(@shao__meng) · 8.5 分

美团发布LongCat-2.0，采用1.6T参数MoE架构，支持1M上下文窗口，训练推理全程依赖国产加速卡。

DeepSeek V4芯模协同背后，国产算力生态开始飞轮加速

量子位5月28日3544 字 (约 15 分钟)

DeepSeek V4标志着国产算力生态从“芯片适配模型”转向“芯模协同”，昇腾CANN开源后开发者可自主解决问题，70+主流大模型发布即适配，AIGCode实现65% MFU、中科大LU求解器达200倍加速，金融级系统已上线核心风控，鲲鹏/昇腾开发者超410万，飞轮效应正式形成。

入选理由：CANN生态从2024年初‘幼儿期’发展至2026年‘青年期’，65个源码仓分层解耦，70+主流大模型发布即适配。

精选文章#昇腾#CANN#芯模协同#国产算力#大模型中文

体验完腾讯发布的 Marvis 助手，我发现个人 AI 的尽头是操作系统

爱范儿5月20日3439 字 (约 14 分钟)

入选理由：Marvis内置六个专用AI代理（PM、File、Computer等），开箱即用，无需用户配置工作流。

精选文章#AI助手#操作系统#腾讯#Marvis#端侧AI中文

美团发布 LongCat-2.0 了，1.6T 参数 MoE 架构，激活参数 48B，上下文窗口 1M（最大输出 128K），采用 5-6 万张中国国产加速卡训练，训练推理全程零英伟达依赖。三项关...

meng shao(@shao__meng)6月30日369 字 (约 2 分钟)

美团发布LongCat-2.0，采用1.6T参数MoE架构，支持1M上下文窗口，训练推理全程依赖国产加速卡。

入选理由：LongCat-2.0使用5-6万张中国国产加速卡训练，实现训推全链路国产化

精选推文#AI模型#MoE架构#国产芯片#大模型中英混合

Turn Research Papers into Insights with DeepSeek-V4 and SGLang

NVIDIA Developer6月26日556 字 (约 3 分钟)

DeepSeek-V4 与 SGLang 结合，能高效处理大量研究论文，提取关键信息并生成研究地图。

入选理由：DeepSeek-V4-Flash 支持 2B 上下文窗口，适合处理大规模研究论文。

精选视频#AI#研究论文#SGLang#DeepSeek-V4#NVIDIA英文

EP219: 12 Open-source LLMs

ByteByteGo Newsletter6月20日1046 字 (约 5 分钟)

2026 年值得关注的 12 个开源大语言模型，涵盖性能、成本、应用场景等关键信息。

入选理由：DeepSeek V4 以 MIT 许可证提供，支持百万级上下文窗口，性能接近前沿模型。

精选文章#LLM#开源#AI#模型英文

Frontier post-training recipe review with Finbarr Timbers

Interconnects AI6月17日12215 字 (约 49 分钟)

2026年前沿模型训练方案转向多专家蒸馏（MOPD），通过多个领域专家模型训练后合并为一个通用模型，显著提升效率与性能。

入选理由：MOPD（多专家蒸馏）是2026年前沿模型训练的核心方法。

精选文章#模型训练#MOPD#深度学习#前沿技术英文

Reasonix — DeepSeek 原生 AI 编程助手

Hacker News Best5月24日1267 字 (约 6 分钟)

Reasonix 是一个专为 DeepSeek API 设计的终端原生 AI 编程助手，通过字节稳定缓存机制实现高达 94% 的缓存命中率和 2.5 倍成本降低。

入选理由：Reasonix 使用 DeepSeek 的 prefix cache 机制，实现 94% 缓存命中率和 1/5 输入 token 成本

精选文章#AI Agent#终端#DeepSeek#缓存#LLM英文

Recent Developments in LLM Architectures: KV Sharing, mHC, and Compressed Attention

LLM架构近期发展：KV共享、mHC和压缩注意力

Ahead of AI5月18日5634 字 (约 23 分钟)

LLM架构近期发展聚焦于KV共享、mHC和压缩注意力，以提升长上下文效率。

入选理由：Gemma 4引入KV共享和每层嵌入，优化内存使用。

精选文章#LLM#架构优化#注意力机制英文

DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手

量子位5月25日1212 字 (约 5 分钟)

DeepSeek V4价格大幅下降，Reasonix工具通过缓存优化将成本降至2折，命中率达99.82%。

入选理由：Reasonix工具使DeepSeek V4成本从61美元降至12美元，降幅达80%

精选文章#DeepSeek#AI模型#缓存优化#开源工具#成本控制中文

163: 详解DeepSeekV4：Infra巨鲸、百万上下文走进现实、极致效率优化

晚点聊 LateTalk5月1日2079 字 (约 9 分钟)

DeepSeekV4发布，通过组合创新和工程优化，在R1的“测试时扩展”范式下，实现百万上下文从理论到实用的飞跃，对Agent和多步复杂任务具有重要意义。

入选理由：DeepSeek V4沿用现有范式，未带来范式变化，但通过一系列技术创新显著提升了长上下文处理能力。

精选播客#DeepSeek#大模型#注意力机制#优化器#稀疏注意力中文

DeepSeek V4的tid2eid是怎么来的？

科学空间5月15日3057 字 (约 13 分钟)

文章探讨了DeepSeek V4模型中tid2eid映射表的生成机制。

入选理由：DeepSeek V4采用hash routing替代first_k_dense策略

精选文章#深度学习#模型架构#MoE中文

Serving DeepSeek-V4: why million-token context is an inference systems problem

Together AI Blog5月10日3411 字 (约 14 分钟)

DeepSeek-V4面临百万token上下文推理问题，提出优化策略并展示性能提升。

入选理由：DeepSeek-V4处理百万token上下文的挑战

精选文章#DeepSeek-V4#推理系统#百万token中文

I Let AI Cold-Call 100 Plumbers (Genspark)

我让 AI 给 100 个水管工打冷电话（GenSpark 实验）

Siraj Raval5月23日2009 字 (约 9 分钟)

AI 可通过 GenSpark 平台调用多个专业代理（如研究、语音脚本、呼叫代理等）自动拨打 100 个英国水管工电话，以验证其作为 24/7 接待员的商业化潜力；实验中 AI 成功引导用户跳转至预约页面，但未披露最终转化数据。

入选理由：使用 GenSpark 构建多代理 AI 系统，整合研究、Stripe、语音脚本、呼叫、收件箱等 6 类代理。

精选视频#GenSpark#AI 代理#冷电话营销#语音 AI#GPT-5.5英文

I swear DeepSeek open-sourcing everything is some Sun-Tzu shit. America is trying to build trillio...

AI Breakfast(@AiBreakfast)5月2日413 字 (约 2 分钟)

DeepSeek 全面开源 V4 系列模型（含 1M 上下文、1.6T 参数 Pro 版），被解读为以‘孙子兵法’式战略瓦解美国 AI 垄断逻辑：当 AGI 核心技术公开，闭源护城河崩塌，估值与商业模型将重构。

入选理由：DeepSeek-V4-Pro 以 1.6T 总参数、49B 活跃参数实现媲美顶级闭源模型的性能，并完全开源。

精选推文#DeepSeek#开源#大模型#AI战略#AGI中文

SGLang is hitting 180 tok/s/GPU on DeepSeek-V4 decode with ~1M context on Blackwell. Good to see f...

NVIDIA AI(@NVIDIAAI)5月1日212 字 (约 1 分钟)

NVIDIA AI 报告称，SGLang 在 Blackwell 硬件上使用 DeepSeek-V4 模型解码达到 180 tok/s/GPU 的速度，约 1M 上下文，得益于 LMSYS 组织针对 Blackwell 的特定优化，提高了混合稀疏注意力的利用效率。

入选理由：SGLang 在 DeepSeek-V4 解码任务上实现高性能，达 180 tok/s/GPU。

精选推文#NVIDIA#DeepSeek-V4#SGLang#Blackwell#LMSYS中文

因为我善？DeepSeekV4 国产适配和100 亿美金融资背后的阳谋，黄仁勋最怕的噩梦成真了！

人民公园说AI5月1日460 字 (约 2 分钟)

DeepSeek V4的发布标志着国产AI模型与华为昇腾算力结合，挑战NVIDIA垄断，腾讯阿里未涉足的领域。梁文锋计划融资100亿美金，旨在未来五年AI战略卡位，探索算力、电力、地权等大模型关键支撑。

入选理由：DeepSeek V4适配华为昇腾，降低价格，深化国产算力与顶级模型合作。

精选播客#DeepSeek#华为昇腾#AI模型#融资策略#算力竞争中文

Hermes Agent NEW Super-App and DeepSeek v4 Catches Up To Opus 4.8?

Riley Brown6月12日5752 字 (约 24 分钟)

AI代理平台更新迅速，Codex新增站点插件，Hermes推出超级应用，DeepSeek v4与Opus竞争。

入选理由：Codex新增站点插件，可生成内部工具并部署到互联网。

精选视频#AI代理#Codex#Hermes#DeepSeek#Opus英文

在VS Code中集成多款AI模型开发

AI HOT 精选5月13日144 字 (约 1 分钟)

本文介绍了如何在VS Code中集成DeepSeek V4、GLM-5.1、Kimi K2.6等AI模型，通过Continuedev插件实现代码补全、AI聊天和编辑功能。

入选理由：通过Continuedev插件可以在VS Code中运行DeepSeek V4、GLM-5.1、Kimi K2.6等AI模型。

精选文章#VS Code#AI模型#开发工具#Continuedev英文

早报｜苹果App Store四成头部应用已支持AI/千问上线肯德基skill/奈雪擦边LABUBU被判赔32万

爱范儿6月5日5486 字 (约 22 分钟)

科技早报汇总显示AI Agent互操作与记忆架构取得实质进展，微信A2A助手落地、ChatGPT记忆准确率升至82.8%，但整体为新闻聚合缺乏深度技术解析。

入选理由：微信与手机厂商合作A2A助手，通过双重授权机制实现跨应用消息发送与通话指令。

精选文章#AI Agent#LLM Memory#A2A Protocol#AI Infrastructure中文

Deepseek V4 May Disrupt The Entire AI Economy

Matt Wolfe5月3日274 字 (约 2 分钟)

DeepSeek V4被宣传为接近SOTA、开源、极低成本（$1.74/百万token）且支持本地部署的AI模型，但原文无技术细节、实测数据或架构说明，属典型短视频营销话术。

入选理由：宣称DeepSeek V4成本仅为GPT-5.5和Claude Opus的约1/3

精选视频#AI#LLM#DeepSeek#open-source#AI-economy中文

GLM 5.2 vs DeepSeek V4: share of tokens on OpenRouter GLM 5.2 has had a very fast uptake relative t...

OpenRouter(@OpenRouterAI)6月24日78 字 (约 1 分钟)

文章内容信息量低，缺乏技术深度和具体分析，仅提及 GLM 5.2 和 DeepSeek V4 在 OpenRouter 上的 token 使用情况。

入选理由：文章未提供具体数据或技术细节，仅提及 GLM 5.2 和 DeepSeek V4 的 token 使用情况。

精选推文#GLM#DeepSeek#OpenRouter#AI模型英文

UNLIMITED FREE Deepseek-V4 PRO AI Coder: THIS IS CRAZY!

AICodeKing5月1日1745 字 (约 7 分钟)

视频宣传免费的Deepseek-V4 PRO AI编码器，讨论其功能与影响，但正文内容缺失，无法深入评估。

入选理由：Deepseek-V4 PRO被宣传为AI编码工具，号称完全免费。

精选视频#AI#编码器#Deepseek-V4#YouTube其他

“客户测950，不到一周下单了”，DeepSeek V4 逼出昇腾真功夫

AI前线4月30日49 字 (约 1 分钟)

文章标题提及DeepSeek V4在昇腾平台的性能表现促使客户快速下单，但正文内容无法正常访问，无法评估深度、新颖性、实用性与可信度。

入选理由：文章标题提及DeepSeek V4在昇腾平台的性能表现促使客户快速下单，但正文内容无法正常访问，无法评估深度、新颖性、实用性与可信度

精选文章#DeepSeek#昇腾中文

跨材料问答 · DeepSeek V4

回答基于：DeepSeek V4 相关 23 条材料