天下苦Token久矣,DeepSeekV4终于来了!
- DeepSeek V4-Pro 性能比肩顶级闭源模型,尤其在代码工程和系统操作能力上表现突出。
- V4-Flash 提供高效经济的 API 服务,适合简单任务场景,降低计算与显存需求。
- 引入全新注意力机制,结合稀疏注意力技术,实现领先的长上下文处理能力。
天下苦Token久矣,DeepSeekV4终于来了!“鸽王”DeepSeek V4 终于来了~! 虽然从物理时间上看,V - 掘金

- * 搜索历史 清空
* 创作者中心
- 写文章
- 发沸点
- 写笔记
- 写代码
- 草稿箱
创作灵感 查看更多
- 登录 注册 ## 首次登录 / 注册免费领取 登录 / 注册
天下苦Token久矣,DeepSeekV4终于来了!
2026-04-24 3,673 阅读6分钟
关注
“鸽王”DeepSeek V4 终于来了~!
虽然从物理时间上看,V3 到 V4 只用了一年多时间。 但是整个 AI 界已经天翻地覆了,从我们的心里感受来说,也是过了好久好久了。
好不好的先不说,能更新,就是个好事情了。
**最好是能把全球的 Token 价格打下来!**
下面就赶紧来看一下,有哪些亮点吧!
目前可以看到的资料是一篇官方的公众号文章。
标题为《[DeepSeek-V4 预览版:迈入百万上下文普惠时代](https://link.juejin.cn/?target=https%3A%2F%2Fmp.weixin.qq.com%2Fs%2F8bxXqS2R8Fx5-1TLDBiEDg "https://mp.weixin.qq.com/s/8bxXqS2R8Fx5-1TLDBiEDg")》
我们就以这篇文章为准,来看看这次更新到底有什么亮点。
第三方平台和很多媒体号肯定是要尬吹一波的,不要当真!
这篇文章的第一个总结下的描述是:
“**DeepSeek-V4 拥有百万字超长上下文,在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。** ”
然后来看正文!
两个尺寸
DeepSeek 这次的发布没有 R 系列,而是两个 V 系列的版本!
一个叫 V4-Pro,另一个叫 V4-Flash。
这种搭配非常常见,谷歌也是一直这么来的,国内 GLM 也有专门 Flash 版本。
我把这个表格扔给了“豆包和千问”,问它们这个参数在目前的国产模型中是什么级别。
**它们都告诉我是顶级。**
1.6T 的参数、49B 激活以及 1M 的上下文,在当前来看应该都是TOP级别的存在了!
Pro 性能拉满
然后他们重点介绍 Pro 这个模型,描述用词为“**性能比肩顶级闭源模型**”!
并给出了一张基准图:
这个图表风格还是很朴实的,数据表现也很不错。
这张图主要展现了**Agent 能力、世界知识、推理能力**这三个维度。
世界知识和推理能力主要作为日常使用模型的核心能力。
而对于我们这种比较关注编程和工程实践的人,最关注的是**智能体的能力**。
更加详细的基准数据如下:
我们把目光聚焦到 Agentic 这一栏目。
这次的对比选手有 K2.6、GLM5.1、Opus4.6、GPT5.4、Gemini3.1 Pro。这些模型的配置全都拉到了 xhigh 或者 Max,也就是最强的那一档。
DeepSeek V4 的基准数据还比较全面的,有些模型发布的时候基准很少。
我们可以快速了解一下几个基准含义。
**SWE 系列**主要体现**代码工程能力**,全称叫**Software Engineering Benchmarks**。
Terminal Bench 2.0 (Acc) —— 终端/系统操作能力
BrowseComp (Pass@1) —— 网页浏览与信息检索
Toolathlon (Pass@1) & MCPAtlas —— 工具调用能力
HLE w/tools & GDPval-AA —— 逻辑与综合评分
从图中可以看到几个亮点:
代码能力很强(SWE Verified 80.6%),这是目前行业内最难啃的骨头,比 K2.6 和 GLM5.1 高。
系统操作能力极强(Terminal Bench 67.9%),比国外的 Opus4.6 和国内的 K2.6 和 GLM5.1 高。
其他参数也非常亮眼,看起来是一个全能型的智能体模型。
当然,我也一直强调,基准测试是开卷考,有多少水分全看节操。
Flash 高效省钱
对于大模型厂商来说,Pro 一般是来秀肌肉的,而对用用户来说,真正拿来用的很可能是 Flash。因为很多时候,快和省很重要。
Flash模型的官方介绍:
Flash 在世界知识储备方面稍逊一筹,但展现出了接近的推理能力。而由于模型参数和激活更小,相较之下 V4-Flash 能够提供更加快捷、经济的 API 服务。
另外还说到了在 Agent 场景中,简单任务上与 Pro 旗鼓相当,但是高难度任务上仍有差距。
结构创新和1M
说了模型的尺寸和特点之后,就说到了 V4 **开创了一种全新的注意力机制**。
这种机制在 token 维度进行压缩,结合 DSA 稀疏注意力,实现了**全球领先**的长上下文能力,并且相比于传统方法大幅**降低了对计算和显存的需求**。
如果真的能做到既降低技术和显存,有能提示能力,这真的是大好消息。
智能体专项优化
当前的大模型更新,没有一个不谈 Agent 的,V4 也不例外。
上面已经说了好几次了,官方文章中还是专门拿出一个大标题来讲这个事情。
主要是表达了 DeepSeek-V4 针对 Claude Code、OpenClaw、OpenCode、CodeBuddy 等主流的 Agent 产品进行了适配和优化,在代码任务、文档生成任务等方面表现均有提升。
然后举了一个 PPT 的例子:
我对 PPT 无感,大家可以看一下效果!
价格问题
这是一个非常关键的问题,尤其是对DeepSeek而言。
它刚开始大火,让大家爱不释手,其中一个重要原因就是成本低。训练成本使用成本也低。
下面来看下V4的价格:
注意小字部分,**昪腾950批量上市之后,Pro价格会大幅下调**。压力来到了华为这边,不要拖后腿哦!
未来的事情我们未来再说,先来看看当下这个价格有没有竞争力。
我让AI帮我做了一个表格:
| 模型 | 缓存命中 | 缓存未命中 | 输出 | 上下文长度 | | --- | --- | --- | --- | --- | | DeepSeek V4-Pro | 1 元 | 12 元 | 24 元 | 1M | | DeepSeek V4-Flash | 0.2 元 | 1 元 | 2 元 | 1M | | GLM-5.1 | 1.3 元 | 6 元 | 24 元 | 200K | | Kimi K2.6 | 1.15 元 | 6.8 元 | 28.8 元 | 256K |
从这个价目表来看:
Flash 价格还是非常有竞争力的,毕竟是 1M 上下文。
Pro 的话“输入”是比较贵的,“输出”基本上和其他家的顶级模型差不多!
开源问题
DeepSeek 另一大杀手锏就是开源,最初就是因为它的开源,导致了整个国外大模型厂商的恐慌,以及国内生态的繁荣。
这一次也不例外,依旧大方开源,目前**已经同步开源**!
既然开源了,那么稍微有点实力的,都可以部署起来了。
供给就变多了,那么是不是Token要便宜一些了呢?
接下来可以期待下,看看能不能给我们这些小显存用户,蒸馏几个小模型来玩玩了。
目前信息并不多,大概就是这些了!
有了这个基础概念和数据,我们接下来就可以搞起来了。
钱已经充好了,开发工具也配置好了,准备开搞!
从基准数据来看,妥妥多国内第一梯队啊!
希望一切都是真的,是真的很猛!
#### 参考链接
官网:[www.deepseek.com/](https://link.juejin.cn/?target=https%3A%2F%2Fwww.deepseek.com%2F "https://www.deepseek.com/")
开发者平台:[platform.deepseek.com/](https://link.juejin.cn/?target=https%3A%2F%2Fplatform.deepseek.com%2F "https://platform.deepseek.com/")
标签:
评论 7
0/ 1000
标点符号、链接等不计算在有效字数内
⌘ + Enter
发送
登录 / 注册 即可发布评论!
最热
最新

前端开发
嗯
21小时前
点赞
评论
- 屏蔽作者:不会飞的鱼吖
- 举报

前端
跑分什么的都不重要, 用起来都是辣鸡
22小时前
1
评论
- 屏蔽作者:野蛮的橘子同学
- 举报

严肃学习
2天前
点赞
评论
- 屏蔽作者:寻麓22
- 举报
查看全部 7 条评论
!Image 23 18
!Image 24 7
!Image 25 收藏
加个关注,精彩更新不错过~
关注

加个关注,精彩更新不错过~
关注
已关注
目录
收起
- [两个尺寸](http://juejin.cn/post/7631956346273087524#heading-0 "两个尺寸")
- [Pro 性能拉满](http://juejin.cn/post/7631956346273087524#heading-1 "Pro 性能拉满")
- [Flash 高效省钱](http://juejin.cn/post/7631956346273087524#heading-2 "Flash 高效省钱")
- [结构创新和1M](http://juejin.cn/post/7631956346273087524#heading-3 "结构创新和1M")
- [智能体专项优化](http://juejin.cn/post/7631956346273087524#heading-4 "智能体专项优化")
- [价格问题](http://juejin.cn/post/7631956346273087524#heading-5 "价格问题")
- [开源问题](http://juejin.cn/post/7631956346273087524#heading-6 "开源问题")
- [参考链接](http://juejin.cn/post/7631956346273087524#heading-7 "参考链接")
相关推荐
[最新:DeepSeek V4 国产大模型之光,万亿参数重构 AI 格局,让国产大模型迈入普惠新纪元 1.3k阅读 · 8点赞](http://juejin.cn/post/7632156929691893795 "最新:DeepSeek V4 国产大模型之光,万亿参数重构 AI 格局,让国产大模型迈入普惠新纪元")[Claude 塌房实锤:Pro 用户可能连 Claude Code 都不配用了 1.5k阅读 · 16点赞](http://juejin.cn/post/7631400784476831794 "Claude 塌房实锤:Pro 用户可能连 Claude Code 都不配用了")[DeepSeek-V4-Pro 写代码到底行不行?我拿 GLM-5.1 跟它硬碰硬比了一轮 5.1k阅读 · 32点赞](http://juejin.cn/post/7632230684447211554 "DeepSeek-V4-Pro 写代码到底行不行?我拿 GLM-5.1 跟它硬碰硬比了一轮")[国产CodingPlan“玩不起”,玩GPT5.5去了! 2.4k阅读 · 17点赞](http://juejin.cn/post/7631832575604129811 "国产CodingPlan“玩不起”,玩GPT5.5去了!")[智谱CodingPlan老套餐绝版了,全网token收拢! 2.1k阅读 · 17点赞](http://juejin.cn/post/7631506248647917609 "智谱CodingPlan老套餐绝版了,全网token收拢!")
精选内容
[我决定写一个 3D 地球仪来记录下我要去的地方 Mh · 178阅读 · 1点赞](http://juejin.cn/post/7632660804625776655 "我决定写一个 3D 地球仪来记录下我要去的地方")[在职前端 Agent 配置分享 菠萝的蜜 · 234阅读 · 3点赞](http://juejin.cn/post/7632567246008270902 "在职前端 Agent 配置分享")[【节点】[Clamp节点]原理解析与实际应用 SmalBox · 24阅读 · 0点赞](http://juejin.cn/post/7632541245160194054 "【节点】[Clamp节点]原理解析与实际应用")[Polyline 组件如何绘制渐变区域? 光影少年 · 62阅读 · 1点赞](http://juejin.cn/post/7632264201231876130 "Polyline 组件如何绘制渐变区域?")[构建无障碍组件之Spinbutton Pattern anOnion · 45阅读 · 1点赞](http://juejin.cn/post/7632251182963834932 "构建无障碍组件之Spinbutton Pattern")
找对属于你的技术圈子
回复「进群」加入官方微信群

为你推荐
* [DeepSeek V4 终于来了,但我感觉 Flash 才是杀手锏](http://juejin.cn/post/7632902755376496640 "DeepSeek V4 终于来了,但我感觉 Flash 才是杀手锏") DeepSeek V4 正式发布,包含 Pro 与 Flash 两个版本。本文深度解析为何极致性价比的 Flash 版本才是本次发布的“杀手锏”,并探讨日常场景中 Flash 模型的巨大价值。
- 飞哥数智谈
- 19小时前
- 185
- 点赞
- 评论
[DeepSeek](http://juejin.cn/tag/DeepSeek "DeepSeek")[人工智能](http://juejin.cn/tag/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD "人工智能")
* [DeepSeek V4来了:百万字记忆,十分之一的价格,和一群等了太久的人](http://juejin.cn/post/7632207921897193526 "DeepSeek V4来了:百万字记忆,十分之一的价格,和一群等了太久的人") 4月24号中午,DeepSeek官方微信公众号推送了一篇文章,标题是《DeepSeek-V4预览版:迈入百万上下文普惠时代》
- 倔强的石头_
- 3天前
- 558
- 2
- 2
[DeepSeek](http://juejin.cn/tag/DeepSeek "DeepSeek")
* [DeepSeek V4 震撼发布!实现全球开源领先](http://juejin.cn/post/7631856130399420426 "DeepSeek V4 震撼发布!实现全球开源领先") 让全球从春节苦等到四月的 DeepSeek V4,终于来了! 就在刚刚,DeepSeek V4 真的来了!
- 新智元
- 3天前
- 135
- 点赞
- 评论
[OpenAI](http://juejin.cn/tag/OpenAI "OpenAI")[AIGC](http://juejin.cn/tag/AIGC "AIGC")
* [10分钟教你本地部署DeepSeek R1,轻松解决“服务器繁忙,请稍后再试”问题](http://juejin.cn/post/7469989253793202176 "10分钟教你本地部署DeepSeek R1,轻松解决“服务器繁忙,请稍后再试”问题") DeepSeek R1本地部署 DeepSeek大火,但天下苦服务器繁忙,请稍后再试久矣. 近期,DeepSeek大模型大火,一举超越ChatGPT登顶下载榜首. DeepSeek从很少人知道一下子变
- Thepatterraining
- 1年前
- 209
- 点赞
- 评论
[后端](http://juejin.cn/tag/%E5%90%8E%E7%AB%AF "后端")[DeepSeek](http://juejin.cn/tag/DeepSeek "DeepSeek")[AIGC](http://juejin.cn/tag/AIGC "AIGC")
* [OpenClaw意外走红,智谱、MiniMax、Kimi终于“得救”了](http://juejin.cn/post/7615031075312648226 "OpenClaw意外走红,智谱、MiniMax、Kimi终于“得救”了") 刚过去的半个月,国内互联网圈的画风有些诡异。 腾讯、阿里、百度、字节跳动等巨头掀起的“AI红包大战”余波未平,媒体和大众在津津乐道地复盘“战果”,答案似乎并不乐观:日活在除夕过后迅速回落,坊间甚至出现
- Alter聊科技
- 1月前
- 152
- 点赞
- 评论
[算法](http://juejin.cn/tag/%E7%AE%97%E6%B3%95 "算法")
* [DeepSeek V4突袭发布,黄仁勋最担心的事还是发生了|国产AI终于硬气了](http://juejin.cn/post/7633242533977030691 "DeepSeek V4突袭发布,黄仁勋最担心的事还是发生了|国产AI终于硬气了") 当我们都习惯了遇事不决问豆包,沉寂了足足15个月的DeepSeek,突然扔出一颗“王炸”——V4预览版横空出世,瞬间引爆全网! 朋友圈、科技圈、职场圈全在刷,有人狂喜“等疯了终于等到”,有人惊呼“黄仁
- Sun智记
- 12小时前
- 4
- 点赞
- 评论
[面试](http://juejin.cn/tag/%E9%9D%A2%E8%AF%95 "面试")
* [编程媲美闭源顶级模型!DeepSeek V4来了,价格便宜75倍!](http://juejin.cn/post/7632156929691598883 "编程媲美闭源顶级模型!DeepSeek V4来了,价格便宜75倍!") 就在刚刚,DeepSeek-V4 的预览版本正式上线并同步开源。 上下文长度直接从从128K直接跳到100万。 没有任何官方公告,没有任何预热。 就那么静悄悄地上线了。 结论是: 便宜,贼便宜
- 老金带你玩AI
- 3天前
- 81
- 点赞
- 评论
[人工智能](http://juejin.cn/tag/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD "人工智能")
* [DeepSeek V3.1正式发布,专为下代国产芯设计](http://juejin.cn/post/7540877562266533924 "DeepSeek V3.1正式发布,专为下代国产芯设计") 就在今天下午,DeepSeek 官方宣布 DeepSeek-V3.1 正式发布。 并且在评论区,DeepSeek 直接摊牌:是针对即将发布的下一代国产芯片设计
- 苍何
- 8月前
- 490
- 2
- 1
[人工智能](http://juejin.cn/tag/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD "人工智能")
* [大模型终于不卷跑分,改卷打工了!](http://juejin.cn/post/7632660804625809423 "大模型终于不卷跑分,改卷打工了!") 这两天我刷帖子刷得有点懵。 4 月 20 号,Kimi 悄悄放出 K2.6。4 月 23 号,腾讯混元 3.0 开源,小米 MiMo-V2.5 同一天公测。4 月 24 号,DeepSeek V4 P
- 数字生命贾克斯
- 1天前
- 14
- 点赞
- 评论
[人工智能](http://juejin.cn/tag/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD "人工智能")
* [DeepSeek 开始融资,又打了一手新牌](http://juejin.cn/post/7629606675545505834 "DeepSeek 开始融资,又打了一手新牌") 大家好,我是董章鱼。 今天一起床,就看到一条消息:DeepSeek 正在寻求首次外部融资,估值不低于 100 亿美元,计划筹集至少 3 亿美元。 那个曾经坚决不融资的 DeepSeek,终于松口了。
- 董章鱼是个攻城狮
- 9天前
- 123
- 1
- 评论
[后端](http://juejin.cn/tag/%E5%90%8E%E7%AB%AF "后端")
* [DeepSeek V4 来了!超越 Claude Sonnet 4.5,赶紧对接 Claude Code 体验一把](http://juejin.cn/post/7631971681049804827 "DeepSeek V4 来了!超越 Claude Sonnet 4.5,赶紧对接 Claude Code 体验一把") 背景:为什么要替换掉原生 Claude? Claude Code 是目前公认最强的 AI 编程工具之一,但原版的 Anthropic API 费用不低——Opus 4.6 的输入价格高达 $15 /
- JEECG低代码平台
- 3天前
- 55
- 点赞
- 评论
[AIGC](http://juejin.cn/tag/AIGC "AIGC")
* [深夜炸弹:DeepSeek V4 要来了,国产开源要逆袭?](http://juejin.cn/post/7627123333709807635 "深夜炸弹:DeepSeek V4 要来了,国产开源要逆袭?") 2026年4月11日深夜,DeepSeek 创始人梁文锋透露:新一代旗舰大模型 DeepSeek V4 将于4月下旬正式发布。 V3 推出才四个月,V4 就来了。第一反应是"这也太快了吧"——但看完这
- 赛博山海经
- 15天前
- 109
- 点赞
- 评论
[DeepSeek](http://juejin.cn/tag/DeepSeek "DeepSeek")
* [终于来了!DeepSeekV4预览版本正式发布:Agent、世界知识和推理性能在开源领域领先](http://juejin.cn/post/7632162180318183465 "终于来了!DeepSeekV4预览版本正式发布:Agent、世界知识和推理性能在开源领域领先") 说实话,等V4等得我都快佛系了。从年初就开始传,二月说春节发,三月说两会后发,四月上旬又说"未来几周",结果一拖再拖,拖到我都以为DeepSeek是不是在憋什么大招还是遇到什么坑了。毕竟R1发布已经过
- 人工智能AI技术
- 3天前
- 37
- 点赞
- 评论
[人工智能](http://juejin.cn/tag/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD "人工智能")
* [DeepSeek V4 来了,百万上下文+万亿参数,还顺便干了件没人干过的事](http://juejin.cn/post/7632156929691320355 "DeepSeek V4 来了,百万上下文+万亿参数,还顺便干了件没人干过的事") DeepSeek V4 预览版上线:百万上下文、万亿参数、Agent 逼近 Opus 4.6,还跑在华为昇腾芯片上。一周六家旗舰同台,AI 军备竞赛周意味着什么?
- 阿木木AEcru
- 3天前
- 65
- 1
- 评论
[DeepSeek](http://juejin.cn/tag/DeepSeek "DeepSeek")[OpenAI](http://juejin.cn/tag/OpenAI "OpenAI")[AI编程](http://juejin.cn/tag/AI%E7%BC%96%E7%A8%8B "AI编程")
* [DeepSeek V4 全解析:百万上下文背后的技术牌,国产算力正式迈过临界点](http://juejin.cn/post/7632264475764867126 "DeepSeek V4 全解析:百万上下文背后的技术牌,国产算力正式迈过临界点") 目录 一、跳票三次之后:DeepSeek 终于亮牌 二、本质变化:算力竞赛转向效率竞赛 三、核心机制拆解:三个维度的技术突破 四、典型案例与对比:V4 到底处于什么位置 五、工程落地启示:你有哪些可用
- Hogwarts霍格沃兹测试开发学社
- 2天前
- 6
- 点赞
- 评论
[人工智能](http://juejin.cn/tag/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD "人工智能")
收藏成功!
已添加到「」, 点击更改
- 微信!Image 35微信扫码分享
- 新浪微博

AI代码助手上线啦
选中代码,体验AI替你一键快速解读代码
立即体验
APP内打开
- !Image 37: 下载掘金APP下载APP 下载APP
- !Image 38: 微信扫一扫微信扫一扫 微信公众号
- 新浪微博
!Image 39选择你感兴趣的技术方向
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
跳过
上一步
至少选择1个分类
温馨提示
当前操作失败,如有疑问,可点击申诉
前往申诉 我知道了
沉浸阅读
确定屏蔽该用户
屏蔽后,对方将不能关注你、与你产生任何互动,无法查看你的主页
取消 确定