返回首页
张小珺Jùn|商业访谈录播客1:22:40

136. 全球大模型季报第9集:和广密聊,Coding是AGI第二幕、硅谷御三家真相、模型正成为新一代OS

8.7Score
136. 全球大模型季报第9集:和广密聊,Coding是AGI第二幕、硅谷御三家真相、模型正成为新一代OS

播客收听

时长 1:22:40原播客页面

问这期播客

会先在本集摘要、章节、转录和笔记里找答案。

本集要点

  • Coding是AGI发展的关键加速器,领先模型通过代码能力放大顶尖人才生产力10-50倍
  • OpenAI因过度聚焦ToC忽视Coding可能面临战略风险,Anthropic则因深度投入占据优势
  • 大模型正演变为新一代操作系统,将引发白领岗位通缩与社会结构深层变革

节目简介

Coding正推动AI从聊天机器人迈向能自主执行任务的Agent,成为AGI第二幕核心驱动力,并重塑硅谷大模型竞争格局。

章节

  1. 02:00

    第9集季报的概览

    第9集季报的概览

  2. 03:28

    硅谷体感与洞察

    硅谷体感与洞察

  3. 22:10

    硅谷御三家内部真实情况

    硅谷御三家内部真实情况

  4. 22:10

    Anthropic

    Anthropic

  5. 33:35

    OpenAI

    OpenAI

  6. 47:13

    Gemini

    Gemini

  7. 54:16

    Meta TBD

    Meta TBD

  8. 58:07

    xAI

    xAI

  9. 1:02:00

    Harness Engineering

    Harness Engineering

  10. 1:03:57

    中国御三家

    中国御三家

  11. 1:05:42

    模型是新一代操作系统

    模型是新一代操作系统

  12. 1:07:01

    潜在的社会影响,失业、通缩

    潜在的社会影响,失业、通缩

转录

02:00

第9集季报的概览

03:28

硅谷体感与洞察

22:10

硅谷御三家内部真实情况

22:10

Anthropic

33:35

OpenAI

47:13

Gemini

54:16

Meta TBD

58:07

xAI

1:02:00

Harness Engineering

1:03:57

中国御三家

1:05:42

模型是新一代操作系统

1:07:01

潜在的社会影响,失业、通缩

1:14:36

硅谷新趋势和投资新思考

16:13

语言即世界,代码即方案,智能体即?

33:11

最牛逼的AI Researcher都担心自己1-2年后没有工作了...

05:53

“挡不住了”

16:28

语言即世界,代码即方案。

#大模型#AGI#AI编程#硅谷科技#操作系统

节目笔记

136. 全球大模型季报第9集:和广密聊,Coding是AGI第二幕、硅谷御三家真相、模型正成为新一代OS - 张小珺Jùn|商业访谈录 | 小宇宙 - 听播客,上小宇宙

做家务 清晨洗漱

听播客,上小宇宙!点击下载

!Image 1: 136. 全球大模型季报第9集:和广密聊,Coding是AGI第二幕、硅谷御三家真相、模型正成为新一代OS!Image 2: 张小珺Jùn|商业访谈录

136. 全球大模型季报第9集:和广密聊,Coding是AGI第二幕、硅谷御三家真相、模型正成为新一代OS

张小珺Jùn|商业访谈录![Image 3: 张小珺Jùn|商业访谈录](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

83分钟·2天前

!Image 4: 播放数21818

·

!Image 5: 评论数139

今天给大家带来的是全球大模型季报第9集,这一集的情绪十分复杂。

一方面,你会看到正在急速进化的AI革命。**Coding把AI从聊天机器人Chatbot第一幕,推向了能够干活的Agent第二幕。**研究员们已经不再亲自写代码。广密带来的核心判断是,Coding是新的”AI加速器",正在加速AGI实现,领先的Coding模型就像领先的GPU。

**另一方面,社会层面随之进入白领通缩与失业的窗口。**整个社会准备好了应对这么剧烈变化的AI革命吗?

**OUTLINE:**

**00:02:00**第9集季报的概览

**00:03:28**硅谷体感与洞察

过去一个Q,智能水平进步幅度赶上2025全年,推背感非常强,AI奇点时刻应该很快就到

最关键转折点就是Opus 4.5 → Opus 4.6模型,算是GPT-3 → GPT-4跨代际提升的模型

今年6月之前可能还会再有一个从GPT-3→4水平幅度的跨越,OpenAI/Anthropic新模型都很强,Mythos/Spud下一代也开始训练了,继续加速

Coding会是头部的放大器,最顶尖1的人才能放大10-50倍的生产力

你是否相信Code可以表达数字世界的绝大多数任务?**“语言即世界,代码即方案”**

如果领先的模型公司不重视Coding,大概率会掉出第一梯队

Coding就像Amazon最早卖书一样,借助卖完书把所有仓储物流用户全都拉通了

Coding在整个AGI的历史进程中处在什么位置?

做好Coding的难点到底在哪里?不只是技术knowhow,更是战略组织和文化问题

**00:22:10**硅谷御三家内部真实情况

**00:22:10 Anthropic**

All in Coding不是day1这个团队就想清楚的

创始人特别hands-on亲自看训练数据,重视数据和重视技术细节刻在基因里

偏好“underdog”而非大人物,文化面试非常严格,尤其是看重一个人的文化特质

**00:33:35 OpenAI**

在这个时代的过去胜利秘诀,可能是下个时代的毒药

过去OpenAI在ChatGPT的成功,让他们专注ToC忽视了Coding

重点说下OpenAI做的不好的地方,可以在构建组织的时候借鉴一下

OpenAI即将要发布的新模型,是真正意义上的GPT-5吧

**00:47:13 Gemini**

Gemini 3被高估

Coding严重落后,Google最大的战略失误

Google是最领先的追随者,资源和布局上没啥绝对短板,但战略跟随OpenAI/Anthropic,掉队可能性很低

**00:54:16 Meta TBD**

最有机会的挑战者,已经取代xAI,成为硅谷4号种子

**00:58:07 xAI**

xAI短期基本上掉队了,最大问题感觉也是战略摇摆

崩溃始于founding team逐渐离开

**01:02:00**Harness Engineering

01:03:57 中国御三家

01:05:42 模型是新一代操作系统

01:07:01 潜在的社会影响,失业、通缩

01:14:36 硅谷新趋势和投资新思考

《全球大模型季报》系列追踪:

2023: 54. 口述全球大模型这一年:人类千亿科学豪赌与参差的中美景观

2024Q1: 64. 和广密聊AGI大基建时代:电+芯片=产出智能

2024Q2: 69. 口述全球大模型这半年:Perplexity突然火爆和尚未爆发的AI应用生态

2024Q3: 73. AGI范式大转移:和广密预言草莓、OpenAI o1和self-play RL|全球大模型季报4

2024Q4: 86. 大模型季报年终特辑:和广密预言LLM产品超越Google之路

2025Q1: 97. 25年Q1大模型季报:和广密聊当下最大非共识、AGI的主线与主峰

2025Q2-Q3: 112. 和广密聊大模型季报:分化与收敛、全家桶与垂直整合、L4体验与挖矿窗口

2025Q4: 127. 大模型季报跨年对谈:和广密预言一场AI War、两大联盟和第三个范式Online Learning

**LINKS:**

我们的播客在小宇宙Apple Podcast、Spotify等全音频平台播出;

我们的视频播客在Bilibili小红书、视频号、抖音等全视频平台播出;

如果你想服用文字版,请搜索我们工作室的公众号:语言即世界language is world。

**DISCLAIMER:**本内容不作为投资建议。

**CONTACT:**xiaojunzhang@lisw.ai

**Jump into the new world-and explore with us!😉**

展开Show Notes

![Image 6: HD4047p](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

HD4047p

2天前

21

少聊了两个重要的问题:1. 中国模型离御三家的差距是缩小还是扩大了,以及在终局,开源模型是否能在90%的任务上胜任。2. 投资组合为什么只包含模型,而不是包括AI芯片在内的半导体产业。

Guangmi:1/ 仅说Q1,进步幅度都很大,但GAP在变大,主要是GPU问题,不好scale很大的模型; 2/ 不敢预测终局,变量太多; 3/ 二级主要逻辑是,Token需求指数级爆发,物理硬件(算力/存储/互联)跟不上,物理世界跟不上数字世界的指数级爆发

HD4047p:模型的终局,确实变数太大,但如果能分享一些思考也挺好的。我的思考是,如果当前模型范式有天花板,那么开源模型就一定能赶上。如果当前模型范式能达到达里奥所说的ai自己进化并且达到逃逸速度,那么国产模型,开源模型都危了

共 6 条回复

![Image 7: 祖春山](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

祖春山

2天前

11

16:13 语言即世界,代码即方案,智能体即?

刘芮麟的CoT:语言是世界的高压表征→代码是方案的高压表征 智能体不是表征,是使用表征的主体

Hung_tdit:语言即世界,代码即方案,智能体即行动!

共 6 条回复

![Image 8: Ayano_83su](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

Ayano_83su

2天前

13

33:11 最牛逼的AI Researcher都担心自己1-2年后没有工作了...

程序员也在担心自己1-2年后没有工作了

不爱吃面爱吃卤煮:1-2 年太久远了,都是当下了,20%-30% 裁员程序员都是少的,遇到过裁员 60% 的,还有所有前后端测试团队都裁,每个团队留一个人

康克由:1-2年太乐观了,现在的目标是活到下半年

共 3 条回复

![Image 9: 井然丶](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

井然丶

2天前

12

太好了,是广密,我们有救了!/手动狗头

![Image 10: 魔都侦探](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

魔都侦探

2天前

9

AI进展太快了,季报感觉和年报一样

![Image 11: 庄明浩](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

庄明浩

2天前

7

05:53 “挡不住了”

jaime-y:这加速论听着就吓人,像劝降的

![Image 12: RayZheng](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

RayZheng

1 天前

8

是不是最水的一期,街边老大爷认知

Guangmi:具体哪里水?你竟然比街边老大爷还有耐心能听完,且能听懂,还会评论,说明我讲的很不错了哈哈。

![Image 13: aibiubiu](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

aibiubiu

2天前

4

硅谷御三家讲了四十分钟,国内御三家不到四分钟,两边差距越来越大了😂😂

Guangmi:硅谷对大家有参考意义,主要目的是传递和拉齐一些认知。国内dynamics怕讲不清楚。

伸伸懒腰:glm5.1在coding上性能,已经在opus和Sonnet之间了(lmarena)。所以他家coding plan敢一直在大涨价

![Image 14: HD441242v](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

random_path

17小时前

3

感谢广密和小珺每个季度给大家分享观察!不过有一点没想明白,其实 opus 4.5 去年 11 月就发了,但是似乎大家即便一直在跟硅谷一线 researcher 聊,也没有预见到 anthropic 今年出圈和 arr 垂直飙升的速度(去年 12 月当时主流话题还是在讨论 oai 和 goog)。似乎大家都是慢了一点要到 2 月 arr 出来以后,或者是稍早点 anthropic 击溃美国 saas 开始才意识到今年第一季度的主角。或者甚至可能 Dario 自己都没意识到(去年底今年初我记得 Dario 还在峰会上阴阳 sam 锁芯片产能是瞎搞,当成 YOLO,结果转头自己晚了两个季度,只能再加价 50%-100% 去找锁...)

Guangmi:是的,Dario都低估了需求,算力规划保守了,估计后面Token定价会涨价

![Image 15: 捺西索斯](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

捺西索斯

2天前

4

这集真的是绝望的一集

庄明浩:绝望到底往往就会出现希望

GtSsac:抓到庄总了

![Image 16: 欢喜HD](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

欢喜HD

2天前

5

有幸见证这次浪潮,强如广密这次更多也说了很多次不知道,都很乐观,“5050”等

![Image 17: HD441242v](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

HD441242v

3小时前

2

模型最近一次质变是gpt5high,之后的gpt5.1codex则是把coding能力补上了。然后现在最强的coding模型是gpt5.4,openai从来没有落后过,包括跟opus对比。只要你需要真正要维护部署一个有一定规模的生产系统,那么你很快就会发现codex的能力比claude高出一个档次,claude在解决真正的疑难问题上大概只有o3水平。回过头来说谷歌,能看出来demis是真不想做coding,他宁可分配人去做多模态,做世界模型,做生物,做数学,也不想做coding,他觉得卷这东西浪费太多人力。这个我觉得挺好,所有模型卷同质化的东西才是药丸

![Image 18: kb34](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

kb34

2天前

3

ai之后的世界看上去就是两拨人:

一小撮想要和“上帝”掰手腕,知识负担更重的人/

和一大群“惊恐的绵羊🐑”,哈哈😂

![Image 19: 不爱吃面爱吃卤煮](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

不爱吃面爱吃卤煮

2天前

3

来了,老李别走了,常驻吧

Kaitrine:+1

![Image 20: bilipili](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

bilipili

1 天前

1

坐等半年后广密自己来打脸,OpenAI 比想象的更强

Guangmi:半年后来对账哈。

![Image 21: liu_0Xci](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

liu_0Xci

1 天前

1

墙头草水平的嘉宾...

Guangmi:不是墙头草,是全部下注。成年人不做选择题。哪家好都行啊。

![Image 22: 飞行卷饼](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

飞行卷饼

5小时前

1

太水了……达不到北京出租车司机的平均水平

![Image 23: 卡叽米米](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

卡叽米米

6小时前

1

模型是操作系统 那苹果变成什么? 越听越觉得模型最后是一个重工业的投资,最后变成拼血条的游戏,一时的领先不能代表什么,最后都是人类在盲人摸象。摸出了一个能自我成长的怪物,自我净化能力超强,跟人类分庭抗礼,最后人类这个种族就一致对外,有外部矛盾了。

![Image 24: AGENT橘](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

AGENT橘

6小时前

1

16:28 语言即世界,代码即方案。

![Image 25: 梁康乐](http://www.xiaoyuzhoufm.com/episode/69de68cfb977fb2c47f1ee14)

梁康乐

8小时前

1

看看两家年底上市之后(也包括spaceX),资本市场对他们的反馈,会不会让各家走出独特的道路还是说会殊途同归。

打开小宇宙查看更多精彩评论

00:00

00:00