跨国串门儿计划播客2026年4月25日37:51

#509.前字节研究员深度访谈：中国AI的真实差距、刷榜文化与Agent新赛道

8.5Score

用这条生成生成视频方案 Markdown AI 摘要

播客收听

时长 37:51原播客页面

问这期播客

会先在本集摘要、章节、转录和笔记里找答案。

本集要点

中国AI在基准分数上追平，但实际体验与创新能力仍落后。
数据蒸馏成为捷径，却阻碍自主数据管道建设。
具身智能或成中国AI突破的关键赛道。

节目简介

前字节研究员深度剖析中国AI现状，揭示刷榜文化、中美差距拉大原因及具身智能新机会。

章节

00:00
开场 & 节目简介
开场 & 节目简介
01:33
从吴恩达课程到 UCLA 博士
从吴恩达课程到 UCLA 博士
03:10
跟随朱松纯归国：数据驱动与规模假设的争论
跟随朱松纯归国：数据驱动与规模假设的争论
04:12
在通院的日子：ChatGPT 如何改变 AI 研究格局
在通院的日子：ChatGPT 如何改变 AI 研究格局
05:51
加入字节跳动：SEED 的诞生与 DeepSeek 的震撼
加入字节跳动：SEED 的诞生与 DeepSeek 的震撼
07:23
“我们以为追上了 GPT-4o，直到 DeepSeek 出现”
“我们以为追上了 GPT-4o，直到 DeepSeek 出现”
08:07
形式化数学与 IMO 金牌项目：公关还是科研？
形式化数学与 IMO 金牌项目：公关还是科研？
09:35
SEED 内部结构：LLM、VLM 与数学组的分工
SEED 内部结构：LLM、VLM 与数学组的分工
11:04
刷榜文化：基准分数如何定义你的成败
刷榜文化：基准分数如何定义你的成败
12:35
午休两小时、九小时工作制：字节 AI 研究员的一天
午休两小时、九小时工作制：字节 AI 研究员的一天
14:11
从银牌到交付：当研究兴趣被工程琐事消磨
从银牌到交付：当研究兴趣被工程琐事消磨
17:16
谷歌三个月迭代一轮，我们要半年：速度差距的背后
谷歌三个月迭代一轮，我们要半年：速度差距的背后

转录

00:00

开场 & 节目简介

01:33

从吴恩达课程到 UCLA 博士

03:10

跟随朱松纯归国数据驱动与规模假设的争论

04:12

在通院的日子ChatGPT 如何改变 AI 研究格局

05:51

加入字节跳动SEED 的诞生与 DeepSeek 的震撼

07:23

“我们以为追上了 GPT-4o，直到 DeepSeek 出现”

08:07

形式化数学与 IMO 金牌项目公关还是科研？

09:35

SEED 内部结构LLM、VLM 与数学组的分工

11:04

刷榜文化基准分数如何定义你的成败

12:35

午休两小时、九小时工作制字节 AI 研究员的一天

14:11

从银牌到交付当研究兴趣被工程琐事消磨

17:16

谷歌三个月迭代一轮，我们要半年速度差距的背后

18:16

特供版 H20、禁运前抢购的 H100字节的芯片家底

19:43

国产芯片为什么训练用不上？

21:14

追赶者缺乏创新中美差距真的在缩小吗？

21:57

Claude Code 让我不想再招博士生编程智能体的震撼

22:48

用户反馈循环美国模型的真正护城河

24:25

离开字节的原因大厂 LLM 工程其实很无聊

26:04

北大新方向推理效率提升 5%，就能省下天量成本

27:50

捷径的代价中国公司为何沉迷数据蒸馏？

29:01

什么是蒸馏？用 GPT 的答案训练自己的模型

30:06

AGI 信仰与现实智能体如何重构工程师的角色

31:16

制造业优势中国可能在具身智能赛道领先

32:20

宇树机器人擅舞却不擅“思”运动控制与智能操作的鸿沟

33:31

如何让机器拥有灵巧操作的能力？

34:12

Open Claw 与 Vibe Research：当研究生开始让智能体帮自己盯实验

35:23

智能体的隐私陷阱与使用边界

36:17

中国程序员正在用 Claude Code 写中国的大语言模型？

37:05

结语

#AI#大模型#具身智能#中美差距

节目笔记

📝 本期播客简介

本期我们克隆了播客《Into Asia》的一期深度对谈A Year Inside ByteDance's AI Lab

【编者述：该内容存在争议，x 上有评论认为该研究者并未接触到字节AI 的核心项目，仅作为信息和视角补充】

主持人 Cheche 与北京大学助理教授、前字节跳动研究员 Chu Chu 坦诚交流了中国人工智能领域的竞争与挑战。Chu Chu 曾深度参与大语言模型的研发，对中美 AI 差距有着一线观察。在节目里，他揭示了中国 AI 公司内部刷榜文化的真相，分析了芯片禁令下数据蒸馏的无奈，并尖锐指出中美 AI 差距其实正在拉大。从字节跳动的 IMO 数学竞赛项目，到北大推理效率算法的新方向，再到具身智能与 AI Agent 的中国机会，这场对话带来了一位圈内人最真实的反思与预判。

👨‍🔬 本期嘉宾

Chu Chu，北京大学助理教授，前字节跳动 Seed 部门研究员，加州大学洛杉矶分校（UCLA）博士。他曾先后在北京通用人工智能研究院（通院）和字节跳动工作，亲历了中国大语言模型从追赶 GPT-4o 到被 DeepSeek 冲击的全过程，目前专注于 AI 推理效率与具身智能的研究。

⏱️ 时间戳

00:00 开场 & 节目简介

嘉宾背景与 AI 之路

01:33 从吴恩达课程到 UCLA 博士

03:10 跟随朱松纯归国：数据驱动与规模假设的争论

04:12 在通院的日子：ChatGPT 如何改变 AI 研究格局

05:51 加入字节跳动：SEED 的诞生与 DeepSeek 的震撼

字节的 AI 战场：刷榜、资源与隐形压力

07:23 “我们以为追上了 GPT-4o，直到 DeepSeek 出现”

08:07 形式化数学与 IMO 金牌项目：公关还是科研？

09:35 SEED 内部结构：LLM、VLM 与数学组的分工

11:04 刷榜文化：基准分数如何定义你的成败

12:35 午休两小时、九小时工作制：字节 AI 研究员的一天

14:11 从银牌到交付：当研究兴趣被工程琐事消磨

17:16 谷歌三个月迭代一轮，我们要半年：速度差距的背后

18:16 特供版 H20、禁运前抢购的 H100：字节的芯片家底

19:43 国产芯片为什么训练用不上？

21:14 追赶者缺乏创新：中美差距真的在缩小吗？

差距拉大的本质：蒸馏、数据与基础设施

21:57 Claude Code 让我不想再招博士生：编程智能体的震撼

22:48 用户反馈循环：美国模型的真正护城河

24:25 离开字节的原因：大厂 LLM 工程其实很无聊

26:04 北大新方向：推理效率提升 5%，就能省下天量成本

27:50 捷径的代价：中国公司为何沉迷数据蒸馏？

29:01 什么是蒸馏？用 GPT 的答案训练自己的模型

30:06 AGI 信仰与现实：智能体如何重构工程师的角色

具身智能与下一代 Agent

31:16 制造业优势：中国可能在具身智能赛道领先

32:20 宇树机器人擅舞却不擅“思”：运动控制与智能操作的鸿沟

33:31 如何让机器拥有灵巧操作的能力？

34:12 Open Claw 与 Vibe Research：当研究生开始让智能体帮自己盯实验

35:23 智能体的隐私陷阱与使用边界

36:17 中国程序员正在用 Claude Code 写中国的大语言模型？

37:05 结语

🌟 精彩内容

💡 中美 AI 差距反而在拉大？

Chu Chu 坦言，尽管在部分基准上中国模型看似追平，但实际体验和智能涌现上的差距仍在扩大。核心原因是用户反馈循环的断裂和基础设施的全面落后。“我认为我们还远远落后，而且差距还在越拉越大，这真的很让人难过。”

💡 刷榜文化才是真正的压力

在字节等大厂，每个团队紧盯着自己负责的基准分数，却没有将表现转化为真实场景中的好用体验。“从论文上看，中国的每一家大厂都有一个不错的模型，但以我自己的使用体验来说，我并不觉得它们真的够好。”

💡 蒸馏：被卡住脖子的中国 AI 在走捷径

为快速获取高质量训练数据，不少中国公司直接查询 GPT、Claude 等模型，将答案塞进自己的训练集。这种蒸馏虽然省时省钱，却让企业迟迟建不起自主的数据管道，形成恶性循环。

💡 推理成本才是烧钱大户

训练模型的成本固然高昂，但 Chu Chu 指出，真正吃掉利润的是部署后的推理算力。“如果能从算法上让推理效率提高一点点，哪怕百分之五，给公司省下的钱也会非常可观。” 这也是他回归北大后的主攻方向。

💡 具身智能：中国的下一张王牌

凭借全球领先的硬件制造能力，尤其在电机和本体方面，中国在具身机器人领域优势明显。但如何让宇树这样的机器人拥有真正的大脑——灵巧地拿起杯子、走进千家万户——仍是待解难题。

💡 智能体正在承包科研工作

他的学生已经开始用 Open Claw 监控模型训练、自动调试 Bug，团队甚至提出“Vibe Research”的概念：设定一个监控任务，就让智能体去完成，自己直接去睡觉。

🌐 播客信息补充

翻译克隆自：

本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的

使用 AI 进行翻译，因此可能会有一些地方不通顺；

如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight