T
traeai
登录
返回首页
跨国串门儿计划播客37:51

#509.前字节研究员深度访谈:中国AI的真实差距、刷榜文化与Agent新赛道

8.5Score
#509.前字节研究员深度访谈:中国AI的真实差距、刷榜文化与Agent新赛道

播客收听

时长 37:51原播客页面

问这期播客

会先在本集摘要、章节、转录和笔记里找答案。

本集要点

  • 中国AI在基准分数上追平,但实际体验与创新能力仍落后。
  • 数据蒸馏成为捷径,却阻碍自主数据管道建设。
  • 具身智能或成中国AI突破的关键赛道。

节目简介

前字节研究员深度剖析中国AI现状,揭示刷榜文化、中美差距拉大原因及具身智能新机会。

章节

  1. 00:00

    开场 & 节目简介

    开场 & 节目简介

  2. 01:33

    从吴恩达课程到 UCLA 博士

    从吴恩达课程到 UCLA 博士

  3. 03:10

    跟随朱松纯归国:数据驱动与规模假设的争论

    跟随朱松纯归国:数据驱动与规模假设的争论

  4. 04:12

    在通院的日子:ChatGPT 如何改变 AI 研究格局

    在通院的日子:ChatGPT 如何改变 AI 研究格局

  5. 05:51

    加入字节跳动:SEED 的诞生与 DeepSeek 的震撼

    加入字节跳动:SEED 的诞生与 DeepSeek 的震撼

  6. 07:23

    “我们以为追上了 GPT-4o,直到 DeepSeek 出现”

    “我们以为追上了 GPT-4o,直到 DeepSeek 出现”

  7. 08:07

    形式化数学与 IMO 金牌项目:公关还是科研?

    形式化数学与 IMO 金牌项目:公关还是科研?

  8. 09:35

    SEED 内部结构:LLM、VLM 与数学组的分工

    SEED 内部结构:LLM、VLM 与数学组的分工

  9. 11:04

    刷榜文化:基准分数如何定义你的成败

    刷榜文化:基准分数如何定义你的成败

  10. 12:35

    午休两小时、九小时工作制:字节 AI 研究员的一天

    午休两小时、九小时工作制:字节 AI 研究员的一天

  11. 14:11

    从银牌到交付:当研究兴趣被工程琐事消磨

    从银牌到交付:当研究兴趣被工程琐事消磨

  12. 17:16

    谷歌三个月迭代一轮,我们要半年:速度差距的背后

    谷歌三个月迭代一轮,我们要半年:速度差距的背后

转录

00:00

开场 & 节目简介

01:33

从吴恩达课程到 UCLA 博士

03:10

跟随朱松纯归国数据驱动与规模假设的争论

04:12

在通院的日子ChatGPT 如何改变 AI 研究格局

05:51

加入字节跳动SEED 的诞生与 DeepSeek 的震撼

07:23

“我们以为追上了 GPT-4o,直到 DeepSeek 出现”

08:07

形式化数学与 IMO 金牌项目公关还是科研?

09:35

SEED 内部结构LLM、VLM 与数学组的分工

11:04

刷榜文化基准分数如何定义你的成败

12:35

午休两小时、九小时工作制字节 AI 研究员的一天

14:11

从银牌到交付当研究兴趣被工程琐事消磨

17:16

谷歌三个月迭代一轮,我们要半年速度差距的背后

18:16

特供版 H20、禁运前抢购的 H100字节的芯片家底

19:43

国产芯片为什么训练用不上?

21:14

追赶者缺乏创新中美差距真的在缩小吗?

21:57

Claude Code 让我不想再招博士生编程智能体的震撼

22:48

用户反馈循环美国模型的真正护城河

24:25

离开字节的原因大厂 LLM 工程其实很无聊

26:04

北大新方向推理效率提升 5%,就能省下天量成本

27:50

捷径的代价中国公司为何沉迷数据蒸馏?

29:01

什么是蒸馏?用 GPT 的答案训练自己的模型

30:06

AGI 信仰与现实智能体如何重构工程师的角色

31:16

制造业优势中国可能在具身智能赛道领先

32:20

宇树机器人擅舞却不擅“思”运动控制与智能操作的鸿沟

33:31

如何让机器拥有灵巧操作的能力?

34:12

Open Claw 与 Vibe Research:当研究生开始让智能体帮自己盯实验

35:23

智能体的隐私陷阱与使用边界

36:17

中国程序员正在用 Claude Code 写中国的大语言模型?

37:05

结语

#AI#大模型#具身智能#中美差距

节目笔记

📝 本期播客简介

本期我们克隆了播客《Into Asia》的一期深度对谈A Year Inside ByteDance's AI Lab

【编者述:该内容存在争议,x 上有评论认为该研究者并未接触到字节AI 的核心项目,仅作为信息和视角补充】

主持人 Cheche 与北京大学助理教授、前字节跳动研究员 Chu Chu 坦诚交流了中国人工智能领域的竞争与挑战。Chu Chu 曾深度参与大语言模型的研发,对中美 AI 差距有着一线观察。在节目里,他揭示了中国 AI 公司内部刷榜文化的真相,分析了芯片禁令下数据蒸馏的无奈,并尖锐指出中美 AI 差距其实正在拉大。从字节跳动的 IMO 数学竞赛项目,到北大推理效率算法的新方向,再到具身智能与 AI Agent 的中国机会,这场对话带来了一位圈内人最真实的反思与预判。

👨‍🔬 本期嘉宾

Chu Chu,北京大学助理教授,前字节跳动 Seed 部门研究员,加州大学洛杉矶分校(UCLA)博士。他曾先后在北京通用人工智能研究院(通院)和字节跳动工作,亲历了中国大语言模型从追赶 GPT-4o 到被 DeepSeek 冲击的全过程,目前专注于 AI 推理效率与具身智能的研究。

⏱️ 时间戳

00:00 开场 & 节目简介

嘉宾背景与 AI 之路

01:33 从吴恩达课程到 UCLA 博士

03:10 跟随朱松纯归国:数据驱动与规模假设的争论

04:12 在通院的日子:ChatGPT 如何改变 AI 研究格局

05:51 加入字节跳动:SEED 的诞生与 DeepSeek 的震撼

字节的 AI 战场:刷榜、资源与隐形压力

07:23 “我们以为追上了 GPT-4o,直到 DeepSeek 出现”

08:07 形式化数学与 IMO 金牌项目:公关还是科研?

09:35 SEED 内部结构:LLM、VLM 与数学组的分工

11:04 刷榜文化:基准分数如何定义你的成败

12:35 午休两小时、九小时工作制:字节 AI 研究员的一天

14:11 从银牌到交付:当研究兴趣被工程琐事消磨

17:16 谷歌三个月迭代一轮,我们要半年:速度差距的背后

18:16 特供版 H20、禁运前抢购的 H100:字节的芯片家底

19:43 国产芯片为什么训练用不上?

21:14 追赶者缺乏创新:中美差距真的在缩小吗?

差距拉大的本质:蒸馏、数据与基础设施

21:57 Claude Code 让我不想再招博士生:编程智能体的震撼

22:48 用户反馈循环:美国模型的真正护城河

24:25 离开字节的原因:大厂 LLM 工程其实很无聊

26:04 北大新方向:推理效率提升 5%,就能省下天量成本

27:50 捷径的代价:中国公司为何沉迷数据蒸馏?

29:01 什么是蒸馏?用 GPT 的答案训练自己的模型

30:06 AGI 信仰与现实:智能体如何重构工程师的角色

具身智能与下一代 Agent

31:16 制造业优势:中国可能在具身智能赛道领先

32:20 宇树机器人擅舞却不擅“思”:运动控制与智能操作的鸿沟

33:31 如何让机器拥有灵巧操作的能力?

34:12 Open Claw 与 Vibe Research:当研究生开始让智能体帮自己盯实验

35:23 智能体的隐私陷阱与使用边界

36:17 中国程序员正在用 Claude Code 写中国的大语言模型?

37:05 结语

🌟 精彩内容

💡 中美 AI 差距反而在拉大?

Chu Chu 坦言,尽管在部分基准上中国模型看似追平,但实际体验和智能涌现上的差距仍在扩大。核心原因是用户反馈循环的断裂和基础设施的全面落后。“我认为我们还远远落后,而且差距还在越拉越大,这真的很让人难过。”

💡 刷榜文化才是真正的压力

在字节等大厂,每个团队紧盯着自己负责的基准分数,却没有将表现转化为真实场景中的好用体验。“从论文上看,中国的每一家大厂都有一个不错的模型,但以我自己的使用体验来说,我并不觉得它们真的够好。”

💡 蒸馏:被卡住脖子的中国 AI 在走捷径

为快速获取高质量训练数据,不少中国公司直接查询 GPT、Claude 等模型,将答案塞进自己的训练集。这种蒸馏虽然省时省钱,却让企业迟迟建不起自主的数据管道,形成恶性循环。

💡 推理成本才是烧钱大户

训练模型的成本固然高昂,但 Chu Chu 指出,真正吃掉利润的是部署后的推理算力。“如果能从算法上让推理效率提高一点点,哪怕百分之五,给公司省下的钱也会非常可观。” 这也是他回归北大后的主攻方向。

💡 具身智能:中国的下一张王牌

凭借全球领先的硬件制造能力,尤其在电机和本体方面,中国在具身机器人领域优势明显。但如何让宇树这样的机器人拥有真正的大脑——灵巧地拿起杯子、走进千家万户——仍是待解难题。

💡 智能体正在承包科研工作

他的学生已经开始用 Open Claw 监控模型训练、自动调试 Bug,团队甚至提出“Vibe Research”的概念:设定一个监控任务,就让智能体去完成,自己直接去睡觉。

🌐 播客信息补充

翻译克隆自:

本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的

使用 AI 进行翻译,因此可能会有一些地方不通顺;

如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

#509.前字节研究员深度访谈:中国AI的真实差距、刷榜文化与Agent新赛道 | 跨国串门儿计划 | traeai