Andrej Karpathy 加入 Anthropic:接下来会发生什么

TL;DR · AI 摘要
Andrej Karpathy加入Anthropic负责Claude预训练研究,专注于AI自主改进能力(RSI),这可能加速AI独立研发进程。
核心要点
- Karpathy将在Anthropic团队领导Nicolas Joseph下工作,使用Claude加速预训练研究,为RSI能力奠定基础。
- Jack Clark预测2028年前有60%以上可能实现无人类参与的AI研发系统,Karpathy的加入可能加速这一进程。
- Karpathy对AI代码生成能力持怀疑态度,认为模型'需要大量工作',这与Anthropic于2025年10月推出的Claude Code相关。
结构提纲
按章节快速跳转。
Karpathy加入Anthropic负责使用Claude加速预训练研究,为自主改进能力铺路。
Karpathy对AI代码生成能力持怀疑态度,认为模型需要大量改进工作,这与实验室封闭趋势形成对比。
2025年10月20日Anthropic推出Claude Code,三周后Karpathy表达了对模型的保留意见,随后加入Anthropic。
Jack Clark预测2028年前有60%以上概率实现无需人类干预的AI研发系统。
一旦实现AI能自动改进自身的能力,将引发AI研发范式根本变革,影响深远。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Karpathy加入Anthropic
- 职业转变
- OpenAI创始成员
- 特斯拉经历
- 重返OpenAI
- 加入Anthropic
- 对行业态度
- 对AI代码生成持怀疑
- 开放研究与封闭实验室冲突
- 与Claude Code发布时间巧合
- 行业未来
- RSS能力预测
- 无人参与AI研发可能
金句 / Highlights
值得收藏与分享的关键句。
Anthropic雇佣Karpathy让Claude能够改进自身,一旦实现自主,这一能力被称为'递归自改进'或RSI。
我写这篇文章是因为当我查看所有公开信息时,我勉强认为有相当大的可能性(60%+)到2028年底前会出现无需人类参与的AI研发系统——一个强大到可以 plausible 地自主构建其后继者的AI系统。
总的来说,模型还不够好。我觉得行业跨越太大,试图假装这很了不起,但实际上不是。这是垃圾。...我不确定发生了什么,但我们正处于这个中期阶段。
这改变了 everything。

_嘿,我是 Alberto!👋 每周,我都会为 The Algorithmic Bridge 发布涵盖文化、哲学和商业的长篇 AI 分析。付费订阅者还能获得周一的操作指南和周五的新闻评论。我偶尔也会发布额外的文章。如果你想成为付费订阅者,这里有一个按钮:_
_一篇关于这一突发新闻重要性的快速文章。_

Andrej Karpathy,OpenAI 的创始成员,特斯拉 Autopilot 的前负责人,以及全球最受欢迎的 AI 教师,于今天,2026年5月19日,加入了 Anthropic。
TechCrunch 和 Axios 报道称,他将在团队负责人 Nick Joseph 的领导下从事预训练工作,"专注于使用 Claude 加速预训练研究"。本质上,Anthropic 雇佣 Karpathy 是为了让 Claude 准备好自我改进,这种能力一旦实现自主,就被称为"递归式自我改进"或 RSI。
这正是 Anthropic 联合创始人 Jack Clark 在5月4日的新闻通讯 ImportAI 中所预测的未来:
我写这篇文章是因为,当我查看所有公开信息时,我不得不得出一个观点:到2028年底,无人参与的 AI 研发——一个足够强大的 AI 系统,能够合理地自主构建其继任者——有相当大的可能性(60%以上)会发生。
这是一件大事。
我不知道该如何理解这一点。
这是一个不情愿的观点,因为其影响是如此之大,以至于我感到自己相形见绌,而且我不确定社会是否已经准备好应对实现自动化 AI 研发所意味着的那种变化。
Karpathy 加入 Anthropic 的决定让大多数人感到意外。
首先,他曾是 OpenAI 的创始团队成员。他于2017年离开并加入了特斯拉。然后他在三年前重新加入了 OpenAI。
然后他在两年前再次离开。
与特斯拉一起,OpenAI 是他的"行业之家"。
其次,他喜欢公开分享他的工作,随心所欲地发表言论,而在前沿 AI 实验室工作是不可能做到这一点的(除非你是匿名发帖者)。这个领域曾经是开放的,但随着行业的发展,商业利益盖过了研究合作,前沿实验室变得神秘起来。
第三,他对行业过度炒作 AI 模型和代理生成优质代码的能力出人意料地持怀疑态度。作为一名专业开发人员,他认为它们"需要大量工作"。他在2025年10月17日参加 Dwarkesh 播客时发表了这些言论。
总的来说,这些模型还不够好。我觉得行业跳跃得太大了,试图假装这很了不起,但事实并非如此。这只是一堆垃圾……我不确定发生了什么,但我们正处于这个中间阶段。这些模型很了不起。它们仍然需要大量工作。目前,自动完成是我的最佳选择。但有时候,对于某些类型的代码,我会使用 LLM 代理。
三天后,在10月20日,Anthropic 在网络上推出了 Claude Code。(Claude Code 自2月以来一直作为研究预览版可用,自5月以来普遍可用,但让这些东西良好运行需要时间。)在寒假期间,开发人员更加认真地尝试使用这些工具,最终从 Claude Code 引发了一场代理热潮。
这改变了一切。
12月19日,Karpathy写道:
[Claude Code 被打包]成一个美丽、简约、引人注目的 CLI 形态,改变了 AI 的外观——它不仅仅是一个像 Google 那样访问的网站,而是一个"生活"在你电脑上的小精灵/幽灵。这是一种与 AI 交互的新的、独特的范式。
然后在12月26日,他发推文说:
作为一名程序员,我从未感到如此落后。这个职业正在被彻底重构,因为程序员贡献的代码片段变得越来越稀少和间隔。我有一种感觉,如果我只是恰当地将过去一年左右出现的技术串联起来,我可以变得强大10倍,而未能获得这种提升感觉明显像是技能问题。
然后在两个月后,2月25日,再次:
很难传达AI在过去2个月内对编程的改变有多大:不是以"常规进步"的方式逐渐随时间变化,而特别是去年12月。虽然有一些限制条件,但在我看来,编码代理在12月之前基本上不起作用,而从那时起基本上就能工作了——模型的质量显著提高,具有长期一致性和韧性,它们能够完成大型且长期的任务,足以对默认的编程工作流程造成极大的颠覆。
这是对整个行业在过去六七个月经历的180度转变的三条推文总结(除了前沿实验室内部的人,他们预见到了这一点)。Karpathy曾质疑这种炒作,四个月后,他理解了为什么实验室在炒作:"卷起袖子,不要落后。"
自然,他一直向我们更新他的工作进展。
从那时起,他一直尝试用AI代理自动化AI研究的各个方面。据称,这目前是Anthropic和OpenAI的主要目标(Google DeepMind则不太关注,但那是另一篇文章的话题)。
自动化AI研究是实现递归自我改进的"逃逸速度"阈值的第一步。他们相信这是通往人工通用智能、超级智能和技术奇点的最可能路径。(这是否属实以及你是否应该关心——请阅读昨天的文章——是另一个问题。)
但是,为了避免陷入属于Vernor Vinge小说中的概念,让我们专注于他的autoresearch项目,这可能是Karpathy努力中最相关的实例。
2026年3月7日,他发推文:
目标是设计你的代理,使其能够无限期地以最快速度进行研究进展,而无需你自己的任何参与。. . . 部分代码,部分科幻,还有一丝疯狂 :)

在GitHub代码仓库中,他写道:
_曾经有一天,前沿AI研究是由"肉脑计算机"在吃饭、睡觉、享受其他乐趣之间完成的,偶尔通过"小组会议"这一仪式使用声波互连进行同步。那个时代早已一去不复返。现在研究完全属于在天空中计算集群巨型结构上运行的自主AI代理群体。代理们声称我们现在处于代码库的第10,205代,但无论如何,没有人能判断这是对是错,因为"代码"现在是一个自我修改的二进制文件,已经发展到超出人类理解的范围。这个仓库是这一切如何开始的故事。_
然后,在3月9日,他再次发推文(为清晰起见进行了编辑):
三天前,我让autoresearch调整nanochat约2天. . . [它]发现了约20个改进验证损失的更改. . . 这是我20年来每天工作的核心内容。看到代理自主完成整个工作流程,处理了大约700个更改,这太疯狂了. . . 所有LLM前沿实验室都会这样做。这是最终的boss战. . . 你启动一群代理,让它们协作调整较小的模型,将最有前景的想法推广到越来越大的规模,而人类(可选)在边缘做出贡献。

他的热情是显而易见的。3月12日,OpenAI推理团队的研究员Noam Brown提出了一个问题,询问为什么Karpathy不在OpenAI、Anthropic或DeepMind工作:
在人类历史上至少自工业革命以来最关键的时刻,他为什么不在前沿AI实验室工作?
Karpathy在3月21日的回应暗示了即将发生的事情。
他认为,由于在言论上的压力,他在"前沿实验室之外更符合人类利益. . ."。(有些你想说但不能说的话,比如"前沿模型有点草率",有些你不想说但公司会强迫你说的话,比如"封闭模型更安全"。)
Karpathy想要自由。但他知道单干的代价:如果你不属于前沿实验室,你就无法处于前沿。他知道他的判断会"不可避免地开始偏离"。他陷入了独立性和相关性之间的困境,而你真的、真的不想处于那种境地。
他的理想解决方案——这与他多年来的行事方式有些相符——是在实验室内外"来回穿梭"。他加入Anthropic标志着他开始了一个新的"进入"阶段。
为什么他现在选择相关性而非独立性?因为他已经看到了即将到来的事情。
如果他们能够利用当前一代的Claude让下一次训练运行效率提高5-10%,并且能够重复这样做,他们将获得复合回报。每一代模型都成为构建下一代模型的稍微更好的研究员。科幻小说中常见的说法是将此称为RSI(递归自我改进)或"起飞场景",或"通往奇点之路"。在实践中,这是一种具有可测量反馈循环的应用工程。
Karpathy过去几个月在自动研究方面的独立工作与他在Anthropic的新职位指向了同一件事,即使用Claude来改进下一个Claude的预训练。Jack Clark预测到2028年底实现完全RSI的可能性为60%,这也指向了同样的方向。这些都不是凭空而来的。他们能够看到这一切正在发生。
对我来说,这些是需要遵循的线索;对他们来说,整个图景已经完整。

_M.C. Escher的《绘画之手》,1948年(每当我写关于递归自我改进的文章时,我都会使用这幅Escher的石版画。它实在太棒了。)_