Andrej Karpathy 加入 Anthropic：接下来会发生什么

The Algorithmic Bridge

The Algorithmic Bridge2026年5月19日

Andrej Karpathy 加入 Anthropic：接下来会发生什么

7.5内容质量

TL;DR · AI 摘要

Andrej Karpathy加入Anthropic负责Claude预训练研究，专注于AI自主改进能力(RSI)，这可能加速AI独立研发进程。

核心要点

Karpathy将在Anthropic团队领导Nicolas Joseph下工作，使用Claude加速预训练研究，为RSI能力奠定基础。
Jack Clark预测2028年前有60%以上可能实现无人类参与的AI研发系统，Karpathy的加入可能加速这一进程。
Karpathy对AI代码生成能力持怀疑态度，认为模型'需要大量工作'，这与Anthropic于2025年10月推出的Claude Code相关。

结构提纲

按章节快速跳转。

§Karpathy加入Anthropic
Karpathy加入Anthropic负责使用Claude加速预训练研究，为自主改进能力铺路。
·职业背景转变
从OpenAI创始团队成员到特斯拉，再回OpenAI，最后加入Anthropic，体现职业轨迹变化。
·对行业态度转变
Karpathy对AI代码生成能力持怀疑态度，认为模型需要大量改进工作，这与实验室封闭趋势形成对比。
·时间线关键事件
2025年10月20日Anthropic推出Claude Code，三周后Karpathy表达了对模型的保留意见，随后加入Anthropic。
§行业未来预测
Jack Clark预测2028年前有60%以上概率实现无需人类干预的AI研发系统。
·递归自改进(RSI)意义
一旦实现AI能自动改进自身的能力，将引发AI研发范式根本变革，影响深远。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Karpathy加入Anthropic
- 职业转变
  - OpenAI创始成员
  - 特斯拉经历
  - 重返OpenAI
  - 加入Anthropic
- 对行业态度
  - 对AI代码生成持怀疑
  - 开放研究与封闭实验室冲突
  - 与Claude Code发布时间巧合
- 行业未来
  - RSS能力预测
  - 无人参与AI研发可能

金句 / Highlights

值得收藏与分享的关键句。

Anthropic雇佣Karpathy让Claude能够改进自身，一旦实现自主，这一能力被称为'递归自改进'或RSI。
— 第 2 段
⬇︎ 下载 PNG 𝕏 分享到 X
我写这篇文章是因为当我查看所有公开信息时，我勉强认为有相当大的可能性(60%+)到2028年底前会出现无需人类参与的AI研发系统——一个强大到可以 plausible 地自主构建其后继者的AI系统。
— Jack Clark 引述
⬇︎ 下载 PNG 𝕏 分享到 X
总的来说，模型还不够好。我觉得行业跨越太大，试图假装这很了不起，但实际上不是。这是垃圾。...我不确定发生了什么，但我们正处于这个中期阶段。
— Karpathy 关于AI模型的评价
⬇︎ 下载 PNG 𝕏 分享到 X
这改变了 everything。
— Claude Code 影响评价
⬇︎ 下载 PNG 𝕏 分享到 X

#AI#Anthropic#Claude#Karpathy#RSI

打开原文

_嘿，我是 Alberto！👋 每周，我都会为 The Algorithmic Bridge 发布涵盖文化、哲学和商业的长篇 AI 分析。付费订阅者还能获得周一的操作指南和周五的新闻评论。我偶尔也会发布额外的文章。如果你想成为付费订阅者，这里有一个按钮：_

_一篇关于这一突发新闻重要性的快速文章。_

Andrej Karpathy，OpenAI 的创始成员，特斯拉 Autopilot 的前负责人，以及全球最受欢迎的 AI 教师，于今天，2026年5月19日，加入了 Anthropic。

TechCrunch 和 Axios 报道称，他将在团队负责人 Nick Joseph 的领导下从事预训练工作，"专注于使用 Claude 加速预训练研究"。本质上，Anthropic 雇佣 Karpathy 是为了让 Claude 准备好自我改进，这种能力一旦实现自主，就被称为"递归式自我改进"或 RSI。

这正是 Anthropic 联合创始人 Jack Clark 在5月4日的新闻通讯 ImportAI 中所预测的未来：

我写这篇文章是因为，当我查看所有公开信息时，我不得不得出一个观点：到2028年底，无人参与的 AI 研发——一个足够强大的 AI 系统，能够合理地自主构建其继任者——有相当大的可能性（60%以上）会发生。
这是一件大事。
我不知道该如何理解这一点。
这是一个不情愿的观点，因为其影响是如此之大，以至于我感到自己相形见绌，而且我不确定社会是否已经准备好应对实现自动化 AI 研发所意味着的那种变化。

Karpathy 加入 Anthropic 的决定让大多数人感到意外。

首先，他曾是 OpenAI 的创始团队成员。他于2017年离开并加入了特斯拉。然后他在三年前重新加入了 OpenAI。

然后他在两年前再次离开。

与特斯拉一起，OpenAI 是他的"行业之家"。

其次，他喜欢公开分享他的工作，随心所欲地发表言论，而在前沿 AI 实验室工作是不可能做到这一点的（除非你是匿名发帖者）。这个领域曾经是开放的，但随着行业的发展，商业利益盖过了研究合作，前沿实验室变得神秘起来。

第三，他对行业过度炒作 AI 模型和代理生成优质代码的能力出人意料地持怀疑态度。作为一名专业开发人员，他认为它们"需要大量工作"。他在2025年10月17日参加 Dwarkesh 播客时发表了这些言论。

总的来说，这些模型还不够好。我觉得行业跳跃得太大了，试图假装这很了不起，但事实并非如此。这只是一堆垃圾……我不确定发生了什么，但我们正处于这个中间阶段。这些模型很了不起。它们仍然需要大量工作。目前，自动完成是我的最佳选择。但有时候，对于某些类型的代码，我会使用 LLM 代理。

三天后，在10月20日，Anthropic 在网络上推出了 Claude Code。（Claude Code 自2月以来一直作为研究预览版可用，自5月以来普遍可用，但让这些东西良好运行需要时间。）在寒假期间，开发人员更加认真地尝试使用这些工具，最终从 Claude Code 引发了一场代理热潮。

这改变了一切。

12月19日，Karpathy写道：

[Claude Code 被打包]成一个美丽、简约、引人注目的 CLI 形态，改变了 AI 的外观——它不仅仅是一个像 Google 那样访问的网站，而是一个"生活"在你电脑上的小精灵/幽灵。这是一种与 AI 交互的新的、独特的范式。

然后在12月26日，他发推文说：

作为一名程序员，我从未感到如此落后。这个职业正在被彻底重构，因为程序员贡献的代码片段变得越来越稀少和间隔。我有一种感觉，如果我只是恰当地将过去一年左右出现的技术串联起来，我可以变得强大10倍，而未能获得这种提升感觉明显像是技能问题。

然后在两个月后，2月25日，再次：

很难传达AI在过去2个月内对编程的改变有多大：不是以"常规进步"的方式逐渐随时间变化，而特别是去年12月。虽然有一些限制条件，但在我看来，编码代理在12月之前基本上不起作用，而从那时起基本上就能工作了——模型的质量显著提高，具有长期一致性和韧性，它们能够完成大型且长期的任务，足以对默认的编程工作流程造成极大的颠覆。

这是对整个行业在过去六七个月经历的180度转变的三条推文总结（除了前沿实验室内部的人，他们预见到了这一点）。Karpathy曾质疑这种炒作，四个月后，他理解了为什么实验室在炒作："卷起袖子，不要落后。"

自然，他一直向我们更新他的工作进展。

从那时起，他一直尝试用AI代理自动化AI研究的各个方面。据称，这目前是Anthropic和OpenAI的主要目标（Google DeepMind则不太关注，但那是另一篇文章的话题）。

自动化AI研究是实现递归自我改进的"逃逸速度"阈值的第一步。他们相信这是通往人工通用智能、超级智能和技术奇点的最可能路径。（这是否属实以及你是否应该关心——请阅读昨天的文章——是另一个问题。）

但是，为了避免陷入属于Vernor Vinge小说中的概念，让我们专注于他的autoresearch项目，这可能是Karpathy努力中最相关的实例。

2026年3月7日，他发推文：

目标是设计你的代理，使其能够无限期地以最快速度进行研究进展，而无需你自己的任何参与。. . . 部分代码，部分科幻，还有一丝疯狂 :)

在GitHub代码仓库中，他写道：

_曾经有一天，前沿AI研究是由"肉脑计算机"在吃饭、睡觉、享受其他乐趣之间完成的，偶尔通过"小组会议"这一仪式使用声波互连进行同步。那个时代早已一去不复返。现在研究完全属于在天空中计算集群巨型结构上运行的自主AI代理群体。代理们声称我们现在处于代码库的第10,205代，但无论如何，没有人能判断这是对是错，因为"代码"现在是一个自我修改的二进制文件，已经发展到超出人类理解的范围。这个仓库是这一切如何开始的故事。_

然后，在3月9日，他再次发推文（为清晰起见进行了编辑）：

三天前，我让autoresearch调整nanochat约2天. . . [它]发现了约20个改进验证损失的更改. . . 这是我20年来每天工作的核心内容。看到代理自主完成整个工作流程，处理了大约700个更改，这太疯狂了. . . 所有LLM前沿实验室都会这样做。这是最终的boss战. . . 你启动一群代理，让它们协作调整较小的模型，将最有前景的想法推广到越来越大的规模，而人类（可选）在边缘做出贡献。

他的热情是显而易见的。3月12日，OpenAI推理团队的研究员Noam Brown提出了一个问题，询问为什么Karpathy不在OpenAI、Anthropic或DeepMind工作：

在人类历史上至少自工业革命以来最关键的时刻，他为什么不在前沿AI实验室工作？

Karpathy在3月21日的回应暗示了即将发生的事情。

他认为，由于在言论上的压力，他在"前沿实验室之外更符合人类利益. . ."。（有些你想说但不能说的话，比如"前沿模型有点草率"，有些你不想说但公司会强迫你说的话，比如"封闭模型更安全"。）

Karpathy想要自由。但他知道单干的代价：如果你不属于前沿实验室，你就无法处于前沿。他知道他的判断会"不可避免地开始偏离"。他陷入了独立性和相关性之间的困境，而你真的、真的不想处于那种境地。

他的理想解决方案——这与他多年来的行事方式有些相符——是在实验室内外"来回穿梭"。他加入Anthropic标志着他开始了一个新的"进入"阶段。

为什么他现在选择相关性而非独立性？因为他已经看到了即将到来的事情。

如果他们能够利用当前一代的Claude让下一次训练运行效率提高5-10%，并且能够重复这样做，他们将获得复合回报。每一代模型都成为构建下一代模型的稍微更好的研究员。科幻小说中常见的说法是将此称为RSI（递归自我改进）或"起飞场景"，或"通往奇点之路"。在实践中，这是一种具有可测量反馈循环的应用工程。

Karpathy过去几个月在自动研究方面的独立工作与他在Anthropic的新职位指向了同一件事，即使用Claude来改进下一个Claude的预训练。Jack Clark预测到2028年底实现完全RSI的可能性为60%，这也指向了同样的方向。这些都不是凭空而来的。他们能够看到这一切正在发生。

对我来说，这些是需要遵循的线索；对他们来说，整个图景已经完整。

_M.C. Escher的《绘画之手》，1948年（每当我写关于递归自我改进的文章时，我都会使用这幅Escher的石版画。它实在太棒了。）_