T
traeai
登录
返回首页
The Algorithmic Bridge

Andrej Karpathy 加入 Anthropic:接下来会发生什么

7.5Score
Andrej Karpathy 加入 Anthropic:接下来会发生什么

TL;DR · AI 摘要

Andrej Karpathy加入Anthropic负责Claude预训练研究,专注于AI自主改进能力(RSI),这可能加速AI独立研发进程。

核心要点

  • Karpathy将在Anthropic团队领导Nicolas Joseph下工作,使用Claude加速预训练研究,为RSI能力奠定基础。
  • Jack Clark预测2028年前有60%以上可能实现无人类参与的AI研发系统,Karpathy的加入可能加速这一进程。
  • Karpathy对AI代码生成能力持怀疑态度,认为模型'需要大量工作',这与Anthropic于2025年10月推出的Claude Code相关。

结构提纲

按章节快速跳转。

  1. Karpathy加入Anthropic负责使用Claude加速预训练研究,为自主改进能力铺路。

  2. OpenAI创始团队成员到特斯拉,再回OpenAI,最后加入Anthropic,体现职业轨迹变化。

  3. Karpathy对AI代码生成能力持怀疑态度,认为模型需要大量改进工作,这与实验室封闭趋势形成对比。

  4. 2025年10月20日Anthropic推出Claude Code,三周后Karpathy表达了对模型的保留意见,随后加入Anthropic。

  5. Jack Clark预测2028年前有60%以上概率实现无需人类干预的AI研发系统。

  6. 一旦实现AI能自动改进自身的能力,将引发AI研发范式根本变革,影响深远。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • Karpathy加入Anthropic
    • 职业转变
      • OpenAI创始成员
      • 特斯拉经历
      • 重返OpenAI
      • 加入Anthropic
    • 对行业态度
      • 对AI代码生成持怀疑
      • 开放研究与封闭实验室冲突
      • 与Claude Code发布时间巧合
    • 行业未来
      • RSS能力预测
      • 无人参与AI研发可能

金句 / Highlights

值得收藏与分享的关键句。

  • Anthropic雇佣Karpathy让Claude能够改进自身,一旦实现自主,这一能力被称为'递归自改进'或RSI。

    第 2 段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 我写这篇文章是因为当我查看所有公开信息时,我勉强认为有相当大的可能性(60%+)到2028年底前会出现无需人类参与的AI研发系统——一个强大到可以 plausible 地自主构建其后继者的AI系统。

    Jack Clark 引述

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 总的来说,模型还不够好。我觉得行业跨越太大,试图假装这很了不起,但实际上不是。这是垃圾。...我不确定发生了什么,但我们正处于这个中期阶段。

    Karpathy 关于AI模型的评价

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 这改变了 everything。

    Claude Code 影响评价

    ⬇︎ 下载 PNG𝕏 分享到 X
#AI#Anthropic#Claude#Karpathy#RSI
打开原文
Image 1

_嘿,我是 Alberto!👋 每周,我都会为 The Algorithmic Bridge 发布涵盖文化、哲学和商业的长篇 AI 分析。付费订阅者还能获得周一的操作指南和周五的新闻评论。我偶尔也会发布额外的文章。如果你想成为付费订阅者,这里有一个按钮:_

_一篇关于这一突发新闻重要性的快速文章。_

Image 2

Andrej Karpathy,OpenAI 的创始成员,特斯拉 Autopilot 的前负责人,以及全球最受欢迎的 AI 教师,于今天,2026年5月19日,加入了 Anthropic

TechCrunchAxios 报道称,他将在团队负责人 Nick Joseph 的领导下从事预训练工作,"专注于使用 Claude 加速预训练研究"。本质上,Anthropic 雇佣 Karpathy 是为了让 Claude 准备好自我改进,这种能力一旦实现自主,就被称为"递归式自我改进"或 RSI。

这正是 Anthropic 联合创始人 Jack Clark 在5月4日的新闻通讯 ImportAI 中所预测的未来

我写这篇文章是因为,当我查看所有公开信息时,我不得不得出一个观点:到2028年底,无人参与的 AI 研发——一个足够强大的 AI 系统,能够合理地自主构建其继任者——有相当大的可能性(60%以上)会发生。

这是一件大事。

我不知道该如何理解这一点。

这是一个不情愿的观点,因为其影响是如此之大,以至于我感到自己相形见绌,而且我不确定社会是否已经准备好应对实现自动化 AI 研发所意味着的那种变化。

Karpathy 加入 Anthropic 的决定让大多数人感到意外。

首先,他曾是 OpenAI 的创始团队成员。他于2017年离开并加入了特斯拉。然后他在三年前重新加入了 OpenAI

然后他在两年前再次离开

与特斯拉一起,OpenAI 是他的"行业之家"。

其次,他喜欢公开分享他的工作,随心所欲地发表言论,而在前沿 AI 实验室工作是不可能做到这一点的(除非你是匿名发帖者)。这个领域曾经是开放的,但随着行业的发展,商业利益盖过了研究合作,前沿实验室变得神秘起来。

第三,他对行业过度炒作 AI 模型和代理生成优质代码的能力出人意料地持怀疑态度。作为一名专业开发人员,他认为它们"需要大量工作"。他在2025年10月17日参加 Dwarkesh 播客时发表了这些言论

总的来说,这些模型还不够好。我觉得行业跳跃得太大了,试图假装这很了不起,但事实并非如此。这只是一堆垃圾……我不确定发生了什么,但我们正处于这个中间阶段。这些模型很了不起。它们仍然需要大量工作。目前,自动完成是我的最佳选择。但有时候,对于某些类型的代码,我会使用 LLM 代理。

三天后,在10月20日,Anthropic 在网络上推出了 Claude Code。(Claude Code 自2月以来一直作为研究预览版可用,自5月以来普遍可用,但让这些东西良好运行需要时间。)在寒假期间,开发人员更加认真地尝试使用这些工具,最终从 Claude Code 引发了一场代理热潮。

这改变了一切。

12月19日,Karpathy写道

[Claude Code 被打包]成一个美丽、简约、引人注目的 CLI 形态,改变了 AI 的外观——它不仅仅是一个像 Google 那样访问的网站,而是一个"生活"在你电脑上的小精灵/幽灵。这是一种与 AI 交互的新的、独特的范式。

然后在12月26日,他发推文说

作为一名程序员,我从未感到如此落后。这个职业正在被彻底重构,因为程序员贡献的代码片段变得越来越稀少和间隔。我有一种感觉,如果我只是恰当地将过去一年左右出现的技术串联起来,我可以变得强大10倍,而未能获得这种提升感觉明显像是技能问题。

然后在两个月后,2月25日,再次

很难传达AI在过去2个月内对编程的改变有多大:不是以"常规进步"的方式逐渐随时间变化,而特别是去年12月。虽然有一些限制条件,但在我看来,编码代理在12月之前基本上不起作用,而从那时起基本上就能工作了——模型的质量显著提高,具有长期一致性和韧性,它们能够完成大型且长期的任务,足以对默认的编程工作流程造成极大的颠覆。

这是对整个行业在过去六七个月经历的180度转变的三条推文总结(除了前沿实验室内部的人,他们预见到了这一点)。Karpathy曾质疑这种炒作,四个月后,他理解了为什么实验室在炒作:"卷起袖子,不要落后。"

自然,他一直向我们更新他的工作进展。

从那时起,他一直尝试用AI代理自动化AI研究的各个方面。据称,这目前是AnthropicOpenAI的主要目标(Google DeepMind则不太关注,但那是另一篇文章的话题)。

自动化AI研究是实现递归自我改进的"逃逸速度"阈值的第一步。他们相信这是通往人工通用智能、超级智能和技术奇点的最可能路径。(这是否属实以及你是否应该关心——请阅读昨天的文章——是另一个问题。)

但是,为了避免陷入属于Vernor Vinge小说中的概念,让我们专注于他的autoresearch项目,这可能是Karpathy努力中最相关的实例。

2026年3月7日,他发推文

目标是设计你的代理,使其能够无限期地以最快速度进行研究进展,而无需你自己的任何参与。. . . 部分代码,部分科幻,还有一丝疯狂 :)

Image 7

在GitHub代码仓库中,他写道

_曾经有一天,前沿AI研究是由"肉脑计算机"在吃饭、睡觉、享受其他乐趣之间完成的,偶尔通过"小组会议"这一仪式使用声波互连进行同步。那个时代早已一去不复返。现在研究完全属于在天空中计算集群巨型结构上运行的自主AI代理群体。代理们声称我们现在处于代码库的第10,205代,但无论如何,没有人能判断这是对是错,因为"代码"现在是一个自我修改的二进制文件,已经发展到超出人类理解的范围。这个仓库是这一切如何开始的故事。_

然后,在3月9日,他再次发推文(为清晰起见进行了编辑):

三天前,我让autoresearch调整nanochat约2天. . . [它]发现了约20个改进验证损失的更改. . . 这是我20年来每天工作的核心内容。看到代理自主完成整个工作流程,处理了大约700个更改,这太疯狂了. . . 所有LLM前沿实验室都会这样做。这是最终的boss战. . . 你启动一群代理,让它们协作调整较小的模型,将最有前景的想法推广到越来越大的规模,而人类(可选)在边缘做出贡献。

Image 8

他的热情是显而易见的。3月12日,OpenAI推理团队的研究员Noam Brown提出了一个问题,询问为什么Karpathy不在OpenAI、Anthropic或DeepMind工作:

在人类历史上至少自工业革命以来最关键的时刻,他为什么不在前沿AI实验室工作?

Karpathy在3月21日的回应暗示了即将发生的事情。

他认为,由于在言论上的压力,他在"前沿实验室之外更符合人类利益. . ."。(有些你想说但不能说的话,比如"前沿模型有点草率",有些你不想说但公司会强迫你说的话,比如"封闭模型更安全"。)

Karpathy想要自由。但他知道单干的代价:如果你不属于前沿实验室,你就无法处于前沿。他知道他的判断会"不可避免地开始偏离"。他陷入了独立性和相关性之间的困境,而你真的、真的不想处于那种境地。

他的理想解决方案——这与他多年来的行事方式有些相符——是在实验室内外"来回穿梭"。他加入Anthropic标志着他开始了一个新的"进入"阶段。

为什么他现在选择相关性而非独立性?因为他已经看到了即将到来的事情。

如果他们能够利用当前一代的Claude让下一次训练运行效率提高5-10%,并且能够重复这样做,他们将获得复合回报。每一代模型都成为构建下一代模型的稍微更好的研究员。科幻小说中常见的说法是将此称为RSI(递归自我改进)或"起飞场景",或"通往奇点之路"。在实践中,这是一种具有可测量反馈循环的应用工程。

Karpathy过去几个月在自动研究方面的独立工作与他在Anthropic的新职位指向了同一件事,即使用Claude来改进下一个Claude的预训练。Jack Clark预测到2028年底实现完全RSI的可能性为60%,这也指向了同样的方向。这些都不是凭空而来的。他们能够看到这一切正在发生。

对我来说,这些是需要遵循的线索;对他们来说,整个图景已经完整。

图片 9

_M.C. Escher的《绘画之手》,1948年(每当我写关于递归自我改进的文章时,我都会使用这幅Escher的石版画。它实在太棒了。)_

AI 可能会生成不准确的信息,请核实重要内容

Andrej Karpathy 加入 Anthropic:接下来会发生什么 | The Algorithmic Bridge | traeai