T
traeai
Sign in
返回首页
宝玉(@dotey)

NVIDIA GEAR 实验室发布了 ENPIRE,一套让 AI 编程 agent 自主操控真实机器人做实验的系统。是在真实物理世界里跑,让 AI 自己重置场景、跑实验、判断成败、查论文、改代码、再来...

8.5Score
NVIDIA GEAR 实验室发布了 ENPIRE,一套让 AI 编程 agent 自主操控真实机器人做实验的系统。是在真实物理世界里跑,让 AI 自己重置场景、跑实验、判断成败、查论文、改代码、再来...

TL;DR · AI Summary

NVIDIA GEAR 实验室发布 ENPIRE 系统,让 AI 编程 agent 在真实物理世界中自主操控机器人完成实验,成功率高达 99%。

Key Takeaways

  • ENPIRE 系统让 AI agent 在真实物理世界中自主操控机器人完成实验,成功率高达 99%。
  • 使用 8 台机器人并行探索时,研究推进速度显著提升。
  • OpenAI、Anthropic 和月之暗面的编程 agent 都能完成任务,但进展速度有差异。

Outline

Jump quickly between sections.

  1. §ENPIRE 系统概述

    介绍 ENPIRE 系统的基本概念和开发背景。

  2. 描述 ENPIRE 系统如何让 AI agent 自主完成实验任务。

  3. 列举 ENPIRE 系统测试的高精度任务及其成功率。

  4. 解释并行机器人对研究推进速度的影响及代价。

  5. 比较 OpenAI、Anthropic 和月之暗面 agent 的任务完成情况。

  6. 说明 ENPIRE 系统的开源计划及其对其他实验室的意义。

Mindmap

See how the topics connect at a glance.

查看大纲文本(无障碍 / 无 JS 友好)
  • ENPIRE 系统
    • 系统概述
      • 由 NVIDIA GEAR 实验室联合 CMU、UC Berkeley 开发
      • 目标是让 AI agent 自主操控机器人完成实验
    • 运作方式
      • AI agent 自动重置场景、跑实验、判断成败、改代码
      • 使用 8 台机器人并行探索,提升研究速度
    • 测试任务
      • 高精度任务如插入 pin 脚、穿扎带、插 GPU
      • 成功率高达 99%(pass@8 标准)

Highlights

Key sentences worth saving and sharing.

  • ENPIRE 的全称是 Agentic Robot Policy Self-Improvement in the Real World,由 NVIDIA GEAR 实验室联合 CMU、UC Berkeley 共同开发。

    第 2 段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • ENPIRE 测试了几个相当刁钻的操作任务,最终 agent 自主训练出的策略达到了 99% 的成功率(pass@8 标准)。

    第 4 段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 使用 8 台机器人并行探索,比 1 台或 4 台的研究推进速度快得多。

    第 6 段

    ⬇︎ 下载 PNG𝕏 分享到 X
#AI#机器人#NVIDIA#ENPIRE#AutoResearch
Open original article

宝玉 on X: "NVIDIA GEAR 实验室发布了 ENPIRE,一套让 AI 编程 agent 自主操控真实机器人做实验的系统。是在真实物理世界里跑,让 AI 自己重置场景、跑实验、判断成败、查论文、改代码、再来一轮,人类只需要早上起来看报告就行。 ENPIRE 的全称是 Agentic Robot Policy Self-Improvement in the Real World,由" / X

宝玉

@dotey

NVIDIA GEAR 实验室发布了 ENPIRE,一套让 AI 编程 agent 自主操控真实机器人做实验的系统。是在真实物理世界里跑,让 AI 自己重置场景、跑实验、判断成败、查论文、改代码、再来一轮,人类只需要早上起来看报告就行。 ENPIRE 的全称是 Agentic Robot Policy Self-Improvement in the Real World,由 NVIDIA GEAR 实验室联合 CMU、UC Berkeley 共同开发。Jim Fan 是 GEAR 实验室的联合负责人,他把这个方向叫 AutoResearch,意思是让 AI 来做科研。之前这个概念只在纯数字环境里跑通过,ENPIRE 是第一次把它搬到了物理世界。 系统的运作方式是这样的:给一组 AI 编程 agent 分配一队机器人、一批 GPU 和足够的 token 预算,然后设定一个目标,比如“尽快完成这个任务,让机器人保持忙碌但别出事”。接下来人就可以走了。 agent 会自动做四件事: 1. 搭建环境:包括自动重置场景和自动判断成败 2. 改进操控策略:从启发式学习到行为克隆到强化学习都会尝试 3. 在真实机器人上跑实验收集数据 4. 分析失败原因并迭代改进代码 整个循环完全自主,不需要人参与。 ENPIRE 测试了几个相当刁钻的操作任务:把细小的 pin 脚精确插入盒子、穿扎带、用剪刀剪扎带、把 GPU 插到主板上。这些都是需要高精度灵巧操作的任务,不是简单的抓取搬运。最终 agent 自主训练出的策略达到了 99% 的成功率(pass@8 标准)。 项目同时测试了三款编程 agent: 1. OpenAI 的 Codex(搭配 GPT-5.5) 2. Anthropic 的 Claude Code(搭配 Opus 4.7) 3. 月之暗面的 Kimi Code(搭配 Kimi K2.6)。 三家的 agent 都能跑通整个流程,但在不同任务上的研究进展速度有差异。 一个比较有意思的发现是他们所谓的“物理 scaling law”:8 台机器人并行探索,比 1 台或 4 台的研究推进速度快得多。 更多机器人意味着更多并行实验,agent 之间还能互相参考对方的成功策略,类似于多个研究者同时攻关同一个问题。不过扩大规模也有代价,token 消耗会显著增加,而且 agent 花在总结同伴进展上的时间会变多,机器人的实际利用率反而下降。 所有代码会开源,让你在家也能搭一个自运行的机器人实验室,但你至少得有一队机器人臂和一批 GPU。开源本身的意义在于,其他机器人实验室可以直接复用这套 agent 驱动的实验框架,省掉大量人工盯实验的时间。

Jim Fan

@DrJimFan

9h

Today, we enable AutoResearch in the physical world for the first time! Introducing ENPIRE: we give 8 Codex agents a fleet of robots, an allocation of GPUs, and generous token budget. We set them free with a simple goal: solve the task as quickly as possible, keep the robots busy

Show more

00:00

11:30 PM · Jun 16, 2026

6.4K

Views

4

5

2

22

1

11

Read 4 replies

AI may generate inaccurate information. Please verify important content.