李飞飞再出手,空间智能的ImageNet来了
李飞飞团队发布ESI-Bench评测基准,首次将观察者变成行动者,闭合感知-行动回路,发现当前AI在空间智能方面存在动作盲视、3D重建陷阱和元认知缺陷三大问题。
入选理由:ESI-Bench包含10个任务类别、29个子类别、3081个任务实例,覆盖人类四大核心空间认知能力
产品
李飞飞团队发布的具身空间智能评测基准
已跟踪 3 条高相关材料
最近变化
2026-05-22 · ESI-Bench包含10个任务类别、29个子类别、3081个任务实例,覆盖人类四大核心空间认知能力
为什么值得关注
ESI-Bench 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
李飞飞再出手,空间智能的ImageNet来了
量子位 · 8.7 分
李飞飞团队发布ESI-Bench评测基准,首次将观察者变成行动者,闭合感知-行动回路,发现当前AI在空间智能方面存在动作盲视、3D重建陷阱和元认知缺陷三大问题。
ESI-Bench Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop
AK(@_akhaliq) · 7 分
ESI-Bench 是一种新型基准测试,专注于评估具身空间智能模型在感知-行动闭环中的表现,提供比现有测试更具挑战性的场景和指标。
paper: https://t.co/6LrJouBfTX
AK(@_akhaliq) · 6.5 分
ESI-Bench 是一个新的评估基准,旨在衡量具身空间智能体的感知-行动闭环能力,填补了现有评估框架的空白。
已收录 3 条与 ESI-Bench 相关的内容,按评分排序。
李飞飞团队发布ESI-Bench评测基准,首次将观察者变成行动者,闭合感知-行动回路,发现当前AI在空间智能方面存在动作盲视、3D重建陷阱和元认知缺陷三大问题。
入选理由:ESI-Bench包含10个任务类别、29个子类别、3081个任务实例,覆盖人类四大核心空间认知能力
ESI-Bench 是一种新型基准测试,专注于评估具身空间智能模型在感知-行动闭环中的表现,提供比现有测试更具挑战性的场景和指标。
入选理由:ESI-Bench 采用连续 3D 轨迹预测任务,比现有基准更具挑战性
ESI-Bench 是一个新的评估基准,旨在衡量具身空间智能体的感知-行动闭环能力,填补了现有评估框架的空白。
入选理由:ESI-Bench 是首个专注于评估具身智能体在物理世界导航和操作能力的基准测试