# GroundedPlanBench: Spatially grounded long-horizon task planning for robot manipulation Canonical URL: https://www.traeai.com/articles/d610c404-4669-474c-94e4-a4284f02e8f6 Original source: https://www.microsoft.com/en-us/research/blog/groundedplanbench-spatially-grounded-long-horizon-task-planning-for-robot-manipulation/ Source name: Microsoft Research Blog Content type: article Language: 英文 Score: 8.5 Reading time: 6 分钟 Published: 2026-03-26T16:03:56+00:00 Tags: 具身智能, 视觉语言模型, 机器人任务规划, 基准测试, 微软研究院 ## Summary 微软研究院提出GroundedPlanBench基准与V2GP框架,解决视觉语言模型在机器人长程任务规划中因自然语言歧义导致的执行失败问题。该框架将演示视频转化为空间锚定训练数据,实现动作规划与空间定位的联合学习,在基准测试与真实机器人实验中显著提升了任务成功率与动作精度。 ## Key Takeaways - 传统VLM机器人规划将动作生成与空间定位解耦,易因自然语言歧义引发长程任务失败。 - V2GP框架通过解析演示视频自动生成空间锚定数据,实现规划与定位的端到端联合训练。 - GroundedPlanBench提供千级真实场景任务集,验证了联合规划在复杂指令下的显著优势。 ## Citation Guidance When citing this item, prefer the canonical traeai article URL for the AI-readable summary and include the original source URL when discussing the underlying source material.