PlanningBench:让 LLM 从“说”到“做”的规划框架
Hunyuan(@TXhunyuan)147 字 (约 1 分钟)
50
腾讯与人大高岭人工智能学院发布 PlanningBench,开源可扩展、可验证的 LLM 规划评估与训练框架,包含 30+ 真实规划任务与自动验证功能。
入选理由:PlanningBench 提供 30+ 真实规划任务,支持 LLM 规划能力评估。
精选推文#LLM#规划#开源#评估框架中文
产品
可扩展、可验证的 LLM 规划评估与训练框架。
已跟踪 1 条高相关材料
最近变化
2026-06-05 · PlanningBench 提供 30+ 真实规划任务,支持 LLM 规划能力评估。
为什么值得关注
PlanningBench 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
已收录 1 条与 PlanningBench 相关的内容,按评分排序。
腾讯与人大高岭人工智能学院发布 PlanningBench,开源可扩展、可验证的 LLM 规划评估与训练框架,包含 30+ 真实规划任务与自动验证功能。
入选理由:PlanningBench 提供 30+ 真实规划任务,支持 LLM 规划能力评估。