T
traeai
登录

产品

PlanningBench

可扩展、可验证的 LLM 规划评估与训练框架。

已跟踪 1 条高相关材料

TraeAI 观察

最近变化

2026-06-05 · PlanningBench 提供 30+ 真实规划任务,支持 LLM 规划能力评估。

为什么值得关注

PlanningBench 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。

LLM开源规划评估框架

相关材料

已收录 1 条与 PlanningBench 相关的内容,按评分排序。

Planning is where LLMs move from “saying” to “doing.”

Tencent Hy, in collaboration with the Gaoling...

PlanningBench:让 LLM 从“说”到“做”的规划框架

Hunyuan(@TXhunyuan)147 字 (约 1 分钟)
50

腾讯与人大高岭人工智能学院发布 PlanningBench,开源可扩展、可验证的 LLM 规划评估与训练框架,包含 30+ 真实规划任务与自动验证功能。

入选理由:PlanningBench 提供 30+ 真实规划任务,支持 LLM 规划能力评估。

精选推文#LLM#规划#开源#评估框架中文

跨材料问答 · PlanningBench

回答基于:PlanningBench 相关 1 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容