T
traeai
Sign in

产品

PlanningBench

可扩展、可验证的 LLM 规划评估与训练框架。

已跟踪 1 条高相关材料

TraeAI 观察

最近变化

2026-06-05 · PlanningBench 提供 30+ 真实规划任务,支持 LLM 规划能力评估。

为什么值得关注

PlanningBench 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。

LLM开源规划评估框架

相关材料

已收录 1 条与 PlanningBench 相关的内容,按评分排序。

Planning is where LLMs move from “saying” to “doing.”

Tencent Hy, in collaboration with the Gaoling...

PlanningBench: Bringing LLMs from “Saying” to “Doing”

Hunyuan(@TXhunyuan)147 字 (约 1 分钟)
50

Tencent and Renmin University of China’s Gaoling School of AI release PlanningBench, an open‑source, scalable, verifiable framework for evaluating and training LLM planning capabilities, featuring 30+ real‑world tasks and automated verification.

入选理由:PlanningBench 提供 30+ 真实规划任务,支持 LLM 规划能力评估。

FeaturedTweet#LLM#Planning#Open Source#Evaluation Framework中文

跨材料问答 · PlanningBench

回答基于:PlanningBench 相关 1 条材料
    0 / 500

    AI may generate inaccurate information. Please verify important content.