T
traeai
登录

概念

什么是 CritPt

评估大模型在理论物理推理任务上的基准测试集。

📰 CritPt 最新动态

已收录 1 篇与「CritPt」相关的 AI 资讯和分析。

watching a team of agents tackling a hard theoretical physics problem is quite mesmerizing - self-co...

Physics-Intern 框架通过多智能体协作将 Gemini 3.1 Pro 在 CritPt 基准上的表现从 17.7% 提升至 31.4%,创下理论物理推理新 SOTA。

入选理由:Physics-Intern 使用多智能体协作框架解决复杂理论物理问题。

精选推文#AI Agent#理论物理#LLM 推理#Gemini#CritPt中英混合

与「CritPt」经常一起出现的 AI 术语。

💡 想追踪「CritPt」的长期趋势?去 实体雷达 · CritPt 查看详细分析和跨材料问答。

AI 可能会生成不准确的信息,请核实重要内容