产品

CORE-Bench

traeai 已收录 1 篇与 CORE-Bench 相关的内容。最新一篇是「When AI Builds Itself: Our progress toward recursive self-improvement」，由 Hacker News Best 发布。

测试AI复现已发表科学研究结果能力的基准测试。

已跟踪 1 条高相关材料

TraeAI 观察

When AI Builds Itself: Our progress toward recursive self-improvement

Hacker News Best · 9.2 分

AI递归自我改进正加速到来，Anthropic内部数据显示工程师代码产出提升8倍，模型可靠任务时长每4个月翻倍，预计2027年可处理周级任务。

Hacker News Best6月5日5602 字 (约 23 分钟)

AI递归自我改进正加速到来，Anthropic内部数据显示工程师代码产出提升8倍，模型可靠任务时长每4个月翻倍，预计2027年可处理周级任务。

入选理由：Anthropic工程师季度代码产出较2021-2025年均值提升8倍，AI已实质性加速研发。

精选文章#递归自我改进#Anthropic#AI智能体#SWE-bench#METR英文

回答基于：CORE-Bench 相关 1 条材料