[AINews] not much happened today
Latent Space1494 字 (约 6 分钟)
63
本文主要梳理了近期 AI 领域的热点动态,包括 Anthropic 的 Mythos/Opus 讨论、RSI 研究的正式化、以及新型长周期评测基准的出现,强调前沿模型在可靠性与长周期任务上的不足。
入选理由:Anthropic 的 Opus 4.7 在某些化学任务上已匹配或超越专用 NMR 软件,显示模型在专业领域的潜力。
精选文章#AI 研究#自我改进#评测基准#Anthropic#Sakana AI中文