跨越非正式AI:Carina Hong与Axiom Math的Verified AI
Latent Space1535 字 (约 7 分钟)
87
Axiom Math以Verified AI为核心,通过形式化证明与Lean工具将“ brilliance”规模化与复利化,已在Putnam达全对并在Verina Codegen取得99%,显著高于OpenAI o3的4.9%,为AGI路径提供关键能力验证与知识传播范式。
入选理由:Axiom在Putnam考试中取得12/12,优于顶尖本科生与当时最接近的AI系统DeepSeek(103/120)。
精选文章#Verified AI#形式化验证#Lean#AGI#Putnam竞赛英文
