T
traeai
登录

论文

什么是 AIME 2025

也叫:AIME 2025 测试、通用推理基准

衡量 AI 模型通用推理能力的关键测试,MAI-Thinking-1 在此测试中达到 97% 的准确率。

📰 AIME 2025 最新动态

已收录 1 篇与「AIME 2025」相关的 AI 资讯和分析。

Super excited to announce seven new world-class MAI models today. They represent what we consider a ...

Mustafa Suleyman 宣布推出七款全新 MAI 模型

Mustafa Suleyman(@mustafasuleyman)448 字 (约 2 分钟)
75

Mustafa Suleyman 宣布推出七款全新 MAI 模型,包括 MAI-Thinking-1、MAI-Image-2.5 和 MAI-Code-1-Flash,这些模型在推理、图像编辑和代码生成等领域表现出色。

入选理由:MAI-Thinking-1 是一款拥有 35B 参数的 MoE 模型,在 AIME 2025 上达到 97% 的准确率,优于 Sonnet 4.6。

精选推文#AI#模型#微软#MAI#芯片英文

与「AIME 2025」经常一起出现的 AI 术语。

💡 想追踪「AIME 2025」的长期趋势?去 实体雷达 · AIME 2025 查看详细分析和跨材料问答。

AI 可能会生成不准确的信息,请核实重要内容