T
traeai
Sign in

论文

什么是 AIME 2025

也叫:AIME 2025 测试、通用推理基准

衡量 AI 模型通用推理能力的关键测试,MAI-Thinking-1 在此测试中达到 97% 的准确率。

为什么现在值得关注?

最近变化

2026-06-02 · MAI-Thinking-1 是一款拥有 35B 参数的 MoE 模型,在 AIME 2025 上达到 97% 的准确率,优于 Sonnet 4.6。

AIME 2025 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。

📰 AIME 2025 最新动态

已收录 1 篇与「AIME 2025」相关的 AI 资讯和分析。

Super excited to announce seven new world-class MAI models today. They represent what we consider a ...

Mustafa Suleyman Announces Seven New MAI Models

Mustafa Suleyman(@mustafasuleyman)448 字 (约 2 分钟)
75

Mustafa Suleyman announces the launch of seven new MAI models, including MAI-Thinking-1, MAI-Image-2.5, and MAI-Code-1-Flash, which excel in reasoning, image editing, and code generation.

入选理由:MAI-Thinking-1 是一款拥有 35B 参数的 MoE 模型,在 AIME 2025 上达到 97% 的准确率,优于 Sonnet 4.6。

FeaturedTweet#AI#Model#Microsoft#MAI#Chip英文

与「AIME 2025」经常一起出现的 AI 术语。

💡 想追踪「AIME 2025」的长期趋势?去 实体雷达 · AIME 2025 查看详细分析和跨材料问答。

AI may generate inaccurate information. Please verify important content.