Mustafa Suleyman 宣布推出七款全新 MAI 模型

Mustafa Suleyman(@mustafasuleyman)

Mustafa Suleyman(@mustafasuleyman)2026年6月2日

Mustafa Suleyman 宣布推出七款全新 MAI 模型

7.5Score

TL;DR · AI 摘要

Mustafa Suleyman 宣布推出七款全新 MAI 模型，包括 MAI-Thinking-1、MAI-Image-2.5 和 MAI-Code-1-Flash，这些模型在推理、图像编辑和代码生成等领域表现出色。

核心要点

MAI-Thinking-1 在 AIME 2025 上达到 97% 准确率，优于 Sonnet 4.6。
MAI-Thinking-1 在 SWE Bench Pro 上达到 53%，与 Opus 4.6 性能相当。
MAI-Code-1-Flash 仅用 5B 参数实现 51% 的 SWE Bench Pro 成绩，成本更低。

结构提纲

按章节快速跳转。

§引言：AI 新时代
Mustafa Suleyman 宣布推出七款全新 MAI 模型，标志着 AI 进入一个新阶段，强调用户控制与前沿技术结合。
·核心模型介绍
MAI-Thinking-1 是一款高性能文本基础模型，擅长推理和软件工程任务，参数规模达 35B，表现优于现有主流模型。
·硬件优化与性能
MAI 模型专为自研芯片 MAIA 200 设计，相比 GB200 芯片，每美元性能提升 30%，每瓦性能提升 1.4 倍。
·其他模型亮点
MAI-Image-2.5 和 MAI-Code-1-Flash 分别在图像编辑和代码生成领域表现出色，前者位居排行榜第二，后者针对 VS Code 和 GitHub Copilot CLI 优化。
·企业定制化服务
Microsoft Frontier Tuning 提供模型定制服务，允许企业使用自有数据训练专属代理，实现成本与性能的双重优化。
·合作与未来展望
与 Mayo Clinic 合作开发医疗领域 AI 模型，进一步推动人类主义超级智能的发展。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

MAI 模型发布
- 核心模型
  - MAI-Thinking-1
    - 35B 参数 MoE
    - MAIA 200 芯片优化
  - MAI-Image-2.5
    - 图像编辑 #2
  - MAI-Code-1-Flash
    - 5B 参数
- 定制化服务
  - Microsoft Frontier Tuning
    - 企业专属模型
- 合作与未来
  - Mayo Clinic
    - 医疗 AI
  - 人类主义超级智能

金句 / Highlights

值得收藏与分享的关键句。

MAI-Thinking-1 在 AIME 2025 上达到 97% 准确率，优于 Sonnet 4.6。
— 第 3 段
⬇︎ 下载 PNG 𝕏 分享到 X
MAI-Thinking-1 在 SWE Bench Pro 上达到 53%，与 Opus 4.6 性能相当。
— 第 3 段
⬇︎ 下载 PNG 𝕏 分享到 X
MAI-Code-1-Flash 仅用 5B 参数实现 51% 的 SWE Bench Pro 成绩，成本更低。
— 第 5 段
⬇︎ 下载 PNG 𝕏 分享到 X

#AI#模型#微软#MAI#芯片

打开原文

Mustafa Suleyman 在 X 上表示：“非常兴奋地宣布今天推出七款全新的世界级 MAI 模型。它们代表了我们认为的 AI 新时代，旨在让您保持掌控并站在前沿。

首先是我们的文本基础模型 MAI-Thinking-1，在推理和软件工程（SWE）任务上表现尤为出色。

它是一个拥有 350 亿活跃参数的混合专家（MoE）模型，上下文窗口为 256K。
独立的人类评估员在 Surge 上更倾向于它作为盲测对比中的整体质量，优于 Sonnet 4.6，并且在 AIME 2025 上达到了 97% 的成绩，这是衡量其通用推理能力的关键指标。
它在 SWE Bench Pro 上达到了 53%，与 Opus 4.6 并列于最艰难的编码基准测试中。
由于我们与自己的硅芯片共同设计了这些模型，MAI-Thinking-1 在 MAIA 200 芯片上进行了优化。
与 GB200 进行基准测试对比时，我们在 MAIA 200 上运行 MAI 模型时，每美元性能提升了 30%，同时每瓦性能提高了 1.4 倍。

接下来是 MAI-Image-2.5 及其 Flash 变体。这两款超级强大的模型目前在排行榜上位列第二，超过了 Nano Banana 2 在图像编辑方面的得分。

最后是 MAI-Code-1-Flash，这是我们新推出的高效推理编码模型，特别针对 VS Code 和 GitHub Copilot CLI 进行了优化。

Code-1-Flash 在 SWE Bench Pro 上达到了 51% 的成绩，尽管只有 50 亿参数，但其规模接近 Haiku，成本却更低。

这一切都是 Microsoft Frontier Tuning 的基础。它允许您定制我们的模型，创建仅由您控制的自定义、公司专属代理。您可以将我们的模型变成您的模型。您的数据。您的代理。您的护城河。早期采用者已经看到了差异。当我们为 McKinsey 的任务调整模型时，MAI 在质量上超越了 GPT-5.5，同时成本降低了 10 倍。

我还非常兴奋地与 Mayo Clinic 的优秀团队合作，共同训练一款新的前沿 AI 模型用于医疗保健。

我们今天的发布标志着通往人本主义超级智能道路上的又一个里程碑。您可以在我们的最新博客中了解更多关于我们其他新模型的信息：microsoft.ai/news/building-