MiniMax 发布 M3 开源模型:首个融合编码、代理与长上下文能力的前沿模型
MiniMax 推出 M3 开源模型,首次融合编码、代理与长上下文能力,在 SWE-Bench Pro 等基准上达 59%+,支持 1M 上下文窗口,推动开源大模型向多能型前沿迈进。
入选理由:MiniMax M3 在 SWE-Bench Pro 基准测试中取得 59.0% 正确率,领先多数开源模型。
论文
也叫:Model Context Performance Atlas
衡量模型在长上下文场景下的综合性能指标。
最近变化
2026-06-01 · MiniMax M3 在 SWE-Bench Pro 基准测试中取得 59.0% 正确率,领先多数开源模型。
MCP Atlas 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
已收录 2 篇与「MCP Atlas」相关的 AI 资讯和分析。
MiniMax 推出 M3 开源模型,首次融合编码、代理与长上下文能力,在 SWE-Bench Pro 等基准上达 59%+,支持 1M 上下文窗口,推动开源大模型向多能型前沿迈进。
入选理由:MiniMax M3 在 SWE-Bench Pro 基准测试中取得 59.0% 正确率,领先多数开源模型。
Google 发布 Gemini 3.5 模型家族,首发 3.5 Flash 专注于复杂智能体工作流,在编码和代理基准测试中超越 3.1 Pro,速度比前沿模型快 4 倍,在 Antigravity 中优化后可达 12 倍。
入选理由:Gemini 3.5 Flash 专为执行复杂、长周期的智能体工作流而设计。
与「MCP Atlas」经常一起出现的 AI 术语。
💡 想追踪「MCP Atlas」的长期趋势?去 实体雷达 · MCP Atlas 查看详细分析和跨材料问答。