MiniMax M3一手实测:老黄PPT上74个Logo,我以为能难住它
量子位3891 字 (约 16 分钟)
85
MiniMax M3是国内首个同时具备长上下文、多模态与Coding能力的开源模型,实测在SWE-Bench Pro上跑出59%成绩,超越GPT-5.5和Gemini 3.1 Pro,效率达上代1/20。
入选理由:M3在SWE-Bench Pro上得分59%,超越GPT-5.5和Gemini 3.1 Pro
精选文章#MiniMax#开源模型#多模态#编程能力#AI评测中文
人物
GitHub AI领域知名开发者,公开推荐M3。
已收录 1 条与 Vercel CEO Guillermo Rauch 相关的内容,按评分排序。
MiniMax M3是国内首个同时具备长上下文、多模态与Coding能力的开源模型,实测在SWE-Bench Pro上跑出59%成绩,超越GPT-5.5和Gemini 3.1 Pro,效率达上代1/20。
入选理由:M3在SWE-Bench Pro上得分59%,超越GPT-5.5和Gemini 3.1 Pro