T
traeai
登录

论文

KernelBench Hard

别名:Kernel Benchmark Hard

评估模型在系统内核级任务中的表现基准。

相关材料

已收录 1 条与 KernelBench Hard 相关的内容,按评分排序。

Read more from @MiniMax_AI:

MiniMax 推出 M3 开源模型,首次融合编码、代理与长上下文能力,在 SWE-Bench Pro 等基准上达 59%+,支持 1M 上下文窗口,推动开源大模型向多能型前沿迈进。

入选理由:MiniMax M3 在 SWE-Bench Pro 基准测试中取得 59.0% 正确率,领先多数开源模型。

精选推文#开源模型#大语言模型#编码能力#长上下文#MiniMax英文

跨材料问答 · KernelBench Hard

回答基于:KernelBench Hard 相关 1 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容