国产GPU组了个开源局,把SGLang等核心开发者都摇来了!
量子位3400 字 (约 14 分钟)
85
国产GPU厂商摩尔线程通过开源活动吸引多个大模型推理框架核心开发者。
入选理由:SGLang在12个H100节点上实现52.3k输入token/s/node性能
精选文章#GPU#开源生态#大模型推理中文
产品
AI编译器,用于优化算子性能。
已跟踪 1 条高相关材料
最近变化
2026-05-14 · SGLang在12个H100节点上实现52.3k输入token/s/node性能
为什么值得关注
Triton 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
已收录 1 条与 Triton 相关的内容,按评分排序。
国产GPU厂商摩尔线程通过开源活动吸引多个大模型推理框架核心开发者。
入选理由:SGLang在12个H100节点上实现52.3k输入token/s/node性能