我们在 NVIDIA GB200 NVL72 Blackwell 机架上发布了 Qwen3 235B 模型的部署研究

Perplexity(@perplexity_ai)

Perplexity(@perplexity_ai)2026年5月12日

我们在 NVIDIA GB200 NVL72 Blackwell 机架上发布了 Qwen3 235B 模型的部署研究

8.5内容质量

TL;DR · AI 摘要

Perplexity 发布了关于如何在 NVIDIA GB200 NVL72 Blackwell 机架上部署 Qwen3 235B 模型的研究，GB200 在大规模 MoE 模型的高吞吐量推理方面优于 Hopper。

核心要点

Qwen3 235B 模型在 NVIDIA GB200 上实现了高效的高吞吐量推理。
GB200 不仅适用于训练，还显著提升了大规模 MoE 模型的推理性能。
研究结果表明，GB200 在处理大规模模型时比 Hopper 更具优势。

结构提纲

按章节快速跳转。

§引言
Perplexity 发布了关于在 NVIDIA GB200 上部署 Qwen3 235B 模型的研究。
·GB200 优势
GB200 在高吞吐量推理方面优于 Hopper，不仅适用于训练。
·研究结果
研究展示了 GB200 在处理大规模 MoE 模型时的性能提升。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Qwen3 235B 模型部署
- NVIDIA GB200
  - 高吞吐量推理
  - 优于 Hopper
- 研究结果
  - 性能提升

金句 / Highlights

值得收藏与分享的关键句。

GB200 is a major step up over Hopper for high-throughput inference on large MoE models, not just a training platform.
— 第 2 段
⬇︎ 下载 PNG 𝕏 分享到 X

#NVIDIA#GB200#Qwen3#MoE#高性能计算

打开原文

GB200 is a major step up over Hopper for high-throughput inference on large MoE models, not just a training platform. https://t.co/yYZuPRXWzr" / X

Image 1: Square profile picture

Perplexity

@perplexity_ai

We published new research on how we serve post-trained Qwen3 235B models on NVIDIA GB200 NVL72 Blackwell racks. GB200 is a major step up over Hopper for high-throughput inference on large MoE models, not just a training platform.

2:17 PM · May 12, 2026

94.8K Views