NVIDIA Developer视频2026年6月4日

推出NVIDIA Nemotron 3 Ultra：面向长时运行智能代理的开放550B模型

8.7Score

可直接观看的视频资源打开原视频

TL;DR · AI 摘要

NVIDIA 推出Nemotron 3 Ultra，550B参数的开放模型，面向长时运行的智能代理，采用LatentMoE与多令牌预测，在同等推理成本下专家数提升4倍，强调速度与智能正相关，并以Open MDW许可面向企业落地。

核心要点

Nemotron 3 Ultra 为550B参数模型，延续Nemotron 3 Super架构，面向长时运行的智能代理场景。
采用LatentMoE架构，在相同推理成本下专家数量提升4倍，显著提升推理效率与智能密度。
发布采用Linux Foundation Open MDW许可（模型、数据、权重），支持企业本地/边缘部署与领域微调。

结构提纲

按章节快速跳转。

§产品发布与定位
宣布Nemotron 3 Ultra，550B参数，延续Nemotron 3 Super架构，面向自主运行的智能代理任务。
·核心架构与性能
采用LatentMoE，同等成本下专家数提升4倍；引入多令牌预测，提升单用户推理速度。
·设计原则与目标
更快即更智能：计算效率与智能正相关，Nemotron 3 Ultra旨在最快且最智能。
·应用场景
覆盖编码代理（计划、编码、测试、调试）与研究代理（检索、评估、交叉引用、综合）。
·开放合作与许可
通过Nemotron Coalition联合构建；采用Open MDW许可（模型、数据、权重），支持企业落地。
·部署与生态
提供开放权重、数据与训练配方，支持在本地、自有云与边缘的部署与微调。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Nemotron 3 Ultra
- 产品定位
  - 面向长时运行智能代理
- 核心架构
  - LatentMoE 专家数+4倍
  - 多令牌预测提速
- 设计原则
  - 更快即更智能
- 应用场景
  - 编码代理 E2E 流程
  - 研究代理跨源综合
- 开放合作
  - Nemotron Coalition 联合构建
  - Open MDW 许可制
- 部署生态
  - 本地/自有云/边缘落地
  - 开放权重、数据、配方

金句 / Highlights

值得收藏与分享的关键句。

LatentMoE架构在相同推理成本下专家数量提升4倍，显著提升智能密度与效率。
— 第2段
⬇︎ 下载 PNG 𝕏 分享到 X
Nemotron 3 Ultra采用Open MDW许可（模型、数据、权重），降低企业进入门槛并促进落地。
— 第2:15-2:21段
⬇︎ 下载 PNG 𝕏 分享到 X
支持编码与研究两类智能代理端到端工作流，可跨小时与多代理协作解决复杂问题。
— 第1:24-1:47段
⬇︎ 下载 PNG 𝕏 分享到 X
发布采用Linux Foundation Open MDW许可，面向企业本地、自有云与边缘的部署与微调。
— 第2:27-2:39段
⬇︎ 下载 PNG 𝕏 分享到 X

#NVIDIA#Nemotron#智能代理#LatentMoE#OpenMDW

推出NVIDIA Nemotron 3 Ultra：面向长时运行智能代理的开放550B模型 | NVIDIA Developer | traeai