Nemotron 3 Ultra教程：使用NemoHermes和OpenCode构建自主研究代理

NVIDIA Developer

NVIDIA Developer视频2026年6月5日

Nemotron 3 Ultra教程：使用NemoHermes和OpenCode构建自主研究代理

8.5内容质量

可直接观看的视频资源打开原视频

TL;DR · AI 摘要

Nemotron 3 Ultra是NVIDIA最新开源的稀疏混合专家模型，拥有5500亿总参数和550亿活跃参数，专为代理型用例设计；文章演示了通过NemoHermes搭建自主研究代理的步骤，包括配置NVIDIA API密钥调用build.nvidia.com端点、选择Ultra作为推理模型，并完成简化自动研究任务（如优化NanoChat）以产出真实优化结果。

核心要点

Nemotron 3 Ultra是稀疏混合专家模型，总参数5500亿、活跃参数550亿，专注代理型用例（如类OpenCode任务）。
搭建NemoHermes需运行安装脚本、设置Hermes环境变量、粘贴NVIDIA API密钥以使用build.nvidia.com端点，并将Ultra设为推理
演示中NemoHermes（基于Nemo Claw运行时）利用Ultra在简化自动研究任务（如NanoChat）中发现小范围但真实的优化结果。

结构提纲

按章节快速跳转。

§Nemotron 3 Ultra简介
Nemotron 3 Ultra是NVIDIA最新开源的稀疏混合专家模型，总参数5500亿、活跃参数550亿，专为代理型用例设计。
§NemoHermes与Ultra的搭建步骤
搭建需运行安装脚本、设置Hermes环境变量、配置NVIDIA API密钥以使用build.nvidia.com端点，并将Ultra设为推理模型。
§自主研究工作流演示
演示中NemoHermes（基于Nemo Claw运行时）利用Ultra完成简化自动研究任务（如NanoChat优化），产出小范围真实优化结果。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

使用Nemotron 3 Ultra搭建自主研究代理
- Nemotron 3 Ultra
  - 稀疏MoE模型
  - 550B总/55B活跃参数
  - 代理型用例优化
- 搭建步骤
  - 安装脚本+环境变量
  - NVIDIA API密钥
  - build.nvidia.com端点
  - Ultra作为推理模型
- 演示工作流
  - NemoHermes（Nemo Claw）
  - NanoChat任务
  - 小范围优化结果

金句 / Highlights

值得收藏与分享的关键句。

它仍然是一个稀疏混合专家模型。总参数5500亿，活跃参数550亿，并且它擅长你期望它擅长的领域，即代理型用例
— [0:17]-[0:29]
⬇︎ 下载 PNG 𝕏 分享到 X
我们使用相同的安装脚本。我们使用一个环境变量来控制需要Hermes……我们将选择NVIDIA端点并粘贴NVIDIA API密钥，以便使用build.nvidia.com端点为Hermes提供动力
— [0:57]-[1:26]
⬇︎ 下载 PNG 𝕏 分享到 X
代理立即开始工作……在这个由Nemo Claw运行的Hermes简化自动研究示例中，Ultra确实找到了一个小但真实的优化
— [2:56]-[3:38]
⬇︎ 下载 PNG 𝕏 分享到 X

#Nemotron 3 Ultra#NemoHermes#NVIDIA#自主代理#混合专家模型

视频笔记

<thought>* Source: A YouTube transcript (English).

Target: Chinese.
Content: A technical walkthrough of "NeMo Guard 3 Ultra" (likely a typo for NeMo Guardrails or a specific model family, but I should stick to the terminology used in the text, though "NeMo Guard 3 Ultra" sounds like a specific model name here).
Key terms: NeMo Guard 3 Ultra, sparse mixture of experts (MoE), agentic use cases, Open Code, Hermes, NVIDIA endpoints, build.nvidia.com, OpenShell, Nemo Claw, NanoChat, Karpathy, auto research workflow, JSON blob.
Format: Markdown with timestamps.

"NeMo Guard 3 Ultra": Keep as is (Product name).
"sparse mixture of experts model": 稀疏混合专家模型 (Sparse MoE).
"agentic use cases": 智能体用例 / Agent 场景.
"open weights": 开放权重.
"recipe": 配方/方案 (in ML context, usually refers to the training recipe).
"active parameters": 激活参数.
"harnesses": 框架 / 运行环境.
"Hermes": Keep as is (Model/Agent name).
"install script": 安装脚本.
"environment variable": 环境变量.
"endpoints": 端点.
"inference": 推理.
"sandbox": 沙箱.
"secure runtime": 安全运行时.
"blueprint": 蓝图.
"smoke tests": 冒烟测试.
"auto research workflow": 自动研究工作流.
"persistent loop": 持久循环.
"cooking show style": 像烹饪节目那样（指快进处理）。
"artifact": 产出物 / 构件.
"JSON blob": JSON 数据块.

*Segment 1 [0:00 - 0:46]:* Introduction to NeMo Guard 3 Ultra. It's open (weights, data, recipe), a sparse MoE (550B total, 55B active), great for agentic tasks.
*Segment 2 [0:46 - 1:42]:* Setting up NeMo Guard with Hermes. Using install scripts, env vars, NVIDIA endpoints/API keys via build.nvidia.com. Setting Ultra as the inference model.
*Segment 3 [1:42 - 3:40]:* Running Hermes agent in OpenShell secure runtime (Nemo Claw blueprint). Example: getting NanoChat from Karpathy and doing an auto research workflow. The agent optimizes something, and Ultra finds a real optimization.
*Segment 4 [3:40 - end]:* Using Ultra in OpenCode. Simple JSON setup. Example: creating a Newton's cradle in JavaScript.

*Drafting [0:00]:* "Hey, what's up, everybody?" -> "大家好！"
*Drafting [0:07]:* "totally open, open meaning weights, data, recipe" -> "完全开放，这意味着权重、数据、训练方案等全部公开。"
*Drafting [0:17]:* "sparse mixture of experts model" -> "稀疏混合专家 (MoE) 模型。"
*Drafting [0:27]:* "agentic use cases" -> "智能体 (agentic) 用例。"
*Drafting [1:03]:* "zip through the installation process" -> "快速跳过安装过程。"
*Drafting [1:15]:* "set everything up for us" -> "为我们配置好一切。"
*Drafting [2:17]:* "stapled together by the blueprint called Nemo Claw" -> "由名为 Nemo Claw 的蓝图整合在一起。"
*Drafting [2:47]:* "cooking show style" -> "像烹饪节目那样快进处理。"
*Drafting [3:52]:* "simple JSON blob" -> "简单的 JSON 数据块。"

Check against constraints: Markdown preserved? Yes. Technical terms accurate? Yes. Natural flow? Yes. Code/URLs untouched? Yes. No mention of "Part 1"? Yes.</thought># YouTube Transcript

语言：英语（自动生成）（en）

[0:00] 大家好！我的名字是

[0:01] Chris。今天我将向大家演示

[0:03] NeMo Guard 3 Ultra 的功能。NeMo Guard 3 Ultra 是

[0:05] 我们 NeMo Guard 3 模型家族中的

[0:07] 最新成员。它同样是

[0:09] 完全开放的，“开放”意味着权重、

[0:12] 数据、训练方案（recipe）等全部公开。它

[0:17] 仍然是一个稀疏混合专家（sparse mixture of experts）

[0:19] 模型。它拥有 5500 亿个总参数，其中

[0:23] 550 亿个激活参数。它在

[0:26] 预期擅长的领域表现出色，

[0:27] 也就是智能体（agentic）用例，

[0:29] 比如那些你会使用 Open Code

[0:32] 来处理的任务。NeMo Guard 3 Ultra 非常擅长这些。

[0:34] 接下来，我们将通过几个示例，

[0:36] 看看如何在一些智能体框架中

[0:38] 配置 Ultra，以及在

[0:40] 配置完成后，你可以利用该模型

[0:42] 实现哪些功能。

[0:44] 首先，我们将看一个

[0:46] 使用 NeMo Guard 和 Hermes 的示例。

[0:51] 好了，首先你们会看到

[0:52] 如何将 NeMo Guard

[0:55] 与 Hermes 进行配置。

[0:57] 我们使用相同的安装脚本，

[1:00] 并通过一个环境变量

[1:02] 来指定我们需要 Hermes。

[1:03] 我们将快速跳过

[1:05] 安装过程。这段视频

[1:07] 经过了大约 4 倍速处理。

[1:10] 简单来说，这个过程会自动运行。

[1:11] 完成后，我们将

[1:13] 运行 NeMo Hermes onboard。

[1:15] 这将为我们配置好一切。

[1:18] 它会设置一系列资源。我们将

[1:20] 选择 NVIDIA 端点（endpoints），

[1:21] 并粘贴我们的 NVIDIA API 密钥，

[1:23] 这样我们就可以使用

[1:25] build.nvidia.com 的端点来驱动

[1:26] Hermes。完成后，我们将

[1:29] 将 Ultra 设置为我们用于

[1:31] 推理的实际模型。

[1:35] Ultra 设置好后，我们可以

[1:36] 连接到沙箱并

[1:38] 启动 Hermes agent。

[1:40] Hermes agent 将在

[1:42] OpenShell 安全运行时中启动，

[1:45] 该运行时是在安装 NeMo Guard 时

[1:47] 一并配置的。我们可以在这里与 Ultra 对话。

[1:49] 同样，它是通过 build.nvidia.com

[1:51] 的端点驱动的。我们将设定一个小目标：

[1:54] 获取 Karpathy 的 NanoChat。

[1:56] 拿到 NanoChat 后，我们将

[1:57] 演示一个简单的

[2:01] 自动研究（auto research）工作流示例。

[2:04] 这一切都通过 Hermes 处理，对吧？

[2:06] 它同样运行在 OpenShell 的

[2:09] 安全运行时中，

[2:11] 并由名为 Nemo Claw 的蓝图（blueprint）

[2:13] 整合在一起。在这种情况下，

[2:14] 我们将其称为 Nemo Hermes，

[2:17] 因为它使用了 Hermes。

[2:19] 我们可以看到 NanoChat 已经设置完毕，

[2:21] 智能体进行了一些冒烟测试（smoke tests），

[2:23] 现在我们开始执行这个

[2:25] 非常简单的自动研究示例。

[2:28] 我们只需告诉模型，

[2:30] 直到完成一次优化为止。

[2:33] 我们不会让它进入持久循环。

[2:35] 在这个演示中，我们将等待模型

[2:37] 获得正确结果。

[2:39] 我们再次采用“烹饪节目”式的快进处理，

[2:42] 这样你们就不用盯着屏幕

[2:43] 看好几分钟了，但你可以看到

[2:45] 智能体立即开始工作。

[2:46] 当智能体完成这项工作后，

[2:50] 我们将查看结果。

[2:52] 结果很快就会显示在屏幕上。

[2:54] 我们已经可以看到，

[2:56] 训练正在运行，

[2:58] 这里可能有一个升级点。

[2:59] 我们等待 Hermes 产生

[3:03] 输出。

[3:05] 我们看到，得益于 Ultra，

[3:08] 在这个运行在 Nemo Claw 中的 Hermes

[3:11] 简化版自动研究示例中，

[3:14] 确实发现了一个虽然微小但真实的

[3:16] 优化。

[3:18] 当然，你不仅可以将 NeMo Transformer Ultra

[3:20] 用于 Nemo Claw 配合 Hermes 的场景，

[3:22] 还可以直接在 OpenCode 中使用。

[3:24] 让我们来看一个配置示例。

[3:27] 正如你所见，只需一个简单的 JSON 数据块即可完成配置。

[3:30] 你也可以通过配置文件（configs）来实现。

[3:32] 配置完成后，上手非常简单。

[3:35] 我将向大家展示我们为

[3:38] 主旨演讲（keynote）制作的演示是如何实现的。

[3:40] 基本上，我们输入提示词，

[3:42] 比如：“用 JavaScript 为我制作一个

[3:44] 牛顿摆，不要出错，好吗？”

[3:46] 然后我们将看到 Open Code 开始工作。

[3:48] Open Code 完成工作后，

[3:50] 我们就可以打开想要查看的产出物（artifact）。

[3:52] 现在，我们不需要去手动寻找 HTML 文件，

[3:54] 而是可以这样做：

[4:27] Ultra 已为我们启动了服务器。接下来，

[4:29] 我们将继续操作。

[4:31] 完成后，

[4:33] 我们可以点击链接查看

[4:35] 在主题演讲中看到的 Newton's Cradle 示例。

[4:43] 如果你想进一步了解该模型，可以查看技术博客、

[4:44] 技术报告、配方以及烹饪书。它们可通过

[4:46] GitHub、Hugging Face 获取，或者你也可以

[4:48] 在技术博客本身找到相应链接，下面会提供链接。

[4:56] 我们迫不及待想看到你用 Ime Tron 3 Ultra 做了什么。希望你喜欢这个模型，并告诉我们你发现的任何有趣功能。我们发现它在绘图和制作动画方面表现出色。

[5:07] 我们很高兴看到你们能创造出什么。非常感谢观看，下一期再见。