Nemotron 3 Ultra教程:使用NemoHermes和OpenCode构建自主研究代理
TL;DR · AI 摘要
Nemotron 3 Ultra是NVIDIA最新开源的稀疏混合专家模型,拥有5500亿总参数和550亿活跃参数,专为代理型用例设计;文章演示了通过NemoHermes搭建自主研究代理的步骤,包括配置NVIDIA API密钥调用build.nvidia.com端点、选择Ultra作为推理模型,并完成简化自动研究任务(如优化NanoChat)以产出真实优化结果。
核心要点
- Nemotron 3 Ultra是稀疏混合专家模型,总参数5500亿、活跃参数550亿,专注代理型用例(如类OpenCode任务)。
- 搭建NemoHermes需运行安装脚本、设置Hermes环境变量、粘贴NVIDIA API密钥以使用build.nvidia.com端点,并将Ultra设为推理
- 演示中NemoHermes(基于Nemo Claw运行时)利用Ultra在简化自动研究任务(如NanoChat)中发现小范围但真实的优化结果。
结构提纲
按章节快速跳转。
Nemotron 3 Ultra是NVIDIA最新开源的稀疏混合专家模型,总参数5500亿、活跃参数550亿,专为代理型用例设计。
搭建需运行安装脚本、设置Hermes环境变量、配置NVIDIA API密钥以使用build.nvidia.com端点,并将Ultra设为推理模型。
演示中NemoHermes(基于Nemo Claw运行时)利用Ultra完成简化自动研究任务(如NanoChat优化),产出小范围真实优化结果。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- 使用Nemotron 3 Ultra搭建自主研究代理
- Nemotron 3 Ultra
- 稀疏MoE模型
- 550B总/55B活跃参数
- 代理型用例优化
- 搭建步骤
- 安装脚本+环境变量
- NVIDIA API密钥
- build.nvidia.com端点
- Ultra作为推理模型
- 演示工作流
- NemoHermes(Nemo Claw)
- NanoChat任务
- 小范围优化结果
金句 / Highlights
值得收藏与分享的关键句。
它仍然是一个稀疏混合专家模型。总参数5500亿,活跃参数550亿,并且它擅长你期望它擅长的领域,即代理型用例
我们使用相同的安装脚本。我们使用一个环境变量来控制需要Hermes……我们将选择NVIDIA端点并粘贴NVIDIA API密钥,以便使用build.nvidia.com端点为Hermes提供动力
代理立即开始工作……在这个由Nemo Claw运行的Hermes简化自动研究示例中,Ultra确实找到了一个小但真实的优化
视频笔记
<thought>* Source: A YouTube transcript (English).
- Target: Chinese.
- Content: A technical walkthrough of "NeMo Guard 3 Ultra" (likely a typo for NeMo Guardrails or a specific model family, but I should stick to the terminology used in the text, though "NeMo Guard 3 Ultra" sounds like a specific model name here).
- Key terms: NeMo Guard 3 Ultra, sparse mixture of experts (MoE), agentic use cases, Open Code, Hermes, NVIDIA endpoints, build.nvidia.com, OpenShell, Nemo Claw, NanoChat, Karpathy, auto research workflow, JSON blob.
- Format: Markdown with timestamps.
- "NeMo Guard 3 Ultra": Keep as is (Product name).
- "sparse mixture of experts model": 稀疏混合专家模型 (Sparse MoE).
- "agentic use cases": 智能体用例 / Agent 场景.
- "open weights": 开放权重.
- "recipe": 配方/方案 (in ML context, usually refers to the training recipe).
- "active parameters": 激活参数.
- "harnesses": 框架 / 运行环境.
- "Hermes": Keep as is (Model/Agent name).
- "install script": 安装脚本.
- "environment variable": 环境变量.
- "endpoints": 端点.
- "inference": 推理.
- "sandbox": 沙箱.
- "secure runtime": 安全运行时.
- "blueprint": 蓝图.
- "smoke tests": 冒烟测试.
- "auto research workflow": 自动研究工作流.
- "persistent loop": 持久循环.
- "cooking show style": 像烹饪节目那样(指快进处理)。
- "artifact": 产出物 / 构件.
- "JSON blob": JSON 数据块.
- *Segment 1 [0:00 - 0:46]:* Introduction to NeMo Guard 3 Ultra. It's open (weights, data, recipe), a sparse MoE (550B total, 55B active), great for agentic tasks.
- *Segment 2 [0:46 - 1:42]:* Setting up NeMo Guard with Hermes. Using install scripts, env vars, NVIDIA endpoints/API keys via build.nvidia.com. Setting Ultra as the inference model.
- *Segment 3 [1:42 - 3:40]:* Running Hermes agent in OpenShell secure runtime (Nemo Claw blueprint). Example: getting NanoChat from Karpathy and doing an auto research workflow. The agent optimizes something, and Ultra finds a real optimization.
- *Segment 4 [3:40 - end]:* Using Ultra in OpenCode. Simple JSON setup. Example: creating a Newton's cradle in JavaScript.
- *Drafting [0:00]:* "Hey, what's up, everybody?" -> "大家好!"
- *Drafting [0:07]:* "totally open, open meaning weights, data, recipe" -> "完全开放,这意味着权重、数据、训练方案等全部公开。"
- *Drafting [0:17]:* "sparse mixture of experts model" -> "稀疏混合专家 (MoE) 模型。"
- *Drafting [0:27]:* "agentic use cases" -> "智能体 (agentic) 用例。"
- *Drafting [1:03]:* "zip through the installation process" -> "快速跳过安装过程。"
- *Drafting [1:15]:* "set everything up for us" -> "为我们配置好一切。"
- *Drafting [2:17]:* "stapled together by the blueprint called Nemo Claw" -> "由名为 Nemo Claw 的蓝图整合在一起。"
- *Drafting [2:47]:* "cooking show style" -> "像烹饪节目那样快进处理。"
- *Drafting [3:52]:* "simple JSON blob" -> "简单的 JSON 数据块。"
- Check against constraints: Markdown preserved? Yes. Technical terms accurate? Yes. Natural flow? Yes. Code/URLs untouched? Yes. No mention of "Part 1"? Yes.</thought># YouTube Transcript
语言:英语(自动生成)(en)
[0:00] 大家好!我的名字是
[0:01] Chris。今天我将向大家演示
[0:03] NeMo Guard 3 Ultra 的功能。NeMo Guard 3 Ultra 是
[0:05] 我们 NeMo Guard 3 模型家族中的
[0:07] 最新成员。它同样是
[0:09] 完全开放的,“开放”意味着权重、
[0:12] 数据、训练方案(recipe)等全部公开。它
[0:17] 仍然是一个稀疏混合专家(sparse mixture of experts)
[0:19] 模型。它拥有 5500 亿个总参数,其中
[0:23] 550 亿个激活参数。它在
[0:26] 预期擅长的领域表现出色,
[0:27] 也就是智能体(agentic)用例,
[0:29] 比如那些你会使用 Open Code
[0:32] 来处理的任务。NeMo Guard 3 Ultra 非常擅长这些。
[0:34] 接下来,我们将通过几个示例,
[0:36] 看看如何在一些智能体框架中
[0:38] 配置 Ultra,以及在
[0:40] 配置完成后,你可以利用该模型
[0:42] 实现哪些功能。
[0:44] 首先,我们将看一个
[0:46] 使用 NeMo Guard 和 Hermes 的示例。
[0:51] 好了,首先你们会看到
[0:52] 如何将 NeMo Guard
[0:55] 与 Hermes 进行配置。
[0:57] 我们使用相同的安装脚本,
[1:00] 并通过一个环境变量
[1:02] 来指定我们需要 Hermes。
[1:03] 我们将快速跳过
[1:05] 安装过程。这段视频
[1:07] 经过了大约 4 倍速处理。
[1:10] 简单来说,这个过程会自动运行。
[1:11] 完成后,我们将
[1:13] 运行 NeMo Hermes onboard。
[1:15] 这将为我们配置好一切。
[1:18] 它会设置一系列资源。我们将
[1:20] 选择 NVIDIA 端点(endpoints),
[1:21] 并粘贴我们的 NVIDIA API 密钥,
[1:23] 这样我们就可以使用
[1:25] build.nvidia.com 的端点来驱动
[1:26] Hermes。完成后,我们将
[1:29] 将 Ultra 设置为我们用于
[1:31] 推理的实际模型。
[1:35] Ultra 设置好后,我们可以
[1:36] 连接到沙箱并
[1:38] 启动 Hermes agent。
[1:40] Hermes agent 将在
[1:42] OpenShell 安全运行时中启动,
[1:45] 该运行时是在安装 NeMo Guard 时
[1:47] 一并配置的。我们可以在这里与 Ultra 对话。
[1:49] 同样,它是通过 build.nvidia.com
[1:51] 的端点驱动的。我们将设定一个小目标:
[1:54] 获取 Karpathy 的 NanoChat。
[1:56] 拿到 NanoChat 后,我们将
[1:57] 演示一个简单的
[2:01] 自动研究(auto research)工作流示例。
[2:04] 这一切都通过 Hermes 处理,对吧?
[2:06] 它同样运行在 OpenShell 的
[2:09] 安全运行时中,
[2:11] 并由名为 Nemo Claw 的蓝图(blueprint)
[2:13] 整合在一起。在这种情况下,
[2:14] 我们将其称为 Nemo Hermes,
[2:17] 因为它使用了 Hermes。
[2:19] 我们可以看到 NanoChat 已经设置完毕,
[2:21] 智能体进行了一些冒烟测试(smoke tests),
[2:23] 现在我们开始执行这个
[2:25] 非常简单的自动研究示例。
[2:28] 我们只需告诉模型,
[2:30] 直到完成一次优化为止。
[2:33] 我们不会让它进入持久循环。
[2:35] 在这个演示中,我们将等待模型
[2:37] 获得正确结果。
[2:39] 我们再次采用“烹饪节目”式的快进处理,
[2:42] 这样你们就不用盯着屏幕
[2:43] 看好几分钟了,但你可以看到
[2:45] 智能体立即开始工作。
[2:46] 当智能体完成这项工作后,
[2:50] 我们将查看结果。
[2:52] 结果很快就会显示在屏幕上。
[2:54] 我们已经可以看到,
[2:56] 训练正在运行,
[2:58] 这里可能有一个升级点。
[2:59] 我们等待 Hermes 产生
[3:03] 输出。
[3:05] 我们看到,得益于 Ultra,
[3:08] 在这个运行在 Nemo Claw 中的 Hermes
[3:11] 简化版自动研究示例中,
[3:14] 确实发现了一个虽然微小但真实的
[3:16] 优化。
[3:18] 当然,你不仅可以将 NeMo Transformer Ultra
[3:20] 用于 Nemo Claw 配合 Hermes 的场景,
[3:22] 还可以直接在 OpenCode 中使用。
[3:24] 让我们来看一个配置示例。
[3:27] 正如你所见,只需一个简单的 JSON 数据块即可完成配置。
[3:30] 你也可以通过配置文件(configs)来实现。
[3:32] 配置完成后,上手非常简单。
[3:35] 我将向大家展示我们为
[3:38] 主旨演讲(keynote)制作的演示是如何实现的。
[3:40] 基本上,我们输入提示词,
[3:42] 比如:“用 JavaScript 为我制作一个
[3:44] 牛顿摆,不要出错,好吗?”
[3:46] 然后我们将看到 Open Code 开始工作。
[3:48] Open Code 完成工作后,
[3:50] 我们就可以打开想要查看的产出物(artifact)。
[3:52] 现在,我们不需要去手动寻找 HTML 文件,
[3:54] 而是可以这样做:
[4:27] Ultra 已为我们启动了服务器。接下来,
[4:29] 我们将继续操作。
[4:31] 完成后,
[4:33] 我们可以点击链接查看
[4:35] 在主题演讲中看到的 Newton's Cradle 示例。
[4:43] 如果你想进一步了解该模型,可以查看技术博客、
[4:44] 技术报告、配方以及烹饪书。它们可通过
[4:46] GitHub、Hugging Face 获取,或者你也可以
[4:48] 在技术博客本身找到相应链接,下面会提供链接。
[4:56] 我们迫不及待想看到你用 Ime Tron 3 Ultra 做了什么。希望你喜欢这个模型,并告诉我们你发现的任何有趣功能。我们发现它在绘图和制作动画方面表现出色。
[5:07] 我们很高兴看到你们能创造出什么。非常感谢观看,下一期再见。