T
traeai
登录
返回首页
NVIDIA Developer视频

Nemotron 3 Ultra教程:使用NemoHermes和OpenCode构建自主研究代理

8.5Score
可直接观看的视频资源打开原视频

TL;DR · AI 摘要

Nemotron 3 Ultra是NVIDIA最新开源的稀疏混合专家模型,拥有5500亿总参数和550亿活跃参数,专为代理型用例设计;文章演示了通过NemoHermes搭建自主研究代理的步骤,包括配置NVIDIA API密钥调用build.nvidia.com端点、选择Ultra作为推理模型,并完成简化自动研究任务(如优化NanoChat)以产出真实优化结果。

核心要点

  • Nemotron 3 Ultra是稀疏混合专家模型,总参数5500亿、活跃参数550亿,专注代理型用例(如类OpenCode任务)。
  • 搭建NemoHermes需运行安装脚本、设置Hermes环境变量、粘贴NVIDIA API密钥以使用build.nvidia.com端点,并将Ultra设为推理
  • 演示中NemoHermes(基于Nemo Claw运行时)利用Ultra在简化自动研究任务(如NanoChat)中发现小范围但真实的优化结果。

结构提纲

按章节快速跳转。

  1. Nemotron 3 Ultra是NVIDIA最新开源的稀疏混合专家模型,总参数5500亿、活跃参数550亿,专为代理型用例设计。

  2. §NemoHermes与Ultra的搭建步骤

    搭建需运行安装脚本、设置Hermes环境变量、配置NVIDIA API密钥以使用build.nvidia.com端点,并将Ultra设为推理模型。

  3. 演示中NemoHermes(基于Nemo Claw运行时)利用Ultra完成简化自动研究任务(如NanoChat优化),产出小范围真实优化结果。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • 使用Nemotron 3 Ultra搭建自主研究代理
    • Nemotron 3 Ultra
      • 稀疏MoE模型
      • 550B总/55B活跃参数
      • 代理型用例优化
    • 搭建步骤
      • 安装脚本+环境变量
      • NVIDIA API密钥
      • build.nvidia.com端点
      • Ultra作为推理模型
    • 演示工作流
      • NemoHermes(Nemo Claw)
      • NanoChat任务
      • 小范围优化结果

金句 / Highlights

值得收藏与分享的关键句。

  • 它仍然是一个稀疏混合专家模型。总参数5500亿,活跃参数550亿,并且它擅长你期望它擅长的领域,即代理型用例

    [0:17]-[0:29]

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 我们使用相同的安装脚本。我们使用一个环境变量来控制需要Hermes……我们将选择NVIDIA端点并粘贴NVIDIA API密钥,以便使用build.nvidia.com端点为Hermes提供动力

    [0:57]-[1:26]

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 代理立即开始工作……在这个由Nemo Claw运行的Hermes简化自动研究示例中,Ultra确实找到了一个小但真实的优化

    [2:56]-[3:38]

    ⬇︎ 下载 PNG𝕏 分享到 X
#Nemotron 3 Ultra#NemoHermes#NVIDIA#自主代理#混合专家模型

视频笔记

<thought>* Source: A YouTube transcript (English).

  • Target: Chinese.
  • Content: A technical walkthrough of "NeMo Guard 3 Ultra" (likely a typo for NeMo Guardrails or a specific model family, but I should stick to the terminology used in the text, though "NeMo Guard 3 Ultra" sounds like a specific model name here).
  • Key terms: NeMo Guard 3 Ultra, sparse mixture of experts (MoE), agentic use cases, Open Code, Hermes, NVIDIA endpoints, build.nvidia.com, OpenShell, Nemo Claw, NanoChat, Karpathy, auto research workflow, JSON blob.
  • Format: Markdown with timestamps.
  • "NeMo Guard 3 Ultra": Keep as is (Product name).
  • "sparse mixture of experts model": 稀疏混合专家模型 (Sparse MoE).
  • "agentic use cases": 智能体用例 / Agent 场景.
  • "open weights": 开放权重.
  • "recipe": 配方/方案 (in ML context, usually refers to the training recipe).
  • "active parameters": 激活参数.
  • "harnesses": 框架 / 运行环境.
  • "Hermes": Keep as is (Model/Agent name).
  • "install script": 安装脚本.
  • "environment variable": 环境变量.
  • "endpoints": 端点.
  • "inference": 推理.
  • "sandbox": 沙箱.
  • "secure runtime": 安全运行时.
  • "blueprint": 蓝图.
  • "smoke tests": 冒烟测试.
  • "auto research workflow": 自动研究工作流.
  • "persistent loop": 持久循环.
  • "cooking show style": 像烹饪节目那样(指快进处理)。
  • "artifact": 产出物 / 构件.
  • "JSON blob": JSON 数据块.
  • *Segment 1 [0:00 - 0:46]:* Introduction to NeMo Guard 3 Ultra. It's open (weights, data, recipe), a sparse MoE (550B total, 55B active), great for agentic tasks.
  • *Segment 2 [0:46 - 1:42]:* Setting up NeMo Guard with Hermes. Using install scripts, env vars, NVIDIA endpoints/API keys via build.nvidia.com. Setting Ultra as the inference model.
  • *Segment 3 [1:42 - 3:40]:* Running Hermes agent in OpenShell secure runtime (Nemo Claw blueprint). Example: getting NanoChat from Karpathy and doing an auto research workflow. The agent optimizes something, and Ultra finds a real optimization.
  • *Segment 4 [3:40 - end]:* Using Ultra in OpenCode. Simple JSON setup. Example: creating a Newton's cradle in JavaScript.
  • *Drafting [0:00]:* "Hey, what's up, everybody?" -> "大家好!"
  • *Drafting [0:07]:* "totally open, open meaning weights, data, recipe" -> "完全开放,这意味着权重、数据、训练方案等全部公开。"
  • *Drafting [0:17]:* "sparse mixture of experts model" -> "稀疏混合专家 (MoE) 模型。"
  • *Drafting [0:27]:* "agentic use cases" -> "智能体 (agentic) 用例。"
  • *Drafting [1:03]:* "zip through the installation process" -> "快速跳过安装过程。"
  • *Drafting [1:15]:* "set everything up for us" -> "为我们配置好一切。"
  • *Drafting [2:17]:* "stapled together by the blueprint called Nemo Claw" -> "由名为 Nemo Claw 的蓝图整合在一起。"
  • *Drafting [2:47]:* "cooking show style" -> "像烹饪节目那样快进处理。"
  • *Drafting [3:52]:* "simple JSON blob" -> "简单的 JSON 数据块。"
  • Check against constraints: Markdown preserved? Yes. Technical terms accurate? Yes. Natural flow? Yes. Code/URLs untouched? Yes. No mention of "Part 1"? Yes.</thought># YouTube Transcript

语言:英语(自动生成)(en)

[0:00] 大家好!我的名字是

[0:01] Chris。今天我将向大家演示

[0:03] NeMo Guard 3 Ultra 的功能。NeMo Guard 3 Ultra 是

[0:05] 我们 NeMo Guard 3 模型家族中的

[0:07] 最新成员。它同样是

[0:09] 完全开放的,“开放”意味着权重、

[0:12] 数据、训练方案(recipe)等全部公开。它

[0:17] 仍然是一个稀疏混合专家(sparse mixture of experts)

[0:19] 模型。它拥有 5500 亿个总参数,其中

[0:23] 550 亿个激活参数。它在

[0:26] 预期擅长的领域表现出色,

[0:27] 也就是智能体(agentic)用例,

[0:29] 比如那些你会使用 Open Code

[0:32] 来处理的任务。NeMo Guard 3 Ultra 非常擅长这些。

[0:34] 接下来,我们将通过几个示例,

[0:36] 看看如何在一些智能体框架中

[0:38] 配置 Ultra,以及在

[0:40] 配置完成后,你可以利用该模型

[0:42] 实现哪些功能。

[0:44] 首先,我们将看一个

[0:46] 使用 NeMo Guard 和 Hermes 的示例。

[0:51] 好了,首先你们会看到

[0:52] 如何将 NeMo Guard

[0:55] 与 Hermes 进行配置。

[0:57] 我们使用相同的安装脚本,

[1:00] 并通过一个环境变量

[1:02] 来指定我们需要 Hermes。

[1:03] 我们将快速跳过

[1:05] 安装过程。这段视频

[1:07] 经过了大约 4 倍速处理。

[1:10] 简单来说,这个过程会自动运行。

[1:11] 完成后,我们将

[1:13] 运行 NeMo Hermes onboard。

[1:15] 这将为我们配置好一切。

[1:18] 它会设置一系列资源。我们将

[1:20] 选择 NVIDIA 端点(endpoints),

[1:21] 并粘贴我们的 NVIDIA API 密钥,

[1:23] 这样我们就可以使用

[1:25] build.nvidia.com 的端点来驱动

[1:26] Hermes。完成后,我们将

[1:29] 将 Ultra 设置为我们用于

[1:31] 推理的实际模型。

[1:35] Ultra 设置好后,我们可以

[1:36] 连接到沙箱并

[1:38] 启动 Hermes agent。

[1:40] Hermes agent 将在

[1:42] OpenShell 安全运行时中启动,

[1:45] 该运行时是在安装 NeMo Guard 时

[1:47] 一并配置的。我们可以在这里与 Ultra 对话。

[1:49] 同样,它是通过 build.nvidia.com

[1:51] 的端点驱动的。我们将设定一个小目标:

[1:54] 获取 Karpathy 的 NanoChat。

[1:56] 拿到 NanoChat 后,我们将

[1:57] 演示一个简单的

[2:01] 自动研究(auto research)工作流示例。

[2:04] 这一切都通过 Hermes 处理,对吧?

[2:06] 它同样运行在 OpenShell 的

[2:09] 安全运行时中,

[2:11] 并由名为 Nemo Claw 的蓝图(blueprint)

[2:13] 整合在一起。在这种情况下,

[2:14] 我们将其称为 Nemo Hermes,

[2:17] 因为它使用了 Hermes。

[2:19] 我们可以看到 NanoChat 已经设置完毕,

[2:21] 智能体进行了一些冒烟测试(smoke tests),

[2:23] 现在我们开始执行这个

[2:25] 非常简单的自动研究示例。

[2:28] 我们只需告诉模型,

[2:30] 直到完成一次优化为止。

[2:33] 我们不会让它进入持久循环。

[2:35] 在这个演示中,我们将等待模型

[2:37] 获得正确结果。

[2:39] 我们再次采用“烹饪节目”式的快进处理,

[2:42] 这样你们就不用盯着屏幕

[2:43] 看好几分钟了,但你可以看到

[2:45] 智能体立即开始工作。

[2:46] 当智能体完成这项工作后,

[2:50] 我们将查看结果。

[2:52] 结果很快就会显示在屏幕上。

[2:54] 我们已经可以看到,

[2:56] 训练正在运行,

[2:58] 这里可能有一个升级点。

[2:59] 我们等待 Hermes 产生

[3:03] 输出。

[3:05] 我们看到,得益于 Ultra,

[3:08] 在这个运行在 Nemo Claw 中的 Hermes

[3:11] 简化版自动研究示例中,

[3:14] 确实发现了一个虽然微小但真实的

[3:16] 优化。

[3:18] 当然,你不仅可以将 NeMo Transformer Ultra

[3:20] 用于 Nemo Claw 配合 Hermes 的场景,

[3:22] 还可以直接在 OpenCode 中使用。

[3:24] 让我们来看一个配置示例。

[3:27] 正如你所见,只需一个简单的 JSON 数据块即可完成配置。

[3:30] 你也可以通过配置文件(configs)来实现。

[3:32] 配置完成后,上手非常简单。

[3:35] 我将向大家展示我们为

[3:38] 主旨演讲(keynote)制作的演示是如何实现的。

[3:40] 基本上,我们输入提示词,

[3:42] 比如:“用 JavaScript 为我制作一个

[3:44] 牛顿摆,不要出错,好吗?”

[3:46] 然后我们将看到 Open Code 开始工作。

[3:48] Open Code 完成工作后,

[3:50] 我们就可以打开想要查看的产出物(artifact)。

[3:52] 现在,我们不需要去手动寻找 HTML 文件,

[3:54] 而是可以这样做:

[4:27] Ultra 已为我们启动了服务器。接下来,

[4:29] 我们将继续操作。

[4:31] 完成后,

[4:33] 我们可以点击链接查看

[4:35] 在主题演讲中看到的 Newton's Cradle 示例。

[4:43] 如果你想进一步了解该模型,可以查看技术博客、

[4:44] 技术报告、配方以及烹饪书。它们可通过

[4:46] GitHub、Hugging Face 获取,或者你也可以

[4:48] 在技术博客本身找到相应链接,下面会提供链接。

[4:56] 我们迫不及待想看到你用 Ime Tron 3 Ultra 做了什么。希望你喜欢这个模型,并告诉我们你发现的任何有趣功能。我们发现它在绘图和制作动画方面表现出色。

[5:07] 我们很高兴看到你们能创造出什么。非常感谢观看,下一期再见。

AI 可能会生成不准确的信息,请核实重要内容

Nemotron 3 Ultra教程:使用NemoHermes和OpenCode构建自主研究代理 | NVIDIA Developer | traeai