Introducing Dynamo Snapshot, our approach for fast startup for inference workloads on Kubernetes, wh...

NVIDIA AI(@NVIDIAAI)

NVIDIA AI(@NVIDIAAI)2026年5月27日

Introducing Dynamo Snapshot, our approach for fast startup for inference workloads on Kubernetes, wh...

8.5内容质量

TL;DR · AI 摘要

NVIDIA 引入 Dynamo Snapshot，将 Kubernetes 上推理工作负载的启动时间从分钟缩短到不到 5 秒。

核心要点

Dynamo Snapshot 将启动时间从分钟缩短到不到 5 秒。
使用 GMS 和 Linux 原生 AIO 加速权重恢复。
通过并发权重恢复和并行 memfd 恢复提高 CRIU 恢复性能。

结构提纲

按章节快速跳转。

§Introduction
介绍 Dynamo Snapshot 的背景和目标。
·Problem Statement
阐述生产环境中推理工作负载需求波动的问题。
·Solution Overview
概述 Dynamo Snapshot 的解决方案和关键技术。
›GMS and AIO
介绍 GMS 和 Linux 原生 AIO 在权重恢复中的作用。
›Parallel Memfd Restoration
说明并行 memfd 恢复如何加速 CRIU 恢复性能。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Dynamo Snapshot

金句 / Highlights

值得收藏与分享的关键句。

Dynamo Snapshot reduces startup time from minutes to under 5 seconds.
⬇︎ 下载 PNG 𝕏 分享到 X
Snapshot leverages GMS to enable concurrent weight restoration over a high-speed interconnect.
⬇︎ 下载 PNG 𝕏 分享到 X
Using Linux native AIO and parallel memfd restoration to accelerate CRIU restore performance.
⬇︎ 下载 PNG 𝕏 分享到 X

#NVIDIA#Kubernetes#Dynamo Snapshot#推理工作负载#GMS

打开原文

NVIDIA AI on X: "推出 Dynamo Snapshot，我们的快速启动方法，适用于 Kubernetes 上的推理工作负载，将启动时间从分钟缩短到不到 5 秒。在生产推理部署中，需求会随时间波动。冷启动推理工作负载可能需要几分钟，https://t.co/QiN1kGXwKQ" / X

别错过发生了什么

Image 1: Square profile picture

NVIDIA AI ![Image 2](https://x.com/NVIDIAAI)

@NVIDIAAI

推出 Dynamo Snapshot，我们的快速启动方法，适用于 Kubernetes 上的推理工作负载，将启动时间从分钟缩短到不到 5 秒。在生产推理部署中，需求会随时间波动。冷启动推理工作负载可能需要几分钟，导致 GPU 空闲，不生成任何令牌且不处理任何请求。Snapshot 利用 GMS 启用高速互连上的并发权重恢复，同时使用 Linux 原生 AIO 和并行 memfd 恢复来加速 CRIU 恢复性能。

11:56 PM · May 27, 2026

·

17.9K Views

8

37

176

63

阅读 8 条回复