Imgix 如何使用 NVIDIA Blackwell 驱动的 G4 VM 每日处理 80 亿张图像

TL;DR · AI 摘要
Imgix 使用 NVIDIA Blackwell 驱动的 G4 VM 处理每日 80 亿张图像,实现 50% 延迟降低和 6 倍吞吐量提升。
核心要点
- Imgix 每天处理超过 80 亿张图像和视频。
- 采用 G4 VM 后,Imgix 将延迟降低了 50%,吞吐量提高了 6 倍。
- G4 VM 配备 NVIDIA RTX PRO 6000 Blackwell GPU,支持实时图像处理和多请求并行处理。
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Imgix 图像处理
- 引言
- 挑战:大规模即时视觉效果
- 采用运行 Google 的系统
- Imgix 架构内部
- Ingestion
- Decoding
- Transformation
- Encoding and Delivery
- 高级视频和图像智能
金句 / Highlights
值得收藏与分享的关键句。
每天,Imgix 为这些品牌和其他许多品牌提供超过 80 亿张图像和视频。
通过转向由 NVIDIA RTX PRO 6000 Blackwell GPU 驱动的 G4 VM,Imgix 加速了其实时处理能力,将中位延迟减少了 50%,并将每个节点的吞吐量提高了 6 倍。
G4 VM 的自定义 P2P 互连比标准配置的吞吐量高出 168%。
标题:Imgix 如何借助 NVIDIA Blackwell 驱动的 G4 虚拟机每日处理 80 亿张图片
来源 URL:https://cloud.google.com/blog/products/infrastructure/how-imgix-processes-8-billion-images-daily-with-g4-vms-powered-by-nvidia-blackwell/
发布日期:2026-05-12
Markdown 内容: 现代网络高度视觉化。用户时间有限且注意力易分散,因此企业深知必须在数秒内通过引人入胜的图片、视频、动画等视觉元素吸引潜在客户。这也是 Bugatti、Yeti、Porsche、Spotify 和 Sonos 等知名品牌依赖 Imgix 作为其在线视觉内容核心引擎的原因。
Imgix 每日为这类品牌及其他众多客户处理超过 80 亿张图片和视频。凭借统一媒体优化、AI 转换与全球交付的平台,Imgix 确保合作伙伴的数字体验既快速又个性化,且具备卓越性能。如今,领先企业对实时、高保真媒体的需求日益迫切,且要求处理速度极快。
为满足这一需求,Imgix 已将基础设施从私有数据中心迁移至基于 Google Cloud AI 超算平台 的全栈 GPU 环境。通过采用搭载 NVIDIA RTX PRO 6000 Blackwell GPU 的 G4 虚拟机,Imgix 显著提升了实时处理能力,将中位延迟降低 50%,单节点吞吐量提升 6 倍,且无需修改核心应用代码。
**挑战:规模化实时视觉体验**
要吸引用户注意力,企业需要能同时触达海量设备的丰富、快速加载内容。
其中关键环节是实时转换——包括缩放、格式协商及艺术效果应用——而实现这些转换所需的计算能力极为庞大。
若技术效率低下,加载速度将变慢,品牌可能因此损害用户体验。Imgix 的解决方案是“按需生成”理念。实现此目标需高性能实例。借助 G4 虚拟机,Imgix 能在用户请求时即时处理图片,而非预渲染并存储数百万种图片变体。
**采用 Google 云运行的系统**
当企业基于 Google Cloud 构建应用时,获得的远不止服务器:它们接入了驱动 Google 数十亿用户产品的同一智能引擎。Imgix 通过使用 G4 虚拟机充分利用了这一结构性优势。
G4 虚拟机集成八颗 NVIDIA RTX PRO 6000 Blackwell GPU、两颗 AMD Turin CPU 以及 Google Titanium 卸载功能——后者如同企业服务器的专属行政助理,后台处理安全与数据流量等“行政事务”,让主处理器专注于核心计算任务。
G4 虚拟机的定制点对点互连(P2P interconnect)可提供比标准配置高 168% 的吞吐量。借助此架构,Imgix 能将所有图片处理操作迁移至 NVIDIA GPU,并在集群中并行处理多项请求。
**Imgix 架构解析**
Imgix 提供 150 多种视觉滤镜,其架构可动态处理用户选择的转换请求。处理流程包含四个核心阶段:

- 摄入(Ingestion):系统直接从客户处获取资源,并路由至 Google Cloud Storage (GCS) 上的 2.5 PB 存储缓存。这一高速层以冗余、地理分布式的基础设施替代了不可靠的随机网络请求。
- 解码(Decoding):高性能 C 库结合 nvJPEG 将资源解码为原始 RGBA 数据。这利用 G4 虚拟机的海量并行能力,同时处理霍夫曼解码、反离散余弦变换及色彩空间转换等多阶段操作。
- 转换(Transformation):自定义 Vulkan 计算着色器栈处理核心计算。与固定图形管线不同,这些着色器将缩放或遮罩等转换视为并行数学问题,而非标准图形任务,使 G4 虚拟机集群能同时处理数千像素操作。
- 编码与交付(Encoding and Delivery):转换完成后,图片通过硬件加速工具(如 NVENC)重新编码,并经全球 CDN 交付。由于 G4 虚拟机内置独立的 NVENC(编码)与 NVDEC(解码)硬件引擎,CUDA 核心上的并发图片操作不会受阻。
**高级视频与图像智能**
Imgix 还利用 NVIDIA CUDA 库实现高性能视频分析。通过集成 NVIDIA DeepStream,它能在视频流中实时执行物体追踪,实现自动化内容分析。

对于静态图像,Imgix 则通过 nvJPEG 将计算密集型 JPEG 解码直接卸载至 GPU。这避免了高分辨率资源摄入时的 CPU 瓶颈,同时使自定义 Vulkan 计算着色器能立即在 GPU 内存中的原始 RGBA 数据上执行像素级转换。
**成果:速度提升 50%,吞吐量最高达 6 倍**
得益于迁移到 G4 虚拟机,Imgix 在无需重写核心逻辑的前提下,实现了上述显著性能提升:
- 处理延迟降低50%: 中位延迟从100毫秒降至50毫秒。
- 吞吐量提升5倍至6倍: 其G4虚拟机现在可处理比上一代节点高六倍的工作负载。
- 无缝迁移: Imgix通过更新Terraform脚本支持G4虚拟机,无需修改任何应用代码。
“依托Google Cloud的AI超算不仅优化了现有工作负载,更确保了平台的未来兼容性。它为我们提供了基础算力,使我们能无缝整合高级生成式AI能力至实时工作流,助力客户在全球规模下突破视觉叙事的边界。”——Alfonso Acosta,Imgix工程负责人
**规模化编排**
为支撑客户每日处理的数十亿张图片和视频请求,Imgix构建了复杂的混合编排模型:

- 管理层: Google Cloud Run 负责管理会话与账户层。
- 核心处理: Google Compute Engine 管理的实例组托管G4虚拟机,允许自定义软件直接调用整机资源,无需容器"切片"。
- 动态扩缩容: 自动扩缩容基于自定义应用指标(如机器队列长度)而非标准CPU利用率,确保系统最昂贵组件实现最大效率。
- 自愈机制: 自定义监控系统实时检测驱动故障,自动终止并重启GPU实例,无需人工干预。
- 性能优化: 为维持峰值性能,Imgix使用NVIDIA Nsight Systems定位并解决代码瓶颈。
**未来:从实验到落地**
即便已实现显著性能提升,Imgix仍在持续扩展AI基础设施,使客户能使用生成式填充、背景替换、物体移除和图像放大等高级功能。
此类功能依赖高性能机器学习系统,需在不损失速度或质量的前提下处理日益复杂的计算。通过采用Google AI超算,Imgix现已高效部署并提供这些模型,为客户提供实时、可投入生产的AI编辑能力。随着对更动态、个性化视觉体验的需求增长,这一基础确保Imgix能持续可靠地规模化交付强大功能。
**立即启程**
G4虚拟机原生兼容Google Compute Engine、Google Kubernetes Engine、Google Cloud Storage及Vertex AI。
- 深入探索: 查看Imgix GitHub架构。
- 开始构建: 阅读G4虚拟机文档。
发布于