Google Tensor SDK Beta with LiteRT 发布
TL;DR · AI 摘要
Google发布Tensor SDK Beta版本,为Pixel 10系列设备提供设备端机器学习能力,通过与LiteRT的深度集成实现统一的开发工作流,并推出包含100+模型的Model Garden,支持PyTorch/TFLite模型编译和TPU推理部署。
核心要点
- Tensor SDK Beta现已支持Pixel 10系列设备,可调用Tensor SoC中专用TPU进行推理加速
- LiteRT提供统一API抽象底层编译器/运行时,支持PyTorch和TFLite模型编译及CPU/GPU回退机制
- Model Garden提供100+预训练模型,包括Gemma 3 1B等生成式AI模型,支持计算机视觉、语音识别等场景
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Google Tensor SDK Beta发布
- LiteRT集成
- 统一API抽象
- 模型编译流程
- 部署与分发机制
- 推理执行与回退
- Model Garden
- 100+预训练模型
- Gemma 3生成式AI
- 视觉/语音/语言场景
- 目标设备
- Pixel 10系列
- Tensor TPU加速
金句 / Highlights
值得收藏与分享的关键句。
Tensor ML SDK从实验阶段进入Beta,使开发者能够在Google Tensor的TPU上无缝构建和部署AI体验。
LiteRT抽象了底层供应商特定的SDK(包括编译器和运行时),并通过统一、简化的面向开发者API暴露它们。
模型花园提供100+经典ML模型和生成式AI模型(Gemma 3 1B),以及可直接下载的预编译模型库。
它还允许通过指定CPU或GPU作为备选选项来启用强大的回退机制,并根据TPU可用性自动使用它们。
MAY 19, 2026
Google Tensor ML SDK 赋能开发者从 Google Pixel 10 系列设备 1 开始构建设备端机器学习能力,同时利用 Pixel 定制设计的 Google Tensor 系统级芯片(SoC)及其专用张量处理单元(TPU)推理加速器。今天,Tensor ML SDK 已从实验访问计划(EAP)毕业,进入 Beta 阶段,使开发者能够通过 Google Tensor 的 TPU 无缝构建和部署 AI 体验。Tensor 的 TPU 解锁了交互式、实时和私密的设备端 AI 体验,例如 Pixel 的 Pro Zoom 2、Add Me、Voice Translate 3 和 Call Notes 4 等。
观看我们的产品管理团队深入探讨 Tensor SDK 及其对 Pixel 开发未来的意义。
Beta 版本的发布为开发者带来了两大优势:
- 与 LiteRT 统一的开发者工作流程
- 模型花园,可在 Tensor 的 TPU 上最优运行 100+ 模型
**与 LiteRT 统一的开发者工作流程**
LiteRT 是 Google 用于在边缘平台上进行高性能机器学习(ML)部署的设备端框架。它抽象了底层、供应商特定的 SDK(包括编译器和运行时),并通过统一、简化的面向开发者的 API 暴露它们。Tensor ML SDK 现已与 LiteRT 集成,提供无缝的开发者工作流程,可通过 Tensor 的 TPU 在 Google Pixel 上转换、编译、部署和运行 ML 和生成式 AI 模型。
- 编译: 使用 LiteRT Torch 将 PyTorch 或 TFLite 模型转换并编译为可利用 Tensor TPU 的优化二进制文件。
- 部署: 使用 Play 功能分发来分发和安装连接到设备端 TPU 驱动程序的兼容运行时和编译器库。使用 AI 包(属于 Play for On-device AI 的一部分)在应用程序中捆绑和交付编译后的模型文件。
- 运行推理: 利用 LiteRT 运行时 仅需几行代码即可在 TPU 上运行模型。它还允许您通过指定 CPU 或 GPU 作为辅助选项来启用强大的回退机制,并根据 TPU 可用性自动使用它们。
有关完整的详细指南,包括 colab 和示例应用,请访问 LiteRT NPU 文档。
**Tensor 上 100+ 模型的模型花园**
Tensor SDK Beta 允许通过大型模型花园将包括计算机视觉和语音识别在内的广泛模型直接部署到 Pixel 设备。模型花园提供超过 **100+ 经典 ML 模型** 和生成式 AI 模型(Gemma 3 1B),以及可直接从 LiteRT Hugging Face 社区下载的预编译模型库。
以下是开发者可以使用可用模型构建的内容:
- 小型语言模型: 使用 Function Gemma 为应用交互启用本地操作。使用 EmbeddingGemma 为您的应用添加丰富的语义功能。
- 智能内容创建: 构建可生成实时文本、应用智能图像滤镜和执行高级计算摄影效果的功能——如人像虚化
- 视觉与理解: 实现对象检测、深度映射、身体跟踪、多模态图像到文本理解,为能够识别和响应用户环境的相机应用提供动力
- 音频与无障碍: 端到端运行语音识别,提供安全、低延迟的音频转录、语音控制的无障碍工具和边缘翻译
以下是一些演示,供您参考:
Video 3 图像分割 LiteRT 示例应用(左)AI Edge Gallery 上的 Function Gemma 与 LiteRT LM - 移动操作(右)
**立即开始使用 Pixel**
我们邀请开发者社区从 Pixel 10 系列开始构建新型智能和响应式 AI 应用程序。探索 Tensor SDK,尝试在 TPU 上运行您的模型,并与 GitHub 上的 LiteRT 社区分享您的反馈。
如果您参加 I/O 大会——无论是现场还是线上——请务必查看我们专门的代码实验室和示例应用。您将获得使用 Tensor SDK、编译模型以及通过 TPU 将它们部署到 Pixel 10 系列设备的实践经验。
- Google Tensor SDK 与 LiteRT 文档
- 浏览模型花园中的 100+ 模型
- 在 LiteRT Hugging Face 社区下载预编译模型
- 开始 Google I/O Tensor SDK 代码实验室
- 查看 Tensor ML SDK 许可和分发条款
支持的设备:Pixel 10、Pixel 10 Pro、Pixel 10 Pro XL 和 Pixel 10 Pro Fold。
我们迫不及待想看到你在 Pixel 上创造的一切!
**致谢**
这个项目得益于多个团队的协作。我们感谢他们的重大贡献:
_Tensor 团队_:Himangshu Roy、Chirag Gupta、Rishubh Khurana、Rachit Agrawal、Priya Patel、Prakul Sawhney、Abby Chung、Malini P V、Jui Pradhan、Naina Singla、Debapriya Maji、Aditya Srivastava、Abhishek Jatram、Vibhu Agrawal、Rachana Jayaram、Lokesh Vutla、Abhishek Singh、Annie Fu、Chen-Hao Liao、Chanchal Raj、Ty Werbicki、Sriram Kashyap M S、Shubham Saini、Thiru Ramasamy、Jayanthan K、Payal Agarwal、Pranjal Srivastava、Yathish Reddy M、Akhilesv Ravi、Harold Yang、Yi Yo、Priyanka Mittal、Ishaan Agrawal、Vivek Kumar、Minje Park、YoonKyung Kim、Eunji Heo、Mehran Nekuii、John Joseph、Nett Phasukavanich、Jess Tsopanis、Chen-Hao Liao、Jeff Setter、Ganesh Rao、Neena Maldikar._
_LiteRT 团队:_Lu Wang、Weiyi Wang、Jingjiang Li、Gerardo Carranza、Terry (Woncheol) Heo、Andrew Zhang、Chenchen Tang、Shuangfeng Li、Changming Sun、Somdatta Banerjee、Na Li、Yu-hui Chen、Tenghui Zhu、Alice Zheng、Chintan Parikh、Sachin Kotwani、Cormac Brick、Matthias Grundmann、Salil Tambe._
**许可**
https://ai.google.dev/edge/litert/next/tensor_ml_terms
1 - 支持的设备包括 Pixel 10、Pixel 10 Pro、Pixel 10 Pro XL 和 Pixel 10 Pro Fold。
2 - 仅在特定国家和地区提供。
3 - 仅在特定国家和地区提供。结果可能有所不同。请核实回复的准确性。
4 - 仅在美国提供。仅限英语
在 io.google 探索此公告和所有 Google I/O 2026 更新。
[](https://developers.googleblog.com/one-year-of-innovation-celebrating-100k-members-in-the-google-cloud-x-nvidia-developer-community/) 上一篇
下一篇
[](https://developers.googleblog.com/build-long-running-ai-agents-that-pause-resume-and-never-lose-context-with-adk/)