T
traeai
登录

产品

什么是 LiteRT

用于macOS桌面应用的本地推理引擎,支持Gemma 4 12B的高效端侧运行。

为什么现在值得关注?

最近变化

2026-06-03 · Gemma 4 12B通过统一架构移除独立多模态编码器,实现端到端多模态处理。

LiteRT 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。

📰 LiteRT 最新动态

已收录 4 篇与「LiteRT」相关的 AI 资讯和分析。

Accelerating on-device AI: A look at Arm and Google AI Edge optimization

加速设备端AI:解析Arm和Google AI Edge优化

Google Developers Blog1644 字 (约 7 分钟)
85

文章介绍了Arm和Google合作优化边缘AI推理,通过SME2架构和Google AI Edge工具链提升设备端AI性能。

入选理由:Arm SME2使CPU成为高性能AI加速器,推理速度提升5倍

精选文章#AI Edge#Arm#机器学习#边缘计算中文
Blazing fast on-device GenAI with LiteRT-LM

LiteRT-LM:设备端 GenAI 的极速体验

Google Developers Blog1574 字 (约 7 分钟)
75

Google AI Edge 发布 LiteRT-LM 推理引擎,专为在边缘设备上高效运行 Gemma 4 模型设计,支持 Android、iOS、Web 多平台,GPU 推理可达 76 tokens/sec,结合 Multi-Token Prediction 技术实现 2.2 倍加速。

入选理由:LiteRT-LM 在 Android GPU (OpenCL) 上实现 52 tokens/sec 解码速度,iOS (Metal) 达 56 tokens/sec,WebGPU 在 MacBook Pro 上可达 76 tokens/sec

精选文章#Google AI Edge#LiteRT-LM#Gemma 4#边缘AI#端侧推理英文
Gemma 4 12B is here! 

It comes with a new, unified architecture that removes separate multimodal en...

Gemma 4 12B 正式发布!

Patrick Loeber(@patloeber)172 字 (约 1 分钟)
72

Gemma 4 12B采用移除独立多模态编码器的统一架构,支持本地视觉音频理解与高级Agent推理,并推出基于LiteRT的macOS桌面应用。

入选理由:Gemma 4 12B通过统一架构移除独立多模态编码器,实现端到端多模态处理。

精选推文#Gemma 4#多模态大模型#LiteRT#智能体AI英文
Google Developers Blog 图标

Google Tensor SDK Beta with LiteRT 发布

Google Developers Blog959 字 (约 4 分钟)
65

Google发布Tensor SDK Beta版本,为Pixel 10系列设备提供设备端机器学习能力,通过与LiteRT的深度集成实现统一的开发工作流,并推出包含100+模型的Model Garden,支持PyTorch/TFLite模型编译和TPU推理部署。

入选理由:Tensor SDK Beta现已支持Pixel 10系列设备,可调用Tensor SoC中专用TPU进行推理加速

精选文章#Google Tensor#LiteRT#边缘AI#设备端机器学习#Pixel英文

与「LiteRT」经常一起出现的 AI 术语。

💡 想追踪「LiteRT」的长期趋势?去 实体雷达 · LiteRT 查看详细分析和跨材料问答。

AI 可能会生成不准确的信息,请核实重要内容