XNNPACK 最近有什么新动态？

traeai 已收录 1 篇与 XNNPACK 相关的内容。最新一篇是「Blazing fast on-device GenAI with LiteRT-LM」，由 Google Developers Blog 发布。

产品

XNNPACK

Google 的高性能神经网络推理加速库。

已跟踪 1 条高相关材料

TraeAI 观察

如果只读 3 篇

Blazing fast on-device GenAI with LiteRT-LM

Google Developers Blog · 7.5 分

Google AI Edge 发布 LiteRT-LM 推理引擎，专为在边缘设备上高效运行 Gemma 4 模型设计，支持 Android、iOS、Web 多平台，GPU 推理可达 76 tokens/sec，结合 Multi-Token Prediction 技术实现 2.2...

Blazing fast on-device GenAI with LiteRT-LM

Google Developers Blog5月20日1574 字 (约 7 分钟)

Google AI Edge introduces LiteRT-LM, an optimized inference engine for deploying Gemma 4 models on edge devices, supporting Android, iOS, and web platforms with GPU inference reaching 76 tokens/sec and Multi-Token Prediction delivering up to 2.2x speedup.

入选理由：LiteRT-LM 在 Android GPU (OpenCL) 上实现 52 tokens/sec 解码速度，iOS (Metal) 达 56 tokens/sec，WebGPU 在 MacBook Pro 上可达 76 tokens/sec

FeaturedArticle#Google AI Edge#LiteRT-LM#Gemma 4#Edge AI#On-device Inference英文

跨材料问答 · XNNPACK

回答基于：XNNPACK 相关 1 条材料