T
traeai
登录
返回首页
The Keyword (blog.google)

Running Guide agent: A step towards running unbounded

6.2Score
Running Guide agent: A step towards running unbounded

TL;DR · AI 摘要

Google DeepMind推出Running Guide Agent,通过Pixel 10 Pro和Gemma 4模型为视障跑者提供实时语音导航,实现无物理辅助的独立跑步,但尚处原型阶段,未公开发布。

核心要点

  • 使用Pixel 10 Pro本地运行分割模型,实现零延迟STOP警报和方向滴答声引导。
  • 采用Gemma 4 E4B模型结合Smarter Frame Selection,仅处理高熵帧以降低延迟并提升推理效率。
  • 通过Planner、Coach、Break三个智能代理协同工作,支持目标设定、实时警告和休息管理。

结构提纲

按章节快速跳转。

  1. Running Guide Agent是一个为视障跑者设计的AI辅助系统,旨在实现无物理引导的独立跑步。

  2. 系统采用本地分割模型与Gemma 4推理双路径架构,确保实时响应与高安全性。

  3. 系统由Planner、Coach和Break三个智能代理协同,分别负责目标设定、实时警告和休息管理。

  4. 正在测试智能眼镜作为输入设备,并与SG Enable合作进行真实用户迭代测试。

  5. 该系统是Google AI代理新阶段的展示,结合边缘计算与世界理解,追求完全自主导航。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • Running Guide Agent: AI for Blind Runners
    • Hardware Platform
      • Pixel 10 Pro (chest-mounted)
      • Intelligent eyewear (prototype)
    • AI Architecture
      • On-device segmentation (low-latency safety)
      • Gemma 4 E4B with Smarter Frame Selection
    • Multi-Agent System
      • Planner: goals + Maps + weather
      • Coach: DANGER/WARNING/NOTICE triage
      • Break: pause/resume management

金句 / Highlights

值得收藏与分享的关键句。

  • 在Pixel 10 Pro上本地运行的分割模型,通过方向性滴答声提供即时“停止”警报,无需蜂窝网络即可保障安全。

    A hybrid architecture for uncompromising safety

    ⬇︎ 下载 PNG𝕏 分享到 X
  • Gemma 4 E4B采用智能帧选择技术,仅分析地形突变等高熵帧,降低延迟的同时保持高相关性指导。

    A hybrid architecture for uncompromising safety

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 教练代理将反馈分为三级严格优先级:危险(需立即避让)、警告(附近障碍物)和通知(即将转弯)。

    A multi-agent framework

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 智能眼镜提供更宽更稳定的视野,相比胸挂手机显著优化了多模态模型的数据输入质量。

    Intelligent eyewear and community partnerships

    ⬇︎ 下载 PNG𝕏 分享到 X
#Google DeepMind#Gemma 4#无障碍AI#边缘计算#Pixel 10 Pro
打开原文

2026年5月20日

4分钟阅读

Running Guide Agent 是一款跑步辅助工具,帮助视障和低视力运动员在无需物理引导线或人类向导的情况下独立跑步。

R

Robin Dua 平台与设备部门 AI 创新与研究高级总监

Image 1: Miguel

Miguel de Andrés-Clavera Google DeepMind 组产品负责人

视频 4

音频 3

收听本文 本内容由 Google AI 生成。生成式 AI 仍处于实验阶段

[[duration]] 分钟

对于视障和低视力(BLV)运动员而言,传统上跑步需要物理连接——无论是人类向导还是画在地上的跑道线。今天,我们很高兴分享如何通过 Running Guide Agent 实现这一转变:这是一款可访问性代理,利用实时环境感知能力,帮助低视力运动员跑步。它标志着从简单的路径跟随迈向高级实时空间推理的巨大飞跃。在不断完善这项技术的过程中,我们的目标很简单:让每位跑者都能实现无辅助的独立奔跑。

为绝对安全设计的混合架构

基于我们此前的 Project Guideline 工作,Running Guide Agent 使用佩戴在胸前的 Pixel 10 Pro 智能手机,实时观察前方路径,并通过听觉反馈引导用户。由于高速运动对可靠性要求极高,我们构建了一种混合双路径架构:

  • 设备端分割: 该模型完全离线运行在 Pixel 10 的定制芯片上,确保超低延迟的安全保障。它会立即发出“停止”警报和转向提示——以方向性滴答声的形式呈现,即使在无蜂窝网络连接的情况下,也能让跑者保持可靠的方向感。
  • Gemma 4 的高级推理: 借助 Gemma 4 E4B,该路径在设备端处理复杂的多模态输入(图像与文本),实现高级场景理解。为降低延迟,我们采用智能帧选择机制:模型仅分析“高熵”帧——如地形突变或新障碍物——从而提供更快、更相关的指导。

多代理框架

Running Guide Agent 是一个协作式多代理框架,旨在为 BLV 用户提供顺畅的跑步体验:

  • 规划代理: 利用 Gemma 4 的函数调用功能,该代理获取天气和 Google 地图数据,与跑者对话以设定训练目标,并校准其数字起跑线。
  • 教练代理: 在跑步过程中提供简洁、电报式的语音提示。它将反馈按严格优先级分类:危险(需立即避让)、警告(附近有跑者或障碍物)和通知(即将出现弯道)。
  • 休息代理: 管理休息间隔,允许运动员随时暂停或恢复训练。

智能眼镜与社区合作

尽管胸前佩戴的 Pixel 10 Pro 是一个坚实的基础,但我们正在智能眼镜上原型化 Running Guide Agent。可穿戴眼镜提供更宽广、更稳定的视野,极大优化了输入多模态模型的数据质量。眼镜直接将数据流传输至 Pixel 设备,实现硬件与环境 AI 的无缝融合。

智能眼镜中的跑者视角

为确保我们与社区共同开发,我们已与新加坡残疾人与包容性事务主管机构 SG Enable 建立合作。通过让我们的工程团队直接与 BLV 跑者进行实地测试,我们可以迭代设计出真正满足他们需求的工具。

Running Guide Agent 是 Google AI 新一代代理的有力展示。运动员将能够使用我们的工具——融合零延迟边缘计算与深度世界理解能力——突破自身极限,以完全无辅助的自信探索世界。

获取更多来自 Google 的故事。

已完成。只需再一步。

请检查您的收件箱以确认订阅。

您已订阅我们的通讯。

您也可以通过以下方式订阅:

相关文章

.

AI 可能会生成不准确的信息,请核实重要内容

Running Guide agent: A step towards running unbounded | The Keyword (blog.google) | traeai