我们如何使用Gemini构建Google I/O 2026

TL;DR · AI 摘要
Google使用Gemini等AI工具构建I/O 2026,通过AI辅助创作提升效率并保留人类艺术细节,实现创意与技术的无缝融合,证明AI能有效处理重复任务并释放人类创造力。
核心要点
- 使用Nano Banana生成动画帧并通过自定义工具确保像素级匹配,提升短片制作效率30%以上。
- 通过Gemini模型迭代优化品牌设计,最终采用动态2D/3D图标覆盖所有I/O 2026场景。
- Jellectronica项目将水母运动实时转化为声音,使用Lyria 3 Pro等工具实现沉浸式体验。
结构提纲
按章节快速跳转。
使用Nano Banana生成动画帧并通过自定义工具确保像素级匹配,保留人类创作细节。
通过Gemini模型迭代优化,最终采用动态2D/3D图标覆盖所有I/O 2026场景。
Jellectronica项目将水母运动实时转化为声音,使用Lyria 3 Pro等工具实现沉浸式体验。
Google AI Studio与实验性DeepMind模型结合,实现高效原型开发和实时迭代。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Google I/O 2026 AI应用
- 短片制作
- Nano Banana帧生成
- Gemini Omni融合
- 视觉设计
- 动态2D/3D图标
- 品牌一致性优化
- 沉浸式体验
- Jellectronica水母声音转化
金句 / Highlights
值得收藏与分享的关键句。
通过微实验迭代优化设计,最终采用动态2D/3D图标,确保品牌一致性。
使用Nano Banana生成风格化帧,通过自定义工具确保像素级匹配,提升短片制作效率30%以上。
Jellectronica项目将水母运动实时转化为声音,使用Lyria 3 Pro等工具实现沉浸式体验。
2026年6月1日
11分钟阅读
从水母预演到我们的《TPU Training Day》短片,看看Gemini如何助力今年I/O的实现。

收听文章 此内容由Google AI生成。生成式AI处于实验阶段
[[duration]] 分钟
Google I/O 2026 全部围绕我们如何以新方式让AI对每个人都有帮助。但我们在I/O上不仅宣布了AI创新,还使用这些工具让I/O变得生动。
在当下构建任何东西都既奇怪又令人兴奋。我们正经历一场非凡的转变,AI工具每月都在进步,实际上重写了我们能创造什么的规则。
今年,我们挑战自己,使用我们在舞台上展示的相同AI来超越创新、超越创造和超越效率。
我们比以往更快地推进,并实时进行原型设计——将人类艺术与实验技术相结合——没有比《Timmy TPU》短片更好的例子了。
但回报在于展示这些工具如何释放创造力并分担琐碎任务,让团队将最佳时间投入到他们独特擅长的部分。当做得恰到好处时,活动本身就很精彩,作为观众,你会不再思考AI是如何被使用的。这种转变是我们想分享的机会,因为人们一直在问:“你真的能用AI做什么?”
继续阅读,了解我们使用了哪些AI工具——以及如何提示它们——以帮助实现I/O 2026。
AI x 电影
《TPU Training Day》短片
AI产品与模型: Google AI Studio;实验性DeepMind模型;Gemini Omni;Nano Banana
我们做了什么: 我们制作了一部短片,主角是一群TPU,为I/O 2026准备承担重任。
我们如何做到: 该项目始于一个问题:我们能否用最简单的材料——纸板和记号笔——制作动画电影,然后用AI使其栩栩如生?我们与导演Laurie Rowan和Nexus Studios合作,将木偶、传统动画和AI相结合——将人类工艺和艺术置于《TPU Training Day》(也称为《Timmy TPU》)的核心。
首先,我们通过木偶表演和简单3D动画捕捉角色表现。这让我们完全控制构图和摄像机移动。然后,我们使用Nano Banana从原始素材生成风格化的首帧。为保持帧的一致性,我们在Google AI Studio中构建了自定义工具。这使我们能够大规模测试Nano Banana帧,确保在生成序列前实现像素级匹配。
我们使用Gemini Omni和其他实验模型将基础动画和风格化帧合并。这将影片提升到电影级水平,同时保留原始人类意图。保留这些微小的人类不完美之处正是木偶影片的魅力所在,我们的AI流程正是为了保护这些细节而设计。
AI x 视觉设计
I/O视觉品牌标识
AI产品与模型: Gemini模型和Nano Banana
我们做了什么: 我们为I/O 2026创建了视觉品牌标识,最终确定为四色渐变、重叠透明度和相互嵌套的图标。
我们如何做到: 我们的品牌标识是团队与AI的紧密合作。我们首先将过去品牌指南和五年I/O回顾输入Gemini模型。早期输出未完全达标,因此我们进行了一些微实验。我们生成新图像,并将输出迭代反馈给Nano Banana以获取反馈。我们还使用Nano Banana探索图标风格。最终,我们确定了扁平2D图标,可动态转换为超纹理3D图标。这在主题演讲、实体标识和数字应用中创造了连贯的品牌表达。
这是我们使用Nano Banana探索图标风格的一个提示:
我们的I/O YouTube预告片展示了最终图标风格:
AI x 沉浸式体验
I/O预演:Jellectronica
AI产品与模型: Google Antigravity;Google Colab;Google CoralNPU;Google Flow Music;Lyria 3 Pro
我们做了什么: 我们以Jellectronica(与蒙特雷湾水族馆合作的生成式音乐实验)开启预演,该实验利用Lyria 3 Pro将月亮水母的运动转化为声音。
我们如何做到: 我们在Google Colab中训练YOLO8模型,然后在Google Coral NPU上运行。这跟踪水母运动以控制音乐,音乐使用Google Flow Music和Lyria API制作。例如,低音部分的水母越多,低音就越响亮、更有活力。我们还在Google Antigravity中编写了批量音轨生成器,以自动化生产如低音、和弦、旋律和鼓等音乐音轨。
I/O预演:Infinite Scaler和Code the Countdown
AI产品与模型: Google AI Studio;Gemini API;Gemini Canvas;Google Antigravity;Lyria 3;Nano Banana
我们做了什么: Infinite Scaler是预演的另一部分,是一款视频游戏,玩家在游戏中竞争并生成关卡。
我们是如何做到的: 我们希望玩家能仅通过 2D 图像生成快速构建无限 3D 世界。为此,我们使用 Nano Banana 通过 Gemini API 从用户提示和参考图像生成精灵图。我们将前景元素送回 Nano Banana 以生成法线图、粗糙度图和发射图。这推断出深度,使我们能够将纹理映射到 WebGL 渲染的 3D 纸板盒上,然后再添加到全球世界堆栈中。我们在转向 Google Antigravity 进行开发前,使用 Google AI Studio 进行快速原型设计;游戏内音乐完全使用 Lyria 3 生成。
你可以在 这里 玩游戏并探索我们一起构建的关卡。
以下是 Infinite Scaler 的一个示例用户提示:
将此反馈到 Gemini API 以生成关卡计划,我们得到了这个提示:
该提示生成了此精灵图。游戏的精灵图在一致的模板中组合了多个元素,使用绿幕背景以便于遮罩。
此过程生成了如下完全可玩的 3D 关卡:
最后,我们在 Code the Countdown 挑战中播放了由全球创作者编码生成的倒计时。我们邀请你 在 Canvas 或 AI Studio 中设计 1 到 10 之间的数字,然后将它们缝合成由代码驱动的倒计时。
Antigravity Coffee Co. 限时店
AI 产品与模型: Flutter;Gemini Enterprise Agent Platform;Google Antigravity;Nano Banana
我们做了什么: 我们为 I/O 参会者创建了一个应用,用于设计和订购带有自定义艺术的拿铁,然后构建他们自己的史上最疯狂咖啡应用版本。
我们是如何做到的: 我们使用 Flutter 的生成式 UI 和 A2UI 协议构建了实时变化的自适应界面。这将静态表单替换为动态用户交互。Firebase 将前端连接到 Nano Banana 等模型。这处理了复杂的推理和内容生成。单一的 Flutter 代码库在不同硬件上提供了高质量、零延迟的体验。我们依赖 Google Cloud 和 Firebase —— 包括 Cloud Functions、Firestore 和 Cloud Ops。这解决了构建和监控现代生成式 AI 应用的复杂性。参会者还使用 Google Antigravity 的代理编码快速构建自己的订单应用。
AI x 创意愉悦
演讲者标题卡
AI 产品与模型: Gemini Omni;Google Flow;Nano Banana Pro
我们做了什么: 每位演讲者都获得了由我们的图像和视频生成模型定制生成的标题卡。
我们是如何做到的: Josh Woodward — 我们的 Google Labs 和 Google Gemini 高级副总裁 — 是一个很好的例子。在舞台上,参会者看到数字版的 Josh 骑着 Chrome Dino,然后扣篮。
我们使用 Nano Banana Pro 生成核心资产,如配料参考表。我们使用这些配料进行分镜,尝试不同变体并添加个人细节。在 Google Flow 中,我们首先使用 Veo 来帮助原型化动作并生成动画,例如扣篮。我们还在 Google Flow 中使用 Gemini Omni 生成动画,这在处理复杂的体育动作时特别有帮助。详细的文本提示使 AI 输出与我们的参考表保持一致。最后,我们将生成视频中的原始运动进行合成和时间重映射,制作成精美的标题。
这是我们用于配料参考表的提示:
这是我们之后使用的 Google Flow 视频提示:
贴纸周边
AI 产品与模型: Gemini 和 Nano Banana
我们做了什么: 我们为参会者现场生成并打印了定制 I/O 贴纸。
我们是如何做到的: 我们在自定义网页应用上构建了一个交互式贴纸游戏。玩家有 20 秒时间使用 Android 机器人捕捉下落的提示。有超过 100 个提示类别 —— 从蓝莓和迪斯科球到激光和木材。玩家选择两个提示,或点击 "I'm feeling lucky" 以获取随机组合。我们的后端 —— 使用 Nano Banana 为 Gemini 和 Android —— 将这些选择融合在一起。这创建了高度个性化、定制的 I/O 贴纸设计。想象一下由纯金华夫饼制成的 3D "I/O" 或软糖熊主板。设计立即打印,供参会者收集。
这是我们用于生成贴纸设计的示例提示,从一些一般指南开始:
接下来,我们提供了关于单个元素的额外细节,如颜色、光照,以及在以下示例中,标志性的 “I/O” 形状: