AI Master视频2026年5月22日

再见 Seedance… 迎接 Gemini Omni：谷歌新 AI 视频模型太疯狂了

8.5内容质量

可直接观看的视频资源打开原视频

TL;DR · AI 摘要

Google 发布 Gemini Omni 视频模型，支持多模态输入并具备物理理解能力，填补 Sora 停运后的免费市场空白。

核心要点

Gemini Omni 支持文本、图像、音频、视频和绘图五种输入方式生成视频。
该模型在测试中展示了对物理规律的理解，如旋转动量和因果序列反应。
用户可通过 Google AI Plus/Pro/Ultra 或 YouTube Shorts Remix 免费访问 Gemini Omni Flash。

结构提纲

按章节快速跳转。

§介绍 Gemini Omni 模型
Gemini Omni 是 Google 推出的新一代 AI 视频生成模型，具备多模态理解和物理模拟能力。
·模型功能与特性
支持文本、图像、音频、视频及绘图作为输入源，输出高质量视频内容。
·访问方式与部署情况
已向 Google AI Plus/Pro/Ultra 用户开放，并将通过 YouTube 应用提供免费试用。
›界面设计更新
采用名为 Neural Expressive 的全新交互界面，提升移动端操作体验。
›实际演示案例分析
通过多个场景验证其物理逻辑处理能力和因果链表达准确性。
›与其他模型对比表现
相比 C Dance 2.0，在因果顺序和细节一致性方面表现出更强性能。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Gemini Omni
- Features
  - Multi-modal Input
  - Physics Understanding
- Access
  - Google AI Subscribers
  - YouTube Free Access
- Performance
  - Cause-effect Sequencing
  - Comparison with C Dance 2.0

金句 / Highlights

值得收藏与分享的关键句。

你可以输入文本、图片、音频、视频甚至手绘草图，然后得到一段视频。
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X
茶壶掉落时确实带有旋转动量再撞击地面。
— 第 2 段
⬇︎ 下载 PNG 𝕏 分享到 X
虽然不是完美无缺，细节一致性略有偏差，但考虑到目前就能使用的模型来说已经很令人印象深刻。
— 第 3 段
⬇︎ 下载 PNG 𝕏 分享到 X

#Gemini Omni#AI 视频生成#Google AI#Sora 替代方案#多模态模型