Seedance 2.0 最强对手偷跑了

爱范儿

爱范儿2026年5月12日

Seedance 2.0 最强对手偷跑了

8.7内容质量

TL;DR · AI 摘要

Google 推出 Gemini Omni 视频生成模型，实测在文本连贯性与物理逻辑还原上超越 Seedance 2.0，支持视频编辑与内容重混，虽短暂泄露后消失，但已引发行业震动。

核心要点

Gemini Omni 在数学板书视频中实现文本完全一致，解决 AI 视频长期存在的文字渲染缺陷。
其人物进食动作物理逻辑异常，盘中意大利面出现与消失，仍存在明显漏洞。
支持对话式视频编辑，可将意大利面替换为冬阴功汤或去除 Sora 水印，展现强大后期能力。

结构提纲

按章节快速跳转。

§Gemini Omni 突然曝光
有网友在凌晨意外触发 Gemini 中的全新视频生成模型 Omni，界面显示其具备创作、编辑与模板功能。
·文本连贯性突破
Gemini Omni 成功生成包含复杂数学公式的黑板书写视频，文本内容准确无误，显著优于以往模型。
·物理逻辑仍存缺陷
在威尔·史密斯吃面测试中，盘中意大利面出现与消失，进食动作不自然，暴露生成逻辑问题。
·视频编辑能力惊艳
Gemini Omni 支持直接替换视频内容（如换菜）和去水印，展示出强大的交互式编辑潜力。
§行业影响与未来展望
尽管模型短暂上线即下线，但其表现已引发对 Seedance 2.0 的挑战，并预示视频生成向“生成+编辑”融合演进。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Google Gemini Omni 视频模型曝光
- 核心功能
  - 视频生成
  - 对话式编辑
  - 内容重混
- 技术突破
  - 文本连贯性提升
  - 物理逻辑优化
  - 去水印能力
- 局限与争议
  - 进食动作不自然
  - 功能短暂上线
  - 来源真实性存疑

金句 / Highlights

值得收藏与分享的关键句。

Gemini Omni 在数学板书视频中完美处理了黑板上的文本内容，这是此前许多视频模型的大 Bug。
— 第 3 段
⬇︎ 下载 PNG 𝕏 分享到 X
用户仅用两个视频就耗尽了 AI Pro 订阅每日额度的 86%，说明 AI 视频生成成本极高。
— 第 12 段
⬇︎ 下载 PNG 𝕏 分享到 X
Gemini Omni 可将 Sora 原视频中的水印彻底去除，且画面保持高度一致，技术能力令人惊叹。
— 第 10 段
⬇︎ 下载 PNG 𝕏 分享到 X

#Google#Gemini#AI视频生成#Seedance 2.0#Omni

打开原文

现在无论哪一家要发布视频模型，都免不了要被拉来和 Seedance 2.0 对比。

而最近比较沉寂的 Google，似乎在悄悄憋一个大招，来重夺视频生成的王座。

今天凌晨，有网友在 Gemini 中意外触发了一个全新的视频生成模型——Omni（全能）。

在 Gemini 的聊天页面，直接显示着「用 Gemini Omni 来创作，认识一下我们全新的视频生成模型。重混你的视频、在对话中直接进行编辑、尝试丰富的模板，以及更多功能。」

▲得到意外访问的 Gemini 截图

不过，这位网友表示他再次打开 Gemini 应用时，不仅 Omni 功能没了，Gemini 界面也恢复到了旧版。

从目前泄露的初测结果来看，Gemini Omni 在某些场景下的表现，相当出色，很有当年 Nano Banana 一统图片生成的感觉。

曝光的两个测试案例里，就像 Nano Banana 解决文本渲染一样，Gemini Omni 也解决了此前 AI 视频生成的两个痛点：文本连贯性和人物进食的物理逻辑。

▲ 视频来源：X@chetaslua｜提示词：A professor writes out a mathematical proof for trigonometric identities on a traditional chalkboard, explaining the step he is currently on in the equation.

这个挑战复杂数学板书的 10s 视频，提示词只有一句话「一位教授在传统的黑板上写出三角恒等式的数学证明，并解释他目前在方程式中执行的步骤。」

尽管在画面中依然能找到一些 AI 生成的小破绽，但整个视频完美处理好了黑板上的「文本」内容，这是曾经很多视频模型的一个大 Bug，此外，视频整体的真实感也非常强。

网友们对这个视频的态度是「太疯狂了」，AI 超创博主@Azed_ai 也在爆料视频下留言，「如果这是实际输出，那么文本一致性确实令人难以置信。」

▲ 视频文件链接：https://gemini.google.com/share/7d5dc678c80a

有网友质疑这个视频的来源，可能并不是由 Gemini Omni 生成的，爆料的博主直接放上了 Gemini 的官方链接。

我们把同样的提示词丢给 Seedance 2.0 进行测试，画面的真实感同样可圈可点，但是板书的内容，似乎和三角恒等式的关系不是很大，黑板上的一些文字渲染还是有问题。

▲由 Seedance 2.0 生成

另一个爆料的视频是致敬「威尔·史密斯吃意大利面」，这个测试案例几乎成了所有视频生成模型的必跑提示词之一。

▲ 来源：Reddit@Zacatac_391｜提示词：Can you create a scene with two men at a table seaside at an upscale restaurant on outdoor deck seating. They are at a circular table with a nice white table cloth, and all of the fancy accessories, all the spoons forks and knives, fancy napkins, centerpiece. One man is Distinguished: A mature African-American man in his 50s with a short beard and confident posture, wearing a tailored, sophisticated suit, the other is is friend, both approaching the table to eat a plate of spaghetti. In the beginning the men approach the table, exchange brief niceties, and begin to eat the spaghetti calmly In between bites sharing conversation.

获得提前访问的测试者表示，当他尝试输入威尔·史密斯意大利面测试时，被 Google 的内容生成护栏限制了，所以他描述了一个长相酷似威尔·史密斯的人。

Gemini Omni 生成的这个视频，虽然比 Google 自家的视频生成模型 Veo 3.1 更好，从声音和画面真实质量上，都更像真人视频。

但也有网友发现，他们站着的时候，盘子里没有意大利面，但是坐下来之后就有了，紧接着是吃的时候，根本没吃，意大利面就没了。

我们同样把这套提示词交给 Seedance 处理，在吃的时候，结果比 Gemini Omni 的表现要自然不少。

▲ 由 Seedance 2.0 生成｜提示词：你能想象两个男人在海边一家高档餐厅的露天餐桌旁用餐的场景吗？他们围坐在铺着洁白桌布的圆桌旁，桌上摆放着各种精致的餐具，包括勺子、叉子、刀叉、漂亮的餐巾和中心装饰品。其中一位男士风度翩翩：一位五十多岁、成熟稳重的非裔美国男士，留着短须，身着剪裁合身的精致西装，姿态自信。另一位是他的朋友，两人都来到桌边，准备享用一盘意大利面。一开始，两人走到桌边，简单地寒暄了几句，然后开始平静地吃意大利面，并不时地闲聊几句。

在 Reddit 上有网友质疑他是否有用过最新的视频生成模型，这位测试博主表示他用过最好的是 Kling 3.0。

网友回复他说，Seedance 2.0 要比 Kling 3.0 好上不少，所以 Gemini Omni 的表现对我（用过 Seedance 2.0 的人）来说一点都不惊讶。

而在 X 上，也有网友认为 Gemini Omni 的表现，要比 Seedance 2.0 更好。