Justine Moore(@venturetwins)2026年5月19日

Justine Moore on X: "@GoogleDeepMind 5) Multi-image prompting..."

5.5内容质量

TL;DR · AI 摘要

Google DeepMind 的 Omni 模型支持最多 5 张图片和 1 个视频作为提示词，实测在处理 Zillow 房源截图时表现出色，但用户希望视频时长能超过 10 秒。

核心要点

Omni 模型支持多模态输入，上限为 5 张图片加 1 个视频。
实测将 Zillow 房源截图输入模型，分析结果令人印象深刻。
当前视频输入限制在 10 秒以内，用户期待更长的时长支持。

结构提纲

按章节快速跳转。

§功能特性
Omni 模型允许用户输入最多五张图片和一个视频作为提示词。
§实测体验
作者通过输入 Zillow 房源截图测试了该模型的多图处理能力。
§使用反馈
模型表现令人印象深刻，但用户希望视频输入时长能超过 10 秒。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Omni 多图提示功能
- 输入限制
  - 最多 5 张图片
  - 1 个视频 (<10秒)
- 应用场景
  - Zillow 房源分析

金句 / Highlights

值得收藏与分享的关键句。

Omni 模型可以接受最多五张图片和一个视频作为提示词。
— 推文正文
⬇︎ 下载 PNG 𝕏 分享到 X
我一直在挑战它的极限——截取 Zillow 的房源截图并直接倒入模型。
— 推文正文
⬇︎ 下载 PNG 𝕏 分享到 X
结果让我印象深刻！（但我希望视频时长能超过 10 秒 😉）。
— 推文正文
⬇︎ 下载 PNG 𝕏 分享到 X

#Google DeepMind#Omni#多模态#AI 搜索

Justine Moore 在 X 上：“@GoogleDeepMind 5) 多图提示 Omni 最多可以接受五张图片和一个视频作为提示。我一直在测试它的极限——截取 Zillow 房源列表的截图并一股脑儿地丢进模型里。我对结果印象深刻！（而且希望能有超过 10 秒的视频时长 😉） https://t.co/isGBVptxbt” / X

不要错过正在发生的事情