Justine Moore(@venturetwins)
Justine Moore on X: "@GoogleDeepMind 5) Multi-image prompting..."
5.5Score
TL;DR · AI 摘要
Google DeepMind 的 Omni 模型支持最多 5 张图片和 1 个视频作为提示词,实测在处理 Zillow 房源截图时表现出色,但用户希望视频时长能超过 10 秒。
核心要点
- Omni 模型支持多模态输入,上限为 5 张图片加 1 个视频。
- 实测将 Zillow 房源截图输入模型,分析结果令人印象深刻。
- 当前视频输入限制在 10 秒以内,用户期待更长的时长支持。
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Omni 多图提示功能
- 输入限制
- 最多 5 张图片
- 1 个视频 (<10秒)
- 应用场景
- Zillow 房源分析
金句 / Highlights
值得收藏与分享的关键句。
Omni 模型可以接受最多五张图片和一个视频作为提示词。
我一直在挑战它的极限——截取 Zillow 的房源截图并直接倒入模型。
结果让我印象深刻!(但我希望视频时长能超过 10 秒 😉)。
#Google DeepMind#Omni#多模态#AI 搜索
打开原文Justine Moore 在 X 上:“@GoogleDeepMind 5) 多图提示 Omni 最多可以接受五张图片和一个视频作为提示。我一直在测试它的极限——截取 Zillow 房源列表的截图并一股脑儿地丢进模型里。我对结果印象深刻!(而且希望能有超过 10 秒的视频时长 😉) https://t.co/isGBVptxbt” / X
不要错过正在发生的事情