Seedance 2.0 最强对手偷跑了
Google 推出 Gemini Omni 视频生成模型,实测在文本连贯性与物理逻辑还原上超越 Seedance 2.0,支持视频编辑与内容重混,虽短暂泄露后消失,但已引发行业震动。
入选理由:Gemini Omni 在数学板书视频中实现文本完全一致,解决 AI 视频长期存在的文字渲染缺陷。
模型
别名:OpenAI Sora
由 OpenAI 开发的视频生成模型,已于 2024 年 4 月停止服务。
已收录 7 条与 Sora 相关的内容,按评分排序。
Google 推出 Gemini Omni 视频生成模型,实测在文本连贯性与物理逻辑还原上超越 Seedance 2.0,支持视频编辑与内容重混,虽短暂泄露后消失,但已引发行业震动。
入选理由:Gemini Omni 在数学板书视频中实现文本完全一致,解决 AI 视频长期存在的文字渲染缺陷。
Google 发布 Gemini Omni 视频模型,支持多模态输入并具备物理理解能力,填补 Sora 停运后的免费市场空白。
入选理由:Gemini Omni 支持文本、图像、音频、视频和绘图五种输入方式生成视频。
快手计划分拆可灵 AI 独立融资,估值达 200 亿美元,拟明年 IPO。其年化收入已突破 5 亿美元,商业化验证成功,估值接近快手母公司七成,标志着中国 AI 视频赛道进入新量级。
入选理由:可灵 AI Pre-IPO 融资目标估值 200 亿美元,预计明年 Q1 启动上市流程。
Google Gemini Omni 是首个原生多模态理解与生成模型,支持图文音视频任意组合输入,实现对话式视频编辑与物理世界知识推理,显著超越Veo等前代模型。
入选理由:Gemini Omni 支持图、文、视频、音频任意组合输入,实现多轮对话式视频编辑,无需重述完整提示词。
OpenAI发布内容来源验证新举措,通过C2PA合规认证、与Google SynthID合作的水印技术以及公开验证工具,构建多层次防篡改的内容溯源体系,提升AI生成内容的可信度和透明度。
入选理由:OpenAI已成为C2PA合规生成产品,平台可读取和传递其内容来源信息
AI行业在2024年经历战略大转向,从消费级应用集体转向开发者工具,Anthropic凭借coding agents实现弯道超车,迫使OpenAI、Google等紧急调整路线,企业软件平台如Slack也正加速集成AI编程能力。
入选理由:Anthropic专注coding agents的战略被验证成功,成为行业新标杆,迫使竞争对手集体转向
Marc Benioff幽默回顾AI行业一年变化:从性爱机器人转向编码代理成为主流趋势,各大公司纷纷调整战略方向。
入选理由:Anthropic押注编码代理获得成功,市值大幅飙升