从高拟真到真可用,LongCat-Video-Avatar 1.5 正式开源
美团技术团队2226 字 (约 9 分钟)
92
LongCat-Video-Avatar 1.5 开源版本在唇形同步、物理合理性、长视频稳定性等方面实现显著提升,支持复杂商业场景下的高质量数字人视频生成。
入选理由:采用 Whisper-large 编码器,提升唇形同步与动作稳定性。
精选文章#数字人#视频生成#AI模型#开源项目#美团中文
概念
Distribution Matching Distillation,一种高效的模型蒸馏方法。
已跟踪 1 条高相关材料
最近变化
2026-05-25 · 采用 Whisper-large 编码器,提升唇形同步与动作稳定性。
为什么值得关注
DMD 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
已收录 1 条与 DMD 相关的内容,按评分排序。
LongCat-Video-Avatar 1.5 开源版本在唇形同步、物理合理性、长视频稳定性等方面实现显著提升,支持复杂商业场景下的高质量数字人视频生成。
入选理由:采用 Whisper-large 编码器,提升唇形同步与动作稳定性。