Whisper-large 最近有什么新动态？

traeai 已收录 1 篇与 Whisper-large 相关的内容。最新一篇是「从高拟真到真可用，LongCat-Video-Avatar 1.5 正式开源」，由美团技术团队发布。

模型

什么是 Whisper-large？

用于音频特征提取的大规模语音识别模型。

从高拟真到真可用，LongCat-Video-Avatar 1.5 正式开源

美团技术团队 · 9.2 分

已收录 1 篇与「Whisper-large」相关的 AI 资讯和分析。

美团技术团队5月25日2226 字 (约 9 分钟)

LongCat-Video-Avatar 1.5 开源版本在唇形同步、物理合理性、长视频稳定性等方面实现显著提升，支持复杂商业场景下的高质量数字人视频生成。

入选理由：采用 Whisper-large 编码器，提升唇形同步与动作稳定性。

精选文章#数字人#视频生成#AI模型#开源项目#美团中文

与「Whisper-large」经常一起出现的 AI 术语。

💡 想追踪「Whisper-large」的长期趋势？去实体雷达 · Whisper-large 查看详细分析和跨材料问答。