从高拟真到真可用,LongCat-Video-Avatar 1.5 正式开源
LongCat-Video-Avatar 1.5 开源版本在唇形同步、物理合理性、长视频稳定性等方面实现显著提升,支持复杂商业场景下的高质量数字人视频生成。
入选理由:采用 Whisper-large 编码器,提升唇形同步与动作稳定性。
概念
广义相对策略优化,一种强化学习训练方法。
最近变化
2026-05-28 · Polar 框架让 Codex 在 SWE-Bench Verified 测试中的 pass@1 分数提升了 594.74%。
GRPO 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
已收录 4 篇与「GRPO」相关的 AI 资讯和分析。
LongCat-Video-Avatar 1.5 开源版本在唇形同步、物理合理性、长视频稳定性等方面实现显著提升,支持复杂商业场景下的高质量数字人视频生成。
入选理由:采用 Whisper-large 编码器,提升唇形同步与动作稳定性。
DeepSeek通过多项底层技术创新构建低成本高效能模型体系,旨在撬动中国10万亿美元AI硬件生态并实现自身万亿美元市值。
入选理由:DeepSeek V4 Pro在100万上下文中仅需5.48GB HBM显存,远低于竞品的60-89GB。
英伟达推出开源框架 Polar,显著提升 Codex 等智能体的性能和效率。
入选理由:Polar 框架让 Codex 在 SWE-Bench Verified 测试中的 pass@1 分数提升了 594.74%。
SFT可能在训练多模态大模型时引入分布偏差,导致RL阶段性能下降。PRISM通过三阶段流水线修复这一问题。
入选理由:SFT可能导致模型性能下降,如Qwen3-VL-8B SFT后准确率下降5.2%
与「GRPO」经常一起出现的 AI 术语。
💡 想追踪「GRPO」的长期趋势?去 实体雷达 · GRPO 查看详细分析和跨材料问答。