基于梯度的长时域世界模型规划
BAIR Blog3066 字 (约 13 分钟)
85
文章介绍了GRASP,一种基于梯度的长时域世界模型规划方法,通过虚拟状态、随机性注入和梯度重塑提升规划鲁棒性。
入选理由:GRASP通过虚拟状态实现并行优化
精选文章#机器学习#强化学习#规划算法中文
人物
研究者
已收录 1 条与 Amir Bar 相关的内容,按评分排序。
文章介绍了GRASP,一种基于梯度的长时域世界模型规划方法,通过虚拟状态、随机性注入和梯度重塑提升规划鲁棒性。
入选理由:GRASP通过虚拟状态实现并行优化