ICLR 2025 | Any-step Dynamics Model for Policy Optimization

Created in February 16, 2025

24年在 @俞扬老师的指导下完成了一个关于model-based reinforcement learning (MBRL)的工作，方法简单有效，已被ICLR’2025接收。这也是我个人博士阶段的第一篇一作文章，在这里分享下文章的主要内容…