ICLR 2025 | Any-step Dynamics Model for Policy Optimization

24年在 @俞扬 老师的指导下完成了一个关于model-based reinforcement learning (MBRL)的工作,方法简单有效,已被ICLR’2025接收。这也是我个人博士阶段的第一篇一作文章,在这里分享下文章的主要内容…

main text