DeepMind · 评测

DeepMind 发布 RL Unplugged 离线强化学习基准

DeepMind 推出 RL Unplugged 基准，为离线强化学习提供标准化评测框架。该基准涵盖多个任务领域，旨在解决离线 RL 中数据分布偏移和策略评估的难题，帮助研究者更公平地比较算法性能。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。