DeepMind · 评测

DeepMind 发布 RL Unplugged 离线强化学习基准

DeepMind 推出 RL Unplugged 基准,为离线强化学习提供标准化评测框架。该基准涵盖多个任务领域,旨在解决离线 RL 中数据分布偏移和策略评估的难题,帮助研究者更公平地比较算法性能。

域名
deepmind.google
评分
4 · 重要更新
发布
2026-03-18

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。