DeepMind · 训练

DeepMind 提出 BYOL-Explore 自监督探索方法

DeepMind 发布 BYOL-Explore,一种基于自举预测的探索方法。该方法让智能体在无奖励信号的环境中,通过预测自身表征的变换来驱动探索,从而收集多样化的经验。BYOL-Explore 在多个稀疏奖励的 3D 导航任务中表现良好,为强化学习的探索问题提供了新思路。

域名
deepmind.google
评分
4 · 重要更新
发布
2026-03-18

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。