DeepMind · 训练
DeepMind 提出 BYOL-Explore 自监督探索方法
DeepMind 发布 BYOL-Explore,一种基于自举预测的探索方法。该方法让智能体在无奖励信号的环境中,通过预测自身表征的变换来驱动探索,从而收集多样化的经验。BYOL-Explore 在多个稀疏奖励的 3D 导航任务中表现良好,为强化学习的探索问题提供了新思路。
- 域名
deepmind.google- 评分
- 4 · 重要更新
- 发布
- 2026-03-18
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。