DeepMind · 训练

DeepMind 提出 BYOL-Explore 自监督探索方法

DeepMind 发布 BYOL-Explore，一种基于自举预测的探索方法。该方法让智能体在无奖励信号的环境中，通过预测自身表征的变换来驱动探索，从而收集多样化的经验。BYOL-Explore 在多个稀疏奖励的 3D 导航任务中表现良好，为强化学习的探索问题提供了新思路。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。