DeepMind · 其他

DeepMind 分享 AlphaZero 与 MuZero 研究成果

DeepMind 在官网展示了 AlphaZero 与 MuZero 两项强化学习研究。AlphaZero 无需人类棋谱输入,从零自学围棋、国际象棋和将棋,均达到超人类水平。MuZero 则将规划能力推向更高层级,无需事先知道环境规则或配备模拟器,就能在游戏中一边学习一边长期规划。两套方法为通用决策智能提供了一条清晰的技术路径。

域名
deepmind.google
评分
5 · 重大发布
发布
2025-10-27

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。