DeepMind · 其他
DeepMind 分享 AlphaZero 与 MuZero 研究成果
DeepMind 在官网展示了 AlphaZero 与 MuZero 两项强化学习研究。AlphaZero 无需人类棋谱输入,从零自学围棋、国际象棋和将棋,均达到超人类水平。MuZero 则将规划能力推向更高层级,无需事先知道环境规则或配备模拟器,就能在游戏中一边学习一边长期规划。两套方法为通用决策智能提供了一条清晰的技术路径。
- 域名
deepmind.google- 评分
- 5 · 重大发布
- 发布
- 2025-10-27
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。