DeepMind · 其他

DeepMind 分享 AlphaZero 与 MuZero 研究成果

DeepMind 在官网展示了 AlphaZero 与 MuZero 两项强化学习研究。AlphaZero 无需人类棋谱输入，从零自学围棋、国际象棋和将棋，均达到超人类水平。MuZero 则将规划能力推向更高层级，无需事先知道环境规则或配备模拟器，就能在游戏中一边学习一边长期规划。两套方法为通用决策智能提供了一条清晰的技术路径。

域名: deepmind.google
评分: 5 · 重大发布
发布: 2025-10-27

访问项目本体

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。

Back to Latest