DeepMind · Agent
DeepMind 从开放式博弈训练中发现通用型 agent 自发涌现
DeepMind 的研究团队通过开放式的博弈能训练环境,观察到智能体在反复对抗与协作中自发涌现出跨任务、跨场景的通用能力。该方法不依赖人工标注或预定义奖励,让 agent 在不断习得新技能的同时保持对陌生任务的上手能力。这项工作为通用智能体的自主学习路径提供了一条摆脱固定监督信号、向自主泛化迈进的关键路径。
- 域名
deepmind.google- 评分
- 5 · 重大发布
- 发布
- 2026-03-04
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。