OpenAI · 大模型
OpenAI 发布 Variational Option Discovery Algorithms 研究
OpenAI 提出变分选项发现算法,旨在让强化学习智能体自主发现可复用的行为模式,即“选项”。该方法通过变分推断将长时决策分解为有意义的子技能,提升探索效率与迁移能力。相关工作已在多个连续控制任务上验证,为分层强化学习提供了新的理论框架。
- 域名
openai.com- 评分
- 4 · 重要更新
- 发布
- 2026-05-02
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。
