OpenAI · 安全

OpenAI 发布 Safety Gym 安全训练环境

OpenAI 推出 Safety Gym,一个用于训练和评估 AI 模型安全行为的标准化环境。它提供了多种任务场景,让 AI 在控制机器人完成任务的同时学习避开危险动作。Safety Gym 帮助研究者衡量模型对安全约束的遵守程度,推动对齐研究从理论走向可复现的实验基准。

域名
openai.com
评分
4 · 重要更新
发布
2026-05-02
OpenAI 发布 Safety Gym 安全训练环境

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。