OpenAI · 安全

OpenAI 推进人机协作红队测试方法

OpenAI 更新了红队测试框架，将人类专家的判断力与 AI 系统的自动化攻击生成能力结合。新方法让 AI 先批量生成对抗性输入，再由人工筛选和深入分析，目的是在有限人力下覆盖更多安全边界。这一做法反映了当前大模型安全评估从纯人工向人机协作的转变。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。