OpenAI · 安全
OpenAI 提出用推理时计算换取对抗鲁棒性
OpenAI 发表研究,提出在推理阶段增加计算量来提升模型对抗鲁棒性的新方法。传统对抗训练往往需要大量额外训练,而该工作探索了用推理时计算换取安全性的权衡路径。实验表明,该方法在不显著牺牲标准性能的前提下,有效抵御了多种白盒与黑盒攻击,为大模型安全对齐提供了另一种可行思路。
- 域名
openai.com- 评分
- 5 · 重大发布
- 发布
- 2026-05-02
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。
OpenAI · 安全
OpenAI 发表研究,提出在推理阶段增加计算量来提升模型对抗鲁棒性的新方法。传统对抗训练往往需要大量额外训练,而该工作探索了用推理时计算换取安全性的权衡路径。实验表明,该方法在不显著牺牲标准性能的前提下,有效抵御了多种白盒与黑盒攻击,为大模型安全对齐提供了另一种可行思路。
openai.com这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。