OpenAI · 安全

OpenAI 提出用推理时计算换取对抗鲁棒性

OpenAI 发表研究,提出在推理阶段增加计算量来提升模型对抗鲁棒性的新方法。传统对抗训练往往需要大量额外训练,而该工作探索了用推理时计算换取安全性的权衡路径。实验表明,该方法在不显著牺牲标准性能的前提下,有效抵御了多种白盒与黑盒攻击,为大模型安全对齐提供了另一种可行思路。

域名
openai.com
评分
5 · 重大发布
发布
2026-05-02
OpenAI 提出用推理时计算换取对抗鲁棒性

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。