OpenAI · 安全

OpenAI 提出用推理时计算换取对抗鲁棒性

OpenAI 发表研究，提出在推理阶段增加计算量来提升模型对抗鲁棒性的新方法。传统对抗训练往往需要大量额外训练，而该工作探索了用推理时计算换取安全性的权衡路径。实验表明，该方法在不显著牺牲标准性能的前提下，有效抵御了多种白盒与黑盒攻击，为大模型安全对齐提供了另一种可行思路。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。