OpenAI · 安全

OpenAI 发布 Robust Adversarial Inputs 安全研究

OpenAI 发布了一项关于对抗性输入鲁棒性的研究，旨在提升大模型在面对恶意构造输入时的防御能力。该工作系统性地分析了当前模型在对抗性攻击下的脆弱点，并提出了新的训练与检测方法，以增强模型的安全边界。这项研究对于构建更可信的 AI 系统具有实际参考价值。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。