OpenAI · 安全

OpenAI 发布 Robust Adversarial Inputs 安全研究

OpenAI 发布了一项关于对抗性输入鲁棒性的研究,旨在提升大模型在面对恶意构造输入时的防御能力。该工作系统性地分析了当前模型在对抗性攻击下的脆弱点,并提出了新的训练与检测方法,以增强模型的安全边界。这项研究对于构建更可信的 AI 系统具有实际参考价值。

域名
openai.com
评分
4 · 重要更新
发布
2026-04-23
OpenAI 发布 Robust Adversarial Inputs 安全研究

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。