OpenAI · 安全
OpenAI 发布 Robust Adversarial Inputs 安全研究
OpenAI 发布了一项关于对抗性输入鲁棒性的研究,旨在提升大模型在面对恶意构造输入时的防御能力。该工作系统性地分析了当前模型在对抗性攻击下的脆弱点,并提出了新的训练与检测方法,以增强模型的安全边界。这项研究对于构建更可信的 AI 系统具有实际参考价值。
- 域名
openai.com- 评分
- 4 · 重要更新
- 发布
- 2026-04-23
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。
