OpenAI · 安全

OpenAI 发布模型鲁棒性测试方法

OpenAI 公开了一套针对大语言模型鲁棒性的系统测试方法,涵盖对抗性输入、分布偏移和边界案例等维度。该工作旨在为模型部署前的安全性评估提供标准化流程,帮助开发者识别和缓解模型在异常输入下的行为退化。测试框架本身开源,可复用于不同规模的模型。

域名
openai.com
评分
4 · 重要更新
发布
2026-05-02
OpenAI 发布模型鲁棒性测试方法

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。