OpenAI · 安全

OpenAI 发布模型鲁棒性测试方法

OpenAI 公开了一套针对大语言模型鲁棒性的系统测试方法，涵盖对抗性输入、分布偏移和边界案例等维度。该工作旨在为模型部署前的安全性评估提供标准化流程，帮助开发者识别和缓解模型在异常输入下的行为退化。测试框架本身开源，可复用于不同规模的模型。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。