OpenAI · 安全
OpenAI 推出 Chain of Thought Monitoring 安全方法
OpenAI 发布 Chain of Thought Monitoring,一种通过分析模型推理过程来检测越狱攻击和有害输出的安全方法。该方法不依赖外部分类器,而是直接利用模型自身的思维链进行实时监控,在保持低误报率的同时提升了对复杂攻击的识别能力。
- 域名
openai.com- 评分
- 4 · 重要更新
- 发布
- 2026-04-06
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。
