OpenAI · 安全

OpenAI 发布指令层级机制

OpenAI 提出指令层级(Instruction Hierarchy)机制,为 AI 系统引入明确的指令优先级规则。该设计将系统提示、用户输入、第三方内容等不同来源的指令按权限分层,防止低权限指令覆盖高权限约束,从而降低提示注入攻击的风险。这是大模型安全对齐领域的重要进展。

域名
openai.com
评分
5 · 重大发布
发布
2026-05-02
OpenAI 发布指令层级机制

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。