OpenAI · 安全
OpenAI 发布指令层级机制
OpenAI 提出指令层级(Instruction Hierarchy)机制,为 AI 系统引入明确的指令优先级规则。该设计将系统提示、用户输入、第三方内容等不同来源的指令按权限分层,防止低权限指令覆盖高权限约束,从而降低提示注入攻击的风险。这是大模型安全对齐领域的重要进展。
- 域名
openai.com- 评分
- 5 · 重大发布
- 发布
- 2026-05-02
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。
OpenAI · 安全
OpenAI 提出指令层级(Instruction Hierarchy)机制,为 AI 系统引入明确的指令优先级规则。该设计将系统提示、用户输入、第三方内容等不同来源的指令按权限分层,防止低权限指令覆盖高权限约束,从而降低提示注入攻击的风险。这是大模型安全对齐领域的重要进展。
openai.com这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。