OpenAI · 安全

OpenAI 发布指令层级机制

OpenAI 提出指令层级（Instruction Hierarchy）机制，为 AI 系统引入明确的指令优先级规则。该设计将系统提示、用户输入、第三方内容等不同来源的指令按权限分层，防止低权限指令覆盖高权限约束，从而降低提示注入攻击的风险。这是大模型安全对齐领域的重要进展。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。