Anthropic · 安全

Anthropic 发布提示注入防御方案

Anthropic 发布了一套针对提示注入攻击的防御方案，涵盖输入过滤、指令隔离和模型行为约束等技术路径。该方案旨在帮助开发者在构建 agent 应用时，有效防止恶意指令与用户意图，降低被注入攻击者利用的风险。Anthropic 同时提供了评估基准和部署建议，为 LLM 为 LLM 应用的安全实践提供了参考框架。

域名: anthropic.com
评分: 4 · 重要更新
发布: 2025-11-24

访问项目本体

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。

Back to Latest