Anthropic · 安全

Anthropic 发布提示注入防御方案

Anthropic 发布了一套针对提示注入攻击的防御方案,涵盖输入过滤、指令隔离和模型行为约束等技术路径。该方案旨在帮助开发者在构建 agent 应用时,有效防止恶意指令与用户意图,降低被注入攻击者利用的风险。Anthropic 同时提供了评估基准和部署建议,为 LLM 为 LLM 应用的安全实践提供了参考框架。

域名
anthropic.com
评分
4 · 重要更新
发布
2025-11-24
Anthropic 发布提示注入防御方案

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。