Anthropic · 安全

Anthropic 发布 Claude 恶意使用检测与应对报告 2025 年 3 月版

Anthropic 发布了 2025 年 3 月版的 Claude 恶意使用检测与应对报告，详细披露了平台在执行安全政策过程中发现的滥用案例及处置方式。报告涵盖了对抗性提示注入、自动化欺诈、深度伪造生成等多个维度的实际威胁，并介绍了模型层面的防御设计与人工审查机制。这份定期汇报体现了 Anthropic 在安全治理上的透明度策略。

域名: anthropic.com
评分: 1 · —
发布: 2025-08-21

访问项目本体

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。

Back to Latest