Anthropic · 安全

Anthropic 前沿红队发布 AI 风险进展与战略警告

Anthropic 前沿红队发布其红队工作的战略警告与进展报告，总结了对前沿 AI 风险的持续评估和缓解经验。文章梳理了红队测试中发现的典型攻击面、模型脆弱性以及防御策略的演进，强调随着能力提升，风险形态也在动态变化。该报告属于安全研究的方法论总结与政策倡导，不涉及具体模型或工具发布。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。