Anthropic · 安全

Anthropic 发布前沿威胁红队测试方法

Anthropic 发布了一套针对前沿 AI 模型的安全红队测试方法，聚焦于红队测试如何应对最严重威胁性的攻击场景。该方法将模型可能被滥用的风险分为多个层级，并设计专门的测试流程来评估模型在生物、网络等高风险领域的防护能力。这一工作为行业提供了更系统的安全评估框架。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。