Anthropic · 安全

Anthropic 推出模型安全漏洞悬赏计划

Anthropic 正式推出模型安全漏洞悬赏计划，鼓励安全研究者发现并报告其模型的安全漏洞。该计划覆盖模型偏见、越狱攻击、有害输出等维度，并提供阶梯式奖励。此举旨在通过外部力量提升模型安全性，为行业建立更透明的安全协作机制。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。