Anthropic · 安全
Anthropic 推出模型安全漏洞悬赏计划
Anthropic 正式推出模型安全漏洞悬赏计划,鼓励安全研究者发现并报告其模型的安全漏洞。该计划覆盖模型偏见、越狱攻击、有害输出等维度,并提供阶梯式奖励。此举旨在通过外部力量提升模型安全性,为行业建立更透明的安全协作机制。
- 域名
anthropic.com- 评分
- 4 · 重要更新
- 发布
- 2024-09-10
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。
Anthropic · 安全
Anthropic 正式推出模型安全漏洞悬赏计划,鼓励安全研究者发现并报告其模型的安全漏洞。该计划覆盖模型偏见、越狱攻击、有害输出等维度,并提供阶梯式奖励。此举旨在通过外部力量提升模型安全性,为行业建立更透明的安全协作机制。
anthropic.com这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。