Anthropic · 安全
Anthropic 发布 Constitutional Classifiers
Anthropic 推出 Constitutional Classifiers,一种基于宪法 AI 原则的分类器技术。它通过将模型行为准则直接编码为分类规则,实现对 AI 输出的细粒度安全控制,在保持有用性的同时降低有害内容风险。
- 域名
anthropic.com- 评分
- 4 · 重要更新
- 发布
- 2025-11-20
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。
Anthropic · 安全
Anthropic 推出 Constitutional Classifiers,一种基于宪法 AI 原则的分类器技术。它通过将模型行为准则直接编码为分类规则,实现对 AI 输出的细粒度安全控制,在保持有用性的同时降低有害内容风险。
anthropic.com这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。