Anthropic · 安全
Anthropic 发布 Claude 宪法
Anthropic 在 Claude 模型的安全训练中引入了一套明确的指导原则,称为“Claude 宪法”。这套规则以人类社会与伦理规范为蓝本,从基础层约束模型行为,减少有害输出并提升对齐度。与单纯依赖人类反馈不同,该宪法提供可公开检验的准则,帮助模型在复杂场景下做出更安全的判断。Anthropic 相信,这种透明且系统化的对齐方式,将为后续更强大模型的开发提供重要基线。
- 域名
anthropic.com- 评分
- 5 · 重大发布
- 发布
- 2026-01-21
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。
