Anthropic · 安全

Anthropic 发布 Claude 宪法

Anthropic 在 Claude 模型的安全训练中引入了一套明确的指导原则，称为“Claude 宪法”。这套规则以人类社会与伦理规范为蓝本，从基础层约束模型行为，减少有害输出并提升对齐度。与单纯依赖人类反馈不同，该宪法提供可公开检验的准则，帮助模型在复杂场景下做出更安全的判断。Anthropic 相信，这种透明且系统化的对齐方式，将为后续更强大模型的开发提供重要基线。

域名: anthropic.com
评分: 5 · 重大发布
发布: 2026-01-21

访问项目本体

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。

Back to Latest