Anthropic · 其他
Anthropic 发布 2024 年 4 月 Circuits 更新
Anthropic 发布了 2024 年 4 月的 Circuits 更新,延续在模型可解释性方面的研究。此次工作揭示了大型语言模型内部神经元与特征表示如何协同运作,为理解模型行为提供了新线索。这类基础研究有助于提升 AI 系统的透明度和安全性,是构建可信任人工智能的重要支撑。
- 域名
anthropic.com- 评分
- 3 · 可关注
- 发布
- 2024-04-26
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。
