Anthropic · 训练
Anthropic 发布 Circuits 研究更新(2023年5月)
Anthropic 发布 Circuits 研究团队 2023 年 5 月的进展更新,延续其可解释性方向的工作。本次更新聚焦于探明模型中特定神经元和电路如何对应到真实世界概念与行为,例如视觉模型中对物体身份的分布式表征。这些研究试图在更复杂的模型上追溯内部表征的机制,为理解大模型行为提供底层视角。
- 域名
anthropic.com- 评分
- 3 · 可关注
- 发布
- 2024-12-19
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。
