Anthropic · 大模型

Anthropic 发布 2024 年 8 月 Circuits 更新

Anthropic 发布 2024 年 8 月 Circuits 更新,内容涉及模型可解释性研究的新进展。团队分享了神经元活动与概念对应关系的追踪方法,以及更高效的特征可视化技术。这些工作延续 Anthropic 在 AI 安全与透明性上的投入,为长期目标服务。

域名
anthropic.com
评分
3 · 可关注
发布
2024-09-06
Anthropic 发布 2024 年 8 月 Circuits 更新

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。