Anthropic · 大模型

Anthropic 研究 Transformer 残差流中的特权基

Anthropic 发布研究,探讨 Transformer 残差流中的特权基。研究发现模型内部表示中某些方向具有更直接的计算地位,这影响了模型对有限维度的推理效率。

域名
anthropic.com
评分
4 · 重要更新
发布
2024-12-19
Anthropic 研究 Transformer 残差流中的特权基

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。