Anthropic · 训练

Anthropic 研究利用影响函数分析大语言模型泛化机制

Anthropic 发表新研究，利用影响函数追踪大语言模型训练数据对模型行为的具体影响，从而理解泛化背后的机制。该方法能定位哪些训练样本驱动了模型在特定任务上的表现，为模型可解释性和数据筛选提供了新的分析工具。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。