Anthropic · 训练

Anthropic 研究利用影响函数分析大语言模型泛化机制

Anthropic 发表新研究,利用影响函数追踪大语言模型训练数据对模型行为的具体影响,从而理解泛化背后的机制。该方法能定位哪些训练样本驱动了模型在特定任务上的表现,为模型可解释性和数据筛选提供了新的分析工具。

域名
anthropic.com
评分
4 · 重要更新
发布
2024-12-19
Anthropic 研究利用影响函数分析大语言模型泛化机制

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。