Anthropic · 训练
Anthropic 研究利用影响函数分析大语言模型泛化机制
Anthropic 发表新研究,利用影响函数追踪大语言模型训练数据对模型行为的具体影响,从而理解泛化背后的机制。该方法能定位哪些训练样本驱动了模型在特定任务上的表现,为模型可解释性和数据筛选提供了新的分析工具。
- 域名
anthropic.com- 评分
- 4 · 重要更新
- 发布
- 2024-12-19
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。
Anthropic · 训练
Anthropic 发表新研究,利用影响函数追踪大语言模型训练数据对模型行为的具体影响,从而理解泛化背后的机制。该方法能定位哪些训练样本驱动了模型在特定任务上的表现,为模型可解释性和数据筛选提供了新的分析工具。
anthropic.com这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。