arXiv · 评测

研究揭示 LLM 事实召回受模型大小和主题频率影响

一项对 38 个模型、超过 8900 条学术引文的评估发现,大语言模型的事实召回质量与模型参数量和训练数据中主题出现频率呈可预测的规模法则关系。研究团队使用自动引用验证系统进行评测,结果说明模型规模和数据组成共同决定了事实性知识的复现能力,为理解 LLM 的幻觉机制提供了量化视角。

域名
arxiv.org
评分
3 · 可关注
发布
2026-05-18
研究揭示 LLM 事实召回受模型大小和主题频率影响

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。

原文摘要

While scaling laws govern aggregate large language model performance, no scaling law has linked factual recall to both model size and training-data composition. We evaluated 38 models on over 8,900 scholarly references evaluated by an automated reference verification system. Recall quality follows …