arXiv · 评测

研究发现表格基础模型集成存在多样性上限与校准陷阱

在表格数据任务上,基础模型(TFM)已经能与调优后的梯度提升树抗衡,但单一模型难以称霸所有数据集。一项研究尝试对六个现代 TFM 做集成,却发现它们之间的预测高度重合,多样性存在上限,同时校准效果反而下降。这一“校准陷阱”意味着简单叠加多个模型未必带来期望的增益,为表格模型的实际部署敲响了警钟。

域名
arxiv.org
评分
3 · 可关注
发布
2026-05-18
研究发现表格基础模型集成存在多样性上限与校准陷阱

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。

原文摘要

Tabular foundation models (TFMs) now match or beat tuned gradient-boosted trees on a growing fraction of tabular tasks, but no single TFM wins on every dataset. Ensembling is the go to fix here, and it works less well than expected. Six modern TFMs form a near-redundant pool: their mean pairwise Q-…