DeepMind · 评测

DeepMind 评测图像语言模型动词理解能力

DeepMind 发布一项系统研究，通过探针分析评估主流图像语言模型对动词的理解能力。实验表明，当前模型在识别动作、时态等语言细节上仍存在显著短板，视觉与语言表征的融合尚未充分覆盖动词这一关键词类。该工作为多模态模型的语言落地能力提供了量化视角。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。