HuggingFace Papers · 评测
SCICONVBENCH 发布多轮澄清对话评测基准
SCICONVBENCH 是为评估大模型在计算科学场景下进行多轮澄清对话能力而设计的评测基准。它要求模型在面对模糊的科学计算任务描述时,主动与用户交互、提问并逐步明确需求,直至形成可执行的正式任务规约。该基准填补了现有评测对任务澄清阶段关注不足的空白,聚焦于模型能否像人一样在初始需求不清晰时引导对话走向精确的表述。
- 域名
huggingface.co- 评分
- 4 · 重要更新
- 收录
- 2026-05-19
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。