Anthropic · 评测

Anthropic 发布 Interviewer 面试评测工具

Anthropic 推出 Interviewer,一个用于评估大语言模型能力的面试式评测工具。它通过模拟结构化面试流程,能更深入地探测模型在推理、知识调用和对话连贯性上的表现,弥补传统 benchmark 的不足。该工具为模型能力评估提供了新的视角,适合考察复杂任务下的真实对话质量。

域名
anthropic.com
评分
4 · 重要更新
发布
2026-02-19
Anthropic 发布 Interviewer 面试评测工具

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。