Anthropic · 评测
Anthropic 发布 Interviewer 面试评测工具
Anthropic 推出 Interviewer,一个用于评估大语言模型能力的面试式评测工具。它通过模拟结构化面试流程,能更深入地探测模型在推理、知识调用和对话连贯性上的表现,弥补传统 benchmark 的不足。该工具为模型能力评估提供了新的视角,适合考察复杂任务下的真实对话质量。
- 域名
anthropic.com- 评分
- 4 · 重要更新
- 发布
- 2026-02-19
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。