OpenAI · 评测

OpenAI 发布 TruthfulQA 评测基准

OpenAI 推出 TruthfulQA 评测基准,用于衡量语言模型生成回答的真实性与准确性。该基准覆盖多个知识领域,通过对抗性提问设计,评估模型在避免常见误解和虚假信息方面的表现。TruthfulQA 为研究者提供了更细粒度的模型真实性度量工具,有助于推动更可靠的语言模型开发。

域名
openai.com
评分
3 · 可关注
发布
2026-05-02
OpenAI 发布 TruthfulQA 评测基准

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。