OpenAI · 评测

OpenAI 发布 TruthfulQA 评测基准

OpenAI 推出 TruthfulQA 评测基准，用于衡量语言模型生成回答的真实性与准确性。该基准覆盖多个知识领域，通过对抗性提问设计，评估模型在避免常见误解和虚假信息方面的表现。TruthfulQA 为研究者提供了更细粒度的模型真实性度量工具，有助于推动更可靠的语言模型开发。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。