OpenAI · 大模型

OpenAI 发布让模型用语言表达不确定性的训练方法

OpenAI 发布了一项研究,旨在让语言模型在回答时用自然语言表达自身的不确定性,而非仅依赖概率或 logit 分数。该方法通过训练模型学会说出“我相当确定”或“我可能错了”这样的表述,从而提升输出的可信任度与可解释性。这项技术有望在医疗、法律等高风险场景中减少用户对模型答案的误判,也为模型对齐提供了一种更贴近人类沟通习惯的新思路。

域名
openai.com
评分
3 · 可关注
发布
2026-05-02

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。