OpenAI · 评测

OpenAI 发布 Healthbench 医疗评测基准

OpenAI 推出 Healthbench，一个面向医疗场景的模型评测基准。该基准覆盖诊断推理、临床决策、医学知识问答等多个维度，旨在系统评估大语言模型在医疗领域的医学能力。Healthbench 的发布为医疗 AI 的标准化测试提供了新工具，有助于推动模型在真实临床环境中的安全应用。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。