OpenAI · 评测

OpenAI 发布 Healthbench 医疗评测基准

OpenAI 推出 Healthbench,一个面向医疗场景的模型评测基准。该基准覆盖诊断推理、临床决策、医学知识问答等多个维度,旨在系统评估大语言模型在医疗领域的医学能力。Healthbench 的发布为医疗 AI 的标准化测试提供了新工具,有助于推动模型在真实临床环境中的安全应用。

域名
openai.com
评分
4 · 重要更新
发布
2026-05-02
OpenAI 发布 Healthbench 医疗评测基准

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。