OpenAI · 安全
OpenAI 发布提升语言模型行为的研究成果
OpenAI 发布了一项关于改善语言模型行为的研究,聚焦模型输出在有用性与安全性之间的平衡。该工作提出了新的训练方法与评估框架,旨在减少模型产生有害或不当内容的概率,同时保持其在复杂推理任务上的表现。相关技术细节涵盖从细粒度反馈到偏好对齐的多个环节,为更可靠的大模型部署提供了参考路径。
- 域名
openai.com- 评分
- 4 · 重要更新
- 发布
- 2026-05-02
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。
