DeepMind · 安全

DeepMind 发布更安全的对话 agent 构建方法

DeepMind 提出了一套提升对话 agent 安全性的技术方案，重点解决模型在开放域对话中生成有害或不当内容的问题。该方法结合了对抗训练、红队测试与细粒度的安全奖励建模，在不显著牺牲对话流畅度的前提下降低风险。这项工作为部署面向公众的对话系统提供了更可靠的安全基线。

导读

这条暂时没有深度导读，点上方「访问项目本体」直接到源页面查看。