DeepMind · 安全
DeepMind 发布更安全的对话 agent 构建方法
DeepMind 提出了一套提升对话 agent 安全性的技术方案,重点解决模型在开放域对话中生成有害或不当内容的问题。该方法结合了对抗训练、红队测试与细粒度的安全奖励建模,在不显著牺牲对话流畅度的前提下降低风险。这项工作为部署面向公众的对话系统提供了更可靠的安全基线。
- 域名
deepmind.google- 评分
- 4 · 重要更新
- 发布
- 2026-03-03
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。