DeepMind · 安全
DeepMind 提出新型 AI 风险早期预警系统
DeepMind 发布了一项关于新型 AI 风险早期预警系统的研究。该系统旨在识别和预警那些可能带来未知危害的 AI 能力,例如欺骗性行为或自修改倾向。通过自动化的红队测试和异常检测,该框架为 AI 安全治理提供了一种前瞻性的技术手段,帮助在风险放大之前进行干预。
- 域名
deepmind.google- 评分
- 4 · 重要更新
- 发布
- 2026-03-03
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。