HuggingFace Papers · 安全
SafeDiffusion-R1 提出在线奖励引导的扩散模型安全训练方法
SafeDiffusion-R1 是一种专为扩散模型设计的在线奖励引导训练方法,旨在解决图像生成过程中的安全对齐问题。该方法通过在后训练阶段引入奖励信号,直接引导模型避免生成有害或不适当内容,而不牺牲图像质量和多样性。这一框架为扩散模型的安全部署提供了一种有效的技术路线。
- 域名
huggingface.co- 评分
- 4 · 重要更新
- 收录
- 2026-05-19
导读
这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。