arXiv · 视频生成模型

Aurora 提出基于工具使用 Agent 的统一视频编辑框架

Aurora 通过一个工具使用 agent,将替换、移除、风格迁移和参考驱动插入等视频编辑任务统一到单一扩散 Transformer 模型中。这种方法用同一套权重处理多种编辑需求,无需为每种操作单独设计模型,在保持编辑质量的同时简化了工作流程。

域名
arxiv.org
评分
4 · 重要更新
发布
2026-05-18
Aurora 提出基于工具使用 Agent 的统一视频编辑框架

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。

原文摘要

Recent video editing models have converged on a unified conditioning design: a single diffusion transformer jointly consumes text, source video, and reference images, and one set of weights covers replacement, removal, style transfer, and reference-driven insertion. The design is flexible, but it a…