arXiv · 视频生成模型

训练-free 身份感知记忆方法推进长视频生成一致性

这篇论文提出了一种无需训练的身份感知记忆机制,用于解决自回归视频生成中的长期不一致和记忆退化问题。现有方法依赖预定义压缩或粗略检索,而该方法通过身份感知保持角色和场景的连贯性,在长视频叙事生成中取得更好效果。

域名
arxiv.org
评分
4 · 重要更新
发布
2026-05-18
训练-free 身份感知记忆方法推进长视频生成一致性

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。

原文摘要

Autoregressive video generation has improved rapidly in visual fidelity and interactivity, but it still suffers from long-term inconsistency and memory degradation. Most existing solutions either compress historical frames using predefined strategies or retrieve keyframes based on coarse implicit a…