arXiv · 图像模型

Lance 发布统一多模态模型,支持图像与视频理解、生成和编辑

Lance 是一个轻量级原生统一多模态模型,同时支持图像和视频的理解、生成与编辑。与依赖模型规模或文本-图像主导设计的方案不同,Lance 通过多任务协同探索统一多模态建模的实用范式。该模型在保持轻量化的同时,实现了跨模态能力的整合,为多模态 AI 研究提供了新的技术路径。

域名
arxiv.org
评分
5 · 重大发布
发布
2026-05-18
Lance 发布统一多模态模型,支持图像与视频理解、生成和编辑

导读

这条暂时没有深度导读,点上方「访问项目本体」直接到源页面查看。

原文摘要

We present Lance, a lightweight native unified model supporting multimodal understanding, generation, and editing for both images and videos. Rather than relying on model capacity scaling or text-image-dominant designs, Lance explores a practical paradigm for unified multimodal modeling via collabo…