⏶58

Omni-Effects：统一且空间可控的视觉效果生成

08月11日发表

08月12日由 xiaochonglinghu 提交

作者: Fangyuan Mao, Aiming Hao, Jintao Chen, Dongxia Liu, Xiaokun Feng, Jiashu Zhu, Meiqi Wu, Chubin Chen, Jiahong Wu, Xiangxiang Chu

摘要

视觉效果（VFX）是现代电影制作中不可或缺的视觉增强技术。尽管视频生成模型为VFX制作提供了经济高效的解决方案，但当前方法受限于每种效果的LoRA训练，这使得生成仅限于单一效果。这种根本性限制阻碍了需要空间可控复合效果的应用，即在指定位置同时生成多种效果。然而，将多种效果整合到一个统一框架中面临着主要挑战：效果变异的干扰以及多VFX联合训练期间的空间不可控性。为了解决这些挑战，我们提出了Omni-Effects，这是第一个能够生成提示引导效果和空间可控复合效果的统一框架。我们框架的核心包括两项关键创新：（1）基于LoRA的专家混合（LoRA-MoE），它采用一组专家LoRA，在统一模型中整合各种效果，同时有效缓解跨任务干扰。(2) 空间感知提示（SAP）将空间遮罩信息整合到文本标记中，从而实现精确的空间控制。此外，我们引入了一个集成在SAP中的独立信息流（IIF）模块，用于隔离与单个效果对应的控制信号，以防止任何不必要的混合。为了促进这项研究，我们通过一种结合图像编辑和第一-最后一帧到视频（FLF2V）合成的新颖数据收集流程，构建了一个全面的VFX数据集Omni-VFX，并引入了一个专门的VFX评估框架来验证模型性能。大量实验表明，Omni-Effects实现了精确的空间控制和多样化的效果生成，使用户能够指定所需效果的类别和位置。

查看 arXiv 页面查看 PDF

xiaochonglinghu

论文提交者

太酷了，太棒了！

https://cdn-uploads.huggingface.co/production/uploads/66d255e3947594430c723ff6/iBwZLkI16Rhh1Y1ZvX4S-.mp4

xiaochonglinghu

论文提交者

查看演示

https://cdn-uploads.huggingface.co/production/uploads/66d255e3947594430c723ff6/kg3HJwGKxjy6JvqAqT5AG.mp4

Omni-Effects：统一且空间可控的视觉效果生成

摘要

评论