⏶58
Omni-Effects:统一且空间可控的视觉效果生成
发表
由
xiaochonglinghu 提交
作者: Fangyuan Mao,
Aiming Hao, Jintao Chen, Dongxia Liu,
Xiaokun Feng, Jiashu Zhu, Meiqi Wu, Chubin Chen, Jiahong Wu, Xiangxiang Chu
摘要
视觉效果(VFX)是现代电影制作中不可或缺的视觉增强技术。尽管视频生成模型为VFX制作提供了经济高效的解决方案,但当前方法受限于每种效果的LoRA训练,这使得生成仅限于单一效果。这种根本性限制阻碍了需要空间可控复合效果的应用,即在指定位置同时生成多种效果。然而,将多种效果整合到一个统一框架中面临着主要挑战:效果变异的干扰以及多VFX联合训练期间的空间不可控性。为了解决这些挑战,我们提出了Omni-Effects,这是第一个能够生成提示引导效果和空间可控复合效果的统一框架。我们框架的核心包括两项关键创新:(1)基于LoRA的专家混合(LoRA-MoE),它采用一组专家LoRA,在统一模型中整合各种效果,同时有效缓解跨任务干扰。(2) 空间感知提示(SAP)将空间遮罩信息整合到文本标记中,从而实现精确的空间控制。此外,我们引入了一个集成在SAP中的独立信息流(IIF)模块,用于隔离与单个效果对应的控制信号,以防止任何不必要的混合。为了促进这项研究,我们通过一种结合图像编辑和第一-最后一帧到视频(FLF2V)合成的新颖数据收集流程,构建了一个全面的VFX数据集Omni-VFX,并引入了一个专门的VFX评估框架来验证模型性能。大量实验表明,Omni-Effects实现了精确的空间控制和多样化的效果生成,使用户能够指定所需效果的类别和位置。
太酷了,太棒了!
https://cdn-uploads.huggingface.co/production/uploads/66d255e3947594430c723ff6/iBwZLkI16Rhh1Y1ZvX4S-.mp4