LongAnimation:基于动态全局-局部记忆的长动画生成

发表
Nan ChenNan Chen 提交
作者: Nan ChenNan Chen, Mengqi Huang, Yihao Meng, Zhendong Mao

摘要

动漫着色是真实动漫产业制作的关键部分。长动漫着色具有高昂的人工成本。因此,基于视频生成模型的自动化长动漫着色具有重要的研究价值。现有的研究仅限于短期着色。这些研究采用局部范式,融合重叠特征以实现局部片段之间的平滑过渡。然而,局部范式忽略了全局信息,无法维持长期的颜色一致性。在本研究中,我们认为,理想的长期颜色一致性可以通过动态的全局-局部范式来实现,即动态地提取与当前生成相关的全局颜色一致性特征。具体来说,我们提出了 LongAnimation,一种新颖的框架,主要包括 SketchDiT、动态全局-局部记忆 (DGLM) 和颜色一致性奖励。SketchDiT 捕获混合参考特征以支持 DGLM 模块。DGLM 模块采用长视频理解模型来动态压缩全局历史特征,并将其与当前生成特征自适应地融合。为了改善颜色一致性,我们引入了颜色一致性奖励。在推理过程中,我们提出了一种颜色一致性融合来平滑视频片段过渡。在短期(14 帧)和长期(平均 500 帧)动画上的大量实验表明,LongAnimation 在保持开放域动画着色任务的短期和长期颜色一致性方面的有效性。该代码可以在 https://cn-makers.github.io/long_animation_web/ 找到。
查看 arXiv 页面查看 PDF

评论

Nan ChenNan Chen
论文作者
论文提交者

超级酷的项目,专注于自动化漫长的动画创作过程,已被 ICCV 接受。

Siyuan WangSiyuan Wang

很好的作品,能发一下你的B站页面链接吗?

Nan ChenNan Chen
论文作者
论文提交者

我们的哔哩哔哩链接:https://www.bilibili.com/video/BV1R63TztEZq/?spm_id_from=333.1387.homepage.video_card.click