Seaweed-7B:视频生成基础模型的经济高效训练

发表
Lu JiangLu Jiang 提交
作者: Team Seawead, Ceyuan Yang, Zhijie LinZhijie Lin, Yang Zhao, Shanchuan Lin, Zhibei MaZhibei Ma, Haoyuan Guo, Hao Chen, Lu Qi, Sen Wang, Feng ChengFeng Cheng, Feilong Zuo Xuejiao Zeng, Ziyan YangZiyan Yang, Fangyuan Kong, Zhiwu Qing, Fei Xiao, Meng Wei, Tuyen Hoang, Siyu Zhang, Peihao Zhu, Qi Zhao, Jiangqiao Yan, Liangke Gui, Sheng Bi, Jiashi Li, Yuxi Ren, Rui Wang, Huixia Li, Xuefeng Xiao, Shu Liu, Ling FengFeng Ling, Heng Zhang, Houmin Wei, Huafeng Kuang, Jerry Duncan, Junda Zhang, Junru Zheng, Li Sun, Manlin Zhang, Renfei Sun, xiaobin zhuangXiaobin Zhuang, Xiaojie Li, Xin Xia, Xuyan Chi, Yanghua Peng, Yuping Wang, Yuxuan Wang, Zhongkai Zhao, Zhuo Chen, Zuquan Song, Zhenheng YangZhenheng Yang, Jiashi Feng, Jianchao Yang, Lu Jiang

摘要

本技术报告介绍了一种经济高效的策略,用于训练视频生成基础模型。我们提出了一个中等规模的研究模型,约有 70 亿参数 (7B),名为 Seaweed-7B,使用 665,000 H100 GPU 小时从头开始训练。尽管 Seaweed-7B 使用适中的计算资源进行训练,但与当代规模更大的视频生成模型相比,它表现出极具竞争力的性能。在资源受限的环境中,设计选择尤为关键。本技术报告重点介绍了提升中等规模扩散模型性能的关键设计决策。根据经验,我们得出两个观察结果:(1)Seaweed-7B 的性能与使用更多 GPU 资源训练的更大模型相当,甚至超越了它们;(2)我们的模型展现出强大的泛化能力,可以通过轻量级微调或持续训练有效地适应各种下游应用。项目主页请见 https://seaweed.video/
查看 arXiv 页面查看 PDF
Seaweed-7B:视频生成基础模型的经济高效训练

评论

Lu JiangLu Jiang
论文提交者

Seaweed-7B:一个经济高效的视频生成基础模型

Morice MichelMorice Michel

file_00000000accc51f6bcf84dd84d748334_conversation_id=67f53562-d114-800f-ace4-0d76721344a0&message_id=ea2430ba-b2ce-4e73-ba57-0990c8b9d834.jpg

Lu JiangLu Jiang
论文提交者
此评论已隐藏。
eeposeepos

看起来很棒!

你们计划发布权重吗? 这对于在消费级 GPU 上进行本地推理,且推理成本较低的情况下,将是非常棒的事情。

Michael BarryMichael Barry

我只读了项目页面,考虑到它具有从参考图像中学习的 ICL 能力,我认为公开地发布权重是不明智的。

SivaNithishSivaNithish

为什么不

PseudoTerminal XPseudoTerminal X

flux 有上下文学习能力,Wan、Hunyuan 视频也是。实际上 IP Adapter 就是为此而存在的,还有 InfiniteYou、photomaker 等等! 这不是一个真正的发布问题。

qiangqiang

太棒了!