Ctrl-Crash: 可控扩散生成逼真汽车碰撞

发表
Anthony GosselinAnthony Gosselin 提交
作者: Anthony GosselinAnthony Gosselin, Ge Ya Luo, Luis LaraLuis Lara, Florian Golemo, Derek Nowrouzezahrai, Liam Paull, Alexia Jolicoeur-Martineau, Christopher Pal

摘要

近年来,视频扩散技术取得了显著进展;然而,由于大多数驾驶数据集中事故事件的稀缺性,它们难以生成逼真的车祸图像。提高交通安全需要真实且可控的事故模拟。为了解决这个问题,我们提出了Ctrl-Crash,这是一个可控的车祸视频生成模型,它以边界框、碰撞类型和初始图像帧等信号为条件。我们的方法能够生成反事实场景,其中输入中的微小变化可能导致截然不同的碰撞结果。为了在推理时支持细粒度控制,我们利用了无分类器指导,并为每个条件信号设置了可独立调整的尺度。与之前的基于扩散的方法相比,Ctrl-Crash在定量视频质量指标(例如FVD和JEDi)以及基于人类对物理真实性和视频质量评估的定性测量方面均达到了最先进的性能。
查看 arXiv 页面查看 PDF

评论

Anthony GosselinAnthony Gosselin
论文作者
论文提交者

💥 访问我们的网站获取更多视频演示!

🌐 网站:https://anthonygosselin.github.io/Ctrl-Crash-ProjectPage/

📄 论文:https://arxiv.org/abs/2506.00227

🔗 GitHub:https://github.com/AnthonyGosselin/Ctrl-Crash/tree/master

🤗 HuggingFace:https://huggingface.co/AnthonyGosselin/Ctrl-Crash

Anthony GosselinAnthony Gosselin
论文作者
论文提交者

生成的视频示例:

genvid_57_11_04453.gif

genvid_64_48_08386.gif

genvid_87_21_08924.gif