从一到多:用于3D生成的上下文部分潜在变量

发表
Shaocong DongShaocong Dong 提交
作者: Shaocong Dong, Lihe Ding, Xiao Chen, Yaokun Li, Yuxin Wang, Yucheng Wang, Qi Wang, Jaehyeok Kim, Chenjian Gao, Zhanpeng Huang, Zibin Wang, Tianfan Xue, Dan XuDan Xu

摘要

AI 生成总结
CoPart是一个部件感知扩散框架,通过将对象分解为上下文相关部件潜在空间,增强了3D生成能力,改进了细节、部件关系和可控性。
3D生成领域的最新进展已从多视角2D渲染方法转向利用真实数据中几何先验的3D原生潜在扩散框架。尽管取得了进展,但仍存在三个主要限制:(1)单一潜在表示未能捕获复杂的多部分几何结构,导致细节退化;(2)整体潜在编码忽略了对于组合设计至关重要的部分独立性和相互关系;(3)全局条件机制缺乏细粒度控制性。受人类3D设计工作流的启发,我们提出了CoPart——一个部分感知的扩散框架,它将3D对象分解为上下文相关的部分潜在表示,以实现连贯的多部分生成。这种范式提供了三个优势:i)通过部分分解降低了编码复杂性;ii)实现了显式部分关系建模;iii)支持部分级别的条件化。我们进一步开发了一种相互引导策略,用于微调预训练的扩散模型,以实现联合部分潜在去噪,确保几何连贯性和基础模型先验。为了实现大规模训练,我们构建了Partverse——一个通过自动化网格分割和人工验证标注从Objaverse派生出的新型3D部分数据集。大量实验表明,CoPart在部分级别编辑、关节对象生成和场景组合方面具有卓越的能力,并提供了前所未有的可控性。
查看 arXiv 页面查看 PDF

评论

Shaocong DongShaocong Dong
论文提交者

data_teaser.png

Shaocong DongShaocong Dong
论文提交者
此评论已隐藏。
DacingStringDacingString

好的