⏶16

从一到多：用于3D生成的上下文部分潜在变量

07月11日发表

07月14日由 Shaocong Dong 提交

作者: Shaocong Dong, Lihe Ding, Xiao Chen, Yaokun Li, Yuxin Wang, Yucheng Wang, Qi Wang, Jaehyeok Kim, Chenjian Gao, Zhanpeng Huang, Zibin Wang, Tianfan Xue, Dan Xu Dan Xu

摘要

3D生成领域的最新进展已从多视角2D渲染方法转向利用真实数据中几何先验的3D原生潜在扩散框架。尽管取得了进展，但仍存在三个主要限制：（1）单一潜在表示未能捕获复杂的多部分几何结构，导致细节退化；（2）整体潜在编码忽略了对于组合设计至关重要的部分独立性和相互关系；（3）全局条件机制缺乏细粒度控制性。受人类3D设计工作流的启发，我们提出了CoPart——一个部分感知的扩散框架，它将3D对象分解为上下文相关的部分潜在表示，以实现连贯的多部分生成。这种范式提供了三个优势：i）通过部分分解降低了编码复杂性；ii）实现了显式部分关系建模；iii）支持部分级别的条件化。我们进一步开发了一种相互引导策略，用于微调预训练的扩散模型，以实现联合部分潜在去噪，确保几何连贯性和基础模型先验。为了实现大规模训练，我们构建了Partverse——一个通过自动化网格分割和人工验证标注从Objaverse派生出的新型3D部分数据集。大量实验表明，CoPart在部分级别编辑、关节对象生成和场景组合方面具有卓越的能力，并提供了前所未有的可控性。

查看 arXiv 页面查看 PDF

Shaocong Dong

论文提交者

Shaocong Dong

论文提交者

此评论已隐藏。