DreamCube:通过多平面同步生成3D全景图

发表
Yukun HuangYukun Huang 提交
作者: Yukun HuangYukun Huang, Yanning Zhou, Jianan Wang, Kaiyi Huang, Xihui Liu

摘要

3D全景合成是一项充满前景但具有挑战性的任务,它要求生成的全向内容具有高质量和多样化的视觉外观及几何结构。现有方法利用预训练的2D基础模型中的丰富图像先验知识来规避3D全景数据稀缺的问题,但3D全景图和2D单视图之间的不兼容性限制了它们的有效性。在这项工作中,我们证明通过将多平面同步应用于2D基础模型的算子,可以将其能力无缝扩展到全向领域。基于此设计,我们进一步引入了DreamCube,一个用于3D全景生成的多平面RGB-D扩散模型,它最大程度地重用2D基础模型先验知识,以实现多样化的外观和精确的几何结构,同时保持多视图一致性。广泛的实验证明了我们方法在全景图像生成、全景深度估计和3D场景生成方面的有效性。
查看 arXiv 页面查看 PDF

评论

Yukun HuangYukun Huang
论文作者
论文提交者

项目页面:https://yukun-huang.github.io/DreamCube/

SpergwareSpergware

有可供尝试的演示版本吗?

Yukun HuangYukun Huang
论文作者
论文提交者

大家好!我们提供了一个 Gradio 演示,可在此 GitHub 仓库 中获取。我们正在寻求 GPU 支持以构建在线演示:https://huggingface.co/spaces/huggingface/InferenceSupport/discussions/2602

Yukun HuangYukun Huang
论文作者
论文提交者

寻求 GPU 支持以构建在线演示:https://huggingface.co/spaces/huggingface/InferenceSupport/discussions/2602