MeshCoder:基于大型语言模型的点云结构化网格代码生成

发表
Zhaoyang LyuZhaoyang Lyu 提交
作者: Bingquan Dai, Li Ray Luo, Qihong TangQihong Tang, Jie Wang, Xinyu Lian, xuhaoHao Xu, Minghan QinMinghan Qin, Xudong Xu, Bo DaiBo Dai, Haoqian Wang, Zhaoyang LyuZhaoyang Lyu, Jiangmiao PangJiangmiao Pang

摘要

将 3D 对象重构为可编辑程序对于逆向工程和形状编辑等应用至关重要。然而,现有方法通常依赖于有限的领域特定语言 (DSL) 和小规模数据集,这限制了它们对复杂几何形状和结构进行建模的能力。为了解决这些挑战,我们引入了 MeshCoder,这是一个新颖的框架,可以将点云中的复杂 3D 对象重构为可编辑的 Blender Python 脚本。我们开发了一套全面的、表达能力强的 Blender Python API,能够合成复杂的几何形状。利用这些 API,我们构建了一个大规模的配对对象-代码数据集,其中每个对象的代码被分解为不同的语义部分。随后,我们训练了一个多模态大型语言模型 (LLM),该模型将 3D 点云转换为可执行的 Blender Python 脚本。我们的方法不仅在形状到代码重构任务上取得了卓越的性能,而且通过方便的代码修改,还促进了直观的几何和拓扑编辑。此外,我们的代码表示增强了 LLM 在 3D 形状理解任务中的推理能力。总而言之,这些贡献共同将 MeshCoder 定位为一种强大的、灵活的程序化 3D 形状重构和理解解决方案。
查看 arXiv 页面查看 PDF

评论