⏶9
MeshLLM:赋能大型语言模型逐步理解和生成 3D 网格
发表
由
Shuangkang Fang 提交
作者: Shuangkang Fang, I-Chao Shen, Yufeng Wang, Yi-Hsuan Tsai, Yi Yang, Shuchang Zhou, Wenrui Ding, Takeo Igarashi, Ming-Hsuan Yang
摘要
我们提出了MeshLLM,一个利用大型语言模型(LLMs)理解和生成文本序列化3D网格的新颖框架。我们的方法解决了现有方法的关键限制,包括在适应LLMs的令牌长度时数据集规模有限以及网格序列化过程中3D结构信息的丢失。我们引入了一种“原始网格分解”策略,将3D网格分解为结构上有意义的子单元。这使得我们能够创建一个包含1500k+样本的大规模数据集,比以前的方法大了近50倍,这更好地符合LLM的缩放定律原则。此外,我们提出了从顶点推断面连接和局部网格组装训练策略,显著增强了LLMs捕捉网格拓扑和空间结构的能力。实验表明,MeshLLM在网格生成质量和形状理解方面均优于最先进的LLaMA-Mesh,突显了其在处理文本序列化3D网格方面的巨大潜力。
ICCV 2025