DPoser-X:扩散模型作为鲁棒的 3D 全身人体姿态先验

发表
Junzhe LuJunzhe Lu 提交
作者: Junzhe LuJunzhe Lu, Jing Lin, Hongkun Dou, Ailing Zeng, Yue Deng, Xian Liu, Zhongang CaiZhongang Cai, yl-1993Lei Yang, Yulun Zhang, Haoqian Wang, Ziwei Liu

摘要

我们提出了 DPoser-X,这是一种基于扩散的三维全身人体姿态先验模型。由于关节式人体姿态固有的复杂性以及高质量全身姿态数据集的稀缺性,构建一个多功能且鲁棒的全身人体姿态先验模型仍然具有挑战性。为了解决这些限制,我们引入了扩散模型作为身体姿态先验(DPoser),并将其扩展到 DPoser-X,用于表达性全身人体姿态建模。我们的方法将各种以姿态为中心的任务统一为逆问题,通过变分扩散采样来解决它们。为了提高下游应用的性能,我们引入了一种新颖的截断时间步调度方法,专门为姿态数据特征设计。我们还提出了一种掩码训练机制,有效地结合了全身和特定部位的数据集,使我们的模型能够捕捉身体部位之间的相互依赖性,同时避免过度拟合特定动作。大量的实验证明了 DPoser-X 在身体、手、面部和全身姿态建模的多个基准上的鲁棒性和多功能性。我们的模型始终优于最先进的替代方案,为全身人体姿态先验建模建立了新的基准。
查看 arXiv 页面查看 PDF

评论

Junzhe LuJunzhe Lu
论文作者
论文提交者
此评论已隐藏。
Junzhe LuJunzhe Lu
论文作者
论文提交者

🚨 革命性的 3D 人体姿态先验模型问世了!

我们隆重推出 DPoser-X——首个基于扩散的强大 3D 全身人体姿态先验模型。

🤖 当前的姿态先验模型,如 VPoser 和 NDFs,在身体部位的多样性和真实性方面表现不足。

因此,我们构建了一个基于扩散的姿态先验模型,它:

🧬 利用无条件扩散模型作为强大的姿态先验

🔁 通过统一的优化框架解决以姿态为中心的任务

📉 使用为姿态数据优化的截断时间步调度

🎯 采用混合训练策略进行高级全身姿态建模

结果如何?一个适用于所有姿态相关任务的多功能先验模型。

📊 在 8 个基准测试中,性能提升高达 61%,超越所有现有替代方案。

📚 论文:https://arxiv.org/abs/2508.00599

💻 代码:https://github.com/careless-lu/DPoser

🌐 项目:https://dposer.github.io/

🎥 演示:https://youtu.be/yzwliadFcX0

🎉 被 ICCV 2025 口头报告接收!