⏶48
PICABench:我们在物理现实图像编辑方面还有多远?
发表
由
YuandongPu 提交

作者: Yuandong Pu, Le Zhuo, Songhao Han, Jinbo Xing, Kaiwen Zhu, Shuo Cao, Bin Fu, Si Liu, Hongsheng Li, Yu Qiao, Wenlong Zhang, Xi Chen, Yihao Liu
摘要
AI 生成总结
PICABench和PICAEval通过评估八个子维度并使用VLM作为评判者并结合人类标注来评估图像编辑中的物理真实性,强调了对基于物理的解决方案的需求。图像编辑近年来取得了显著的进展。现代编辑模型已经能够遵循复杂的指令来操纵原始内容。然而,除了完成编辑指令之外,伴随的物理效应是生成逼真的关键。例如,移除一个物体也应该移除它的阴影、反射以及与附近物体的相互作用。不幸的是,现有的模型和基准测试主要关注指令的完成,而忽略了这些物理效应。那么,目前我们离物理上逼真的图像编辑还有多远?为了回答这个问题,我们介绍了PICABench,它系统地评估了大多数常见编辑操作(添加、移除、属性更改等)在八个子维度(涵盖光学、力学和状态转换)上的物理真实性。我们进一步提出了PICAEval,一个可靠的评估协议,使用VLM作为裁判,并结合逐例、区域级别的人工标注和问题。除了基准测试,我们还通过从视频中学习物理原理来探索有效的解决方案,并构建了一个训练数据集PICA-100K。在评估了大多数主流模型后,我们观察到物理真实性仍然是一个具有巨大探索空间的挑战性问题。我们希望我们的基准测试和提出的解决方案能为未来从简单的内容编辑走向物理一致性逼真的工作奠定基础。
项目页面:https://picabench.github.io/