LookingGlass:通过拉普拉斯金字塔扭曲的生成式变形

发表
Manuel KansyManuel Kansy 提交
作者: Pascal ChangPascal Chang, Sergio SanchoSergio Sancho, Jingwei Tang, Markus Gross, Vinicius C. Azevedo

摘要

变形图像是指一类被故意扭曲的图像,直接观看时无法辨认。它们的真实形态只有从特定的视角才能显现出来,这可以通过诸如镜子或透镜之类的反射折射设备来实现。虽然这些数学装置的构造可以追溯到 17 世纪早期,但它们只有从特定的有利位置观看时才能被理解,并且在正常观看时往往会失去意义。在本文中,我们以生成式的方式重新审视这些著名的光学错觉。借助潜在的修正流模型,我们提出了一种创建变形图像的方法,这些图像在直接观看时仍然保留有效的解释。为此,我们引入了拉普拉斯金字塔扭曲,这是一种频率感知图像扭曲技术,是生成高质量视觉效果的关键。我们的工作将视觉字谜 (arXiv:2311.17919) 扩展到潜在空间模型和更广泛的空间变换,从而能够创造出新颖的生成式感知错觉。
查看 arXiv 页面查看 PDF

评论

Manuel KansyManuel Kansy
论文提交者

LookingGlass 是一种方法,用于使用潜在扩散模型生成高质量的歧义变形图——这些图像在通过镜子或透镜观看时会显示隐藏的图像。

被 CVPR 2025 接收 (口头报告)

Pascal ChangPascal Chang
论文作者

你好 @manuelkansy,感谢分享这项工作!

Linoy TsabanLinoy Tsaban

@manuelkansy 太棒了!你会开源代码吗?

Pascal ChangPascal Chang
论文作者

你好 @linoyts,感谢您支持我们的工作!很遗憾我们不能开源代码,但是附录中的伪代码应该提供足够的信息,关于如何在之前的工作基础上实现这一点 :)

Pascal ChangPascal Chang
论文作者

这是该方法的一些视频结果。请欣赏! https://cdn-uploads.huggingface.co/production/uploads/64e3950d9ec4cf50009ce960/2jUOqJSQAPnfsyi4KG7b3.mp4