⏶8
LookingGlass:通过拉普拉斯金字塔扭曲的生成式变形
发表
由
Manuel Kansy 提交
作者:
Pascal Chang,
Sergio Sancho, Jingwei Tang, Markus Gross, Vinicius C. Azevedo
摘要
变形图像是指一类被故意扭曲的图像,直接观看时无法辨认。它们的真实形态只有从特定的视角才能显现出来,这可以通过诸如镜子或透镜之类的反射折射设备来实现。虽然这些数学装置的构造可以追溯到 17 世纪早期,但它们只有从特定的有利位置观看时才能被理解,并且在正常观看时往往会失去意义。在本文中,我们以生成式的方式重新审视这些著名的光学错觉。借助潜在的修正流模型,我们提出了一种创建变形图像的方法,这些图像在直接观看时仍然保留有效的解释。为此,我们引入了拉普拉斯金字塔扭曲,这是一种频率感知图像扭曲技术,是生成高质量视觉效果的关键。我们的工作将视觉字谜 (arXiv:2311.17919) 扩展到潜在空间模型和更广泛的空间变换,从而能够创造出新颖的生成式感知错觉。
评论
论文作者
这是该方法的一些视频结果。请欣赏! https://cdn-uploads.huggingface.co/production/uploads/64e3950d9ec4cf50009ce960/2jUOqJSQAPnfsyi4KG7b3.mp4
LookingGlass 是一种方法,用于使用潜在扩散模型生成高质量的歧义变形图——这些图像在通过镜子或透镜观看时会显示隐藏的图像。
被 CVPR 2025 接收 (口头报告)