基于图像扩散先验的文本到向量生成风格定制

发表
intchousintchous 提交
作者: intchousPeiying Zhang, ZNanxuan Zhao, Jing Liao

摘要

可缩放矢量图形 (SVG) 因其分辨率无关性和良好组织的图层结构而深受设计师青睐。尽管现有的文本到矢量图 (T2V) 生成方法可以从文本提示创建 SVG,但它们常常忽略了实际应用中的一个重要需求:风格定制,这对于生成具有一致视觉外观和连贯美学的矢量图形集合至关重要。扩展现有 T2V 方法以实现风格定制带来一些挑战。基于优化的 T2V 模型可以利用文本到图像 (T2I) 模型的先验知识进行定制,但难以保持结构规律性。另一方面,前馈 T2V 模型可以确保结构规律性,但由于 SVG 训练数据有限,它们在解耦内容和风格方面遇到困难。为了解决这些挑战,我们提出了一种新颖的两阶段 SVG 生成风格定制流程,利用了前馈 T2V 模型和 T2I 图像先验的优点。在第一阶段,我们训练了一个采用路径级表示的 T2V 扩散模型,以确保 SVG 的结构规律性,同时保持多样的表达能力。在第二阶段,我们通过蒸馏定制的 T2I 模型,将 T2V 扩散模型定制到不同的风格。通过集成这些技术,我们的流程可以根据文本提示以高效的前馈方式生成高质量、多样化且具有定制风格的 SVG。我们的方法通过大量实验验证了其有效性。项目页面是 https://customsvg.github.io
查看 arXiv 页面查看 PDF

评论

intchousintchous
论文作者
论文提交者

项目页面是 https://customsvg.github.io。

Linoy TsabanLinoy Tsaban

非常酷!要是在能在 Spaces 上有个 demo 就太棒了 🤗