⏶10
CreatiPoster:迈向可编辑和可控的多层图形设计生成
发表
由
Zhao Zhang 提交

作者:
Zhao Zhang, Yutao Cheng,
Dexiang Hong,
Maoke Yang,
Gonglei Shi, Lei Ma, Hui Zhang, Jie Shao, Xinglong Wu

摘要
平面设计在商业和个人领域都扮演着至关重要的角色,然而,创建高质量、可编辑且美观的图形作品仍然是一项耗时且技能密集的任务,特别是对于初学者而言。当前的 AI 工具自动化了工作流程的部分环节,但在准确整合用户提供的素材、保持可编辑性以及实现专业视觉效果方面仍面临挑战。诸如 Canva Magic Design 等商业系统依赖于庞大的模板库,这在复制方面是不切实际的。在本文中,我们推出了 CreatiPoster,这是一个可以根据可选的自然语言指令或素材生成可编辑、多层构图的框架。首先,一个协议模型(即一个 RGBA 大型多模态模型)生成一个 JSON 规范,详细说明每个图层(文本或素材)的精确布局、层级、内容和样式,以及一个简洁的背景提示。然后,一个条件背景模型根据这些渲染的前景图层合成一个连贯的背景。我们构建了一个包含自动化指标的平面设计生成基准,并展示了 CreatiPoster 超越了领先的开源方法和专有商业系统。为了促进进一步的研究,我们发布了一个包含 10 万个多层设计的无版权语料库。CreatiPoster 支持多种应用,如画布编辑、文本叠加、响应式调整大小、多语言适配和动画海报,从而推动 AI 辅助平面设计的普及。项目主页:https://github.com/graphic-design-ai/creatiposter
评论

论文作者
论文提交者
此评论已隐藏。