⏶21
负引导的主体保真度优化以实现零样本主体驱动生成
发表
由
shin 提交
作者:
Chaehun Shin,
Jooyoung Choi, Johan Barthelemy, Jungbeom Lee, Sungroh Yoon
摘要
我们提出了主体保真度优化(Subject Fidelity Optimization, SFO),一个用于零样本主体驱动生成的新型比较学习框架,旨在增强主体保真度。SFO超越了仅依赖正目标并使用扩散损失(如预训练阶段)的监督微调方法,它引入了合成负目标,并通过成对比较明确地引导模型偏爱正目标而非负目标。对于负目标,我们提出了条件-降级负采样(Condition-Degradation Negative Sampling, CDNS),该方法通过有意降级视觉和文本提示,自动生成独特且信息丰富的负样本,而无需昂贵的人工标注。此外,我们重新加权扩散时间步,以将微调集中在主体细节出现的中间步骤。广泛的实验表明,结合CDNS的SFO在主体保真度和文本对齐方面显著优于主体驱动生成基准上的现有方法。项目页面:https://subjectfidelityoptimization.github.io/
我们引入了主体保真度优化(SFO),通过引入负目标和基于比较的学习信号,明确指导模型哪些方面是期望的,哪些不是,从而增强了零样本主体驱动文本到图像生成中的主体保真度。