HPSv3: 迈向广谱人类偏好分数

发表
YunhaoshuiYunhaoshui 提交
作者: Yuhang Ma, Xiaoshi Wu, Keqiang Sun, Hongsheng Li

摘要

评估文本到图像生成模型需要与人类感知对齐,但现有以人类为中心的度量标准受到数据覆盖有限、特征提取次优和损失函数效率低下的限制。为了解决这些挑战,我们引入了人类偏好评分 v3 (HPSv3)。(1) 我们发布了 HPDv3,这是第一个广泛的人类偏好数据集,整合了来自最先进的生成模型和从低质量到高质量真实世界图像的 1.08M 文本-图像对和 1.17M 标注的成对比较。(2) 我们引入了一个基于 VLM 的偏好模型,该模型使用不确定性感知排名损失进行训练,以实现细粒度排名。此外,我们提出了人类偏好链 (CoHP),这是一种迭代图像细化方法,可以在不额外数据的情况下提高质量,使用 HPSv3 在每个步骤中选择最佳图像。大量实验表明,HPSv3 作为广泛图像评估的稳健度量标准,CoHP 提供了一种高效且与人类对齐的方法来提高图像生成质量。代码和数据集可在 HPSv3 主页获取。
查看 arXiv 页面查看 PDF

评论

YunhaoshuiYunhaoshui
论文提交者

我们发布HPSv3!