⏶30
VisualQuality-R1:通过强化学习排序实现的基于推理的图像质量评估
发表
由
Tianhe Wu 提交

作者:
Tianhe Wu, Jian Zou, Jie Liang, Lei Zhang, Kede Ma

摘要
DeepSeek-R1 通过强化学习在激发大型语言模型(LLMs)的推理和泛化能力方面表现出显著的有效性。然而,在图像质量评估(IQA)这一严重依赖视觉推理的任务中,由推理驱动的计算建模的潜力尚未得到充分探索。在本文中,我们引入了 VisualQuality-R1,一个由推理驱动的无参考 IQA(NR-IQA)模型,并使用强化学习进行排序训练,这是一种针对视觉质量本质上相对性的学习算法。具体来说,对于一对图像,我们采用组相对策略优化为每张图像生成多个质量分数。然后利用这些估计值,在 Thurstone 模型下计算一张图像质量高于另一张图像的比较概率。每个质量估计的奖励是使用连续保真度度量定义的,而不是离散的二元标签。大量实验表明,所提出的 VisualQuality-R1 持续优于基于判别式深度学习的 NR-IQA 模型以及最近的一种由推理驱动的质量回归方法。此外,VisualQuality-R1 能够生成上下文丰富、与人类感知一致的质量描述,并支持多数据集训练,无需感知尺度重新对齐。这些特性使得 VisualQuality-R1 特别适合可靠地衡量超分辨率和图像生成等广泛图像处理任务的进展。
评论

论文作者
论文提交者
此评论已隐藏。