⏶15
G-FOCUS: 迈向评估UI设计说服力的一种鲁棒方法
发表
由
Jaehyun Jeon 提交
作者:
Jaehyun Jeon,
Jang Han Yoon, Min Soo Kim,
Sumin Shim,
Yejin Choi, Hanbin Kim, Youngjae Yu
摘要
评估用户界面 (UI) 设计的有效性不仅仅关乎美学,更在于其影响用户行为的能力,这是设计说服力 (Design Persuasiveness) 的核心原则。A/B 测试是确定哪种 UI 变体能带来更高用户参与度的主要方法,但其成本高昂且耗时。尽管最近的视觉语言模型 (VLMs) 可以进行自动化的 UI 分析,但现有方法侧重于孤立的设计属性,而非比较性说服力——后者才是优化用户交互的关键因素。为了解决这个问题,我们引入了 WiserUI-Bench,这是一个专为“成对 UI 设计说服力评估”任务设计的基准,包含 300 对带有 A/B 测试结果和专家理由标注的真实世界 UI 图像。此外,我们还提出了 G-FOCUS,这是一种新颖的推理时策略,通过减少位置偏差和提高评估准确性,增强基于 VLM 的说服力评估。实验结果表明,在成对 UI 评估中,G-FOCUS 在一致性和准确性方面超越了现有的推理策略。通过推动基于 VLM 的 UI 说服力评估,我们的工作提供了一种补充 A/B 测试的方法,从而推动了可扩展 UI 偏好建模和设计优化的进展。代码和数据将公开发布。
我们推出了 WiserUI-Bench,这是一个包含 300 对真实世界 UI 图像和 A/B 测试结果的基准,用于评估设计的说服力。我们的推理策略 G-FOCUS 通过减少偏差和提高准确性,增强了多模态模型(VLMs)在 UI 评估中的可靠性。