⏶3
MMRefine:多模态大语言模型鲁棒精炼的障碍揭示
发表
由
Gio Paik 提交
作者:
Gio Paik, Geewook Kim, Jinbae Im
摘要
本文介绍了 MMRefine,这是一个多模态精炼基准,旨在评估多模态大型语言模型(MLLM)的错误精炼能力。随着重点转向推理过程中的推理能力增强,MMRefine 提供了一个框架,该框架不仅比较精炼前后的最终准确率,还评估 MLLM 在六种不同场景中检测和纠正错误的能力。此外,该基准通过将错误分为六种错误类型来分析精炼性能。对各种开放和封闭 MLLM 的实验揭示了瓶颈和阻碍精炼性能的因素,突出了有效推理增强的改进领域。我们的代码和数据集可在 https://github.com/naver-ai/MMRefine 公开获取。
ACL Findings 2025
代码即将在此处提供:github!