MMRefine:多模态大语言模型鲁棒精炼的障碍揭示

发表
Gio PaikGio Paik 提交
作者: Gio PaikGio Paik, Geewook Kim, Jinbae Im

摘要

本文介绍了 MMRefine,这是一个多模态精炼基准,旨在评估多模态大型语言模型(MLLM)的错误精炼能力。随着重点转向推理过程中的推理能力增强,MMRefine 提供了一个框架,该框架不仅比较精炼前后的最终准确率,还评估 MLLM 在六种不同场景中检测和纠正错误的能力。此外,该基准通过将错误分为六种错误类型来分析精炼性能。对各种开放和封闭 MLLM 的实验揭示了瓶颈和阻碍精炼性能的因素,突出了有效推理增强的改进领域。我们的代码和数据集可在 https://github.com/naver-ai/MMRefine 公开获取。
查看 arXiv 页面查看 PDF

评论

Gio PaikGio Paik
论文作者
论文提交者

ACL Findings 2025

代码即将在此处提供:github