⏶3

MMRefine：多模态大语言模型鲁棒精炼的障碍揭示

06月05日发表

06月11日由 Gio Paik 提交

作者: Gio Paik, Geewook Kim, Jinbae Im

摘要

本文介绍了 MMRefine，这是一个多模态精炼基准，旨在评估多模态大型语言模型（MLLM）的错误精炼能力。随着重点转向推理过程中的推理能力增强，MMRefine 提供了一个框架，该框架不仅比较精炼前后的最终准确率，还评估 MLLM 在六种不同场景中检测和纠正错误的能力。此外，该基准通过将错误分为六种错误类型来分析精炼性能。对各种开放和封闭 MLLM 的实验揭示了瓶颈和阻碍精炼性能的因素，突出了有效推理增强的改进领域。我们的代码和数据集可在 https://github.com/naver-ai/MMRefine 公开获取。

查看 arXiv 页面查看 PDF

Gio Paik

论文作者

论文提交者

ACL Findings 2025

代码即将在此处提供：github！

MMRefine：多模态大语言模型鲁棒精炼的障碍揭示

摘要

评论