SWE-Exp:经验驱动的软件问题解决方案

发表
YulingYuling 提交
作者: Silin ChenSilin Chen, Shaoxin Lin, Xiaodong Gu, YulingYuling Shi, Heng Lian, Longfei Yun, Dong Chen, Weiguo Sun, Lin Cao, Qianxiang Wang

摘要

大型语言模型(LLM)智能体最近在软件问题解决方面取得了显著进展,利用了多智能体协作和蒙特卡洛树搜索(MCTS)等先进技术。然而,当前的智能体如同无记忆的探索者——它们孤立地处理每个问题,不保留或重用以往修复经验中的知识。这导致了对失败轨迹的冗余探索,并错失了将成功的问题解决方法应用于类似问题的机会。为了解决这个问题,我们引入了SWE-Exp,一种经验增强方法,它从先前的智能体轨迹中提炼出简洁且可操作的经验,从而实现跨问题的持续学习。我们的方法引入了一个多方面的经验库,捕捉成功和失败的修复尝试。具体来说,它在不同层面上提取可重用的问题解决知识——从高层次的问题理解到具体的代码变更。实验表明,在开源智能体框架下,SWE-Exp在SWE-bench-Verified数据集上取得了当前最佳的问题解决率(41.6% Pass@1)。我们的方法建立了一个新范式,即自动化软件工程智能体系统地积累和利用修复专业知识,从根本上将试错式探索转变为战略性的、由经验驱动的问题解决方式。
查看 arXiv 页面查看 PDF

评论

YulingYuling
论文作者
论文提交者

AI代理从过去的修复“经验”中学习,更高效地解决新问题。

代码:https://github.com/YerbaPage/SWE-Exp