SWE-Debate:用于解决软件问题的多智能体竞争性辩论

发表
YulingYuling 提交
作者: Han Li, YulingYuling Shi, Shaoxin Lin, Xiaodong Gu, Heng Lian, Xin Wang, Yantao Jia, Tao Huang, Qianxiang Wang

摘要

得益于大型语言模型(LLM)先进的推理能力,问题解决领域取得了显著进展。最近,诸如SWE-agent之类的基于智能体的框架通过让自主的、会使用工具的智能体处理复杂的软件工程任务,进一步推动了这一进展。虽然现有的基于智能体的问题解决方法主要依赖于智能体的独立探索,但它们常常陷入局部最优解,并且无法识别出跨越代码库不同部分的模式性问题。为了解决这个局限,我们提出了SWE-Debate,一个竞争性的多智能体辩论框架,它鼓励多样化的推理路径,并实现更可靠的问题定位。SWE-Debate首先通过遍历代码依赖图,创建多个故障传播轨迹作为定位提议。然后,它组织了一场由多个专业智能体参与的三轮辩论,每个智能体都沿着故障传播轨迹体现出独特的推理视角。这种结构化的竞争使智能体能够协同合作,最终达成一个统一的修复计划。最后,这个统一的修复计划被整合到一个基于蒙特卡洛树搜索(MCTS)的代码修改智能体中,用于生成补丁。在SWE-bench基准上的实验表明,SWE-Debate在开源智能体框架中取得了新的最佳结果,并以较大优势超越了基线模型。
查看 arXiv 页面查看 PDF

评论

YulingYuling
论文作者
论文提交者

AI代理竞争和“辩论”,以生成最佳代码修复。

代码:https://github.com/YerbaPage/SWE-Debate