⏶7
变革的智能体:用于战略规划的自演进LLM智能体
发表
由
Xin Eric Wang 提交
作者:
Nikolas Belle,
Dakota Barnes,
Alfonso Amayuelas,
Ivan Bercovich,
Xin Eric Wang, William Wang

摘要
LLM的最新进展使其能够作为自主代理应用于各种任务,但它们在制定和遵循连贯的长期策略方面仍然存在困难。在本文中,我们研究了LLM代理在明确挑战其战略规划能力的环境中是否能够自我改进。我们使用通过开源Catanatron框架访问的《卡坦岛》棋盘游戏,对一系列基于LLM的代理进行基准测试,从简单的游戏代理到能够自主重写自身提示和玩家代理代码的系统。我们引入了一种多代理架构,其中专门的角色(分析器、研究员、编码器和玩家)协同工作,迭代分析游戏玩法,研究新策略,并修改代理的逻辑或提示。通过比较手动创建的代理与完全由LLM进化的代理,我们评估了这些系统诊断故障和随时间适应的有效性。我们的结果表明,自我进化的代理,特别是当由Claude 3.7和GPT-4o等模型驱动时,通过自主调整策略、将示例行为传递给游戏代理并在多次迭代中展示自适应推理,优于静态基线。
《变革的智能体》展示了自进化的LLM智能体如何自主重写提示和代码,掌握卡坦岛定居者游戏中的战略规划,无需人工干预即可实现技能的重大提升。