AutoMind:用于自动化数据科学的自适应知识型智能体

发表
Ningyu ZhangNingyu Zhang 提交
作者: Ou YixinYixin Ou, Yujie Luo, Jingsheng Zheng, Lanning Wei, Shuofei Qiao, Jintian Zhang, Da Zheng, Huajun Chen, Ningyu ZhangNingyu Zhang

摘要

大型语言模型(LLM)智能体在解决现实世界的数据科学问题方面展现出巨大潜力。LLM 驱动的数据科学智能体有望自动化整个机器学习流程,但它们在现实世界中的有效性仍然有限。现有框架依赖于僵硬、预定义的工作流和不灵活的编码策略;因此,它们仅在相对简单、经典的问题上表现出色,未能捕捉人类实践者在复杂、创新任务中积累的经验专业知识。在这项工作中,我们引入了 AutoMind,一个自适应、知识丰富的 LLM 智能体框架,它通过三项关键进展克服了这些不足:(1)一个精心策划的专家知识库,为智能体奠定领域专家知识基础;(2)一个智能体知识树搜索算法,战略性地探索可能的解决方案;以及(3)一个自适应编码策略,根据任务复杂性动态调整代码生成。在两个自动化数据科学基准测试上的评估表明,AutoMind 比最先进的基线模型展现出卓越的性能。进一步的分析证实了其有利的有效性、效率和定性解决方案质量,凸显了 AutoMind 是迈向全自动化数据科学的有效且稳健的一步。
查看 arXiv 页面查看 PDF

评论

Ningyu ZhangNingyu Zhang
论文作者
论文提交者

我们引入了 AutoMind,一个自适应、知识丰富的LLM-agent框架,通过三项关键进展克服了这些缺陷:(1) 一个精心策划的专家知识库,为代理提供了领域专家知识基础;(2) 一个代理式知识树搜索算法,策略性地探索可能的解决方案;以及 (3) 一个自适应编码策略,动态地根据任务复杂性调整代码生成。