HASHIRU: 分层智能体系统用于混合智能资源利用

发表
Kunal PaiKunal Pai 提交
作者: Kunal PaiKunal Pai, Parth ShahParth Shah, Harshil Patel

摘要

大型语言模型 (LLM) 的快速发展正在推动自主多智能体系统 (MAS) 的发展。然而,当前框架通常缺乏灵活性、资源感知能力、模型多样性以及自主工具创建能力。本文介绍了 HASHIRU (混合智能资源利用的分层智能体系统),一个新颖的 MAS 框架,旨在增强灵活性、资源效率和适应性。HASHIRU 设有一个“CEO”智能体,动态管理专业的“员工”智能体,这些员工智能体根据任务需求和资源限制(成本、内存)进行实例化。其混合智能优先使用较小的本地 LLM(通过 Ollama),同时在必要时灵活使用外部 API 和大型模型。一个包含雇佣/解雇成本的经济模型促进了团队稳定性和高效资源分配。该系统还包括自主 API 工具创建和内存功能。对学术论文审阅(58% 成功率)、安全评估(在 JailbreakBench 子集上达到 100%),以及复杂推理(在 GSM8K 上超越 Gemini 2.0 Flash:96% 对 61%;JEEBench:80% 对 68.3%;SVAMP:92% 对 84%)等任务的评估,证明了 HASHIRU 的能力。案例研究表明,它通过自主成本模型生成、工具集成和预算管理实现了自我改进。HASHIRU 通过动态分层控制、资源感知混合智能和自主功能扩展,为构建更健壮、高效和适应性强的 MAS 提供了一种有前景的方法。源代码和基准可在 https://github.com/HASHIRU-AI/HASHIRUhttps://github.com/HASHIRU-AI/HASHIRUBench 分别获取,按需提供 https://hashiruagentx-hashiruai.hf.space 的实时演示。
查看 arXiv 页面查看 PDF

评论

Kunal PaiKunal Pai
论文作者
论文提交者

大型语言模型(LLM)的迅速发展正在推动自主多智能体系统(MAS)的发展。然而,现有框架通常缺乏灵活性、资源感知能力、模型多样性以及自主工具创建能力。本文介绍了一种新颖的MAS框架——HASHIRU(混合智能资源利用分层智能体系统),旨在提高灵活性、资源效率和适应性。HASHIRU设有一个“CEO”智能体,负责动态管理基于任务需求和资源限制(成本、内存)实例化的专业“员工”智能体。它的混合智能优先使用较小的本地LLM(通过Ollama),同时在必要时灵活使用外部API和更大的模型。一个包含雇佣/解雇成本的经济模型促进了团队稳定性和高效的资源分配。该系统还包括自主API工具创建和记忆功能。在学术论文审阅(58%成功率)、安全评估(在JailbreakBench子集上达到100%)和复杂推理(在GSM8K上表现优于Gemini 2.0 Flash:96% 对 61%;JEEBench:80% 对 68.3%;SVAMP:92% 对 84%)等任务上的评估展示了HASHIRU的能力。案例研究表明,HASHIRU通过自主成本模型生成、工具集成和预算管理实现自我提升。通过动态分层控制、资源感知混合智能和自主功能扩展,HASHIRU为构建更稳健、高效和适应性强的MAS提供了一种有前景的方法。