⏶18
用于全面理解足球的多智能体系统
发表
由
Jiayuan Rao 饶珈源 提交
作者:
Jiayuan Rao, Zifeng Li,
Haoning Wu, Ya Zhang, Yanfeng Wang, Weidi Xie

摘要
人工智能驱动的足球理解领域的最新进展取得了快速发展,但现有研究主要集中在孤立或狭窄的任务上。为了弥合这一差距,我们提出了一个用于全面足球理解的综合框架。具体来说,我们在本文中做出了以下贡献:(i) 我们构建了SoccerWiki,这是第一个大规模多模态足球知识库,整合了关于球员、球队、裁判和场地的丰富领域知识,以实现知识驱动的推理;(ii) 我们提出了SoccerBench,这是最大、最全面的足球专用基准,包含大约1万个标准化多模态(文本、图像、视频)多项选择题对,涵盖13个不同的理解任务,并通过自动化流程和人工验证精心策划;(iii) 我们引入了SoccerAgent,这是一个新颖的多智能体系统,它通过协作推理分解复杂的足球问题,利用SoccerWiki的领域专业知识,并取得了稳健的性能;(iv) 大量的评估和消融实验,在SoccerBench上对最先进的MLLMs进行了基准测试,突显了我们提出的智能体系统的优越性。所有数据和代码均可在以下地址公开获取:https://jyrao.github.io/SoccerAgent/。
技术报告;项目页面:https://jyrao.github.io/SoccerAgent/