AI智能体行为科学

发表
Jie FengJie Feng 提交
作者: Lin ChenLin Chen, Yunke Zhang, Jie FengJie Feng, Haoye Chai, Honglin Zhang, Bingbing Fan, Yibo Ma, Shiyuan Zhang, Nian Li, Tianhui Liu, Nicholas Sukiennik, Keyu Zhao, Yu Li, Ziyi Liu, Fengli Xu, Yong Li

摘要

大型语言模型(LLMs)的最新进展使得AI智能体得以发展,它们在各种、交互式和开放式场景中展现出越来越像人类的行为,包括规划、适应和社交动态。这些行为不仅是底层模型内部架构的产物,更是它们集成到在特定情境下运作的智能体系统中的结果,其中环境因素、社交线索和交互反馈塑造着行为随时间的变化。这种演变需要一种新的科学视角:AI智能体行为科学。这种视角不再仅仅关注内部机制,而是强调系统地观察行为,设计干预以检验假设,并以理论指导解释AI智能体如何随时间行动、适应和互动。我们对跨个体智能体、多智能体和人机交互设置的日益增多的研究进行了系统化整理,并进一步展示了这种视角如何通过将公平性、安全性、可解释性、问责制和隐私视为行为属性来指导负责任的AI。通过统一最近的研究成果并提出未来的方向,我们将AI智能体行为科学定位为传统模型中心方法的必要补充,为理解、评估和治理日益自主的AI系统的现实世界行为提供了基本工具。
查看 arXiv 页面查看 PDF
AI智能体行为科学

评论

Jie FengJie Feng
论文作者
论文提交者

本文全面回顾了大型语言模型 (LLM) 时代新兴的 AI Agent 行为科学领域。