⏶22
世界模型的批判
发表
由
Mingkai Deng 提交
作者: Eric Xing,
Mingkai Deng,
Jinyu Hou, Zhiting Hu
摘要
世界模型,作为生物主体体验并作用于的真实世界环境的所谓算法替代品,近年来一直是一个新兴话题,因为开发具有人工(通用)智能的虚拟主体的需求日益增长。关于世界模型究竟是什么、如何构建、如何使用以及如何评估,一直存在大量争论。在本文中,我们从著名科幻经典《沙丘》中的想象出发,并从心理学文献中“假设性思维”的概念中汲取灵感,对世界模型构建的几种思想流派提出批评,并论证世界模型的主要目标是模拟真实世界中所有可操作的可能性,以实现有目的的推理和行动。在这些批判的基础上,我们提出了一种通用世界模型的新架构,它基于分层、多级以及连续/离散混合的表示,并采用生成式和自监督学习框架,展望了由这种模型所支持的物理、主体性、嵌套(PAN)通用人工智能系统。
世界模型(WM)并非旨在生成视频,而是关于模拟世界上所有的可能性,以作为通过思想实验进行通用推理的沙盒。本文提出了一种实现这一目标的架构。
在本文中,我们正式表明,世界模型是最佳通用智能体不可或缺的一部分。然后,我们回顾了旨在实现这一目标的世界模型方面的几个研究流派,并提出了我们替代方案——用于通用世界模型的PAN(物理、智能体、嵌套)架构。
PAN 基于以下原则构建:
1) 利用来自所有经验模态的数据;
2) 采用混合的连续和离散表示;
3) 采用分层生成模型范式,以扩展的LLM(大型语言模型)为主干(用于基于离散概念的推理),并辅以生成式嵌入预测模块(用于基于连续梯度的推理);
4) 基于观测数据,通过生成损失进行训练;
5) 应用世界模型模拟经验,用于通过强化学习训练智能体。
我们即将发布PAN的27B首个版本,它将是第一个可玩的通用世界模拟器。敬请期待!