世界模型的批判

发表
Mingkai DengMingkai Deng 提交
作者: Eric Xing, Mingkai DengMingkai Deng, Jinyu HouJinyu Hou, Zhiting Hu

摘要

世界模型,作为生物主体体验并作用于的真实世界环境的所谓算法替代品,近年来一直是一个新兴话题,因为开发具有人工(通用)智能的虚拟主体的需求日益增长。关于世界模型究竟是什么、如何构建、如何使用以及如何评估,一直存在大量争论。在本文中,我们从著名科幻经典《沙丘》中的想象出发,并从心理学文献中“假设性思维”的概念中汲取灵感,对世界模型构建的几种思想流派提出批评,并论证世界模型的主要目标是模拟真实世界中所有可操作的可能性,以实现有目的的推理和行动。在这些批判的基础上,我们提出了一种通用世界模型的新架构,它基于分层、多级以及连续/离散混合的表示,并采用生成式和自监督学习框架,展望了由这种模型所支持的物理、主体性、嵌套(PAN)通用人工智能系统。
查看 arXiv 页面查看 PDF

评论

Mingkai DengMingkai Deng
论文作者
论文提交者

世界模型(WM)并非旨在生成视频,而是关于模拟世界上所有的可能性,以作为通过思想实验进行通用推理的沙盒。本文提出了一种实现这一目标的架构。

在本文中,我们正式表明,世界模型是最佳通用智能体不可或缺的一部分。然后,我们回顾了旨在实现这一目标的世界模型方面的几个研究流派,并提出了我们替代方案——用于通用世界模型的PAN(物理、智能体、嵌套)架构。

PAN 基于以下原则构建:

1) 利用来自所有经验模态的数据;

2) 采用混合的连续和离散表示;

3) 采用分层生成模型范式,以扩展的LLM(大型语言模型)为主干(用于基于离散概念的推理),并辅以生成式嵌入预测模块(用于基于连续梯度的推理);

4) 基于观测数据,通过生成损失进行训练;

5) 应用世界模型模拟经验,用于通过强化学习训练智能体。

我们即将发布PAN的27B首个版本,它将是第一个可玩的通用世界模拟器。敬请期待!