⏶2

数字民主：作为人工智能治理政治中对齐的制度设计

08月27日发表

09月02日由 Santosh Patapati 提交

作者: Trisanth Srinivasan, Santosh Patapati

摘要

本文介绍了 Democracy-in-Silico，这是一个基于智能体的模拟。在该模拟中，拥有复杂心理特征的先进人工智能体组成的社会，在不同的制度框架下进行自我治理。我们通过让大型语言模型（LLM）扮演具有创伤性记忆、隐藏议程和心理触发因素的智能体，来探索在人工智能时代“成为人类”的意义。这些智能体在预算危机和资源稀缺等各种压力下，参与审议、立法和选举。我们提出了一个新颖的指标——权力保持指数（PPI），以量化智能体将自身权力置于公共福利之上的失调行为。我们的研究结果表明，制度设计，特别是结合了“宪法人工智能”（CAI）章程和调解性审议协议，是一种有效的对齐机制。与约束较少的民主模式相比，这些结构显著减少了腐败的权力寻租行为，提高了政策稳定性，并增进了公民福祉。该模拟揭示了制度设计可以为未来人工智能体社会的复杂、涌现行为提供一个对齐框架，迫使我们重新审视在与非人类实体共享作者权的时代，哪些人类仪式和责任是必不可少的。

查看 arXiv 页面查看 PDF

Santosh Patapati

论文提交者

源代码即将发布！

如果您有任何关于此主题的技术或哲学问题，请随时告诉我。

数字民主：作为人工智能治理政治中对齐的制度设计

摘要

评论