数字民主:作为人工智能治理政治中对齐的制度设计

发表
Santosh PatapatiSantosh Patapati 提交
作者: Trisanth Srinivasan, Santosh Patapati

摘要

本文介绍了 Democracy-in-Silico,这是一个基于智能体的模拟。在该模拟中,拥有复杂心理特征的先进人工智能体组成的社会,在不同的制度框架下进行自我治理。我们通过让大型语言模型(LLM)扮演具有创伤性记忆、隐藏议程和心理触发因素的智能体,来探索在人工智能时代“成为人类”的意义。这些智能体在预算危机和资源稀缺等各种压力下,参与审议、立法和选举。我们提出了一个新颖的指标——权力保持指数(PPI),以量化智能体将自身权力置于公共福利之上的失调行为。我们的研究结果表明,制度设计,特别是结合了“宪法人工智能”(CAI)章程和调解性审议协议,是一种有效的对齐机制。与约束较少的民主模式相比,这些结构显著减少了腐败的权力寻租行为,提高了政策稳定性,并增进了公民福祉。该模拟揭示了制度设计可以为未来人工智能体社会的复杂、涌现行为提供一个对齐框架,迫使我们重新审视在与非人类实体共享作者权的时代,哪些人类仪式和责任是必不可少的。
查看 arXiv 页面查看 PDF

评论

Santosh PatapatiSantosh Patapati
论文提交者

源代码即将发布!

如果您有任何关于此主题的技术或哲学问题,请随时告诉我。