Agentic Design of Compositional Machines

发表
Weiyang LiuWeiyang Liu 提交
作者: Wenqian Zhang, Weiyang LiuWeiyang Liu, Zhen Liu

摘要

AI 生成总结
最先进的大型语言模型在名为 BesiegeField 的机器设计测试台进行基准测试,突显了强化学习在提高空间推理、战略组装和指令遵循能力方面的必要性。
复杂机器的设计既是人类智慧的标志,也是工程实践的基础。鉴于大型 语言模型 (LLM) 的最新进展,我们想知道它们是否也能学会创造。我们 通过组合式机器设计这一任务来探讨这个问题:一项任务是根据标准化组件 组装机器,以满足物理模拟环境中的运动或操作等功能需求。为了支持这项 研究,我们引入了 BesiegeField,一个基于机器建造游戏 Besiege 的测试平台, 该平台支持基于零件的构建、物理模拟和奖励驱动的评估。使用 BesiegeField, 我们对具有智能工作流程的先进 LLM 进行了基准测试,并确定了成功的关键 能力,包括空间推理、战略组装和指令遵循。由于当前的开源模型表现不佳, 我们探索了强化学习 (RL) 作为改进的途径:我们策划了一个冷启动数据集, 进行了 RL 微调实验,并强调了语言、机器设计和物理推理交叉领域的开放性 挑战。
查看 arXiv 页面查看 PDF

评论

Weiyang LiuWeiyang Liu
论文作者
论文提交者

项目页面是 https://besiegefield.github.io/

Weiyang LiuWeiyang Liu
论文作者
论文提交者

介绍视频在这里:https://www.youtube.com/watch?v=JIwTFpBLdSs