⏶10
Agentic Design of Compositional Machines
发表
由
Weiyang Liu 提交

作者: Wenqian Zhang,
Weiyang Liu, Zhen Liu

摘要
AI 生成总结
最先进的大型语言模型在名为 BesiegeField 的机器设计测试台进行基准测试,突显了强化学习在提高空间推理、战略组装和指令遵循能力方面的必要性。复杂机器的设计既是人类智慧的标志,也是工程实践的基础。鉴于大型
语言模型 (LLM) 的最新进展,我们想知道它们是否也能学会创造。我们
通过组合式机器设计这一任务来探讨这个问题:一项任务是根据标准化组件
组装机器,以满足物理模拟环境中的运动或操作等功能需求。为了支持这项
研究,我们引入了 BesiegeField,一个基于机器建造游戏 Besiege 的测试平台,
该平台支持基于零件的构建、物理模拟和奖励驱动的评估。使用 BesiegeField,
我们对具有智能工作流程的先进 LLM 进行了基准测试,并确定了成功的关键
能力,包括空间推理、战略组装和指令遵循。由于当前的开源模型表现不佳,
我们探索了强化学习 (RL) 作为改进的途径:我们策划了一个冷启动数据集,
进行了 RL 微调实验,并强调了语言、机器设计和物理推理交叉领域的开放性
挑战。
项目页面是 https://besiegefield.github.io/