⏶10

Agentic Design of Compositional Machines

10月16日发表

10月17日由 Weiyang Liu 提交

作者: Wenqian Zhang, Weiyang Liu, Zhen Liu

摘要

AI 生成总结

最先进的大型语言模型在名为 BesiegeField 的机器设计测试台进行基准测试，突显了强化学习在提高空间推理、战略组装和指令遵循能力方面的必要性。

复杂机器的设计既是人类智慧的标志，也是工程实践的基础。鉴于大型语言模型 (LLM) 的最新进展，我们想知道它们是否也能学会创造。我们通过组合式机器设计这一任务来探讨这个问题：一项任务是根据标准化组件组装机器，以满足物理模拟环境中的运动或操作等功能需求。为了支持这项研究，我们引入了 BesiegeField，一个基于机器建造游戏 Besiege 的测试平台，该平台支持基于零件的构建、物理模拟和奖励驱动的评估。使用 BesiegeField，我们对具有智能工作流程的先进 LLM 进行了基准测试，并确定了成功的关键能力，包括空间推理、战略组装和指令遵循。由于当前的开源模型表现不佳，我们探索了强化学习 (RL) 作为改进的途径：我们策划了一个冷启动数据集，进行了 RL 微调实验，并强调了语言、机器设计和物理推理交叉领域的开放性挑战。

查看 arXiv 页面查看 PDF

Weiyang Liu

论文作者

论文提交者

项目页面是 https://besiegefield.github.io/

Weiyang Liu

论文作者

论文提交者

介绍视频在这里：https://www.youtube.com/watch?v=JIwTFpBLdSs

Agentic Design of Compositional Machines

摘要

评论