⏶3
SPhyR:关于材料分布的空间物理推理基准
发表
由
Philipp Siedler 提交

作者:
Philipp D. Siedler

摘要
我们引入了一个新的数据集,旨在基于拓扑优化(一种在给定载荷和支撑条件下计算设计空间内最优材料分布的方法)来评估大型语言模型(LLM)的物理和空间推理能力。在这个数据集中,LLMs被提供了诸如二维边界、施加的力和支撑等条件,并且必须推理出由此产生的最优材料分布。该数据集包含多种任务,从填充部分结构中的遮蔽区域到预测完整的材料分布。解决这些任务需要在没有模拟工具或显式物理模型的情况下,理解力的流动和给定约束下所需的材料分布,这对模型提出了关于结构稳定性和空间组织的推理挑战。我们的数据集旨在评估二维环境中的空间和物理推理能力,为传统的语言和逻辑基准提供了一个补充视角。
太长不看: 一个用于通过二维拓扑优化任务评估大型语言模型物理和空间推理能力的数据集——预测在载荷和支撑下的材料分布,无需模拟。
数据集: https://huggingface.co/datasets/philippds/SPhyR
代码: https://github.com/philippds/SPhyR