⏶44
AmbiK:厨房环境中的歧义任务数据集
发表
由
Alexey Kovalev 提交
作者: Anastasiia Ivanova,
Eva Bakaeva,
Zoya Volovikova, Alexey K. Kovalev, Aleksandr I. Panov
摘要
作为具身智能体的一部分,大型语言模型(LLMs)通常用于根据用户提供的自然语言指令进行行为规划。然而,在现实世界环境中处理模糊指令对LLMs来说仍然是一个挑战。已经提出了各种任务模糊性检测方法。然而,由于它们在不同的数据集上进行测试且缺乏通用基准,因此难以进行比较。为此,我们提出了AmbiK(厨房环境中的模糊任务),这是一个完全文本格式的数据集,包含针对厨房环境中机器人发出的模糊指令。AmbiK是在LLMs的协助下收集并经过人工验证的。它包含1000对模糊任务及其对应的明确任务,按模糊性类型(人类偏好、常识、安全性)进行分类,并附有环境描述、澄清问题和答案、用户意图以及任务计划,总计2000个任务。我们希望AmbiK能使研究人员对模糊性检测方法进行统一比较。AmbiK可在此处获取:https://github.com/cog-model/AmbiK-dataset。
评论
论文作者
论文提交者