⏶6
INTIMA:人类-人工智能伴侣行为基准
发表
由
Adina Yakefu 提交

作者:
Lucie-Aimée Kaffee,
Giada Pistilli, Yacine Jernite


摘要
人工智能伴侣,即用户与人工智能系统建立情感联系,已成为一个具有积极但也有令人担忧影响的重要模式。我们提出了交互与机器依恋基准(INTIMA),一个用于评估语言模型伴侣行为的基准。借鉴心理学理论和用户数据,我们开发了一个包含四个类别和368个目标提示的31种行为的分类系统。对这些提示的响应被评估为强化伴侣关系、维持边界或中性。将INTIMA应用于Gemma-3、Phi-4、o3-mini和Claude-4,结果表明,在所有模型中,强化伴侣关系的行为仍然更为普遍,尽管我们观察到模型之间存在显著差异。不同的商业提供商在基准中更敏感的部分内优先考虑不同的类别,这令人担忧,因为适当的边界设定和情感支持都对用户的福祉很重要。这些发现凸显了在处理情绪化互动方面需要更一致的方法。
INTIMA,一项揭示语言模型在维持界限方面不如人工智能伴侣方面表现更强的基准测试,强调了在情感化互动中需要一致的方法。