⏶25
MentraSuite:用于心理健康推理和评估的后训练大型语言模型
发表
由
Mengxi Xiao 提交
作者: Mengxi Xiao,
Kailai Yang, Pengde Zhao, Enze Zhang,
Ziyan Kuang, Zhiwei Liu, Weiguang Han, Shu Liao, Lianting Huang, Jinpeng Hu, Min Peng,
Qianqian Xie, Sophia Ananiadou
摘要
AI 生成总结
MentraSuite 是一个统一框架,通过 Mindora(一个采用混合 SFT-RL 的后训练模型)推进可靠的心理健康推理,并通过 MentraBench(一个评估任务性能和推理质量的基准)进行评估。精神疾病在全球影响数亿人,而互联网现已成为获取支持、信息和评估的主要媒介。大型语言模型(LLM)提供了可扩展且易于访问的帮助,但当其推理不完整、不一致或缺乏依据时,将其部署在精神健康环境中仍然存在风险。现有的心理学LLM强调情感理解或知识回忆,但忽视了评估、诊断、干预规划、抽象和验证所需的逐步、临床一致的推理。为了解决这些问题,我们引入了MentraSuite,一个用于推进可靠精神健康推理的统一框架。我们提出了MentraBench,一个全面的基准,涵盖五个核心推理方面、六个任务和13个数据集,评估任务性能和推理质量的五个维度:简洁性、连贯性、幻觉避免、任务理解和内部一致性。我们进一步提出了Mindora,一个通过混合SFT-RL框架优化的后训练模型,并带有不一致性检测奖励,以强制执行忠实和连贯的推理。为了支持训练,我们使用新颖的推理轨迹生成策略构建高质量轨迹,该策略战略性地过滤难题样本,并应用结构化、面向一致性的重写过程,以产生简洁、可读且平衡的轨迹。在20个评估的LLM中,Mindora在MentraBench上取得了最高的平均性能,并在推理可靠性方面表现出色,证明了其在复杂精神健康场景中的有效性。
评论
论文提交者
