CoT 百科全书:分析、预测和控制推理模型如何思考

发表
seongyun_leeseongyun_lee 提交
作者: seongyun_leeSeongyun Lee, Seungone KimSeungone Kim, Minju SeoMinju Seo, Yongrae JoYongrae Jo, Dongyoung Go, Hyeonbin HwangHyeonbin Hwang, Jinho ParkJinho Park, Xiang Yue, Sean WelleckSean Welleck, Graham NeubigGraham Neubig, Moontae Lee, Minjoon SeoMinjoon Seo

摘要

长链式思索 (CoT) 是有效使用现代大型语言模型的关键要素,但我们对这些能力背后的推理策略的理解仍然有限。虽然先前的一些工作试图使用预定义的策略类型来分类 CoT,但这些方法受限于人类直觉,未能捕捉到模型行为的全部多样性。在这项工作中,我们引入了 CoT 百科 (CoT Encyclopedia),这是一个用于分析和指导模型推理的自下而上 (bottom-up) 框架。我们的方法自动从模型生成的 CoT 中提取多样化的推理标准,将它们嵌入到语义空间中,聚类成具有代表性的类别,并导出对比式评分标准 (contrastive rubrics) 来解释推理行为。人工评估表明,该框架比现有方法产生了更具可解释性和更全面的分析。此外,我们证明了这种理解能够带来性能提升:我们可以预测模型可能使用哪种策略,并将其引导到更有效的替代方案。最后,我们提供了一些实用的见解,例如,训练数据格式(如自由文本 vs. 多项选择)对推理行为的影响远大于数据领域,这突显了格式感知型模型设计的重要性。
查看 arXiv 页面查看 PDF

评论

seongyun_leeseongyun_lee
论文作者
论文提交者

摘要:长链式思考 (CoT) 是有效使用现代大型语言模型的关键要素,但我们对支撑这些能力的推理策略的理解仍然有限。虽然一些先前的工作试图使用预定义的策略类型来分类 CoT,但这些方法受限于人类直觉,未能捕捉到模型行为的全部多样性。在这项工作中,我们引入了 CoT 百科,这是一个用于分析和指导模型推理的自下而上的框架。我们的方法自动从模型生成的 CoT 中提取多样化的推理标准,将它们嵌入到语义空间中,聚类成代表性类别,并推导出对比性评估标准来解释推理行为。人类评估表明,该框架比现有方法产生了更具可解释性和更全面的分析。此外,我们证明这种理解能够带来性能提升:我们可以预测模型可能使用哪种策略,并引导它转向更有效的替代方案。最后,我们提供了实践性见解,例如训练数据的格式(例如,自由形式与多项选择)对推理行为的影响远大于数据领域,强调了格式感知模型设计的重要性。