分层频率标记探针 (HFTP):一种统一的方法来研究大型语言模型和人脑中的句法结构表征

发表
JingminJingmin 提交
作者: JingminJingmin An, Yilong Song, Ruolin Yang, Nai Ding, Lingxi Lu, Yuxuan Wang, Wei Wang, Chu Zhuang, Qian Wang, Fang Fang

摘要

AI 生成总结
分层频率标记探针 (HFTP) 可识别 LLM 和大脑皮层区域中编码句法结构的神经元级组件,揭示了 LLM 和人脑在处理句法方式上的差异。
大型语言模型(LLM)展现出与人类相当甚至更强的语言能力,能够有效地建模句法结构,但负责这些能力的具体计算模块仍不清楚。一个关键问题是,LLM的行为能力是否源于与人类大脑相似的机制。为了解决这些问题,我们引入了分层频率标记探测器(HFTP),一种利用频域分析来识别LLM(例如,单个多层感知器(MLP)神经元)和皮层区域(通过颅内记录)中编码句法结构的神经元级别组件的工具。我们的结果表明,GPT-2、Gemma、Gemma 2、Llama 2、Llama 3.1和GLM-4等模型在相似的层级中处理句法,而人脑则依赖于不同的皮层区域来处理不同的句法级别。表示相似性分析揭示了LLM的表示与大脑的左半球(在语言处理中占主导地位)之间存在更强的对齐。值得注意的是,升级的模型表现出不同的趋势:Gemma 2比Gemma更具大脑相似性,而Llama 3.1与大脑的对齐程度低于Llama 2。这些发现为理解LLM行为改进提供了新的见解,引发了关于这些进步是由类人还是非类人机制驱动的问题,并确立了HFTP作为连接计算语言学和认知神经科学的宝贵工具。该项目可在https://github.com/LilTiger/HFTP 获取。
查看 arXiv 页面查看 PDF

评论

JingminJingmin
论文作者
论文提交者

HFTP 是一种统一的频域探针,可从 LLM 激活和人类 sEEG 中恢复分层语言节奏,并定量测试模型与大脑在句法表示上的对齐情况。