⏶1
分层频率标记探针 (HFTP):一种统一的方法来研究大型语言模型和人脑中的句法结构表征
发表
由
Jingmin 提交
作者:
Jingmin An, Yilong Song, Ruolin Yang, Nai Ding, Lingxi Lu, Yuxuan Wang, Wei Wang, Chu Zhuang, Qian Wang, Fang Fang
摘要
AI 生成总结
分层频率标记探针 (HFTP) 可识别 LLM 和大脑皮层区域中编码句法结构的神经元级组件,揭示了 LLM 和人脑在处理句法方式上的差异。大型语言模型(LLM)展现出与人类相当甚至更强的语言能力,能够有效地建模句法结构,但负责这些能力的具体计算模块仍不清楚。一个关键问题是,LLM的行为能力是否源于与人类大脑相似的机制。为了解决这些问题,我们引入了分层频率标记探测器(HFTP),一种利用频域分析来识别LLM(例如,单个多层感知器(MLP)神经元)和皮层区域(通过颅内记录)中编码句法结构的神经元级别组件的工具。我们的结果表明,GPT-2、Gemma、Gemma 2、Llama 2、Llama 3.1和GLM-4等模型在相似的层级中处理句法,而人脑则依赖于不同的皮层区域来处理不同的句法级别。表示相似性分析揭示了LLM的表示与大脑的左半球(在语言处理中占主导地位)之间存在更强的对齐。值得注意的是,升级的模型表现出不同的趋势:Gemma 2比Gemma更具大脑相似性,而Llama 3.1与大脑的对齐程度低于Llama 2。这些发现为理解LLM行为改进提供了新的见解,引发了关于这些进步是由类人还是非类人机制驱动的问题,并确立了HFTP作为连接计算语言学和认知神经科学的宝贵工具。该项目可在https://github.com/LilTiger/HFTP 获取。
HFTP 是一种统一的频域探针,可从 LLM 激活和人类 sEEG 中恢复分层语言节奏,并定量测试模型与大脑在句法表示上的对齐情况。