Nature | 利用语言模型绘制人类语言的神经元构建模块图谱

DrugAI

发布于 2026-06-24 13:29:38

1060

人类能够通过语言传递新的、极其多样的信息。将词语组合成复杂短语和句子的能力，使人类可以表达几乎无穷无尽的意义，也是人类认知的核心基础。然而，精确支撑人类语言的微观细胞构建模块及其皮层分布图谱，长期以来仍难以解析。

研究人员结合大规模单神经元记录和自然语言处理模型，在语言产生过程中识别人类额颞皮层中的细粒度语言表征。结果显示，一些神经元表征词语之间的具体语法关系或词性，另一些神经元则追踪句子的高阶句法结构、短语转换和词序。整体来看，这些神经元不仅可靠捕获词语的句法和语义属性，还动态整合词语所在句子的具体上下文，从而能够以组合方式、在非常精细的层级上编码语言信息。

研究人员进一步展示了这些神经元群体的局部组织方式，以及其微观表征如何不同于更广泛的局部场电位模式。研究还发现，这些神经元广泛分布于额颞皮层，但其语言信息编码能力具有左半球偏侧化特征，并且在不同皮层区域之间存在差异。总体而言，这些发现识别了人类语言信息编码的一些基本细胞构建模块，并开始从微观细胞、局部群体和宏观脑区三个尺度描绘语言的皮层图谱。

语言是人类特有的基本认知过程，使我们能够交流复杂而多样的意义。通过语法规则，人类可以将词语排列、组合成新的表达，并将这种组合能力推广到新的句子中，而不仅仅是重复已有句子。语言学研究已经较好描述了人类如何利用词语属性，例如语法功能、句法关系和层级短语结构，来构建独特句子并传递特定思想。

神经影像学和皮层电图研究则从宏观尺度识别出额颞皮层中广泛参与语言产生和句子构建的脑区。这些脑区能够区分语法结构良好的句子与无结构词表或声音，也能对词语合并为短语、语义属性和句子结构产生反应。这些研究揭示了支持人类语言的广泛皮层网络。

然而，人类神经元如何在微观尺度编码语言信息仍然不清楚。已有研究揭示了词语的语音成分如何被神经元编码，但这并不能解释人类如何产生有意义的言语，也不能说明神经元如何支持词语排列、短语组合和句子构建。为了表达意义，人类需要使用抽象语法类别，例如名词、形容词和动词，也需要使用词语之间的依存关系，例如主语、宾语和修饰关系。这些关系能够跨句子泛化，并描述动作、结果和复杂事件。但这些语法特征是否由神经元直接编码、如何跨句子泛化，仍缺少细胞尺度证据。

另一个关键问题是，句法信息与语义信息在神经元层面是否可以部分分离。已有影像研究提示语言信息可能在脑内广泛分布，但还不清楚这种分布在单神经元尺度上如何表现，也不清楚自然言语产生过程是否在细胞层面呈现左半球偏侧化。此外，个体神经元的活动及其调谐特性，与局部神经群体的场电位模式之间有何关系，也仍然缺乏直接证据。

因此，研究人员在人类额颞皮层开展单神经元记录，并在参与者自然产生语言时追踪神经元动作电位和局部场电位活动。通过语音追踪、句子解析、语言模型和神经解码方法，研究人员系统分析了神经元对语言信息的编码属性、局部分布、区域差异和半球偏侧化，从而在微观、局部群体和宏观脑区三个尺度上研究语言产生的神经基础。

方法

研究人员在接受癫痫监测相关神经外科治疗的8名参与者中，使用半慢性植入的96通道微电极阵列，从人类额叶、前颞叶和后颞叶相关语言区域记录神经活动。研究共获得579个候选神经元，来自14次记录会话；只纳入波形稳定、分离良好且符合皮层神经元特征的单单位活动。参与者在清醒状态下自然产生短语和句子，这些句子不是简单朗读或重复，而是在自然语言产生过程中即时构建，涵盖广泛上下文和结构。研究人员共记录10,460个词，分布于1,895个句子中，并将每个词的发音时间与神经元动作电位活动对齐。随后，研究人员使用自然语言处理中的成分句法分析和依存句法分析，为每个词标注词性、短语成分、成分深度、短语闭合层级、依存关系、依存深度和词序等语言特征；同时用词嵌入和上下文语言模型表征词语语义和句子上下文。研究人员重点分析词语发音前的预发声时间窗，以捕捉语言计划阶段的神经编码，并使用统计选择性分析、回归、解码、嵌入模型预测和局部场电位比较，评估神经元如何编码语言特征、特征组合、上下文信息及其脑区分布。

图1｜在人类自然言语过程中追踪额颞皮层神经元的语言表征。

结果

自然言语过程中记录单神经元活动

研究人员首先在自然语言产生过程中记录人类额颞皮层神经元活动。微电极阵列位于额叶、前颞叶和后颞叶区域，这些区域已知会参与言语产生、句子构建和语言选择性反应。由于参与者在电极植入后保持清醒，并能够自然说话，这为研究人类自然语言产生中的单神经元活动提供了罕见机会。

参与者产生的句子在内容和结构上差异很大。例如，他们可能说出陈述句，也可能产生主谓倒装形式的问题。所有词语被半自动转录，并与单神经元动作电位活动对齐。研究人员将分析重点放在词语发音前的时间窗，因为该阶段更可能反映即将说出的词语及其句法、语义和上下文信息，而不仅仅是发音后的感觉反馈。

这一数据集使研究人员能够在单神经元尺度上研究自然语言产生，而不是仅分析人工任务、单词朗读或重复语音。这一点非常重要，因为自然语言产生需要即时组织词语、构建短语、整合上下文，并将意义转换为连续言语输出。

神经元表征词语的语言属性

研究人员发现，神经元群体中的一部分细胞会选择性响应词语的语言属性。通过成分句法分析，每个词可以被标注为不同语言特征。词性反映词语的语法功能，例如名词、动词、形容词或代词；短语成分反映词语或词组在句子中作为语法单位的功能，例如名词短语、动词短语或介词短语；成分深度描述词语在句法树中的层级位置；短语闭合层级则反映短语合并或结束的结构信息。

研究人员发现，9.2%的神经元选择性响应词性。例如，有些神经元会在即将说出情态动词时短暂增加放电。另有16.2%的神经元选择性响应句子成分，15.9%的神经元选择性响应成分深度，11.1%的神经元选择性响应短语闭合层级。这些比例显著高于随机水平，并且在不同抽样和统计方法下保持稳定。

进一步的解码分析显示，仅凭神经元活动模式，就可以在逐词水平上可靠预测词语的语言属性。解码表现最高的是成分深度，其次是短语闭合层级、短语成分和词性。这说明这些语言属性并不是研究人员事后强加的标签，而是真正在神经元群体活动中具有可读出的表征。

研究人员还检验了这些表征是否可泛化。通过随机抽取不同神经元、不同参与者、不同记录会话和不同句子上下文，研究人员发现语言特征的解码表现仍然稳定。这说明神经元并非只记住某些特定句子或词语，而是以可跨句子泛化的方式编码语言结构。

语言编码的特异性

研究人员随后进一步分析神经元语言编码的特异性。与成分句法分析不同，依存句法分析主要描述词语之间的语法关系，例如某个词是主语、直接宾语、介词宾语、修饰语或限定词。依存深度则描述词语在依存关系层级中的位置。

研究人员发现，10.2%的神经元选择性响应词语之间的依存关系，12.1%的神经元选择性响应依存深度。例如，某些神经元会根据即将说出的词是名词性主语还是直接宾语而改变活动。依存关系和依存深度也可以从神经元活动中可靠解码，说明神经元不仅编码词语本身的类别，也编码词语在句子结构中的关系角色。

一个可能问题是，不同语言特征之间存在重叠。例如，一个词可以既是名词，也属于名词短语；成分深度和依存深度也可能随着句子推进而共同增加。研究人员因此检验不同特征编码之间的重叠程度。结果显示，神经元对不同语言特征的选择性总体上高度特异，只有很少比例神经元同时对多个特征表现选择性。词性和依存关系之间存在一定重叠，但总体而言，大多数特征编码可以在细胞层面区分开来。

研究人员还检验了这些神经元反应是否可能由较低层次语音属性解释，例如词语音高、词频、词长或惊讶度。结果显示，虽然有一些神经元对词语音高变化敏感，但它们与语言特征选择性神经元的重叠很少。加入词频、词长和惊讶度等变量后，语言特征选择性的结论仍然稳定。这说明这些神经元主要反映语言结构，而不是简单反映声音、词长或常见程度。

图2｜细胞尺度上语言表征的选择性和稳健性。

组合式语言编码

虽然上述结果说明神经元能够编码词语的单一语言属性，但自然语言并不是孤立特征的集合。一个词在不同句子中可能具有相同词形和词性，却承担不同语法角色。例如，“dog”在“The dog ate the bone”中是主语，而在“The man walked the dog”中是宾语。类似地，两个词都可以是名词，但语义完全不同。因此，研究人员进一步分析神经元是否编码语言特征的具体组合。

研究人员构建了多种嵌入模型，用于同时表示词语的句法、语义和上下文信息。句法嵌入使用词性、依存关系、成分深度等特征；语义嵌入使用词向量表示词义；组合模型同时包含句法和语义信息；上下文模型则使用大型语言模型捕捉词语所在句子的具体语境。研究人员将这些嵌入与神经元活动进行比较，评估模型对神经活动的预测能力。

结果显示，神经元群体活动可以被词语的特征组合可靠预测。包含句法和语义信息的模型优于只包含单一信息的模型。然而，在单个神经元层面，大多数神经元更偏向编码句法信息或语义信息之一，只有少数神经元同时编码两类信息。这说明，单细胞可能具有相对专门化的调谐，但群体层面可以组合出更加丰富的词语表征。

更重要的是，上下文语言模型对神经元活动的预测能力优于只包含句法或语义特征的模型。这意味着神经元群体不仅编码即将说出的词的词性、语法关系和语义，还编码该词在当前句子中的具体上下文。例如，同一个词在不同句子中具有不同含义时，神经活动能够反映这种上下文差异。

研究人员进一步发现，随着上下文窗口从前面2个词增加到10个词，模型对神经元活动的预测能力逐渐增强，并在约前5个词时达到平台。这说明神经元在语言产生过程中整合了多个先前词语的上下文信息。对照实验也支持这一结论：当句子与神经活动随机打乱，或将原句替换为随机伪句时，模型预测能力下降到机会水平。

时间分析显示，上下文模型对神经元活动的预测能力在词语发音前已经显著存在，并在发音前约1秒达到峰值。这表明这些神经元在实际发声之前，就已经编码即将说出的词的句法、语义和上下文信息。换言之，人类大脑在说出词之前，已经在神经元群体层面组织了该词在句子中的语言角色。

图3｜神经元信息编码的群体组织和时间结构。

神经元的多样性与脑区分布

研究人员接着分析这些语言选择性神经元在额颞皮层中的分布。结果显示，对至少一种语言特征具有选择性的神经元广泛分布于额叶、前颞叶和后颞叶区域。在三个区域中，选择性神经元比例总体相似；左右半球中选择性神经元比例也没有显著差异。这说明，语言相关神经元并不局限于某一个小区域，而是广泛分布于额颞语言网络。

不过，虽然选择性神经元的比例广泛分布，但编码强度和信息量呈现明显区域化和左半球偏侧化。研究人员用神经活动调制强度来衡量神经元对语言特征的反应幅度，发现左半球神经元的调制强度显著高于右半球。即使是音高等较低层次语音特征，左半球也表现出更强调制。不同皮层区域比较显示，前额叶区域的调制强度最强，而上下文嵌入对神经活动的预测能力在前颞叶区域最高。

这些结果表明，人类语言信息在细胞尺度上既是分布式的，又是左侧偏侧化和区域化的。换句话说，语言信息可能在整个额颞网络中广泛可用，但某些左半球和特定区域具有更强、更有效的语言编码能力。

图4｜额颞皮层不同区域和半球中语言选择性神经元的多样性与分布。

局部皮层组织

最后，研究人员比较了单神经元动作电位活动与同一微电极位置记录到的局部场电位。动作电位反映单个神经元的输出活动，而局部场电位主要反映局部神经群体的同步活动，包括突触输入和亚阈值膜电位。由于微电极尺度很小，研究人员可以在微米级位置上比较单神经元和局部群体信号。

结果显示，许多电极位点的局部场电位也对语言特征具有选择性。在1,344个电极接触点中，约23%的位点显示出与特定语言特征相关的局部场电位变化。然而，这一比例显著低于单神经元层面的选择性比例。更重要的是，大多数具有语言选择性局部场电位的位点，并不包含同样选择性的神经元；即便同一位点同时存在选择性神经元和选择性局部场电位，它们编码的语言特征也常常不同。

与局部场电位相比，单神经元活动表现出更强调制和更高特异性。部分神经元对特定语言特征表现出极高选择性，而局部场电位几乎不出现这种强选择性。这说明，在微观尺度上，个体神经元可能高度专门化地编码特定语言信息，而局部场电位则反映更广泛、更混合的群体活动。

这一发现为连接不同研究尺度提供了重要线索。神经影像和局部场电位可以揭示语言网络的宏观或中观活动，但它们可能无法直接反映单个神经元的精细调谐。单神经元记录则揭示了隐藏在局部群体信号之下的细粒度语言编码。

图5｜单神经元动作电位与局部场电位语言编码模式的差异。

讨论

研究人员通过大规模人类单神经元和局部场电位记录，结合自然语言处理模型、句法解析和神经解码方法，揭示了自然语言产生过程中语言信息在神经元尺度上的精细表征和分工。许多神经元会在词语发音之前，根据即将说出的词的语言属性选择性改变活动，即使这些语言属性彼此相关，神经元也能够区分它们。这说明语言信息不仅可以在细胞层面被编码，而且可以从神经元群体活动中可靠读出。

语言生成需要人类将词语递归地组合成更大的结构，以表达特定意义。研究人员发现，神经元不仅反映词性等基本词汇层面特征，还追踪句子的高阶句法结构，包括词语如何组成短语、短语如何合并、词语在层级结构中的位置以及词语之间的依存关系。这些神经元对语言结构特征表现出选择性，而对音高等较低层次声音属性反应较少。这提示，神经元层面的语言编码可能支持语言的递归、层级和组合性质。

这些神经元群体还提供了对词语、短语和句子的丰富表征。部分神经元编码词语之间的语法关系和词性，另一些神经元区分词语的句法属性与语义意义。整体建模显示，神经元群体能够捕获定义一个词的具体特征组合，即使这些词来自不同上下文和不同话题的句子。上下文语言模型的结果进一步表明，这些神经元还能编码正在构建的句子的具体上下文，并且这种上下文整合在词语发音前约1秒已经出现。这种类似“记录与索引”的机制，可能使细胞群体既能组合式表示即将说出的词，也能在非常精细的层级上编码其语言属性。

另一个重要发现是，这些语言编码神经元广泛分布于额颞皮层。已有影像学和皮层电图研究显示，人类语言网络并不局限于传统初级语言区，而是覆盖外侧颞叶和前额叶大片区域，并且通常在左半球更突出。本研究在细胞尺度上提供了类似证据：语言选择性神经元分布广泛，但语言编码强度和上下文信息量更偏向左半球，并在不同皮层区域之间存在差异。这说明语言信息可能以分布式方式在多个区域中表示，同时又在某些特化区域中更强地集中。

研究人员还发现，单个神经元与局部场电位之间存在明显差异。即使在同一微电极位置，单神经元编码的语言特征也常与局部场电位不同。单神经元表现出更强、更精确的选择性，而局部场电位更像是局部群体活动的混合信号。这一结果提示，不同测量尺度可能捕捉语言系统的不同层面：宏观成像和局部场电位能够揭示语言网络的整体参与，而单神经元记录则能揭示最基本的细胞级编码单元。

总体而言，这项研究识别了支撑人类语言的一些基本神经元元素，并提出了一种从微观细胞、中观局部群体和宏观脑区三个尺度研究语言皮层组织的方法。未来研究可以进一步检验类似机制是否也存在于语言理解、书写、朗读或脚本化言语中，也可以探索语调、韵律和情感表达等语言成分如何在这些神经元群体中表示。此外，还需要在左下额回等经典语言关键区域以及更广泛脑区进行更多记录，以绘制更完整的人类语言产生神经图谱。

整理 | DrugOne团队

参考资料

Cai, J., Kfir, Y., Jamali, M. et al. Mapping the neuronal building blocks of human language with language models. Nature (2026).

https://doi.org/10.1038/s41586-026-10691-5