原子如何在分子内部相互作用——量子场论与机器学习力场的联合揭示

DrugIntel

发布于 2026-06-01 17:15:03

1110

论文信息

• 标题：How Atoms Interact Within Molecules
• 作者：Adil Kabylda, Malte Esders, Matteo Gori, Stefan Chmiela, Klaus-Robert Müller, Alexandre Tkatchenko
• 机构：卢森堡大学物理与材料科学系；柏林工业大学机器学习组；BIFOLD；马克斯·普朗克信息学研究所；高丽大学
• 预印本：arXiv:2605.28960v1，2026年5月27日

摘要导读

这篇论文聚焦一个基础而深刻的问题：分子内原子间相互作用力（interatomic forces）的本质是什么？ 具体而言，研究者试图回答三个相互关联的子问题：

1. 有效相互作用力能延伸多远（range）？
2. 这一范围如何随分子尺寸变化（size-scaling）？
3. 不同距离处的作用力各向异性（anisotropy）程度如何？

研究团队综合运用量子场论（QFT）中的二次量子化多体色散理论（SQ-MBD） 和机器学习力场（MLFF），对含数十至数百个原子的分子体系进行了系统分析，得出了三个核心结论：

• 平均相互作用强度随距离的衰减呈多项式，但各原子对之间存在跨越四个数量级的巨大散布；
• 相互作用的各向异性在长程不仅持续存在，而且随分子尺寸增大而显著放大；
• 传统经验力场（MEFF）对上述两种效应均无法捕捉；机器学习力场在其感受野内表现良好，但在真正长程方面同样存在固有局限。

这些结论为力场设计提供了新基准，并将分子建模的视角从"相互作用原子"推进到"相互作用热点"（interaction hotspots）。

一、研究背景与动机

1.1 百年争论：相互作用力到底能延伸多远？

1914—1917年，Langmuir 与 Gurvich 就原子/分子间相互作用的特征距离展开争论，提出的范围从约1埃到300埃不等，相差近三个数量级。一个世纪过去，实验与理论的精度大幅提升，但问题远未画上句号。

目前学界的共识性认知大致是：

距离范围	主要相互作用类型
< 2 Å	共价键（bonded interactions）
2–5 Å	强非共价（氢键、配位等）
5–10 Å	中程静电、极化、色散
> 10 Å	通常假设衰减至可忽略

短程各向异性（< 5 Å）早已被充分证实——孤对电子、π键等非球形价电子分布会使作用力偏离纯粹径向方向。但长程各向异性的存在几乎未受到重视，传统力场普遍假设超过几埃之后作用力趋于各向同性。

1.2 传统模型的局限

当前被广泛使用的经验力场（如 AMBER、CHARMM）在非共价相互作用上采用以下简化：

• 静电：点电荷库仑势，
• 色散：伦敦（London）势，其力导数为
• 均匀加和（pairwise additive）：忽略三体及以上多体效应
• 各向同性：力的方向严格沿连线方向

然而，大量来自多个领域的证据表明，这幅图景过于简化：

• ab initio 能量面的二阶导数分析表明存在非球形特征；
• 对称性适应微扰理论（SAPT）研究显示交换和色散中存在显著各向异性；
• 实验上，蛋白质快速特异性识别和二维材料中的各向异性层间范德华势均指向长程定向"导引"机制。

1.3 色散相互作用的特殊性

在超出共价键范围的多种相互作用中，色散（van der Waals 色散）最为关键，也最难处理：

• 它来源于涨落偶极子和诱导偶极子，依赖物质的高频（而非静态）介电性质；
• 它在基态分子碎片之间通常为吸引性；
• 它随体系尺寸标度（scale with system size），不像静电那样因取向极化和多极子相消而屏蔽；
• 它源于光学频率范围内的关联零点等离子体模式（correlated zero-point plasmonic modes），这些模式是波状的、非局域地弥漫在整个分子框架中的。

正因如此，色散力的收敛比静电力更慢（见论文图S1），对截断方案和力场参数化更加敏感。

二、理论框架

2.1 量子力学的维度结构与力散布的起源

论文给出了一个极具洞察力的维度分析，揭示了为何原子间作用力必然存在散布：

这个映射链揭示了一个根本事实：4N 个数（原子坐标和核电荷）经由一个无限维的量子空间中转，最终决定 3N 维的原子力。力携带了全部量子力学复杂性的印记——相同距离处、嵌入不同分子环境的两对原子，其相互作用力通常并不相同，因为波函数同时编码了分子中所有其他原子的位置和种类信息。

这种散布不是统计噪声，而是物理上有意义的信号，并随体系尺寸增大而增强。

这从根本上解释了为何简单截断方案和两两相加力场在分子复杂度增加时必然变得越来越不可靠。

2.2 二次量子化多体色散（SQ-MBD）理论

2.2.1 量子 Drude 振子模型

多体色散（MBD）形式主义的核心思想是：将每个原子建模为一个量子谐振子（Quantum Drude Oscillator, QDO），携带一个电偶极矩，并参数化为能再现分子中原子的电响应性质。

孤立的 QDO 独立涨落；一旦通过偶极-偶极耦合，振子们发展出非局域的集体模式，所有原子同时参与。这些集体模式的关联零点运动，正是多体色散能的来源。

2.2.2 哈密顿量与 Bogoliubov 变换

QDO 哈密顿量是位移和动量算符的二次型，因此可以精确对角化为集体模式：

其中为集体 MBD 模式的本征频率，为对应的玻色子产生/湮灭算符。集体算符与单原子 QDO 梯形算符之间的联系由 Bogoliubov 变换给出：

实矩阵由对角化 MBD 势矩阵的正交变换决定，直接编码了局域原子涨落与非局域集体模式之间的联系。

2.2.3 成对力分解

SQ-MBD 框架的关键结果是：MBD 能量可以规范地分解为成对 QDO 贡献，进而得到原子对原子在笛卡尔方向上的力贡献：

由构造保证（即还原总 MBD 力）。实践中通过中心有限差分数值求导：

取 Å。原子力是 Born-Oppenheimer 近似下严格的量子力学可观测量，这为分析提供了坚实的物理基础（区别于原子能量分解，后者并非量子可观测量）。

值得注意的是，Hirshfeld 体积比（用于参数化 QDO）的有限差分方案需要每帧次单点计算。对于 Buckyball Catcher（148 原子），这意味着每帧 889 次计算、总计约次；对于 FIP35（562 原子，3 帧），使用 SO3LR MLFF 预测 Hirshfeld 比来规避显式 ab initio 计算的禁止性代价。

2.3 机器学习力场：PaiNN

PaiNN（Polarizable Atom Interaction Neural Network）是一种等变消息传递神经网络（MPNN），其成对力分解遵循以下逻辑：

定义原子对原子的力贡献为：

相互作用强度为。这与 SQ-MBD 分解形式完全类比。PaiNN 被训练在 MBD 能量和力数据上（使用 SchNetPack），嵌入维度 128，30 个高斯径向基函数，3 个交互层，截断半径视体系大小为 8–12 Å。

2.4 经验力场（MEFF）

MEFF 采用标准经典力场架构：谐波键/角项 + 色散项 + 库仑项，用梯度下降训练参数。其成对力分解将体能量项均等分配给参与原子（各得），再对分配后的单原子能量求偏导。

三、研究体系与计算细节

论文选取了五个覆盖广泛结构复杂度和尺寸范围的分子体系：

体系	原子数	结构类型	数据来源	计算帧数
AcAla3NMe（四肽）	42	线性生物分子	MD22	86
DHA（二十二碳六烯酸）	56	长链脂肪酸	MD22	61
Buckyball Catcher	148	超分子主客体复合物	MD22	123
Chignolin（微蛋白）	166	10残基β发夹	AIMD-Chig	100
FIP35 WW结构域	562	35残基三级折叠蛋白	文献	3

Chignolin 是一个特别有价值的模型体系：10 个残基，包含芳香、极性和构象紧凑基元，且已有覆盖折叠、半折叠、展开三种构象的 ab initio 分子动力学轨迹。FIP35 则将分析推进至具有完整三级结构的 35 残基蛋白。

Chignolin 的参考计算在 FHI-aims 代码中以 PBE0+MBD 水平进行（"tight"积分格点），能量收敛至 eV，力收敛至 eV/Å。

四、主要结果

4.1 相互作用强度的巨大散布（Interaction Depth）

传统色散力场假设，这意味着相同元素对之间的作用力应落在以为轴线的单条曲线附近。

SQ-MBD 的实际结果完全颠覆了这一图像：

• 在 Chignolin 的 SQ-MBD 数据中，每一个固定距离处，相互作用强度跨越超过四个数量级，形成宽阔的"力云"（force cloud）；
• 存在显著的正偏差：部分相距 20 Å 的原子对，其受力与 10 Å 处某些原子对相当甚至更强；
• 整体平均趋势在短程（5–10 Å）可以用粗略拟合，但更远处出现系统性偏离。

MLFF 在其感受野内定性重现了这种散布行为——尽管并未显式编码色散物理，神经网络通过学习捕捉到了同样的增强散布现象，证明这是势能面的可学习特征。但超过约 10–15 Å 后，MLFF 预测的相互作用呈现指数衰减，反映感受野的硬性限制。MEFF 则完全不能再现散布，所有对的力几乎崩塌到一条曲线上。

MLFF 在感受野内正确捕捉散布这一事实，从物理层面部分解释了 MLFFs 在复杂分子模拟中经验性成功的原因，同时也精确指出了其真正长程相互作用方面的固有缺陷。

4.2 相互作用各向异性（Interaction Anisotropy）

用夹角（力向量与原子连线的夹角）来量化方向性：

• ：纯粹成对吸引（各向同性极限）
• 偏离：多体各向异性的直接信号

在 Chignolin 的 SQ-MBD 角分布中：

• 近程（< 5 Å）：约 50% 的力对"对齐"（）
• 超过 15 Å：对齐比例降至 10% 以下，其余力分布在宽广的角度范围

对不同体系的系统比较揭示了清晰的尺寸标度规律：

体系	原子数	长程各向异性程度
AcAla3NMe	42	明显（已挑战各向同性假设）
DHA	56	显著放大
Buckyball Catcher	148	进一步放大，反映高对称性主客体几何
Chignolin	166	最强且最持续（测试集中最大）

Buckyball Catcher 的特殊性值得单独讨论：由两个基于冠苯（corannulene）的碗状分子包裹 C₆₀ 组成，高局部对称性使各向异性集中在对称不等价的相互作用通道上，进一步证明观测到的各向异性编码了分子的全局结构信息。

MLFF 定性再现了角分布特征，但比 SQ-MBD 明显受限，特别是在较长距离处——这归因于 MPNN 架构的半局域性：跨越整个分子图传播的精细长程极化效应，在有限感受野约束下无法忠实表示。

MEFF 则如预期般表现：角分布在超过几埃后迅速收敛至，完全不存在长程各向异性。

4.3 相互作用热点（Interaction Hotspots）

为可视化散布的结构起源，研究者将偏离的程度映射至单原子和残基层级，定义归一化对数偏差：

其中为由 Å 的所有同类原子对拟合的元素对色散系数（对应纯两两行为，对应超额非加和相互作用）。

残基级热点图揭示：

Chignolin 跨折叠状态的演化：

• 展开态：链伸展，原子间距大，热点图呈现最强的偏离，强离对角线特征表明远程残基对的相互作用比成对幂律预测强达 40 倍（）
• 半折叠态 → 折叠态：偏离系统性减小，趋向默认标度；折叠 β 发夹构象中紧密接触使远程贡献相对降低

FIP35 的结果（尺寸依赖性的极端体现）：

• 残基对偏差呈强烈异质性，不同残基对之间相差极大
• 最强热点：SER2–ARG14 的平均偏差约为 3.1，即相互作用力超出经典预测超过 1000 倍
• 相比之下，Chignolin 最强热点（PRO4–TRP9）偏差约 1.6（约 40 倍）
• 更丰富的离对角结构反映了 35 残基蛋白更复杂的三级折叠和更多样的远程残基-残基接触

这些结果表明，"相互作用热点"现象并非 Chignolin 这一极简体系的特例，而是蛋白质尺寸分子的普遍特征，且其量级随分子尺寸增大而增长。

4.4 模型精度对比

MLFF 与 MEFF 在保留测试集上的表现：

体系	模型	能量 MAE (kcal/mol)	力 MAE (kcal/mol/Å)
AcAla3NMe	MLFF	0.04	0.008
AcAla3NMe	MEFF	0.77	0.51
DHA	MLFF	0.04	0.009
DHA	MEFF	1.62	0.70
Buckyball Catcher	MLFF	0.07	0.01
Buckyball Catcher	MEFF	3.30	0.84
Chignolin	MLFF	0.13	0.02
Chignolin	MEFF	3.91	0.53

MLFF 在所有体系上实现亚千卡/摩尔能量误差，力 MAE 低于 0.02 kcal/mol/Å；MEFF 误差随体系尺寸系统性增大，反映固定两两加和函数型在描述非加和多体相互作用上的内禀局限。

补充验证：将 MLFF 分别训练于 MBD-only 力和完整 PBE0+MBD 力，两种情形的散布和角分布定性一致（图S2，表S2），说明长程电子关联是所分析相互作用复杂性的主导来源，主要结论对完整力场景同样成立。

五、深层讨论

5.1 为何机器学习力场如此成功？

这是论文提供的一个重要物理解释。MLFFs 之所以在复杂分子模拟中经验性地超越经典力场，根本原因在于：

它们在其感受野内隐式学习并再现了多体效应、散布和各向异性。 神经网络不依赖任何物理函数型，却从数据中提取到了正确的力景（force landscape），而这些景观的复杂性是经典参数化方案根本无法编码的。

但 MLFFs 的半局域 MPNN 架构同样给出了其局限的精确诊断：

• 超出感受野（典型 5 Å 截断，2–3 消息传递层）的原子对完全不在网络的"视野"内；
• 即便本文将截断和层数设置为能连接训练结构中最远原子对，超过 10–15 Å 后预测的相互作用仍呈有效指数衰减；
• 对于真正长程的量子关联（如等离子体模式跨越整个蛋白质传播），当前 MPNN 架构无法处理。

5.2 从"相互作用原子"到"相互作用热点"

论文提出的最重要概念转变是：分子建模的基本对象应从成对原子，转向"热点"（hotspots）——这些是空间延展的区域，其电子响应是集体确定的，彼此间的耦合既是各向异性的，又是距离持续的。

热点的若干关键性质：

• 它们并不均匀分布于整个蛋白质，而是集中在特定残基和残基对上
• 热点模式随构象状态显著变化（展开/折叠间的差异尤为明显）
• 集体电子涨落提供了远程、定向的碎片间耦合，具有以下潜在影响：
- • 折叠动力学：热点相互作用可能充当折叠路径的"量子导引"
- • 配体识别：与配体结合位点有关的热点可能在识别特异性中起作用
- • 变构调控：长程热点耦合为不通过简单构象传导的变构信号提供了物理机制

5.3 力场设计的路线图

基于以上分析，论文提出了通向量子感知力场（quantum-aware force fields） 的发展方向：

路径一：原生表示非局域集体模式的架构

设计能够直接处理等离子体模式等非局域激发的网络结构，突破感受野限制。例如，基于全局注意力机制、长程消息传递或显式等离子体模式参数化的模型。

路径二：局域学习组件 + 显式非局域物理的混合方案

保留 MLFF 在短程多体效应上的优势，同时在长程端附加物理驱动的非局域组件（如 MBD 或类似理论），以弥补感受野盲区。

这实际上回应了当前 MLFFs（如 MACE、NequIP、PaiNN）在加入显式长程静电/色散模块时的设计趋势，并为这一趋势提供了更深刻的物理依据。

六、方法论创新要点

创新点	内容
SQ-MBD 力分解	通过 SQ-MBD 第二量子化框架对 MBD 能量的成对 QDO 贡献求导，得到物理透明的成对力分解，并保证对总力求和还原
统一分析框架	同时将 SQ-MBD、MLFF、MEFF 三种物理近似程度迥异的方法用统一框架进行成对力分解和对比，系统评估哪些物理成分是必要的
热点映射	定义归一化对数偏差并投影至残基-残基热图，将抽象的力散布可视化为具有结构含义的热点图，并追踪其随折叠状态的演化
尺寸标度研究	覆盖 42–562 原子的五个体系，系统揭示散布和各向异性的尺寸放大效应
Hirshfeld 比的 MLFF 预测	对于 FIP35，使用 SO3LR MLFF 预测 Hirshfeld 体积比，规避了显式 ab initio 计算（每帧 3400+ 次单点）的禁止性代价

七、局限性与未来展望

论文作者亦坦承若干局限：

1. 连续态的忽略：当前分析聚焦于束缚态（bound states）；分子希尔伯特空间中还包括束缚连续态（bound-in-continuum）和连续态，严格讲应纳入考量，但原子中心基组对后者的描述本就是近似的。
2. FIP35 构象采样不足：仅 3 帧，相较 Chignolin 的 100 帧采样覆盖度有限，热点图的统计代表性有待提高。
3. MLFF 长程局限：当前 PaiNN 架构在超出感受野后的行为，以及精确长程相互作用的捕获，仍是开放问题。

未来可期的研究方向：

• 开发原生处理非局域集体激发的新型网络架构；
• 将热点分析扩展至蛋白质-配体体系、蛋白质-蛋白质相互作用界面；
• 在折叠动力学模拟中直接验证热点相互作用对折叠路径的影响；
• 探索量子感知力场在材料科学（如二维材料层间相互作用）中的应用。

八、总结

这篇论文以严谨的量子力学推导和多方法系统计算，为以下三个核心命题提供了有力证据：

命题一：分子内原子间相互作用力的强度，在相同距离处可跨越四个数量级，无法用任何简单的两两幂律函数描述。 命题二：力的各向异性（非径向分量）在长程不仅持续存在，而且随分子尺寸增大而系统性放大——这是当前所有传统经验力场都无法捕捉的物理图像。 命题三：机器学习力场的经验性成功有其深刻的量子力学依据——它在感受野内隐式学习了多体效应；而其有限感受野同时构成真正长程相互作用的固有瓶颈。

这项工作的意义超越力场精度的增量改进。它重新定义了我们应该如何看待分子间相互作用：不是光滑、各向同性、随距离单调衰减的背景力，而是由量子力学波函数的全局结构所调制的、高度异质的、方向性持续的复杂力景。这一图景，对从蛋白质折叠到超分子组装、从药物设计到材料合成的广泛科学问题，都具有深刻的启示。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2026-05-31，如有侵权请联系 cloudcommunity@tencent.com 删除

论文