首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >J. Med. Chem. | 活性景观表征:解读分子构效关系的多维视角

J. Med. Chem. | 活性景观表征:解读分子构效关系的多维视角

作者头像
DrugIntel
发布2026-06-05 20:16:25
发布2026-06-05 20:16:25
100
举报

文献来源:Wassermann A M, Wawer M, Bajorath J. Activity Landscape Representations for Structure-Activity Relationship Analysis. Journal of Medicinal Chemistry, 2010, 53(23): 8209–8223. DOI:10.1021/jm100933w 作者单位:德国波恩莱茵弗里德里希-威廉大学


引言:为什么需要活性景观?

在药物化学研究中,构效关系(Structure-Activity Relationship,SAR)分析是核心主题之一。随着化合物数据集规模不断扩大,仅凭化学家的直觉和经验已难以全面把握结构与活性之间的复杂关联。计算方法的引入虽然提升了分析效率,但作者明确指出:计算方法并不等于客观——任何计算模型都内含假设和近似,其适用范围往往有限,结果也难以直接评估。

在这一背景下,活性景观(Activity Landscape) 的概念应运而生。它将化合物的结构相似性与活性差异整合于同一框架之中,为数据驱动、描述性的大规模 SAR 分析提供了强有力的工具。本文作者系统综述了活性景观的理论基础、数值分析方法和多种图形表征模式,并深入探讨了其在药物化学中的实际应用价值。


一、活性景观的核心概念

1.1 基本定义

活性景观可以被广义定义为:

任何整合了化合物结构相似性分析与活性差异分析的表征形式,且所研究化合物共享同一生物活性靶点。

在实现层面,活性景观将化合物在化学参考空间中的位置(由结构相似性决定)与其活性值相结合,形成一个"活性超曲面"。结构相似的化合物在空间中彼此靠近,结构差异大的化合物彼此远离,而活性差异则由超曲面的起伏来反映。

1.2 化学参考空间的选择

活性景观的生成依赖于化学参考空间。与用于活性预测的空间不同,用于 SAR 分析的参考空间优先强调结构相似性而非活性相关性。常用的分子表征手段包括:

  • 二维指纹(2D Fingerprints):如 ECFP、MACCS 结构键等,捕捉分子拓扑特征
  • 三维药效团指纹(3D Pharmacophore Fingerprints):如 TGT,关注三维空间中的功能基团排布
  • 原子环境指纹(Atom Environment Fingerprints):如 Molprint2D,基于原子局部化学环境编码

作者特别强调了相似性悖论(Similarity Caveat):分子表征方式的选择对景观拓扑的影响,往往远大于活性测量误差的影响。不同参考空间可能导致截然不同的相似性关系,进而使活性悬崖出现或消失。因此,在多个参考空间中一致出现的活性悬崖(称为"共识活性悬崖")被认为具有更高的可靠性。

1.3 三种理想化 SAR 类型

基于活性景观的拓扑特征,可将 SAR 特征分为三类(见图2):

SAR 类型

景观特征

化学含义

计算模型适用性

SAR 连续性

平缓起伏的丘陵地形

结构渐变伴随活性渐变

高,适合 QSAR、虚拟筛选

SAR 不连续性

陡峭的悬崖地形

微小结构变化引发活性突变

低,挑战 QSAR 模型

SAR 异质性

混合地形

连续与不连续区域共存

中等,需分区处理

研究表明,现实化合物数据集中的全局 SAR 绝大多数呈异质性,即图2c所示的"可变活性景观",这与连续和不连续 SAR 成分在不同化合物子集中的共存密切相关。


二、SAR 信息内容的信息论解读

这是本文一个极具启发性的理论切入点。作者从信息论角度重新审视 SAR 信息内容:

  • 信息熵:若活性值在化学参考空间中随机分布,则 SAR 信息熵最高——但此时活性完全不可预测
  • 活性悬崖:作为 SAR 不连续性的极端表现,代表最高 SAR 信息内容——微小结构变化引发巨大活性响应
  • 悖论:高 SAR 信息内容(如活性悬崖)往往与化学可解释性和可预测性负相关

这一悖论揭示了一个重要认识:活性悬崖区域能暴露对活性十分重要的取代位点,但未必能提供如何进一步优化化合物的趋势性指导。 因此,SAR 分析既不能只盯着活性悬崖,也不能忽视连续区域中蕴藏的规律性信息。


三、数值化 SAR 分析函数

3.1 结构-活性相似性图(SAS Map)

SAS Map 是最早提出的活性景观二维表征方式,由 Shanmugasundaram 和 Maggiora 于2001年报道。其核心思想是对数据集中所有化合物对进行系统性两两比较:

  • x 轴:结构相似性(通常为 Tanimoto 系数)
  • y 轴:活性相似性,定义为:
  • 颜色编码:反映该化合物对中活性较高者的绝对活性值

SAS Map 可自然划分为四个象限,分别对应不同 SAR 特征:

象限位置

结构相似性

活性相似性

SAR 含义

左上

骨架跳跃区(Scaffold Hopping)

右上

类似物系列,活性趋同

左下

低信息量区域

右下

活性悬崖区(Activity Cliffs)

3.2 SAR 指数(SARI)

SARI 由 Peltason 和 Bajorath 于2007年提出,是对 SAS Map 的数值化抽象,由两个分量构成:

(1)连续性评分(Continuity Score)

其中权重定义为:

此评分强调高活性且活性差异小的结构多样化化合物对,反映景观的平缓区域。

(2)不连续性评分(Discontinuity Score)

此评分仅考虑相似度超过阈值 且活性差异超过一个数量级的化合物对,精确捕捉活性悬崖。

两个原始评分经 Z-score 标准化后映射至 [0,1] 区间,最终合并为:

SARI 对全局 SAR 的分类标准:高分 → 连续性 SAR;低分 → 不连续性 SAR;中间值(约0.5)→ 异质性 SAR。

此外,SARI 还可在单化合物层面计算局部不连续性评分,识别对局部 SAR 突变贡献最大的化合物。

3.3 结构-活性景观指数(SALI)

SALI 由 Guha 和 van Drie 提出,是针对活性悬崖的简洁量化工具:

SALI 为分母趋近于零时(即两分子几乎全同但活性差异极大)取值趋于无穷,能敏锐捕捉最显著的活性悬崖。

与 SARI 不连续性评分相比,SALI 的特点在于:

  • • 为成对分数,值域无界
  • • 更强调大活性差异与高相似度的组合
  • • 不适合直接作为全局 SAR 异质性的度量

Guha 后来还将 SALI 扩展至考虑剂量-响应曲线的 Hill 方程参数,以替代单点活性值,用于更精细地描述中等程度的活性悬崖。


四、图形化景观表征方法

4.1 SALI 图(活性悬崖中心视图)

在 SALI 图中,节点代表化合物,若两化合物的 SALI 值超过预设阈值(如全部 SALI 值的前 50%、60%、70%……),则连接一条有向边(方向指向活性更高的化合物)。

随着阈值提高,保留的边逐渐减少,最终只有最显著的活性悬崖化合物对被保留(图3中红色边)。这一分析可直接识别化合物优化路径,是药物化学应用的有力工具。

SALI 图还可用于评估不同 SAR 模型对活性悬崖的覆盖能力:通过绘制"SALI 曲线"(正确预测的有向边比例 vs. SALI 阈值),可筛选出最适合特定数据集的计算模型。

4.2 网络相似性图(NSG)

NSG 是迄今功能最为全面的活性景观表征方式之一,由 Wawer 等人提出(图5):

  • 节点:代表化合物,颜色映射活性值,大小映射单化合物 SARI 不连续性评分
  • :连接相似度超过阈值的化合物对,反映拓扑结构
  • 聚类:对数据集进行层次聚类,并为每个聚类计算整体不连续性评分
  • 活性悬崖标记:红色(高活性)与绿色(低活性)大节点相连,即为显著活性悬崖

NSG 的独特优势在于同时揭示全局与局部 SAR 特征。例如:

  • • 角鲨烯合酶抑制剂数据集:全局 SAR 异质,NSG 可见兼具连续性与不连续性的化合物聚类共存
  • • 凝血酶抑制剂数据集:全局 SAR 高度不连续,NSG 中大量红绿节点对主导整个景观

SAR 通路(SAR Pathways) 是 NSG 的延伸应用:基于预定义的 SAR 模型,系统计算和排序从连续区域延伸至活性悬崖的化合物路径,为跨越连续/不连续 SAR 区域提供可解释的化学关联(图5d)。

NSG 还可扩展至多靶点选择性分析:将活性值替换为对两个靶点的对数活性差(选择性),生成"选择性-NSG",识别"选择性悬崖",揭示结构决定选择性的取代基模式(图6)。

4.3 相似度-活性树(SPT)

SPT 是以单个化合物为中心的局部景观视图(图7):

  • • 参考化合物(根节点)置于树顶
  • • 自顶向下,各层化合物与根节点的相似度递减,直至低于最小阈值
  • • 同层级的兄弟节点按活性值从左到右升序排列
  • • 同一父节点下的子节点代表参考结构的直接衍生物

SPT 的关键在于参考化合物的选择:遍历数据集中所有化合物作为根节点,生成全部 SPT 后按预设 SAR 信息内容排序,确保不遗漏任何局部 SAR 信息。优质 SPT 具有宽广的覆盖范围和规律的活性分布模式,直接为衍生物合成提供方向(图7b)。

4.4 详细三维活性景观

三维活性景观将化合物的二维化学参考空间投影(通过多维尺度分析,MDS)与 z 轴活性值相结合,利用插值函数生成连续活性曲面(图8):

  • 数据峰(Data Peaks):局部数据密集区的小突起,非真实悬崖
  • 活性悬崖:曲面上红色高峰区域,可与相邻绿色(低活性)区域形成鲜明对比
  • 颜色渐变:绿(低活性)→ 红(高活性)连续色谱,配合高度信息增强视觉直觉

三维景观的重要应用之一是诊断性比较:同一数据集在不同分子表征下产生的三维景观可能大相径庭(图8c),从而帮助研究者评估哪种描述符空间更适合特定的建模目标。

4.5 组合类似物图(CAG)

CAG 专为小型类似物系列设计,填补了其他景观方法在精细取代基分析上的空白(图9):

  • 基本单元:基于 R 基团分解,将化合物按取代位点组合划分子集
  • 节点:代表在特定位点或位点组合上存在差异的化合物子集,颜色映射不连续性评分
  • :连接共享一个或多个修饰位点的子集
  • SAR 热点:不连续性评分最高的取代位点,即微小结构变化最可能引发活性突变之处
  • SAR 空洞(SAR Holes):尚未被探索的取代位点组合,提示下一步合成优先级

CAG 已被拓展至多靶点 SAR 分析(图9b):对同一系列化合物针对 factor Xa、凝血酶、尿激酶和胰蛋白酶分别生成 CAG,可直观比较各靶点的 SAR 热点差异,为选择性优化提供精确指导。


五、活性悬崖的分布规律与结构来源

5.1 普遍性

系统性活性景观分析表明,几乎所有活性化合物数据集(包括高通量筛选数据集)都含有中等到大幅度的活性悬崖。这一发现具有重要意义:活性悬崖并非例外,而是药物化学数据集的普遍特征

5.2 R 基替换模式

基于匹配分子对(Matched Molecular Pairs,MMP)分析,研究者系统鉴定了约 200 种在不同化合物类别和生物靶点中普遍诱导活性悬崖的 R 基替换模式(图4a),典型类别包括:

  • 电荷变化:如羧基→中性基团(引入/去除负电荷)
  • 氢键能力改变:如氨基→无氢键供体基团
  • 体积/疏水性变化:如小脂肪链→大芳香基

5.3 分子骨架的悬崖倾向

除取代基外,分子骨架本身也可能是活性悬崖的来源。研究鉴定了超过 100 种在多个靶点上均能形成显著活性悬崖的分子骨架(图4b),这些骨架的普遍悬崖倾向提示:骨架选择本身就应纳入化合物库设计和优先筛选的考量之中。


六、景观分析在药物化学中的实践价值

本文明确区分了活性景观分析与预测性 SAR 方法的定位:景观分析是描述性的,不是预测性的。其核心价值体现在:

  1. 1. 快速评估数据集的 SAR 信息含量:数据集是否值得深入分析?存在哪种类型的 SAR?
  2. 2. 识别 SAR 热点与关键化合物:哪些化合物形成活性悬崖?哪些区域具有连续性 SAR?
  3. 3. 辅助化合物筛选与优先排序:通过 SARI/SALI 量化评分快速定位高信息量子集
  4. 4. 揭示可解释的优化路径:SAR 通路连接连续区域与悬崖,提供"化学桥梁"
  5. 5. 识别已充分探索的"平坦" SAR 区域:避免在已无显著信息增益的方向继续投入
  6. 6. 多靶点选择性分析:从活性悬崖到选择性悬崖,理解靶点间的 SAR 关联

七、局限性与未来展望

作者坦诚地指出了活性景观分析的若干局限:

  • 规模适用性:过大的数据集使网络图难以可视化分析;过小的数据集(几十个化合物)则无需景观模型
  • 相似性度量的主观性:分子表征的选择深刻影响景观拓扑,目前尚无"金标准"
  • 三维景观仍处早期:高分辨率三维景观建模方法有待发展

对于未来方向,作者预期:

  • • 更多基于替代分子表征的详细三维景观模型将被开发
  • • 交互式活性景观建模将日益普及,用于历史化合物数据集的回顾性 SAR 探索
  • • 景观分析将成为评估不同化学参考空间"SAR 捕获能力"的诊断工具

总结

本文是活性景观领域最具代表性的综述之一,系统梳理了从 SAS Map 到三维景观、从全局到局部、从单靶点到多靶点的完整方法体系。其核心贡献在于:

将原本定性的药物化学 SAR 直觉,转化为可量化、可可视化、可系统比较的计算框架,同时保留了化学可解释性这一不可或缺的核心。

对于从事早期药物发现、命中-先导物转化和先导物优化的研究者而言,掌握活性景观分析方法,意味着拥有了一套能够在复杂数据中高效定位"地形特征"的导航系统。


本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DrugIntel 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 引言:为什么需要活性景观?
  • 一、活性景观的核心概念
    • 1.1 基本定义
    • 1.2 化学参考空间的选择
    • 1.3 三种理想化 SAR 类型
  • 二、SAR 信息内容的信息论解读
  • 三、数值化 SAR 分析函数
    • 3.1 结构-活性相似性图(SAS Map)
    • 3.2 SAR 指数(SARI)
    • 3.3 结构-活性景观指数(SALI)
  • 四、图形化景观表征方法
    • 4.1 SALI 图(活性悬崖中心视图)
    • 4.2 网络相似性图(NSG)
    • 4.3 相似度-活性树(SPT)
    • 4.4 详细三维活性景观
    • 4.5 组合类似物图(CAG)
  • 五、活性悬崖的分布规律与结构来源
    • 5.1 普遍性
    • 5.2 R 基替换模式
    • 5.3 分子骨架的悬崖倾向
  • 六、景观分析在药物化学中的实践价值
  • 七、局限性与未来展望
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档