首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >ChIP-seq 数据分析图表汇总-2高级篇

ChIP-seq 数据分析图表汇总-2高级篇

作者头像
三兔测序学社
发布2026-06-05 20:42:47
发布2026-06-05 20:42:47
10
举报

1. 结合信号与靶基因表达量关联四分图 / 箱线图 (ChIP-seq vs RNA-seq Integration Plot)

分析内容:将 ChIP-seq 数据与转录组(RNA-seq)数据联合分析,研究表观修饰或转录因子结合强度的改变如何直接影响下游靶基因的表达水平。

图形类型:多组箱线图 / 散点趋势图(Boxplot / Scatter Plot)

常用工具:R 包 (BETA /zgsea)

文献展现形式:文献常根据 ChIP-seq peaks 信号值或者差异值,与RNA-seq的基因表达量或者差异表达值进行相关性散点图绘制。

举例说明:

图例说明:图 a:分别在肝脏(绿色点,31 个印记基因)和囊胚(洋红色点,30 个印记基因)中,对印记基因启动子区的 H3K4me3 信号强度(x 轴,Log₂ RPM)与对应基因的表达水平(y 轴,Log₂ RPKM)进行了 Pearson 相关性分析。两者均呈显著正相关(肝脏:R=0.365,P=0.044;囊胚:R=0.543,P=0.002),且囊胚中的相关性更强,提示在发育早期,印记基因的 H3K4me3 修饰与转录活性的耦合关系更紧密。图 b:进一步对比了同一批印记基因在囊胚与肝脏间的 H3K4me3 修饰水平差异(x 轴,Log₂(囊胚 / 肝脏))与对应基因表达水平差异(y 轴,Log₂(囊胚 / 肝脏)),两者呈显著正相关(R=0.693,P=0.00002,n=30,注:囊胚组中因表达量为 0 无法进行 log 转换的印记基因 BEGAIN 被剔除),说明印记基因 H3K4me3 修饰的组织 / 阶段特异性变化,能够较好地解释其表达水平的组织 / 阶段特异性差异。Ishibashi, M., Ikeda, S. & Minami, N. Comparative analysis of histone H3K4me3 modifications between blastocysts and somatic tissues in cattle. Sci Rep 11, 8253 (2021). https://doi.org/10.1038/s41598-021-87683-0

2. 基因表达调控网络图 (Transcriptional Regulatory Network Diagram)

分析内容:系统整理转录因子所结合的核心靶基因(特别是靶基因本身也是转录因子时),构建网状的转录调控下游电路。

图形类型:网络拓扑图(Network Graph)

常用工具:Cytoscape / Gephi

文献展现形式:中心核心节点(Node)代表研究的转录因子,连线(Edge)代表通过 ChIP-seq 证实的直接结合关系。

图例说明

图例说明:a. Tead1 附近多个转录因子(TFs)的 ChIP-seq 信号轨迹。b. TSC 特异性转录因子的转录调控网络图。在 TSC 中功能已知功能和未知功能的转录因子用不同形状表示(圆形代表已知,矩形代表未知)。根据转录因子在 TSC 分化过程中的表达模式(图 2a)所定义的类别,用不同的颜色代码表示。敲除后会导致胚胎致死表型的基因用蓝色边框标示。具有自我调控作用的转录因子用斜体表示.图片来源:Lee, BK., Jang, Y.j., Kim, M. et al. Super-enhancer-guided mapping of regulatory networks controlling mouse trophoblast stem cells. Nat Commun 10, 4749 (2019). https://doi.org/10.1038/s41467-019-12720-6

3.关联分析堆叠条形图

分析内容:用于展示不同组蛋白修饰峰中,活跃 / 非活跃调控元件及无元件区域的占比分布,并按修饰强度四分位分层呈现趋势。

图形类型:堆叠条形图(stacked bar plot),用于展示不同组蛋白修饰峰中,活跃 / 非活跃 PINTS 元件及无元件区域的占比分布,并按修饰强度四分位分层呈现趋势。

常用工具:R 语言(ggplot2 包)、Python(matplotlib/seaborn 库),也可用 GraphPad Prism 绘制。

文献展现形式:通常作为表观基因组关联分析的补充结果图,配合文字说明组蛋白修饰与非编码元件活性的关联,常与功能注释、富集分析结果共同呈现。

举例说明:

图例说明:百分百水平堆叠条形图展示基因组PINTs峰被划分为激活态、非激活态及无状态的占比情况。该对比分析先依据全部基因组峰分层,再按照三种组蛋白修饰(H2BK20ac、H3K27ac、H3K4me1)分面呈现,同时依据峰强度四分位数(第一至第四四分位数)进一步细分统计,对于激活型修饰 H2BK20ac、H3K27ac:随着修饰强度升高(从 Q1 到 Q4),峰中包含PINTS-active 元件的比例显著上升,而 “无 PINTS 元件” 的比例下降。尤其是 H3K27ac 的 Q3、Q4 组,几乎全部为 PINTS-active 元件,说明高信号的激活型修饰峰与活跃的 PINTS 元件高度重合。对于增强子相关修饰 H3K4me1:虽然同样随修饰强度升高,PINTS-active 占比上升,但整体占比低于前两种激活型修饰,且仍有较多峰不包含 PINTS 元件,说明它与活跃 PINTS 的关联弱于 H3K27ac/H2BK20ac。图片来源:Narita, T., Higashijima, Y., Kilic, S., ..., Choudhary, C. (2023) Acetylation of histone H2B marks active enhancers and predicts CBP/p300 target genes. Nature Genetics 55(4), 679-692. https://doi.org/10.1038/s41588-023-01348-4

4. 增强子与超级增强子鉴定图 (Super-Enhancer Identification / ROSE Plot)

分析内容:针对 H3K27ac 或 Mediator(如 Med1)的 ChIP-seq 数据,通过特定的几何切线算法(ROSE)筛选出对细胞身份决定至关重要的 “超级增强子(Super-Enhancers)”。

图形类型:曲率折线散点图(Rank-Ordering Plot / Hockey-stick Plot)

常用工具:ROSE (Rank Ordering of Super-Enhancers)

文献展现形式:X 轴为按 ChIP-seq 信号强度从小到大排序的增强子排名,Y 轴为富集信号总量。曲线在后半段会发生陡峭的指数级上升,切线斜率为 1 的点右侧的所有增强子(通常用红色点高亮)即为超级增强子,文献通常会把核心癌基因(如 MYC)标注在最右上角。

图例说明:(A)基于经过输入标准化的 H3K27ac ChIP-seq 信号来识别 SEs 和 TEs。增强子区域根据 Y 轴给出的 ChIP-seq 信号值,在 X 轴上进行排序。拐点值(inflection value)≥ 1 的区域被定义为 SEs(红点),其余左侧区域则被定义为典型增强子(TEs)(灰色高亮显示)。图中的“低-高(low–high)”条形表示每个区域内的 reads 密度。(B) 整合基因组浏览器(IGV)展示了在 SE/TE 调控的基因位点处的 ChIP-seq 信号(如 H3K27ac)密度。图片来源:Jiang Y, Jiang YY, Lin DC. Super-enhancer-mediated core regulatory circuitry in human cancer. Comput Struct Biotechnol J. 2021 May 5;19:2790-2795. doi: 10.1016/j.csbj.2021.05.006. PMID: 34093993; PMCID: PMC8138668.

5. 组蛋白修饰共定位组合热图 (Histone Modification Co-occurrence Heatmap)

分析内容:将多种不同的组蛋白修饰(如 H3K4me1, H3K4me3, H3K27ac, H3K27me3)在相同结合位点上的信号协同展示,用以识别染色质的活性状态。

图形类型:多列对齐矩阵热图(Multi-region Density Heatmap)

常用工具:DeepTools (plotHeatmap)

文献展现形式:数个热图横向并排对齐。例如:第一列展示 H3K4me1,第二列展示 H3K27ac。若两者在同一行(同一位点)均有深色信号,文献中则定义该区域为 “活跃态增强子(Active Enhancer)”。

举例说明:

图例说明:浆母细胞状态下的表观遗传模式与核心转录因子(TF)的结合相关。 (A) 来自浆母细胞状态的 K-means 聚类整合 ChIP-seq 数据的 deepTools 热图展示。数据是基于 IRF4、BLIMP1 和 XBP1 的峰值并集进行聚类的,并包含了来自相同细胞的 CTCF、H3K4me3 和 H3K27ac 的相关数据。由此衍生出六个调控簇,在左侧被命名为 U.K1-K6。 (A, B) 根据堆叠条形图右侧的颜色代码所示,图 (A) 中衍生出的 K-means 聚类 U.K1-K6 按照基因组分布(转录终止位点、启动子、外显子区、内含子区和基因间区)的相对分布情况。 (A, C) 图 (A) 衍生出的 K-means 聚类中,各个转录因子(TF)的结合百分比占有率。各 TF 对应图右侧颜色代码所示(BLIMP1-红色,IRF4-绿色,XBP1-蓝色。

6. 染色质状态转变矩阵图 (Chromatin State Transition Plot)

分析内容:利用隐马尔可夫模型(ChromHMM)将基因组划分为不同的表观状态,展示在细胞分化或受到刺激前后,全基因组区域状态的相互转换比例。

图形类型:转移概率矩阵热图 / 桑基图(Transition Heatmap / Sankey Diagram)

常用工具:ChromHMM

文献展现形式:行代表处理前的状态(如 “不活跃启动子”),列代表处理后的状态(如 “活跃启动子”),格子内的数值和颜色深浅代表转换的百分比。桑基图则能直观看到流向流速。

图例说明:染色质状态的定义及其随年龄增长发生的状态转变。(A) 年轻样本中染色质状态的定义、标签以及选定功能元件组的富集情况。左侧热图中的数字表示在相应染色质状态下观察到特定组蛋白修饰的概率。右侧热图中的数字是 ChromHMM 针对每种染色质状态与特征组合计算得出的富集值。(B) 展示 SD 3月龄(中心)、SD 12月龄(左侧)和 CR 12月龄(右侧)组之间染色质状态转变的桑基图(alluvial plot)。条形图的高度代表基因组覆盖率的百分比(所有状态加起来为 100%)。” SD 和 CR 通常分别代表“标准饮食”(Standard Diet)和“热量限制”(Caloric Restriction)组。图片来源:Hillje R, Luzi L, Amatori S, Persico G, Casciaro F, Rusin M, Fanelli M, Pelicci P, Giorgio M. Time makes histone H3 modifications drift in mouse liver. Aging (Albany NY). 2022 Jun 10;14(12):4959-4975. doi: 10.18632/aging.204107. Epub 2022 Jun 10. PMID: 35687897; PMCID: PMC9271290.

7. 表观基因组状态富集条形图 (Chromatin State Enrichment Bar Chart)

分析内容:分析鉴定的转录因子 Peak 主要落在由 ChromHMM 定义的哪种 “表观染色质状态”(如强启动子、弱增强子、异染色质等)中。

图形类型:富集倍数条形图 / 倍数热图(Enrichment Score Bar Chart)

常用工具:ChromHMM / EpiCompare

文献展现形式:X 轴为各种表观状态(1-15 states),Y 轴为富集倍数(Fold Enrichment)。用于明确证明该因子更倾向于结合在何种表观背景下。

举例说明:

图例说明:(A) ChromHMM 自动化染色质状态注释的参数。(B) 甲基化水平与年龄高度相关的特定 CpG 位点的染色质状态。对数富集度(Log enrichment)指的是:某染色质状态下阳性(+)或阴性(-)CpG 位点的比例,除以该染色质状态下所有 CpG 位点的比例,再取 log 2。参考背景选自 数据集中测序覆盖度至少为 10 的所有 CpG 位点。星号(*)表示 Fisher 精确检验的校正 p 值小于 0.05。图片来源:Bennett, Ronan & Morselli, Marco & Peshkin, Leonid & Pellegrini, Matteo. (2024). An epigenetic clock for Xenopus tropicalis reveals age-associated sites enriched in H4K20me3-marked heterochromatin. 10.1101/2024.12.21.629929.

8. 启动子 - 增强子相互作用网络图 (Promoter-Enhancer Interaction Loop Plot)

分析内容:将 ChIP-seq 鉴定出的增强子 / 超级增强子,通过三维基因组数据(Hi-ChIP / ChIA-PET / Hi-C)与远端的靶基因启动子进行空间连线,揭示远端调控机制。

图形类型:弧形连线图 / 轨道图(Arc Track Plot / Bedtools Interaction Track)

常用工具:WashU Epigenome Browser

文献展现形式:在基因组浏览器下方,用彩色的半圆弧线(Arcs)将一个 ChIP-seq 峰(增强子)与几百 kb 之外的另一个 ChIP-seq 峰(TSS)连接起来,代表它们在空间上发生了物理接触。

举例说明:

图例说明:H3K27ac HiChIP数据与H3K27ac CHIP-seq数据,Hi-CHIP数据得到H3K27ac 介导的Loop互作环,图中展示互作环,互作环锚顶点,以及H3K27ac 富集峰图。从图中可知TNFAIP3基因上有存在自身免疫疾病SNP位点,并与上下游基因IL22RA,IFNGR1与TNFAIP3都存在远距离相互作用。图片来源:https://gaffney.omrf.org/wp-content/uploads/sites/3/2018/04/2018-omrf-retreat-YF.pdf

9. 拓扑敏感结构域(TAD)边界 ChIP 信号图 (ChIP-seq Signal around TAD Boundaries)

分析内容:探究结构蛋白(如 CTCF, Rad21 粘连蛋白)在三维基因组拓扑敏感结构域(TAD)边界处的富集分布特征。

图形类型:边界对齐元基因谱图(TAD Boundary Profile Plot)

常用工具:DeepTools / Juicer

文献展现形式:X 轴中心点为 TAD Boundary(边界),向两侧延伸。Y 轴为 CTCF 的 ChIP 信号强度,通常在边界中心会呈现极为尖锐的单峰,证明其在维持三维基因组结构中的 “绝缘子” 屏障功能。

在胚胎干细胞中,鉴定出HoxA 基因 3' 端所在同一拓扑相关结构域(TAD)内距离其最近的CTCF 结合元件(CBE+47)。A. 未分化胚胎干细胞中,HoxA 基因座周边约 0.5 兆碱基区域的染色质构象捕获(Hi-C)互作图谱。B. 整合基因组浏览器(IGV)截图,展示胚胎干细胞内 Skap2 与 HoxA 基因座上CTCF、MED1、MED12 及 YY1的ChIP-seq 信号分布。CTCF 的 ChIP-seq 结果显示,该基因座全域均存在 CTCF 结合信号,且 HoxA 基因座下游分布有多个 CTCF 结合位点。C、D. 胚胎干细胞内 Skap2 与 HoxA 基因座的 ChIP-seq 信号 IGV 可视化结果。图 C 展示H3K27ac、H3K4me1、H3K4me2、H3K4me3修饰信号;图 D 展示RNA 聚合酶 II(Pol II)、染色质开放区域测序(ATAC-seq)及 DNase I 超敏感位点信号。蓝色竖线标注 CBE+47 区域,灰色阴影标注 HoxA 基因座;图 A 中蓝色虚线框标示拓扑相关结构域(TAD)边界区域。图片来源:Su G, Wang W, Chen J, et al. CTCF-binding element regulates ESC differentiation via orchestrating long-range chromatin interaction between enhancers and HoxA. J Biol Chem. 2021;296:100413. doi:10.1016/j.jbc.2021.100413


如果你觉得这篇博文对你有帮助,请点赞、收藏、转发!支持我们持续输出优质内容!

关注“三兔测序学社”,获取更多测序分析实用教程与前沿解读。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2026-06-04,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 三兔测序学社 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 结合信号与靶基因表达量关联四分图 / 箱线图 (ChIP-seq vs RNA-seq Integration Plot)
  • 2. 基因表达调控网络图 (Transcriptional Regulatory Network Diagram)
  • 3.关联分析堆叠条形图
    • 4. 增强子与超级增强子鉴定图 (Super-Enhancer Identification / ROSE Plot)
    • 5. 组蛋白修饰共定位组合热图 (Histone Modification Co-occurrence Heatmap)
    • 6. 染色质状态转变矩阵图 (Chromatin State Transition Plot)
    • 7. 表观基因组状态富集条形图 (Chromatin State Enrichment Bar Chart)
    • 8. 启动子 - 增强子相互作用网络图 (Promoter-Enhancer Interaction Loop Plot)
    • 9. 拓扑敏感结构域(TAD)边界 ChIP 信号图 (ChIP-seq Signal around TAD Boundaries)
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档