染色质免疫共沉淀测序(ChIP-seq)的数据挖掘思路 |干货系列

日期:23-05-04

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。

CHIP-seq研究的数据挖掘思路主要分为3步:

1)        整体把握CHIP-seq图谱特征:peak/reads在基因组上的分布、peak在元件上的富集、peak在基因元件上的分布、peakmotif分析、peak距离TSS位点的距离分析、peak修饰基因的功能分析

2)       筛选具体差异peak和基因:差异 peak鉴定、非时序数据的分析策略、时序数据的分析策略、差异peak关联基因的功能分析、差异peak关联基因的PPI分析、感兴趣目标区域的可视化展示

3)       CHIP-seq&转录组学关联分析Meta genes整体关联、peak关联基因与DEG对应关联、目标区域和靶基因的筛选

后期视情况是否需要下游实验设计验证TF结合/组蛋白修饰的目标区域和候选靶基因。


1、图谱分析

1peak/reads在基因组上的分布



peak分布圈图

2)信号的富集程度分析——覆盖度累积曲线

对样本比对结果reads累积情况进行展示。一定长度窗口(bin)reads数进行计数,然后排序,再依次累加画图。input (能测到90 DNA片段)在基因组理论上是均匀分布,随着测序深度增加趋近于直线,实验组在排序越高的窗口处reads累积速度越快,说明这些区域富集的越特异。

narrow peak :富集程度高;broad peak:富集程度低。