易基因|DNA甲基化研究的测序数据挖掘思路:干货分享

日期:23-05-04

大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。


总体来说,DNA甲基化一般遵循三个步骤进行数据挖掘。


首先,进行整体全基因组甲基化变化的分析,包括平均甲基化水平变化、甲基化水平分布变化、降维分析、聚类分析、相关性分析等。

其次,进行甲基化差异水平分析,筛选具体差异基因,包括DMC/DMR/DMG鉴定、DMC/DMR在基因组元件上的分布、DMC/DMRTF结合分析、时序甲基化数据的分析策略、DMG的功能分析等。

最后,将甲基化组学&转录组学关联分析,包括Meta genes整体关联、DMG-DEG对应关联、网络关联等。


一、甲基化图谱分析

1)平均甲基化水平的比较

胚胎发育


果实成熟


肌肉发育


2CG/CHG/CHH甲基化水平分布

单样本三类甲基化水平分布


组间CpG甲基化水平分布比较


CGI相关元件

各类重复序列元件



基因元件

3)降维分析

降维分析尝试找到最能反映数据点真实分布情况的两个维度,以方便对数据进行直观把握。一般采用共同覆盖的5×以上位点进行分析:
l  主成分分析(PCA
l  非度量多维标度法(NMDS
l  主坐标分析(PCoA