大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。
总体来说,DNA甲基化一般遵循三个步骤进行数据挖掘。
首先,进行整体全基因组甲基化变化的分析,包括平均甲基化水平变化、甲基化水平分布变化、降维分析、聚类分析、相关性分析等。
其次,进行甲基化差异水平分析,筛选具体差异基因,包括DMC/DMR/DMG鉴定、DMC/DMR在基因组元件上的分布、DMC/DMR的TF结合分析、时序甲基化数据的分析策略、DMG的功能分析等。
最后,将甲基化组学&转录组学关联分析,包括Meta genes整体关联、DMG-DEG对应关联、网络关联等。
一、甲基化图谱分析
(1)平均甲基化水平的比较
胚胎发育
果实成熟
肌肉发育
(2)CG/CHG/CHH甲基化水平分布
单样本三类甲基化水平分布
组间CpG甲基化水平分布比较
CGI相关元件
各类重复序列元件
基因元件
(3)降维分析
降维分析尝试找到最能反映数据点真实分布情况的两个维度,以方便对数据进行直观把握。一般采用共同覆盖的5×以上位点进行分析:
l 主成分分析(PCA)
l 非度量多维标度法(NMDS)
l 主坐标分析(PCoA)