多组学联合分析方案

Multi omics Joint Analysis Scheme

多组学(Multi-Omics)是探究生物系统中多种物质之间相互作用的方法,包括基因组学、表观基因组学、转录组学、蛋白质组学、代谢组学、微生物组学等,这些物质共同影响生命系统的表型、性状等。对不同组学数据源进行归一化处理、比较分析,建立不同组间数据的关系,综合多组学数据对生物过程从不同组学水平进行全面的深入阐释,从而更好的对生物系统进行全面了解。


多组学研究方案
1. 研究目标和设计


  • 目标设定:明确研究目的,比如探究特定疾病的病因、病理机制或药物反应。
  • 样本选择:根据研究目标选择合适的样本类型(如血液、组织、细胞等)和样本量。
  • 实验设计:设计对照组和实验组,确保实验的可重复性和随机性。
2. 数据收集与预处理
基因组学:
  • 进行高通量测序(如WGS或WES)以获得基因组数据。
  • 预处理包括质量控制、序列比对、变异检测和基因型鉴定。
表观基因组学:
  • 通过WGBS或RRBS等技术获取DNA甲基化数据。
  • 预处理包括甲基化水平的定量和差异甲基化区域(DMR)的鉴定。
转录组学:
  • 利用RNA-seq技术获取基因表达数据。
  • 预处理包括序列比对、表达量估计和差异表达基因(DEG)分析。
蛋白质组学:
  • 通过质谱技术(如LC-MS/MS)获取蛋白质表达和修饰数据。
  • 预处理包括肽段鉴定、蛋白质定量和差异蛋白质分析。
代谢组学:
  • 通过NMR或LC-MS技术获取代谢物数据。
  • 预处理包括代谢物鉴定和相对定量。
微生物组学:
  • 通过16S rRNA测序或宏基因组测序分析微生物组成。
  • 预处理包括OTU聚类、物种注释和多样性分析。
3. 数据分析
单组学分析:
  • 对每个组学的数据进行独立分析,识别关键的生物标志物和调控网络。
多组学整合分析:
  • 利用统计和生物信息学方法整合不同组学的数据,如相关性分析、网络分析和机器学习。
  • 识别跨组学间的相互作用和调控机制。
4. 结果验证
实验验证:


  • 通过实验方法(如qPCR、Western blot、ELISA等)验证关键基因、蛋白质和代谢物的表达变化。
  • 进行功能实验验证候选基因或蛋白质的功能。


应用领域

  • 基础医学
  • 植物生理病理机制
  • 分子育种
  • 临床医学研究
  • 微生物代谢
  • 药物研发

多组学案例展示: 
 
WGBS+totalRNA-seq:探索差异甲基化区域(DMR)与差异表达基因、miRNA和siRNA之间的重叠关系,揭示基因表达调控的复杂网络。

 
血液组织RRBS+RNAseq:通过皮尔森关联分析,研究DMR甲基化水平与基因表达水平间的相关性,深入理解表观遗传对基因表达的影响。

 
肠道宏基因组+宏病毒组:比较健康与炎症性肠病(UC)组中噬菌体与细菌丰度的相关性,发现微生物组与疾病之间的潜在联系。

 
肠道菌群16S+血液代谢组+肝脏转录组:运用多元线性模型关联分析,筛选出关键调控模型,构建低剂量抗生素饲喂促进仔猪快速生长的多组学调控网络。
参考文献:
1) Yan H, Bombarely A, Xu B, et al.Autopolyploidization in  switchgrass alters phenotype and flowering time viaepigenetic  and tranion regulation[J]. Journal of experimental botany,2019
2) Zhang, D., Hu, Q., … Gao, F. (2019). Epigenetic and transcriptional signatures of  ex situ conserved golden snub-nosed monkeys (Rhinopithecus roxellana).
3) Zuo, T., Lu, X. J., Zhang, Y. (2019). Gut mucosal virome alterations in ulcerative  colitis. Gut, 68(7), 1169-1179.
4) Inter-correlated gut microbiota and SCFAs changes upon antibiotics exposure links with rapid body-mass gain in weaned piglet model. The Journal of nutritional biochemistry,2019, 74: 108246.