应用单细胞测序技术研究科学问题越来越普遍,当下应用最火热的是10x Genomics公司的Chromium解决方案(以下简称10X)。但是基于2017年Christoph Ziegenhain et al[1]对6种单细胞转录组技术及2019 Broad研究所的团队对7种单细胞RNA测序方法进行了比较[2],某些特殊或者少量细胞样本的单细胞转录组研究中,Smart-seq2技术还是一项研究利器。Smart-seq2与10x技术的区别与应用的科研场景有哪些呢?北京大学张泽民团队在2019年发表的预印文章“Direct Comparative Analysis of 10x Genomics Chromium and Smart-seq2”中给予了答案。那么今天小编再次对Smart-seq 2与10x Genomics Chromium的技术原理和应用进行阐明。
Smart-Seq简介
Smart-Seq (Switching mechanism at 5' end of the RNA transcript)于2012年发表[3],2013年发表了其改进技术的应用Smart-Seq2[4],2014年Smart-Seq2 protocol发表[5]。Smart-Seq2 对原始的Smart-Seq实验流程进行了多项改进优化,它不再需要纯化步骤,可大大提高产量,最重要的改进是下面两项:
· TSO 3'端最后一个鸟苷酸替换为锁核酸LNA(locked nucleic acid)。LNA单体的热稳定性增强,其退火温度增强非模板cDNA的3'延伸能力
· 甜菜碱(一种具有两个重要作用的甲基供体:它会增加蛋白质的热稳定性,并通过破坏DNA螺旋来降低甚至消除了DNA热融变对碱基对组成的依赖性)与较高的MgCl2浓度结合使用。解决某些RNA形成二级结构(例如发夹或环)由于空间位阻,可能导致酶终止链延长的问题
Smart技术是基于高保真的反转录酶、模板转换和前置放大来增加cDNA得率,实验流程2天,得到的是全长转录本。该方法有较好的覆盖范围,可检测到稀有转录本,不需要额外的专业设备,因此应用范围较广。
Smart-Seq2建库原理
1. 单细胞分选:Smart-seq2使用流式细胞仪或显微操作进行细胞分选,体积不超过0.5 ul。
2. 细胞裂解:将分离细胞直接转移到细胞裂解液中进行细胞裂解。
3. 反转录( 一链合成 ):使用Oligo(dT) primer 对带有polyA尾的RNA( 主要mRNA )进行反转录。由于使用了特殊活性反转录酶( Moloney Murine Leukemia Virus )进行反转录,所以会在cDNA链3'端加上三个C。
4. 模板置换( 二链合成 ):该步使用TSO ( template-switching oligo )引物合成了cDNA的二链,从而置换了与一链cDNA互补的RNA。要注意的是TSO 3'端有三个G能与一链3'端的三个C互补,而最末端的+G是一个修饰过的G,能增加TSO的热稳定性,以及其与一链cDNA游离的3’端的互补的能力。
5. PCR扩增:该步进行轻度的cDNA富集,将cDNA扩增至ng级即可。
6. 标记:利用改造后的高活性Tn5转座酶对DNA进行打断的同时将接头添加到cDNA的两端。标记完成后的DNA片段通常在200-600bp。
7. PCR富集及上机测序:在进行最后一次PCR扩增后,即可上机测序。
10x Genomics单细胞技术
ChromiumTM Single Cell 3' Solution是基于10 X Genomics平台,能够一次性分离、并标记5000–10000个单细胞,并能在单细胞水平进行检测的技术。该方法基于微流控技术(Microfluidics-based approaches),与Smart有相似的分子生物学原理,运用了模板转换技术,但与Smart的细胞捕获和通量不同。droplet-based方法是将单个细胞包裹在一个小油滴中(含有barcode和RT primer)反转录成cDNA,然后油滴破裂释放cDNA,统一进行文库构建,增大了实验通量,但需要专门的实验设备。
10x Genomics建库原理
1. 制备好的细胞悬液、10x barcode凝胶磁珠和油滴分别加入到Chromium Chip B的不同小室,经由微流体“双十字”交叉系统形成GEM。为了获得单细胞反应体系,细胞悬液浓度建议控制在700-1200细胞/ul,因此产生的90-99% GEM不含有细胞,剩下的大部分GEM含有一个细胞。
2. 单个GEM依次形成后再全部混合,细胞裂解,凝胶珠自动溶解释放大量引物序列。
3. 释放的引物中包含30nt poly dT反转录引物,带有polyA的RNA被反转录为带有10x Barcode和UMI信息的cDNA一链,再以SMART方式完成二链合成。
4. 油滴破碎,磁珠纯化cDNA一链,然后PCR扩增cDNA。
5. cDNA扩增完成后酶切片段化并磁珠筛选最适片段,通过末端修复、加A、接头连接Read2测序引物,再以PCR方式构建含有P5和P7接头的cDNA文库即可。
Smart-Seq2 优点和限制
优点
· Smart-seq2利用现成的试剂比广泛商用的SMARTer kit生产更高质量的文库,成本便宜~12%,为分析大量细胞提供了可能性
· 相对于截短的cDNAs,M-MLV逆转录酶更倾向于选择全长cDNAs作为其末端转移酶活性的底物。因此每个转录本的所有外显子都能被检测到,这使它可以用于检测可变剪接,还可以在转录本层面进行全面的SNP和突变分析,扩大了其应用范围
· 不同I5、I7 Index组合使其能够进行多样品混合测序
· Smart-seq2的方案组分和原理是公开的,让研究人员可以进一步对其进行改良,目前在这个方案基础上涌现了许多单细胞测序的新成果
· 相对于10x Genomics 平台,单细胞检测到的转录本更多
限制
· 由于对聚腺苷酸化的RNA具有选择性,所以不能分析非poly(A)的RNA
· 测序reads不带有mRNA链特异性
10x Genomics优点和限制
优点
· 简单便捷:集单细胞分选、扩增、建库于一体;
· 细胞通量高:每个样本细胞数可达5000-10000个;
· 建库周期短:1天可完成细胞悬液制备、单细胞捕获、扩增及建库;
· 超高捕获效率:单细胞捕获效率高达65%;
· 真正意义的单细胞:单个液滴捕获到多个细胞的概率极低(0.9%/1000cells);
· 价格实惠:相较于其它单细胞平台,价格实惠。
缺点
· 非全长信息:只能获得3’端转录本信息;
· 样本要求高:单个样本细胞起始量达5x10^4-10^5个,活细胞数目需超过80%,建议在90%以上最佳。
数据差异
张泽民团队通过直接比较两个平台上来自相同CD45细胞样本的scRNA-seq数据,广泛系统地分析评估了各自数据特征。 Smart-seq2在细胞中检测到更多的基因和更为复杂的数据集,尤其是丰度较低的转录本以及可变剪切的转录本,但捕获了更高比例的线粒体基因。 Smart-seq2数据的组合也更类似于bulk RNA-seq数据。
尽管都是基于poly(A)富集策略,两个平台检测到的所有转录本中约有10-30%来自非编码基因,而lncRNA在10x中所占的比例更高。
Smart-seq2具有更高的敏感度,检测到的表达基因数目远高于10x的检测到的表达基因数目。
对于检测到的基因,Smart-seq2数据呈单峰分布,在所有细胞中检测到的低表达基因很少。相比之下,10x的数据由于有大量的接近零表达的基因,呈现出明显的双峰分布,说明10x数据中mRNA在很低的表达水平上有较高的噪声或随机捕获。
基于10x的数据显示出更严重的dropout问题(dropout是scRNA-Seq数据的一大特点,就是很多基因在某些细胞根本就检测不到表达,但是在另外的细胞却检测为高表达。通常认为这个dropout是因为在文库构建的过程中,有部分基因没有被成功的反转录。),尤其是对于表达水平较低的基因。
10x 技术测序数据由于技术特色在mRNA的3’端有着较强的bias,而Smart-seq2技术则在gene上有着更为均一的分布。同时, 10x技术数据在splicing分析层面并不适用。
但是,由于10x数据能够覆盖大量细胞,因此可以更好地检测稀有细胞类型。此外,每个平台检测到的细胞簇之间差异表达基因的不同集合,表明这些技术是具有互补性的。
Smart-seq2技术案例:
Björklund 2016年利用Smart-seq2单细胞转录组测序揭示人CD127+先天淋巴细胞的异质性[6]。先天淋巴细胞(ILCs)是一种免疫细胞,它通过释放可溶性的因素调节对病毒、细菌和寄生虫的早期免疫反应。这些细胞可以根据细胞表面的转录因子及细胞因子被分为三个亚型,每种亚型都有不同的功能。利用流式细胞仪分选患有阻塞性睡眠呼吸暂停综合症患者的扁桃体组织中的ILCs(Lin−CD127+)和NK cells(CD45+Lin−CD127−NKG2A+CD56+CD16− )。采用Smart-seq2进行单细胞转录组扩增建库;Illumina HiSeq 2000 3M reads /样本进行测序分析。采用PCA(主成分分析)和t-SNE对ILC中847个表达的基因进行分型分析,将细胞分为4类:ILC1、ILC2、ILC3、NK cells。应用SCDE软件包对4类细胞的差异基因进行分析,找出共有及特有差异基因,结果发现,CD127+ILCs中共有的差异基因的表达量比NK细胞中明显要高。 ILC1、 ILC2、ILC3差异基因表达分析,结果表明,ILC1 cells共有79个上调表达基因,参与干扰素γ的调控,ILC2 cells共有58个上调表达的基因,在前列腺素、Notch信号通路及环境感应中发挥作用,ILC3 cells共有371个上调表达的基因,根据GO注释有85个与免疫相关,且存在未知功能的基因。
采用PCA和t-SNE分析ILC3中1,958个注释的免疫基因,将ILC3分为3个亚型:Cluster A、Cluster B、Cluster C, 通过对这3种亚型细胞的分析,发现了新的免疫细胞CD62L+ ILC3。本研究通过对648个单细胞进行单细胞转录组的分析,应用t-SNE细胞分型、SCDE基因差异表达分析,在ILC3中发现新的免疫细胞CD62L+ ILC3。
10x Genomics技术案例:
比利时的研究团队通过对数以千计的健康与癌变肺细胞的研究,创建了史上第一个完整的肺癌细胞图谱。研究结果表明,肺癌较先前认识复杂得多,其包含了52种不同类型的基质细胞,这些新信息可用于开发新的肺癌治疗途径[7]。
Smart-seq2与10x Genomics联合技术案例:
2019年10月31日,北京大学生物医学前沿创新中心(BIOPIC)、生命科学学院、北京未来基因诊断高精尖创新中心(ICG)张泽民教授、任仙文副教授联合首都医科大学附属北京世纪坛医院彭吉润教授以及勃林格殷格翰公司刘康博士,在Cell上发表了题为Landscape and Dynamics of Single Immune Cells in Hepatocellular Carcinoma的研究论文[8]。该研究结合10x Genomics和SMART-seq2两种单细胞RNA测序技术,对肝癌患者多个组织的免疫细胞做出了系统性的刻画,分析了免疫细胞动态迁移和状态转化的特征,探索了它们在肝癌治疗上的潜在价值。
课题总体设计图
主要发现
1. 不同组织的免疫组成有较大差异,肿瘤中的巨噬细胞构成腹水中髓系细胞的主要来源
2. 肿瘤中的巨噬细胞呈现两种不同的状态(TAM-like和MDSC-like)通过与其他数据中3. 肿瘤中的LAMP3+ DC是成熟态的DC,具有向肝淋巴结迁移和与多种淋巴细胞相互作用的潜在能力
参考文献
1. Ziegenhain, C., et al., Comparative Analysis of Single-Cell RNA Sequencing Methods. Mol Cell, 2017. 65(4): p. 631-643 e4.
2. Vieth, B., et al., A systematic evaluation of single cell RNA-seq analysis pipelines. Nat Commun, 2019. 10(1): p. 4667.
3. Ramskold, D., et al., Full-length mRNA-Seq from single-cell levels of RNA and individual circulating tumor cells. Nat Biotechnol, 2012. 30(8): p. 777-82.
4. Picelli, S., et al., Smart-seq2 for sensitive full-length transcriptome profiling in single cells. Nat Methods, 2013. 10(11): p. 1096-8.
5. Picelli, S., et al., Full-length RNA-seq from single cells using Smart-seq2. Nat Protoc, 2014. 9(1): p. 171-81.
6. Bjorklund, A.K., et al., The heterogeneity of human CD127(+) innate lymphoid cells revealed by single-cell RNA sequencing. Nat Immunol, 2016. 17(4): p. 451-60.
7. Lambrechts, D., et al., Phenotype molding of stromal cells in the lung tumor microenvironment. Nat Med, 2018. 24(8): p. 1277-1289.
8. hang, Q., et al., Landscape and Dynamics of Single Immune Cells in Hepatocellular Carcinoma. Cell, 2019. 179(4): p. 829-845 e20.