单细胞全基因组测序技术是在单细胞水平对全基因组进行扩增与测序的一项新技术。其原理是将单个细胞溶解得到的微量基因组DNA进行扩增,获得高覆盖率的单细胞基因组后,通过外显子捕获进行高通量测序,用于揭示细胞群体差异和细胞进化关系。在癌症研究、胚胎发育、辅助生殖、细胞分化、免疫机制、微生物等研究领域中发挥着越来越重要的作用。
技术流程
一、单细胞分离
进行单细胞测序,首先要进行单细胞的分离。虽然已有较成熟的用于分离在细胞群体中占多数的单细胞的技术,但分离在细胞群体中罕见(<1%)的单细胞仍是一项艰巨的挑战。目前常用的单细胞分离方法主要有:连续稀释法、口吸管技术、显微操作法、荧光流式分选法、激光捕获显微切割技术以及微流控技术等。方法的选择参考:单细胞分离技术。
二、全基因组扩增
单细胞中的DNA含量非常小(通常<10pg/细胞),达不到测序仪的检测要求,因此在测序前,必须要先进行扩增富集,才能进行下一步的实验。
全基因组扩增技术(whole genome amplification,WGA)能够实现对整个基因组的扩增,为单细胞基因组测序提供了强有力的支持。现有的WGA技术按原理可分为三种类型:
1.基于热循环以PCR为基础的扩增技术
- 简并寡核苷酸引物PCR(degenerate oligonucleotide primed PCR,DOP-PCR)
- 连接反应介导的PCR(ligation mediated PRC,LM-PCR)
- 扩增前引物延伸反应(primer extension pre-ampification,PEP)。
2.基于等温反应不以PCR为基础的扩增技术
- 多重置换扩增(multiple displacement amplification,MDA)
- 基于引物酶的全基因组扩增(primer-based whole genome amplification,pWGA)技术。
3.基于特殊短分子DNA引物进行线性扩增的技术
- 多次退火环状循环扩增技术(multiple annealing and looping-based amplification cycles,MALBAC)。
实际研究中应根据实验目的选择相应的扩增方式。不同WGA原理详见:单细胞全转录组扩增技术。
WGA技术 | 主要原理 | 最低DNA模板量 | 产物长度 | 基因组覆盖度 | 扩增前后偏倚倍数 | 应用 |
---|---|---|---|---|---|---|
DOP-PCR | 部分随机引物法 | 50 pg | <2kb | ~40% | 61.8 | CGH,SSCP分析,SNP分型,STR分型 |
LM-PCR | 连接介导的PCR反应 | 5 pg | <2kb | ~96% | — | CGH,LOH研究,STR分型 |
PEP | 完全随机引物法 | 5 pg | <2kb | ~50% | 220.5 | LOH研究,SNP分型,STR分型 |
MDA | 多重置换扩增 | 10 pg | <100kb | ~73% | 19.8 | CGH,RFLP分析,SNP分型,STR分型 |
pWGA | 体外再造T7噬菌体DNA复制 | 100 fg | <40kb | — | 6.3 | SNP分型,STR分型 |
MALBAC | 多次退火环状循环扩增技术 | 0.5 pg | <2kb | ~93% | 2 | 二代测序、CGH、SNP分型、STR分型、基因克隆、荧光定量 |
三、高通量测序
高通量测序技术(High-throughput sequencing)是测序技术发展的一个里程碑,该技术可以对数百万个DNA分子进行同时测序。包括:
- 第二代测序技术,例如,Roche公司推出的454焦磷酸测序、Illumina公司推出的Solexa/Hiseq聚合酶合成测序和ABI公司推出的SOLiD连接酶测序。该技术均采用“边合成边测序”的测序原理,利用高通量测序技术对基因组/转录组进行测序分析,第二代测序技术因其高通量、高效率和低水平的优势,已被广泛应用于医学研究、生物学研究和药物研发等领域。
- 第三代测序技术,例如美国Helicos Biosciences公司推出的HeliScope单分子荧光可逆终止技术、Pacific Bioscience公司推出的单分子实时(single molecule real-time,SMRT)测序技术和英国牛津纳米孔公司推出的单分子纳米孔测序技术(nanopore sequencing)。其中HeliScope单分子荧光可逆终止技术和SMRT测序技术均采用的是基于单分子水平上的“边合成边测序”;nanopore sequencing采用的是水解测序法。第三代测序技术不依赖PCR扩增,降低了系统误差,同时还能检测特定序列的SNP,测定出稀有突变及其发生频率。
四、数据分析
在获得单细胞全基因组测序之后,首先我们需要监控read的质量剔除低质量的reads,然后进行基因组的map工作等,通过矫正由于GC含量引起的误差之后,通过多种算法寻找基因组当中变异类型。
- 目前常见的变异类型有单核苷酸多态性(single nucleotide polymorphism,SNP)、插入缺失标记(insertion-deletion,InDel)和拷贝数变异(copy number variation,CNV)。
参考文献
[1] 董燕, 宋程程, 黄鹤. 单细胞测序技术研究进展[J]. 化学工业与工程, 2015, 32(1):71-78.
Li Y , Kim H J , Zheng C , et al. Primase-based whole genome amplification[J]. Nucleic Acids Research, 2008, 36(13):e79-e79.