科普讲堂 | 一代、二代、三代基因测序技术大对比

作者&投稿:莘厘 (若有异议请与网页底部的电邮联系)
测序技术是基因组学的核心技术,是基因组学最基本最重要的数据,也是生命科学领域大数据时代的核心组成部分。今天我来简单盘点一代、二代、三代测序技术的优劣势及应用情况。

一代测序是上世纪70年代由Sanger和Coulson开创的DNA双脱氧链终止法测序,也称为Sanger测序。在1977年完成第一个基因组序列(噬菌体X174),全长共计5375个碱基。2001年完成的首个人类基因组图谱就是以改进了的Sanger法为其测序基础。

Sanger测序原理: 在4个DNA合成反应体系(含dNTP)中分别加入一定比例带有标记的ddNTP(分为:ddATP、ddCTP、ddGTP和ddTTP),通过凝胶电泳和放射自显影后可以根据电泳带的位置确定待测分子的DNA序列。由于ddNTP的2’和3’都不含羟基,其在DNA的合成过程中不能形成磷酸二酯键,因此可以用来中断DNA合成反应。

一代测序虽然准确度十分高,且该技术在当下依然被广泛应用(比如构建载体做克隆,基因敲除等实验都可以用到),但是通量太低,所以对于大片段或者全外显子等非常耗时,且很多情况下成本较高。

二代测序技术,又称为Next Generation Sequencing(NGS)技术,是为了改进一代测序通量过低的问题而出现的,能够同时对上百万甚至数十亿个DNA分子进行测序,实现了大规模、高通量测序的目标。刚面世时主要包括Roche公司的454技术、ABI公司的Solid技术和Illumina公司的Solexa技术。这三种技术都极大的提高了测序的通量,大大降低了测序成本和周期。

其中Illumina公司凭借超低的测序成本和可以接受的读长,成为了目前最主流的二代测序公司,其测序成本近五年来从几千元1G(1G即10亿碱基)降到了到今天的40多块钱1G数据量,这个过程中基因组 De novo 测序、转录组测序、小RNA测序、LncRNA测序、circRNA测序、DNA甲基化测序、高密度遗传图谱、大规模GWAS关联分析等等实验手段得到了广泛的推广应用。近年来,NGS技术发展迅速,其应用已进展至临床检测,如无创产前、遗传性疾病,肿瘤(实体/血液)等。

Illumina 原理: 桥式PCR+4色荧光可逆终止+激光扫描成像。

主要步骤:

1、DNA文库制备——超声打断加接头;

2、Flowcell——吸附流动DNA片段;

3、桥式PCR扩增与变性——放大信号;

4、测序——测序碱基转化为光学信号。

二代测序技术虽然通量很高,成本低廉,但是读长实在太短,主流的Illumina测序仪,常规模式只能测PE150的长度,靠着软件算法上的进步才得以可用。由此三代测序走上了历史舞台。

三代测序主要有两种技术:PacBio公司的SMRT和Oxford Nanopore Technologies的纳米孔单分子测序技术,这两种技术的测序读长都可以达到几十kb的级别,远远高于二代测序技术。与前两代相比,他们最大的特点就是单分子测序,测序过程无需进行PCR扩增。实现了对每一条DNA分子的单独测序。单分子测序可以更准确地检测串联重复扩增等。这对于无参物种的分子生物学研究大有帮助,长读长对于基因组拼接、全长基因序列的获取提供了巨大的便利。

Pacific Biosciences公司研发的单分子实时测序系统(Single Molecule Real Time,SMRT)应用了边合成边测序的原理,并以SMRT芯片为测序载体。基本原理如下:

1、聚合酶捕获文库DNA序列,锚定在零模波导孔底部;

2、4种不同荧光标记的dNTP随机进入零模波导孔底部;

3、荧光dNTP被激光照射,发出荧光,检测荧光;

4、荧光dNTP与DNA模板的碱基匹配,在酶的作用下合成一个碱基;

5、统计荧光信号存在时间长短,区分匹配碱基与游离碱基,获得DNA序列;

6、酶反应过程中,一方面使链延伸,另一方面使dNTP上的荧光基团脱落;

7、聚合反应持续进行,测序同时持续进行。

但是三代仍然不是完美的技术,其测序错误率相对于一代和二代还是高了很多,另外通量还是远低于二代测序,导致成本也是数倍于二代测序。

胡润  | 文案

~