全外显子组测序(whole exome sequencing)利用序列捕获技术捕获整个基因组中所有外显子区域的DNA序列,并在聚集后进行高通量测序。它可以用来研究单核苷酸多态位点和插入缺失位点的已知基因,不适合研究基因组结构的变异。全外显子组测序是一种广泛使用的新一代测序(NGS)该方法涉及基因组蛋白质编码区域的测序。人类外显子组在基因组中所占的比例不超过2%,但它包含大约85%与疾病有关的已知变异。这使得该方法成为全基因组测序的经济有效替代方法。全外显子组测序采用外显子组聚集技术,可有效识别一系列广泛应用中的编码变异,包括群体遗传学、遗传病和癌症研究。
1、全外显子组测序的意义
全外显子组测序(whole exome sequencing,WES)与传统的单基因疾病研究方法相比,它具有时间短、通量大、对样品要求低、灵敏度高等优点。它已成为寻找单基因疾病致病基因的重要方法,对单基因疾病的发病机制研究、诊断、治疗、预防和治愈后判断具有重要意义。
全外显子组测序不仅使研究人员能够找到一些散发性疾病的致病基因,而且有助于找到一些标本较少的家族性疾病的致病基因。家族性疾病的研究一直是科学家关注的焦点。在高通量测序应用之前,定位克隆一直是寻找致病基因的主要方法。连锁分析可以将致病基因定位在染色体上约0.5cM~10厘米的位置(包括大约300个基因),然后通过逐一筛选该区域的基因,最终找到致病基因。整个过程既费时又费力。截至2009年底,只发现了约2000个致病基因。孟德尔遗传病的一些致病基因仍处于未知阶段。然而,自2009年在Freeman-Sheldon综合征患者中选择和识别外显子组测序以来,科学家们普遍感兴趣,一些疑难疾病的致病基因很快被发现,尤其是一些罕见的遗传病。
2、全外显子组测序的基本原理
WES是一种基因组分析技术,通过外部显子DNA序列芯片或探针捕获基因组中外部显子区域的DNA序列,并对捕获序列进行统一的高通量测序。WES包括三个主要步骤:目标区域序列的聚集、DNA测序和生物信息学统计。首先,大量寡核苷酸探针捕获基因组上的外部显子区域。其次,捕获的外部显子区域进行高通量测序。基本原理是:分段基因组DNA两侧连接接头,以不同的方式生成数百万个PCR单克隆阵型。
3、全外显子组测序的不足
全外显子组测序也存在缺点:
(1)该技术对结构变化和非编码区域变化的研究存在局限性,结构变化和非编码区域变化也可能与疾病有关。非编码区域变异可以通过全外显子组测序进行研究,基因组装可以同步进行。在与基因序列进行比较后,可以发现一些结构变异,如CNV、indels,此外,还可以结合芯片研究检验CNV;
(2)在捕获目标区域时,存在捕获不均匀、捕获误差等现象。通过增加测序深度,可以获得更多的序列信息进行统计分析,从而尽可能地填补这些误差;
(3)在研究常见疾病的罕见突变时,需要大量样本,这也导致了测序成本的上升;Sequenom等目前用于检测基因分类的平台、TaqMan主要适用于研究常见变异,需要定制芯片或通过Sanger进行测序,但这些方法耗时且昂贵;数据分析方法仍然不完善,需要处理。很难从大量数据中快速找到有价值的信息。
即便如此,在全外显子组测序成本居高不下的今天,全外显子组测序仍然是一个不错的选择,因为外显子是与疾病和表型相关的最具特征的区域,到目前为止很难评估非编码区域对疾病的影响。全外显子组测序为澄清疾病的发病机制提供了新的线索,在疾病的基因诊断和致病基因研究方面具有广阔的前景,为后续的功能研究奠定了理论基础,为临床治疗铺平了道路。