孕妇外周血胎儿游离DNA产前检测技术,也就是无创产前检测技术,是目前为止,在二代测序平台中应用最为成熟的一门技术。这门技术从幼稚到成熟,离不开行业内医务工作者、生物信息分析人员以及科研人员孜孜不倦的努力和永不停歇的创新。其中,无创产前检测技术准确性的提升与胎儿浓度的准确估计密切相关,而在胎儿浓度评估方面的探索,近几年也同样取得了很大的进展。
何为胎儿浓度?
简单来说,就是在孕妇外周血中,来自于胎儿的游离DNA所占的百分数。早在1997年,香港中文大学的卢煜明团队就发现了这个具有开创性的事实,即孕妇的外周血中的游离DNA并不都是孕妇本人的,还有极少部分的游离DNA是来自这个孕妇所怀的胎儿,因此,在理论上,
抽取孕妇的外周血,也可以对胎儿的DNA情况进行检测,对胎儿进行染色体病的评估。
然而,由于胎儿来源的游离DNA在孕妇外周血中占比极低,因此在实验中,提升孕妇外周血中的胎儿浓度并且对胎儿浓度进行准确评估就变得至关重要。
总而言之,如果我们想通过只需抽孕妇血液的办法就能对胎儿做出染色体病的检测,那么我们就必须要对胎儿游离DNA具有非常深刻的认识!只有这样,我们才能
使孕妇外周血中的胎儿部分变得可控,才能做到准确评估!
在这期间,香港中文大学的卢煜明教授团队做出了卓越的贡献。
探索胎儿浓度估算方法
最初,由于人们对胎儿游离DNA所知甚少,无法从众多的母血游离DNA片段中有效区分出胎儿来源的部分,因此只能通过Y染色体进行胎儿浓度的估算。这基于一个事实,即正常的女性染色体为46,XX,是不含有Y染色体的,也就是说一旦在母血中检测出了来源于Y染色体的游离DNA片段,那么它就一定是来自于胎儿的游离DNA。该方法准确性很高,几乎可以当做胎儿浓度评估的金标准,但是却存在无法回避的缺陷。这种方法只适用于怀有男胎的孕妇,如果孕妇怀的是女胎,那么不管胎儿还是母体就都不含有Y染色体,通过Y染色体估算胎儿浓度的方法也就不再适用了。
图片来源:视觉中国
针对Y染色体估算法显而易见的缺陷,众多科研工作者想了很多的方法解决这个弊端。2010年,卢煜明团队尝试通过在母血中检测胎儿特异性等位基因的方式来进行胎儿浓度的评估。由于胎儿的遗传物质是遗传自父母双方的,胎儿的同源染色体上的等位基因总是一个来自父亲,一个来自母亲。该研究根据这种遗传规律,想到了一个办法,就是先分别检测父亲和母亲的特异性等位基因,找到他们互相不同的纯合部分,如果在孕妇的外周血中检测到了来源于父亲等位基因的游离DNA片段,就可以判断出该游离DNA片段是来自于胎儿的了。这种方法解决了无法对女胎进行胎儿浓度评估的问题,却同样有不容忽视的缺点,那就是在整个实验过程中,不仅需要抽孕妇本人的外周血进行检测,还要抽男方丈夫的外周血进行检测,这就降低了孕妇及其家属的依从性,同时由于需要进行双倍的检测分析,势必也会增加检测成本。
怎样做到不抽父亲的血
便能准确评估胎儿浓度
为了解决这个问题,科研工作者们想出了两种思路,
一种是通过检测胎源特异性等位基因的方法,
在孕妇的外周血中,不管是母体来源的游离DNA片段,还是胎儿来源的DNA片段,都是既含有纯合的等位基因,也含有杂合的等位基因,在遗传学中,纯合通常被记做AA和aa,杂合则被记为Aa,该方法通过将母体和胎儿的基因型进行组合,将胎儿来源的基因型以下标做区分,可以得到AAAA,AAAa,AaAA,AaAa四种母胎基因型组合。在这四种组合中,母亲和胎儿都是纯合以及母亲和胎儿都是杂合的情况,均是无法进行胎儿浓度评估的。也就是说只有遇到AAAa和AaAA的情况,才能够进行胎儿浓度的估算。这四种组合如果按照自然的方式形成,会近似的符合一个二项分布规律。因此,科研工作者可以通过建立一个二项分布的混合模型来估算各组合所占的比例,从而准确估算出胎儿浓度。然而,这种方法对每个等位基因的检测精确度要求很高,如果出现检测错误,将纯合检测成杂合或将杂合检测成纯合,都会对最终胎儿浓度评估的准确性造成极大的影响。为了增加二代测序检测的精确度,就需要尽可能增大测序深度,使用该方法估算胎儿浓度,需要检测到超过60%的特异性等位基因位点,测序深度需要达到200乘,这极大的增加了成本预算,该方法可以用来进行无创单基因病产前检测的胎儿浓度评估,但是如果只是用来检测染色体病就会很不划算!
另外一种思路则是从胎儿游离DNA本身入手,找到胎儿游离DNA与母体游离DNA不同的特点。
在2014年,该思路获得重大突破,依然是卢煜明团队,他们从这个思路出发,实现了胎儿浓度评估成本的降低。早在2004年,卢煜明教授的研究团队就已经通过研究,发现在怀孕期间,胎儿游离DNA片段的长度要短于孕妇本人的游离DNA片段的长度。基于这个事实,他们选取了73例怀有男胎的孕妇的血液样本,将其中的36例做为实验组,另外37例做为对照组。在实验组中,每一例样本经过测序,计算出长度在100bp-150bp之间的DNA片段与长度在163bp-169bp之间的DNA片段的相对比例,并通过该相对比例来估算胎儿浓度;在对照组中,则通过Y染色体估算法来估算胎儿浓度。最终他们得出结论:两种估算胎儿浓度的结果高度一致,其中位数绝对值差异为2.3%!这种通过比较DNA片段大小来估算胎儿浓度的方法为无创产前检测胎儿浓度的评估开辟了新的道路,但是仍然有不完美之处,该方法虽然不需要进行超深度测序,比较适用于常规的无创产前检测的过程,但是该方法的准确性只能达到中等的程度,同时很多二代测序平台在浅覆盖度的基础上,也并不能做到对游离DNA片段长度进行非常准确的判断。
为了能够最大限度的做到尽善尽美,2015年,美国Sequenom公司实验室的Sung K. King 等人在卢煜明团队的基础上,开创了
SeqFF法来估算胎儿浓度
,该方法基于这样一个事实,即在孕妇血浆中检测到的胎儿游离DNA并非是均匀散在分布在染色体的所有区段内,在有的染色体区段内,胎儿游离DNA占比高,而在有的染色体区段内,胎儿游离DNA占比很少。该方法利用胎儿游离DNA的这一特性,首先将各常染色体按照每50kb分割成区间窗口(也称bin),随后从中选出游离DNA片段长度平均在100bp-150bp之间的bin,计算这些游离DNA片段长度较短的bin占所有bin的比率,并以GC含量、读段数等指标作为参数,建立一个高维回归模型,即SeqFF模型,通过该模型即可估算胎儿浓度。Sung K. King 等人通过对25312名孕妇进行全基因组大规模单端测序,构建出SeqFF模型,并通过该模型对505名孕妇的血液样本进行胎儿浓度的估算,将之做为实验组;与此同时,他们还使用Y染色体估算法对这些样本的胎儿浓度进行估算,将之做为对照组。最终得出,两种胎儿浓度估算方法的结果具有高度一致性,其相关系数高达0.932-0.938!
SeqFF法避免了对每个游离DNA片段长度的具体估算,只需要计算长度较短的bin所占的比例就可以达到估算胎儿浓度的目的,因此很适用于临床的检测。
至此以后,无创产前检测技术进入了一个比较成熟的阶段,目前各大平台估算胎儿浓度的方法,一般也都是Y染色体估算法和SeqFF的综合运用。然而,SeqFF法虽然很适合运用于临床检测,并且也具有较高的准确性,但是仍有不完美之处,SeqFF模型的建立是一个机器学习的过程,因此需要很大的样本量累积,若样本量过小或样本本身胎儿浓度<5%,那么该模型就不能通过机器学习很好的建立,胎儿浓度也就估算不准。所以,目前来说,虽然各大检测平台对无创产前检测几乎都要求胎儿浓度最低限不能低于4%,但是对于女胎来说,即使胎儿浓度在5%-7%这种满足了最低检测限要求的情况下,数据分析审核人员依然不可掉以轻心!
无创产前检测新进展
近两年,科研工作者们孜孜不倦,仍然在精益求精,针对孕妇血浆中检测到的胎儿游离DNA并非均匀分布在染色体的所有区段的情况,已经有研究发现了其具体的发生机制。2016年,荷兰阿姆斯特丹VU大学Roy Straver等人通过研究,验证了一个假设:之所以胎儿游离DNA与母体游离DNA在片段长度上有差异,是因为胎儿游离DNA大部分是随着胎盘滋养细胞凋亡而释放入母血的,在这些胎儿游离DNA释放入母血的过程中,胎儿游离DNA核小体之间的链接DNA被消化,只剩下了附着在核小体上的DNA片段部分。
该研究通过比较发现,在SeqFF法中,胎儿游离DNA含量占比较多的bin与该染色体的核小体聚集区高度相符。这揭开了胎儿游离DNA奥秘的冰山一角。
2018年5月,卢煜明团队在原有理论基础上,更进一步发现了胎儿游离DNA具备特异性的末端序列。
他们将孕妇血浆中所有DNA序列进行测序,将这些DNA序列分为60bp-155bp的短序列和170bp-250bp的长序列。在这两类序列中,分别获得了8,832,009个短序列末端和12,889,647个长序列末端。在这其中,有7,182,434个特异性末端只出现在短序列,有11,240,072个特异性末端只出现在长序列,于是,他们将这两类序列末端的集合分别定为集合S和集合L。随后,他们通过Y染色体估算法计算胎儿浓度,发现集合S中的DNA片段比集合L中的DNA片段总体要短,并且集合S与集合L的血浆DNA丰度的比率与胎儿浓度具有较高的相关性,相关系数为0.79;之后,卢煜明教授的团队通过基因组注释技术,发现集合S中的DNA片段大多位于核小体与链接DNA接头最外侧的侧翼,而集合L中的DNA片段则几乎位于链接DNA处。
该发现更深入的阐述了胎儿游离DNA片段形成的具体机制,由于这些短DNA片段的特异性末端与核小体结构高度相关,势必会对无创产前检测技术胎儿浓度的估算起到重要的促进作用。
在无创产前检测技术的研究和开发过程中,科研工作者、临床医务工作者和生物信息分析人员携手共进,从孕妇的实际出发,全力满足孕妇对优生优育的需求,在追求创新的道路上勇往直前,不断开辟新的篇章。
本文参考文献如下:
[1].Peng, X.L. and P. Jiang, Bioinformatics Approaches for Fetal DNA Fraction Estimation in Noninvasive Prenatal Testing. Int J Mol Sci, 2017. 18(2).
[2].Straver, R., et al., Calculating the fetal fraction for noninvasive prenatal testing based on genome-wide nucleosome profiles. Prenat Diagn, 2016. 36(7): p. 614-21.
[3].Snyder, M.W., et al., Cell-free DNA Comprises an In Vivo Nucleosome Footprint that Informs Its Tissues-Of-Origin. Cell, 2016. 164(1-2): p. 57-68.
[4].Kim, M., et al., Cost-effective and accurate method of measuring fetal fraction using SNP imputation. Bioinformatics, 2017.
[5].Zhang, L., et al., Count-based size-correction analysis of maternal plasma DNA for improved noninvasive prenatal detection of fetal trisomies 13, 18, and 21. Am J Transl Res, 2017. 9(7): p. 3469-3473.
[6].Kim, S.K., et al., Determination of fetal DNA fraction from the plasma of pregnant women using sequence read counts. Prenat Diagn, 2015. 35(8): p. 810-5.
[7].Jiang, P., et al., FetalQuant(SD): accurate quantification of fetal DNA fraction by shallow-depth sequencing of maternal plasma DNA. NPJ Genom Med, 2016. 1: p. 16013.
[8].Jiang, P., et al., FetalQuant: deducing fractional fetal DNA concentration from massively parallel sequencing of DNA in maternal plasma. Bioinformatics, 2012. 28(22): p. 2883-90.
[9].Hudecova, I., et al., Maternal plasma fetal DNA fractions in pregnancies with low and high risks for fetal chromosomal aneuploidies. PLoS One, 2014. 9(2): p. e88484.
[10].Lun, F.M., et al., Noninvasive prenatal methylomic analysis by genomewide bisulfite sequencing of maternal plasma DNA. Clin Chem, 2013. 59(11): p. 1583-94.
[11].Chan, K.C., et al., Size distributions of maternal and fetal DNA in maternal plasma. Clin Chem, 2004. 50(1): p. 88-92.
[12].Yu, S.C., et al., Size-based molecular diagnostics using plasma DNA for noninvasive prenatal testing. Proc Natl Acad Sci U S A, 2014. 111(23): p. 8583-8.
[13].Sun, K., et al., Size-tagged preferred ends in maternal plasma DNA shed light on the production mechanism and show utility in noninvasive prenatal testing. Proc Natl Acad Sci U S A, 2018. 115(22): p. E5106-E5114.
[14].Lo, Y.M., et al., Presence of fetal DNA in maternal plasma and serum. Lancet, 1997. 350(9076): p. 485-7.