高通量测序技术临床应用:问题与思考

作者:李金明
2021-12-16

国家卫健委临床检验中心  李金明

专家论坛-李金明.jpg

李金明,研究员,医学博士。国家卫生计生委临床检验中心副主任兼临床免疫室主任。北京协和医学院、北京大学医学部博士生导师,获国务院政府特殊津贴,2009-2010年度卫生部有突出贡献中青年专家。自上世纪90年代中期以来在国内系统提出了临床分子诊断质量管理和标准化的概念和方法。研究方向为:临床分子诊断方法及标准化。

高通量测序(Next generation sequencing,NGS)又称为大规模平行测序(Massively Parallel Signature Sequencing,MPSS),最早是从焦磷酸测序的原理上发展起来的,目前较为成熟的应用平台主要有Ion torrent、Illumina和Complete Genomics(CG)的各种型号。自从其10年前出现以来,技术日趋成熟。因为其一次可检测大量靶基因及其变异位点,具有高检测灵敏度和特异性,兼具定性和定量检测,而且检测费用相对于同样数量的基因和位点检测来说极低。因而在无创产前筛查(noninvasive prenatal screening,NIPS)、肿瘤基因突变、遗传病、胚胎植入前遗传学筛查(Preimplantation Genetic Screening,PGS)和胚胎植入前基因诊断(Preimplantation Genetic Dignosis,PGD)以及病原微生物和宏基因组学(Metagenomics)等领域展现了极为广阔的临床及科研应用前景。已成为目前DNA和RNA序列分析最为高效的工具,也是精准医学时代研究和临床疾病诊疗的支撑技术。使得基因组学和转录组学迅速由概念走向临床疾病诊疗实践,预示着疾病诊疗分子时代的到来。


高通量测序技术的特点是操作步骤多、程序复杂。既包括实验室内的标本预处理、核酸提取及其片段化(基因组检测时)、建库、扩增、靶序列富集、混样(pooling)、测序前准备及测序,即湿桌实验(wet bench process)。还有测序后包括测序数据质量分析、比对、变异识别、注释和结果报告与解释等生物信息学分析流程(Bioinformatics Pipeline),即干桌实验(dry bench process)[1]。任一环节有问题,即会影响结果的准确性,进而影响临床决策。同样,我国的精准医学的研究计划也涉及大量的对特定疾病和人群的生物样本的高通量测序分析研究,上述环节出现问题也将使研究失去真实价值。质量控制对于高通量测序技术的应用具有重要意义。


高通量测序技术临床应用的质量保证涉及实验室的方面有分析前、分析中和分析后等环节,其关键点主要有:

(1)检验申请单是合适的:对“Who”在“When”开出“What”申请单;

(2)标本是正确的和好的:采集、运送和保存;

(3)实验室环境条件是好的:温湿度、可能的干扰的避免(分区、灰尘、电磁、振动等);

(4)仪器设备状态是好的:维护、定期校准;

(5)试剂是好的:性能验证或性能确认、批质检;

(6)实验室人员是有能力的:外部和内部培训,能力评估;

(7)SOP的可操作性及全员遵循;

(8)得到结果的过程是有监控的:室内质量控制和室间质量评价(或实验室间比对);

(9)针对差错、投诉、失控等分析原因采取措施的质量持续改进;

(10)临床医生能正确的理解和应用检验结果于患者疾病的诊断和 治疗等。


一、分析前检验申请单及标本采集、运送、保存和质检的问题

近些年来,一些所谓的基因检测公司及体检中心,打着高通量测序技术的幌子,向公众开展所谓的天赋基因、各种疾病风险预测基因甚至美容基因以及婚姻配对基因等检测,不但骗人钱财,其中一些对人的身心健康还具有极大的危害性。有关肿瘤的易感性遗传检测,ASCO(2003年修改,2010年重申)声明只能在以下情况下进行[2]:(1)有遗传性肿瘤易感性的个人或家族史;(2)检测结果可得到充分的解释;(3)结果有助于患者或有肿瘤风险的家族成员的诊断,或影响其临床治疗或手术。通俗地讲,就是一个家族里如果有多人发病,并且发病年龄较年轻,且已知特定的基因与这种疾病有明确的关系,检测后有阻断或者治疗的方法,则可以进行检测,否则不可以。肿瘤基因突变的高通量测序多基因检测目前主要是作为靶向治疗药物的选择依据和治疗耐药监测。


染色体非整倍体(T21、T18和T13)无创产前筛查(NIPS)是高通量测序技术在临床检测上最简单也是最成功的应用,但对什么样的孕妇、在妊娠的什么时间进行检测以及可以报告什么样的结果,在国内仍存在不少问题。2016年7月28日美国医学遗传学与基因组学学会(ACMG)的一份最新声明表示[3],只要不是显著肥胖,从9-10周妊娠开始,检测细胞游离DNA(cfDNA)的无创产前筛查(NIPS)适用于所有年龄段孕妇,以及整个妊娠期的检测,能够取代常规的21、18和13三体综合征筛查。ACMG还指出,NIPT/NIPS是目前筛查T21、T18、T13最敏感的技术。NIPT阳性患者必须要进行产前诊断验证和接受专业的遗传专家指导。ACMG不建议3大染色体以外的常染色体非整倍体、全基因组CNVs、骨髓移植和器官移植者、单基因病、开放性神经管缺陷及肥胖者进行这项检测。


从临床的案例来看,实验室技术人员对于NGS检测标本的要求有时还不能很准确的把握。如对于肿瘤基因突变NGS检测的组织标本要求,如果实验室NGS检测的测序深度为500~1000×,分析敏感性大约在2.5~5%,那么考虑到肿瘤的异质性以及体细胞突变可能发生在其中一个等位基因上,因此组织标本中,肿瘤细胞的比例应为5~10%。又如对于血液中循环肿瘤DNA(ctDNA)NGS检测,根据游离DNA的特点[4],血液标本应使用EDTA-K2/3抗凝管;两次离心,第一次为1,200~1,600g离心10min,第二次为16,000离心10min,最好在采集后6h内完成。对于血浆标本的运送和保存,要求4℃或者室温运送至实验室;运输过程中需避免血液样本发生剧烈振荡;进行NGS检测前,对提取的游离DNA进行片段分布的分析(毛细管电泳)等,来监测是否存在大片段人基因组DNA污染;如果不能立即进行游离DNA提取,可放置在-20℃或-80℃条件下,如果可以提取,可暂时在4℃保存3h。


从临床案例来看,标本质量出现问题,一是临床实验室对影响标本本身质量的因素了解不够;二是对标本质量对结果的影响了解不够;三是缺乏对每一特定项目的质检SOP,临床实验室人员也没有接受过相应方面的内部培训。关于标本质量的问题,临床实验室有责任将特定样本的正确采集方法以标准操作程序或流程图的方式,详细地传达给相关样本采集人员;建立拒收样本的标准,对采集运送不正确、出现凝块、冰冻组织融化时间过长等样本应拒绝检测。在拒收过程中,也应当与临床充分“对话”,除要求重新采集样本以外,对于一些难以再次获得的活检样本、拒收后再无其他来源的样本,或者孕周较大的产前检测,在报告结果的时间要求很短等情况下,在与临床沟通获得充分知情同意后,可考虑记录后进行让步检测。

 

二、分析中的实验室环境条件、仪器设备维护校准、试剂方法性能确认和质量控制问题

避免假阳性结果是所有涉及高灵敏检测方法都需要高度关注的。严格有序的实验室各功能区的物理分隔以及持续的通风换气,是避免因“基因或核酸”气溶胶所致实验室和标本间交叉“污染”的前提之硬件条件;日常工作中,严格遵循各功能区物品专用、单一工作流向、及时的实验室清洁,以及生物信息学分析流程中适当的数据库和滤过策略的使用等,则为防止假阳性的软件要素。


假阴性结果通常容易受到忽视,但在精准医学的临床实践中,假阴性结果与假阳性结果对临床疾病诊疗决策具有同等的危害性。临床标本的采集、运送和保存不当,核酸提取过程中靶核酸的丢失和提取试剂中可抑制后续检测过程(如扩增)的试剂(如有机溶剂)的残留,因仪器设备维护和校准不到位所致的加样不准、光路不正、温度不均一等,均有可能造成假阴性结果。因此涉及上述各个关键环节的可操作性SOP的制订以及工作人员在日常工作中的严格遵循,是避免假阴性结果的必要条件。


NGS性能确认包括[5]:

(1)平台确认:确定平台鉴定一大范围基因组区域一些遗传变异

的能力。

(2)检测方法确认:证明该检测方法能检出满足其预期应用的具

有临床意义的变异序列,包括:精密度(precision):重复性研究;准确度(accuracy):方法学比较研究;分析灵敏度(analytical sensitivity):测定下限(Limit of detection)研究;分析特异性(analytical specificity):干扰物质(非特异基因)研究;可报告范围(reportable range):可测定的基因区域研究。

(3)临床确认(Clinical Validation,通过患者人群研究得到):

临床敏感性、临床特异性、阳性预测值和阴性预测值。

(4)生物信息学分析确认:明确要求提供准确的序列数据以及在

靶向基因组区域内的变异。生物信息学分析独立于检测系统,研发检测过程中,应对生物信息学分析先于检测方法确认,单独进行理想化。


此外,还有一个重要的问题就是实验室技术人员“无基因”或“无核酸”的意识还有待加强。通常情况下,临床实验室人员在实验室的清洁方面的内部培训不够。实验中的爆管是偶发事件,需立即实施及时有效的去“污染”程序;不同区域的清洁用具的混用,则为违背基因扩增检测的基本要求,属于不守规矩;实验室的累积轻度污染,则为日常实验室清洁措施的不完全到位所致。对此,应该加强人员的内部培训。实验室负责人则应加强对于内部的日常质量管理措施是否落实到位的监督检查。


关于人员培训,我们可以先思考以下几个问题:内部培训最好的第一手培训教材是什么?内部培训最重要的培训内容是什么?如何进行人员能力评估?标准操作程序(SOP)是指导实验室人员日常工作的“最高标准”,是人员进入到实验室后,内部培训时最好的第一手人员培训教材。SOP源于一些标准文件(如仪器试剂说明书、国际国内标准文件)和实验室实际工作经验积累,因此高于相关标准文件。有可操作性的SOP及全员遵循是质量管理的“灵魂”!关于内部培训所涉及的内容,在理论方面,专业部分包括试剂、方法原理,质量控制方法和相关领域的新技术;其他方面包括相关法律法规、质量管理体系、新理念和新进展等。操作方面,包括仪器设备使用、维护和校准,以及实验操作技能等。


NGS需有严格的试剂配制和使用标准操作程序(Standard Operation Procedure,SOP)。通常包括核酸提取、片段化、文库制备、加入标签、混样、测序、生物信息学分析和结果报告等步骤;对所有试剂原料的来源、试剂配制的过程、基因检测的区域、软件及版本、对照品等均需详细说明,以及使用试剂进行检测的步骤,均需有试剂使用说明书或SOP,并且每次检测都按照SOP来进行。在NGS检测中,需建立测序质量标准,且所有的性能指标均在相同的测序质量标准下进行评价。重要的质量标准有[5]:最低测序深度(minimum coverage)、平均测序深度(average coverage)、测序均一性(uniformity)、符合要求质量值的碱基百分比(如Q20百分比)、比对至靶向区域的reads百分比等。质量标准一旦建立,所有的检测过程均需在此条件下进行,不得随意改变。例如实验室在建立LDTs和性能确认评价时,要求的最低测序深度为500×,基于此质量标准,检测下限(检测突变等位基因百分比)为5%,那么在临床检测中,最低测序深度为500×的结果为有效结果,如果怀疑临床样本中有低于5%的突变,也不得随意增加测序深度。可在SOP中,设立重新采集样本或者采用其它更敏感方法重复检测的程序。

室内质量控制是指由实验室工作人员,采取一定的方法和步骤,连续评价本实验室工作的可靠性程度,旨在监测和控制本实验室工作的精密度,提高本室常规工作中批内、批间样本检验的一致性,以确定测定结果是否可靠、可否发出报告的一项工作。可概括为:(1)执行者(Who):实验室技术人员;(2)目的(Why):①监测实验室测定的精密度(重复性);②提高常规检测结果一致性(质量的持续改进);③决定了当批测定的有效性,报告可否发出。是对实验室测定的即时性评价。

       

采用已知阴性和弱阳性质控品进行室内质控是保证检测质量的关键环节,其监控的是实验室测定的最重要的性能指标即重复性,并决定了当批实验测定是否有效,报告能否发出,是对实验室测定的即时性评价,是质量改进的不可缺少的措施。阴性质控品:不是指突变阴性的样本,而是采用无模板对照(No Template Control,NTC)作为阴性质控品,阴性质控品需包含在所有的扩增步骤中,以证实在样本和试剂中没有核酸的污染。阳性质控品:包括至少一个已知突变位点,最好变异百分比接近检测下限,以证实低百分比的突变可在每批次中检出。质控样本无需在每批检测中包括所有突变类型,只需加入一个已知突变位点的质控品。但是,实验室最好有多个突变的质控品,并在日常检测中轮流使用,或是在一个质控品中含多种多个突变类型。质控样本可以采用人基因组DNA或其他合成的带有突变的基因组DNA(不建议采用质粒),但是这种质控品不能监测提取过程。临床样本当然是最理想的质控品,但是样本来源有限,很难长期使用。


关于室间质量评价,EQA或实验室间比对的目的是监测实验室测定准确性或结果可比性,是质量改进的不可缺少的措施。而肿瘤靶向治疗涉及的基因位点较多,EQA往往难以覆盖所有的情况,而且为保证EQA样本的来源和重复性,EQA组织者可能采用细胞系或人基因组DNA作为评价样本。临床实验室可通过临床样本的实验室间比对作为补充。


三、NGS检测结果报告与解释

关于结果报告与解释,根据CLSI指南[6],遗传检测报告至少要包括的信息有:将报告与特定患者联系在一起的唯一编号、咨询人员的姓名和联系方式、与检测结果解释有关的特异的信息和检测性能、检验项目及所使用的方法(包括检测范围及检测局限性)、标本类型、标本接收日期、检测实验室名称地点、检验结果、根据检测特性和其他提供给实验室的信息对结果的解释、报告批准人的签字、实验室联系方式、报告日期等。适当时,还应包括:建议的有资质的遗传咨询人员、对其他家庭成员的意义、进一步的检测建议等。

对于NGS在肿瘤基因突变检测中的结果报告与解释,美国分子病理学会(AMP)、美国肿瘤学会(ASCO)和美国病理学家协会(CAP)共同发布了一个指南,以下为该指南的相关内容简介。NGS检测过程中的生物信息学分析,常需使用到各种数据库,对于数据库的使用,应注意明确数据库的内容以及数据的来源,临床实验室应该仔细阅读数据库使用说明文档和相关文献,以确保数据库数据的来源、类型以及用途;注意每一个数据库的使用局限性,以避免对检测注释结果的过度解读;确认人类参考基因组组装及mRNA转录本版本,以确保与HGVS注释版本一致;尽可能使用基因组坐标(如chr17:7674250)而不是HGVS命名法对突变位点进行标注,以避免使用不同数据库时造成歧义;根据基因组数据的来源(已发表的研究文献或另一个相关数据库)、测序深度、适当的质控的使用、变异的体细胞起源的证实以及功能和潜在的药物应答研究等来评估数据的质量;通过提供的病理诊断报告(如部位、诊断和亚型)核实数据的质量。


数据库的类型可分为:参考序列数据库、人群数据库、癌症数据库、胚系突变数据库、实验室内部数据库。

(1)参考序列数据库:提供人参考基因组序列,以及基因注释信息;

(2)人群数据库:基于大样本人群的数据库,如SNP信息,某一突

变在人群中的频率等;当解释体细胞突变时,使用这类数据库应小心谨慎,因为一些癌症相关的突变位点也被包含进此类数据库;

(3)癌症数据库:包含不同癌症种类或亚型中各突变的发生频率

和流行率,同时也包括与其他基因组数据库的交叉引用,包含突变相关的参考文献、细胞信号通路、靶向治疗药物、临床试验以及预后信息等;使用这类数据库也应小心谨慎,因为某些良性突变位点也被包含进此类数据库;

(4)胚系突变数据库:如HGMD、ClinVar等;

(5)实验室内部数据库:实验室内部应建立自己的数据库,确定

实验室内部不同癌症种类的突变频率谱:①用于追踪实验室中确定的突变;②提供一致的突变注释;这样可以帮助假阳性突变位点的识别。


最后要说的是关于突变致病性预测。在发现一个未知临床意义的突变时,通常会使用生物信息算法对该突变位点可能造成的基因结构或蛋白功能的改变进行预测。主要可分为两类:预测错义突变对该基因编码蛋白功能的影响;预测突变对可变剪接的影响,但其预测具有不确定性。临床实验室在对报告解读的时候应意识到,此类预测结果仅能作为一个参考,不能以此用来作为突变分类和临床决策的唯一证据。对于体细胞突变的解读,应专注于其在临床中的价值,包括治疗、预后、诊断、预防等。


某一突变在临床中的意义应该基于现有的临床证据、文献以及专家共识,可将临床证据分为以下4个层面:

(1)Level A:特定类型的肿瘤,对FDA批准的药物的临床应答有预测作用(如EGFR T790M)的标志物;以及写进癌症临床诊疗指南的对肿瘤有治疗、诊断或预后作用的标志物(如EGFR L858R);

(2)Level B;经过充分研究证实,且具有专家共识的能够对某种治疗方案的临床应答有预测疗效或耐药的作用的标志物;或经过充分研究证实,且具有专家共识对某种疾病具有诊断或预后意义的标志物;

(3)Level C;经FDA或专业协会批准的在其它类型肿瘤预测治疗反应或耐药作用(如超说明书用药,即off-label use of a drug)的、可作为临床试验入选标准的、或基于多个小型临床试验证实具有诊断或预后意义的标志物;

(4)Level D;基于临床前研究显示对疾病的治疗可能有临床意义的、基于小型研究或多个无共识的病例报告的可能具有辅助疾病诊断或预后作用(单独或结合其他生物标志物)的标志物。


基因突变的临床意义分类有以下几种:

(1)Tier I:具有明显临床意义的突变(level A和B证据支持);

(2)Tier II:可能具有临床意义的突变(level C或D证据支持);

(3)Tier III:临床意义未知的突变;

(4)Tier IV:良性突变。由于FDA批准的癌症治疗药物极少,文献研究、临床指南以及大规模癌症突变数据库就成为判断基因突变临床价值证据的主要资源。


参考文献

[1] Aziz N, Zhao Q, Bry L, Driscoll DK, Funke B, Gibson JS, Grody WW, Hegde MR, Hoeltge GA, Leonard DG, Merker JD, Nagarajan R, Palicki LA, Robetorye RS, Schrijver I, Weck KE, Voelkerding KV. College of American Pathologists' laboratory standards for next-generation sequencing clinical tests. Arch Pathol Lab Med. 2015; 139(4):481-93

[2] Robson ME, Bradbury AR, Arun B, Domchek SM, Ford JM, Hampel HL, Lipkin SM, Syngal S, Wollins DS, Lindor NM. American Society of Clinical Oncology Policy Statement Update: Genetic and Genomic Testing for Cancer Susceptibility. J Clin Oncol. 2015; 33(31):3660-3667.

[3] Gregg AR, Skotko BG, Benkendorf JL, Monaghan KG, Bajaj K, Best RG, Klugman S, Watson MS. Noninvasive prenatal screening for fetal aneuploidy, 2016 update: a position statement of the American College of Medical Genetics and Genomics. Genet Med. 2016; 18(10):1056-1065.

[4] Snyder MW, Kircher M, Hill AJ, Daza RM, Shendure J. Cell-free DNA Comprises an In Vivo Nucleosome Footprint that Informs Its Tissues-Of-Origin. Cell. 2016; 164:57-68.

[5] Gargis AS, Kalman L, Berry MW, et al. Assuring the quality of next-generation sequencing in clinical laboratory practice. Nat Biotechnol  2012,30(11):1033-1036

[6] MM20-A. (vol.32. No.15) Quality management for molecular genetic testing, Approved guideline

[7] Li MM, Datto M, Duncavage EJ, Kulkarni S, Lindeman NI, Roy S, Tsimberidou AM, Vnencak-Jones CL, Wolff DJ, Younes A, Nikiforova MN. Standards and Guidelines for the Interpretation and Reporting of Sequence Variants in Cancer: A Joint Consensus Recommendation of the Association for Molecular Pathology, American Society of Clinical Oncology, and College of American Pathologists. J Mol Diagn. 2017; 19(1):4-23.