宏基因组高通量测序技术临床应用中面临的问题与思考

作者:韩东升
作者单位:江大学医学院附属第一医院检验科/浙江省临床体外诊断技术研究重点实验室/浙江大学检验医学研究所 2022-03-25

韩东升,博士,北京协和医学院/国家卫生健康委临床检验中心医学博士毕业,浙江大学医学院附属第一医院检验科;主持国家级、地市级及院校级科研基金项目5项;获市级以上医学技术奖及自然科学优秀学术论文奖数项;参编书籍3部;以第一/通讯作者身份在Annals of Internal Medicine、Journal of advanced research、Theranostics、Critical Reviews in Microbiology等专业期刊上发表论文近30篇;国内外多个期刊审稿人。

【摘要】宏基因组高通量测序技术(metagenomic next-generation sequencing,mNGS)作为一种新的分子诊断方法,已经在临床感染性疾病诊断中得到了较为广泛的应用,为常规方法难以诊断的感染提供了新的思路。但该技术目前处在临床转化的早期阶段,尚面临不少的方法学和临床问题。本文首先概述了mNGS的临床应用现状,并重点对mNGS的临床应用中面临的识别来自背景微生物和人源DNA的干扰、建立结果解读与报告标准、开展性能确认活动、开展室内质控和参加室间质量评价等关键问题进行讨论和思考,期望研究人员及临床医生能够客观了解和规范使用该项技术。


【关键词】宏基因组高通量测序;mNGS;生物信息学分析


一、mNGS测序技术在感染性疾病诊断中的应用


宏基因组高通量测序技术(metagenomic next-generation sequencing,mNGS)是一种不依赖传统微生物培养的分子检测技术,其依靠先进的高通量测序(下一代测序)平台和生物信息学分析流程可以通过一次测试确定样本中存在的所有微生物(包括病毒,细菌,真菌和寄生虫等)[1]。鉴于该技术不依赖微生物培养、无需预先临床假设,已经被广泛应用在各种临床感染性疾病相关标本的检测中,为包括中枢神经系统感染、血流感染、呼吸系统感染及其他多种感染性疾病的鉴别诊断提供了较为及时的病原学证据[2, 3]。研究证明,mNGS的检出率明显高于基于传统培养的方法,并在鉴定少见、新发和混合感染及排除感染方面体现出较大的优势,同时也在耐药基因检测、毒力基因鉴定、病原体分型及预测感染的发生等方面也表现出潜在的应用前景[3, 4]。


然而,尽管mNGS具有较好的应用前景,但它的技术复杂,操作繁琐,对环境、设备和人员技术能力要求高,而且仍处于向临床常规技术转化的早期阶段[5]。目前,仍缺乏通用指南和建议,以帮助mNGS在临床实验室的常规开展,确保结果的准确性及可靠性,并获得监管部门的批准。目前只有几种经过实验室性能确认的mNGS方案可用于从脑脊液(cerebrospinal fluid,CSF)、血浆和呼吸样本中鉴定病原体[6-8],但是还没有被FDA等监管机构批准。实验室根据自己的经验采取高度个性化的策略以减少来自样本/实验室/试剂的污染,降低宿主DNA干扰,提高微生物核酸提取方法的效率和参考数据库的完整性,以及增加生物信息学算法的准确性[9, 10]。但这些非标准化的处理策略极大地影响了宏基因组测序的实验室间结果的可比性,导致了结果的不确定性[5, 11]。据报道,不同实验室开发的mNGS平台诊断感染性疾病的敏感性和特异性差异很大,分别为50.7%-96.6%和41.7%-85.7%[4, 12, 13]。所以,如何有序发展、规范管理及合理使用mNGS技术,是从业者必须审慎对待的科学课题。


二、mNGS面临的关键问题


1. 背景微生物的干扰:作为一种理论上的“全微生物”核酸检测技术,mNGS不仅能够检出标本本身携带的微生物(病原体及正常寄居微生物),也会检出实验过程中引入的来自于实验环境(采样、实验室物表及操作人员皮肤表面)、检测试剂等外源性微生物或微生物基因组片段[3, 14-17]。这些外源性微生物或微生物基因组片段的污染是造成mNGS检测结果假阳性的重要因素之一,需要在后续的数据分析过程中通过设定的统计学算法和过滤规则予以剔除。可通过严格执行无菌标本采集和处理技术有效降低来自于采样环节中引入的污染[15]。具有挑战性的是实验室环境及试剂盒来源微生物的鉴别。研究表明,实验室环境中存在的微生物分类会随时间(季节)而变化,常用的DNA提取试剂盒和其他实验室试剂中也普遍携带微生物DNA,且不同试剂盒及其批次之间的成分差异很大[17]。这就需要实验室通过使用阴性/空白质控建立实验室环境及试剂常见背景微生物的数据库[15],并保持动态监测与定期更新,这是一个长期积累的过程,但对于排除外源微生物污染带来的假阳性结果非常重要。


2. 人源DNA干扰:疑似感染的临床标本中通常伴随白细胞的增多,如痰液、肺泡灌洗液等呼吸道感染标本中含有白细胞或脓细胞的数量往往会在105cell/ml以上,导致测序结果中人源序列的占比超过90%, 甚至在99%以上,这是影响mNGS检测敏感性的重要因素。研究表明,在5-20M测序量水平下,如果标本内的白细胞水平达到105cell/ml时,则会导致DNA病原体的检测敏感性降低[18]。实验室通常会采用两种策略来减少人源DNA的干扰对检测敏感性的不利影响。一种是根据人源细胞和微生物的体积大小、细胞外膜/壁和基因组序列的结构差异,采用诸如离心、滤膜过滤、化学试剂裂解联合DNA酶消化、基于抗体或CRISPR-Cas9技术靶向去除人基因组中特征性序列(如高度重复的rRNA基因)等方法降低人源DNA进而提高微生物序列的占比[19]。但这种策略并不完美,由于人类基因组(大小约3000M)与微生物基因组(如细菌约为3-5M)大小相差悬殊,即便使用了去宿主技术,很多标本的最终测序数据中人源DNA的占比仍会在90%以上。并且有研究提示,一些去宿主技术的使用可能会对低微生物量样本产生负面影响,比如在宿主DNA去除过程中洗涤,离心,重悬和回收等操作会不可避免的导致微生物数的绝对损失,引起检出率下降。用于宿主DNA去除的化学试剂如皂苷不仅可以破坏人源细胞,还可以在一定程度上裂解微生物(与浓度与作用时间有关),尤其对于没有细胞壁或细胞壁薄的微生物如病毒和某些革兰氏阴性细菌更加明显。这些微生物被裂解后,DNA将被释放,并且和宿主DNA一样,容易被DNA酶降解,从而使其无法被检测到,所以有必要对所使用的化学试剂的浓度及作用时间进行有效的评估[20]。另一种策略则是通过扩大测序量来增加检测敏感性,有的实验室将单个样本测序量设置在60M甚至达到100M,但是这种策略在临床应用中不具备成本效益,因为提高测序量意味着测序时间的延长、测序成本的增加、每张芯片可运行标本通量的下降、生成的大量数据也会增加实验室数据储存空间的压力。重要的是,有研究表明,当测序量在超过20M的时候,mNGS对样本中微生物的回收率提高有限[21]。


3. 结果解读与报告标准的建立:mNGS结果解读和报告的逻辑分为两个步骤,首先是要建立方法学本身的阳性判断阈值(cut-off值),以此为标准从原始数据中区分哪些是真阳性结果(即标本中真实存在的微生物),然后再结合病原学和临床资料将这些真阳性微生物进一步划分为(疑似)致病微生物和定植微生物,进一步用以辅助临床诊疗决策。在建立阳性判断值时,通常利用检测到的reads数量(可做标准化处理)、微生物基因组覆盖度等指标作为度量标准,利用ROC曲线等统计学算法明确最佳的数据点作为区别阴阳性的阈值[22]。由于mNGS对于不同样本类型和微生物种类的实际检测能力是不同的,所以建议实验室应建立常见标本类型、常见病原体的阈值[22]。在区别致病和定植微生物时,结果解读和报告人员需具备大量临床、感染及临床微生物学知识和经验,需要结合患者的详细临床资料以判断阳性微生物的临床相关性。但是由于目前mNGS检测主要在第三方检验机构开展,临床医生送去的往往只有标本而并不附带病人的临床病史信息,检验机构的解读人员在缺乏对病人信息了解和不明确医生送检意图(怀疑)的情况下做出的判断个人经验成分偏重容易导致解读误差,这也是行业中存在的不同背景的人来解读同一份检测结果会得到不同结论的原因。所以,对于目前检验领域最为复杂的检测技术,mNGS产生的结果应该由包括分子生物学、临床医学、感染病学、临床微生物学、临床药学、影像学和生物信息学等多学科人才组成团队,共同参与解读才能有利于获得更加准确的诊断结果。但这样的团队无论是在第三方检验机构还是医院内的临床实验室(如检验科)都还是不完善的,这是团队建设需要努力的关键点。


4. 完成方法学性能确认:任何检验项目在进入临床使用前都应该完成性能确认,以明确方法学的性能特征、适用性及局限性。经过前期的调研,参与国家临检中心组织的一项多中心质量评价研究的实验室中,将近一半还没有开展任何标本类型的性能确认活动,很多实验室对性能确认的必要性、操作方案及评价指标还不熟悉[5]。虽然目前还没有针对mNGS检测性能确认的指南和共识公布,但是实验室可以参考近年来一些机构发表的比较完整的基于脑脊液、呼吸道样本、血浆及其他体液样本的mNGS检测流程的性能确认研究,制定本实验室的性能确认方案,完成包括分析敏感性(检出限)、精密度、准确性、分析特异性(包括抗干扰能力)等性能指标的确认。至于性能确认的样本,最好首选特征明确的临床样本,病原体尽可能包括革兰阳性菌、革兰阴性菌、真菌、支原体/衣原体、DNA病毒和RNA病毒和寄生虫等。如果无法获得足够量的代表性临床样本,也可使用自建模拟群落样本代替,理想情况下,模拟群落样本应该不仅仅只包括几个重点关注的分类群的代表微生物,而应该根据预期用途纳入尽可能多的具有不同特征的微生物,以帮助确认检测方案对多种微生物类群的鉴定能力。此外,一些商业化的模拟群落可从ATCC(www.atcc.org)、BEI resource(www.beiresources.org)和Zymo Research(www.zymoresearch.com)等平台获取。需要注意的是,由于mNGS对不同的样本类型和不同病原体的检测能力有差距,所以实验室需要对所有拟开展的样本类型分别开展性能确认活动。若在运行过程中,检测系统的组件如所用试剂、软件和数据库及算法等发生改变,实验室应根据检测系统改变的程度对全流程或部分检测环节重新开展性能确认活动。


5. 开展室内质量控制和参加室间质量评价活动:每批次mNGS检测都需要伴有随临床标本共同上机的阳性质控、阴性质控和无模板质控。阳性质控品中应涵盖不同类型的微生物,为了防止阳性质控品与临床样本交叉污染引发假阳性的风险,阳性质控中的微生物可倾向性选择非致病性外源微生物。阴性质控品不应含有检测范围内的病原体。由于分析敏感度会受到样品基质和核酸组成复杂度的影响,所以为了最大限度的提高痕量污染的检测灵敏性,应尽量使用低背景的体液(如健康人血浆)作为阴性样本的基质成分。无模板质控可以由人源细胞和纯水制备而成,该质控非常重要,它的检测结果可以作为本地的微生物(污染)背景基线,能够用来和临床样本结果配对分析,剔除可能来自于试剂成分或其他操作环节引入的微生物污染。除了日常的室内质控外,实验室还应定期参加外单位组织的室间质量评价(EQA)或实验室间比对活动[5, 23],有利于发现检测过程存在的问题,也利于检测方法及流程的优化和标准化。


三、总结


mNGS在临床感染性疾病的诊断中的应用越来越广泛,并逐步以实验室自建检测(LDT)的方式开始在医院内实验室本地化开展。但作为一项复杂的检测技术,mNGS在应用过程中还不完美,需要来自临床医生、微生物学家、分子生物学、生物信息学等多学科的专业人才共同努力,去解决发展过程中面临的临床和技术问题,以推动该项技术的方法学成熟及向临床转化的进程。


参考文献


Chiu C Y, Miller S A. Clinical metagenomics[J]. Nat Rev Genet, 2019, 20(6): 341-355.

Bryson A L, Miller S A, Filkins L M, et al. Navigating Clinical Utilization of Direct-from-Specimen metagenomic Pathogen Detection: Clinical Applications, Limitations, and Testing Recommendations[J]. Clinical chemistry (Baltimore, Md.), 2020, 66(11): 1381-1395.

Han D, Li Z, Li R, et al. mNGS in clinical microbiology laboratories: on the road to maturity[J]. Critical Reviews in Microbiology, 2019: 1-18.

Han D, Li R, Shi J, et al. Liquid biopsy for infectious diseases: a focus on microbial cell-free DNA sequencing[J]. Theranostics, 2020, 10(12): 5501-5513.

Han D, Diao Z, Lai H, et al. Multilaboratory assessment of metagenomic next-generation sequencing for unbiased microbe detection[J]. Journal of Advanced Research, 2021.

van Boheemen S, van Rijn A L, Pappas N, et al. Retrospective Validation of a metagenomic Sequencing Protocol for Combined Detection of RNA and DNA Viruses Using Respiratory Samples from Pediatric Patients[J]. The Journal of Molecular Diagnostics, 2020, 22(2): 196-207.

Schlaberg R, Chiu C Y, Miller S, et al. Validation of metagenomic Next-Generation Sequencing Tests for Universal Pathogen Detection[J]. Arch Pathol Lab Med, 2017, 141(6): 776-786.

Blauwkamp T A, Thair S, Rosen M J, et al. Analytical and clinical validation of a microbial cell-free DNA sequencing test for infectious disease[J]. Nature Microbiology, 2019, 4(4): 663-674.

Bachmann N L, Rockett R J, Timms V J, et al. Advances in Clinical Sample Preparation for Identification and Characterization of Bacterial Pathogens Using metagenomics[J]. Frontiers in Public Health, 2018, 6.

Quince C, Walker A W, Simpson J T, et al. Shotgun metagenomics, from sampling to analysis[J]. Nature Biotechnology, 2017, 35(9): 833.

Han D, Gao P, Li R, et al. Multicenter assessment of microbial community profiling using 16S rRNA gene sequencing and shotgun metagenomic sequencing[J]. Journal of Advanced Research, 2020, 26: 111-121.

Miao Q, Ma Y, Wang Q, et al. Microbiological Diagnostic Performance of metagenomic Next-generation Sequencing When Applied to Clinical Practice[J]. Clin Infect Dis, 2018, 67(suppl_2): S231-S240.

Charalampous T, Kay G L, Richardson H, et al. Nanopore metagenomics enables rapid clinical diagnosis of bacterial lower respiratory infection[J]. Nature Biotechnology, 2019, 37(7): 783-792.

Weyrich L S, Farrer A G, Eisenhofer R, et al. Laboratory contamination over time during low-biomass sample analysis[J]. Mol Ecol Resour, 2019, 19(4): 982-996.

Eisenhofer R, Minich J J, Marotz C, et al. Contamination in Low Microbial Biomass Microbiome Studies: Issues and Recommendations[J]. Trends in Microbiology, 2019, 27(2): 105-117.

de Goffau M C, Lager S, Salter S J, et al. Recognizing the reagent microbiome[J]. Nat Microbiol, 2018, 3(8): 851-853.

Salter S J, Cox M J, Turek E M, et al. Reagent and laboratory contamination can critically impact sequence-based microbiome analyses[J]. BMC Biol, 2014, 12: 87.

Miller S, Naccache S N, Samayoa E, et al. Laboratory validation of a clinical metagenomic sequencing assay for pathogen detection in cerebrospinal fluid[J]. Genome Research, 2019, 29(5): 831-842.

Marotz C A, Sanders J G, Zuniga C, et al. Improving saliva shotgun metagenomics by chemical host DNA depletion[J]. Microbiome, 2018, 6(1).

Sardi S I, Somasekar S, Naccache S N, et al. Coinfections of Zika and Chikungunya Viruses in Bahia, Brazil, Identified by metagenomic Next-Generation Sequencing[J]. Journal of Clinical Microbiology, 2016, 54(9): 2348-2353.

Liu D, Xu T, Zhou H, et al. Development and Multicenter Assessment of a Reference Panel for Clinical Shotgun metagenomics for Pathogen Detection[J]. 2021.

宏基因组高通量测序技术应用于感染性疾病病原检测中国专家共识[J]. 中华检验医学杂志, 2021, 44(2): 107-120.

Brinkmann A, Anusch A, Belka A, et al. Proficiency Testing of Virus Diagnostics based on Bioinformatics Analysis of Simulated In Silico High-Throughput Sequencing Data Sets[J]. Journal of Clinical Microbiology, 2019, 57(8).