夏涵,博士,予果生物创始人&CEO。具有多年跨国药企工作经验。2017年创立予果生物,领衔公司学术创新和技术研发。主要研究领域与方向:感染与免疫、微生态、宏基因组微生物检测、临床宏基因组病原与靶向病原检测的应用等。参与国家十三五、十四五重点课题项目和多项省级重点研究课题。已发表文章70余篇,第一作者或通信作者发表SCI论文25篇;拥有自主知识产权专利百余项,其中发明20项,软著80项。现任中国医药生物技术协会生物诊断技术分会第三届委员常务委员,医用高通量测序标准化技术归口单位专家,广东省医疗行业协会中枢神经系统感染管理分会第一届委员会副主任委员,中国医学装备协会基因检测分会第一届委员,省级人才和地方领军人物,获HICOOL全球创业大赛一等奖。
宏基因组学测序技术(mNGS)是一种无需培养,无需预设就可以深入快速鉴定感染病原体的新技术,这比培养等传统方法学拥有更高敏感性的同时又与精准诊疗的理念相契合。对于辅助临床精准抗感染,进一步提升患者预后和生命体验,具有重要的意义。本文从新技术、新工具、新发现、新想法以及新应用五方面进行阐述。
一、新技术
1. mNGS在病原体检测方面的发展:2014年,加州大学旧金山分校(UCSF)的Charles Y. Chiu团队首次采用高通量测序技术成功的对一位患有联合免疫缺陷综合征,并最终确诊为钩端螺旋体引起脑膜炎的临床患者提供了诊断与治疗的病原学依据。而钩端螺旋体这一类的病原体通常依靠常规检测方法是难以检出的,此次应用证实了mNGS技术在病原微生物鉴定领域,尤其是疑难微生物鉴定方面的应用潜能。随着该技术的社会经济成本不断降低和技术的不断完善,在不同感染类型中的科研探索及临床应用均取得迅速发展,尤其是在新发、罕见及难以检测病原体鉴定,混合感染,排除感染,及耐药基因方面优势尤为明显。
2. PACEseq病原宏基因组学检测技术原理:宏基因组学测序无需预设、无需培养、无偏好性,直接从临床样本中的提取核酸,进行高通量测序,基于生物信息学算法,与临床病原基因组信息数据库进行比对分析,鉴定样本中病原微生物种类及功能信息,能够快速、客观、全面和准确的检测临床样本中的病原微生物(包括病毒、细菌、真菌、寄生虫等),为临床抗感染提供精准的病原学证据。
PACEseq病原宏基因组学检测技术原理(图1),分为两个技术环节,即实验操作环节,也称“湿实验”,生物信息学分析环节,也称“干实验”。湿实验包括临床样本采集、核酸抽提、文库构建和上机测序。而之后的生物信息学分析是mNGS中的重要部分,是对测序产生的原始数据进行处理和分析,包括数据质控、去人源宿主数据、种属鉴定与功能分析、病原相对定量与准确判读分析、报告解读等过程。针对mNGS方法来说,如果要把mNGS应用在临床以及检验科,最大的困难就是如何把质控做好,对比传统的分子生物学PCR技术,整个从样本采集、核酸提取、文库构建、上机测序,数据质控及分析,每一个步骤都有可能出现问题,如何在每一个步骤有一个合理的且可执行的质控点,这个是所有mNGS检测流程所共有的痛点。
图1. PACEseq病原宏基因组学检测技术原理
在该方法中,对于去宿主核酸技术,无论是在中国还是美国,甚至欧洲等国家,不管是市面上宣传的,还是文献里给出的,更多的是停留在百家争鸣的阶段,真正用于临床样本的使用,其实是很有局限的,其原因在于去宿主过程中不可避免会造成样本中病原体的绝对损失。针对这一问题,我们经过大量文献调研以及团队的不断研讨,采用了总核酸(即Whole cell)与游离核酸(Cell free)两个方法路线去做脑脊液的检测,经过大量反复实验,发现脑脊液这种无菌体液里采用基于Cell free的低载量核酸提取技术,显著提高了样本核酸提取效率(相较于WC去宿主提升2.8倍以上),尤其是核酸低载量样本,全面覆盖各种不同类型的病原体。因此,得益于Cell free技术可以从样本中获得更高病原核酸占比,更灵敏检出病原微生物。在灵敏性、特异性以及数据分析特点上是一个非常好的靶标。
对于数据分析,这个过程是相对复杂的。我们拿到多样本的测序下机数据Fastq文件,基于Index序列进行数据拆分,获得不同样本各自的测序数据,首先在数据质控过程中,接下来,通过生信算法过滤人源测序数据,临床病原微生物检测过程中普遍存在人源核酸污染,因此人源背景去除也是生信分析流程中重要的一步。并将剩余的测序数据与专门的病原体基因组序列数据进行比对分析,运用予果自主开发的“超高维度特征值分析”病原鉴定模型,完成目标病原体的种属鉴定及功能分析等得到的“置信度”参数,背后涉及mNGS全流程的超高维度参数,能够全面评价该病原体检出的可靠性,联合“特异性序列数”,实现对病原体进行精准定性与相对定量分析。
二、新工具
基于宏基因组测序技术做病原体诊断,如何变成可靠的工具,室间质评就是其中之一。主要分为两个方面,一是检测仪器的性能,二是生信分析的能力。例:3家实验室(A、B、C)检测30例肺泡灌洗液样本,平均年龄56.37岁(18-76),男女比例15:15,进行宏基因组测序,测序方式为单端、DNA,测序读长A实验室为76bp(予果生物),B、C实验室为50bp。
1. 结果一:测序质控数据Q30占比(测序碱基准确性达到99.9%以上)、非人源测序数据占比、微生物物种数量三方面进行比较,其结果为A实验室的测序质控数据Q30值最高,B和C实验室测序质控在同一水平;A实验室(予果生物)原始数据微生物序列占比以及检出微生物种类数均为最高,C实验室原始微生物序列占比以及检出微生物种类数均为最低,可能为检出率偏低并导致漏检的原因之一。
2. 结果二:采用权威的Kraken2微生物物种分类工具,分别分析三组mNGS数据物种注释效果,结果为A实验室(予果生物)产生的序列其物种注释比例最高,B实验室注释比例最低。
3. 结果三:从病原体物种鉴定维度评估三家实验室的mNGS检测性能,其结果为(1)整体上来说,三家实验室的mNGS检测阳性率均高于传统病原检测方法学(培养与PCR),且各家总检出阳性率差异不大,其中A实验室(予果生物)最高。但是各实验室中总阳性率差异不大。(2)三者检测均具有较高的敏感性(以培养+PCR结果为金标准)。
4. 结果四:在对结核分枝杆菌的检测中,有一例样本PCR为阴性,但3家实验室的mNGS结果菌检出结核分枝杆菌(序列数较少),表明mNGS对低浓度微生物灵敏度高于PCR,但是够为病原体仍需结合临床考虑。对常见菌的检测中各实验室差异不大,均有较高敏感度和特异性。
5. 结果五:最后评估不同读长对于微生物序列物种注释的影响,结果显示读长大于70bp的数据,分类效果明显好于50bp以下数据集,表明更长读长更有利于物种的注释。
三、新发现
在“十三五”国家重点研发计划,予果生物承担感染性脑(膜)炎病因分型研究,从中发现脑脊液在成人和孩子,神经内科和神经外科,甚至在男性和女性之间是有差别的,成人45-60岁之间的男性感染例数构成比是最高的。在所有患者、移植、儿科患者呼吸道感染病原谱分析比较中,TOP15病原中分布也是有所不同的。而对于儿童感染性疾病,回顾2019年、2020年与2021年重症儿童病毒检出情况分析得出,病毒类病原体仍然是儿童下呼吸道感染主要病原体构成类型。
四、新想法
病原mNGS技术在不断的更新迭代,如何用好的技术服务更多的患者,需要联合多学科单位进行持续不断的探索与创新。
1. 方法学比较,及多种方法学的联合使用,辅助临床精准抗感染。西安交通大学第一附属医院联合予果生物,从235例疑似肺部感染者中采集其肺泡灌洗液BALF样本,评估PACEseq宏基因组学检测在肺部感染诊断中的临床应用价值研究中,充分展示了更好的病原检测能力,更多样的病原谱。
2. 研究不同疾病类型中病原谱差异分析,辅助个性化精准治疗。对于疑似免疫功能正常与免疫功能低下感染患者采用PACEseq宏基因组学流程及宏转录组学流程进行评估,不同疾病病原谱的差异及其原因,探索个性化精准抗感染治疗的临床价值;也同步评估在不同疾病中PACEseq宏基因组与传统病原检测方法学的性能差异及各自的价值,来评估:(1)两种疾病病原谱差异的原因,及对于精准抗感染治疗的临床价值;(2)PACEseq与传统病原检测方法的检测性能差异。
3. 以临床诊断为标准,评估mNGS的临床应用效能或价值。收集临床诊断感染性疾病的患者的血液标本用于PACEseq病原检测,根据其结果进行靶向用药治疗,与临床诊断后经验性治疗两组进行对比,评价PACEseq病原检测辅助指导感染性疾病用药治疗的临床效能。
4. 基于mNGS进行相对定量分析,探索辅助临床进行患者感染病程监测患者感染病程的临床价值。收集临床诊断移植后患者感染多个患病时期的标本,分别用传统临床方法学以及PACEseq病原检测来评价PACEseq在移植后患者感染病原学检测中的临床效能以及评估PACEseq病原检测动态监测脓毒血症患者的病情变化,辅助抗感染用药合理使用的临床应用价值。
5. 予果生物与哈佛大学等多单位联合发表-基于肺组织的多组学研究揭示感染新冠病毒患者的免疫调节分子机制,利用基因组学、转录组学及蛋白组学等多组学技术揭示COVID-19死亡病例肺组织免疫应答反应特征,将9例首批新冠死亡病例与非新冠癌症者病理分别进行PACEseq mNGS(RNA)测序,在新冠死亡患者中检测出极低载量新冠病毒,并采用转录组学分析差异表达基因情况,免疫相关功能通路富集分析,及采用蛋白组、免疫荧光进行验证。
6. 解放军总医院联合发表予果生物—剖析新冠患者的环境样本微生态研究。利用mNGS探究新冠肺炎患者相关的环境微生物群落结构,将患者病房的气溶胶和表面拭子与医生办公室的气溶胶进行PACEseq mNGS测序,其结果为病房内环境微生物多样性大于医生办公室,但门口位置病原菌数目和含量与医生办公室相似;不同隔离室中微生物多样性差异显著;距离病人越远,气溶胶中微生物越低。
7. 南京大学医学院附属金陵医院联合予果生物—探索耐药分析与对应基因型的关联。针对肺炎克雷伯菌的抗生素药物治疗和耐药性,予果自主开发病原体与耐药基因分析流程,实现病原体鉴定基因型与关键的耐药基因分析,解析现有药敏检测表型结果,完成耐药表型与对应基因型的关联。
五、新应用
1. 自动化设备的布局-为病原测序落地定做的方案。在核酸提取和建库方面,首先应该从源头做起,将测序方法做病原诊断实验流程不断地简化。其次在不能够简化的前提下,持续的提高检测的性能和效能。在此基础上,才能提出自动化的解决方案。
2. 多种不同类型产品服务于更多的感染患者。BloodSeqTM病原体靶向高通量检测方法是一种针对临床重点病原体的更快速和更高敏的病原体检测方法,通过直接提取血液样本中核酸,以成百上千的特异性引物实现超多重靶向扩增病原体目标域,排除人源宿主干扰,采用高通量测序平台,以全因素权重体系病原体鉴定人工智能算法,精准鉴定病原体及重要耐药基因,辅助临床进行快速、精准抗感染治疗。基于大样本回顾性数据分析显示,BloodSeqTM检出细菌、真菌、病毒、结核与非结核分枝杆菌、非典型病原体,相较于mNGS,检出病原效能大于12.2倍。
小结:mNGS以无需培养、无需预设、无偏好性、全面、快速和精准的实现临床病原体的精准检测。突破了传统病原学检测方法的局限性,尤其是对于罕见、新发、混合感染病原体等,它与传统病原学检测相辅相成。以更加全局的角度,发现不同感染病原的传播及病原谱构成特征等。从病原谱分析、多组学研究、微生态研究、耐药与毒力、定植与感染等方向持续优化mNGS在临床中的应用,辅助临床精准抗感染。同时做好本地化解决方案,多产品联合,更好服务临床与患者。