二代测序和三代测序在癌症诊疗中的应用与研究方向

作者:卓钟灵 戴二黑 赵晓涛
作者单位:北京大学医学部(卓钟灵);河北石家庄第五医院检验科(戴二黑);北京大学人民医院检验科(赵晓涛) 2022-05-31

戴二黑,医学博士,石家庄市第五医院副院长,教授,博士生导师,美国哈佛大学和纽约大学访问学者。兼任中国老年保健医学研究会检验医学分会副主任委员、中华医学会检验医学分会委员、中国医师协会检验医师分会委员、河北省医学会检验医学分会主任委员等职务。担任《世界华人消化杂志》常务副主编,《分子诊断与治疗杂志》常务编委,《临床检验杂志》《天津医药》《河北医药》等杂志编委。主要从事病原微生物的实验诊断与研究工作。主研课题50余项,获得省部级科技进步奖5项。发表学术论文230余篇,其中SCI收录60余篇,包括NEJM、Gut、Signal Transduct Target Ther等顶级学术期刊,单篇最高影响因子72.4。出版学术著作18部。获得国家发明专利8项。荣获省管优秀专家、省优秀科技工作者、市高层次人才、市管拔尖人才、市有突出贡献中青年专家等荣誉称号。


赵晓涛,博士,教授、主任医师,硕士研究生导师,北京大学人民医院检验科副主任。主要从事临床分子检测及相关基础研究工作。作为课题负责人获得国家自然科学基金、北京市自然科学基金等资助,以第一或通讯作者发表核心期刊及SCI收录论著多篇。主要社会任职:北京大学医学部医学检验学系委员(兼秘书);中国医疗保健国际交流促进会临床微生物与感染分会常务委员(兼秘书长);中华医学会北京检验学会科研与研究生培养专项工作组副组长;中华医学会检验医学分会分子诊断组委员;北京医师协会检验专科医师分会理事;中国中西医结合学会检验医学专委会委员;北京中西医结合学会检验医学专业委员会常委;中国医疗保健国际交流促进会基层检验技术标准化分会委员等。



卓钟灵,北京大学医学部博士生,研究方向为高通量测序在肿瘤研究中的应用。以第一作者和通讯作者发表SCI文章8篇,以共同作者发表中文文章7篇。参与国家及市级重点研究课题三项。研究生期间获北京市优秀毕业生和北京大学三好学生标兵等荣誉称号,获得北京大学国家奖学金。


癌症是一种基因组疾病,其特征性基因变异的识别已成为精准医学中不可或缺的部分。过去的20年中,Sanger测序是基因组研究的主流方法,取得了包括人类基因组计划(human genome project,HGP)在内的一系列重大成就,这使得单基因遗传病的鉴定和靶向治疗成为可能[1-2]。尽管Sanger测序是基因检测的金标准,但无论是临床还是研究均迫切需要速度更快、通量更高的测序方法,因此二代测序(next-generation sequencing,NGS)技术应运而生。NGS技术在短时间内产生的海量数据,可以描述不同癌症的分子景观,并使癌症基因组的研究取得了巨大进展,二代测序技术在癌症研究中发挥着越来越重要的作用,而且也逐渐走进医院,实现本地化检测,为指导临床诊疗发挥更有效的作用。


而针对二代测序的短读长和无法直接检测碱基修饰的缺点,诞生了包括基于单分子荧光测序的美国太平洋生物(Pacific Bioscience)和基于纳米孔测序的英国牛津纳米孔公司的三代测序平台。三代测序技术是未来科学研究的主要发展方向,其读长和可以直接检测碱基修饰的优点将在基因组测序、甲基化研究、突变鉴定(SNP检测)等方面发挥巨大优势。


一、二代测序在癌症研究中的应用


二代测序,又称高通量测序,可应用于全基因组测序(whole genome resequencing,WGS)和全外显子组测序(whole exome resequencing,WES),可获得点突变、小片段插入或缺失、拷贝数变异和结构变异的信息。NGS的广泛应用可揭示肿瘤异质性和肿瘤进化的机制,帮助划分肿瘤的不同分子亚型,也可在遗传性肿瘤预警、靶向治疗、早期诊断等方面提供更多更全面的分子标志物信息。


1. 二代测序在基因组检测中的应用:全基因组测序意味着对整个基因组进行从头测序,并将序列映射到参考基因组以识别突变,因此常用于识别新发和罕见的突变。全外显子组测序仅对已知基因的外显子进行深度测序,与全基因组测序相比,其主要优势在于费用较低且所需数据量较小。全基因组测序和全外显子测序在乳腺癌[3-10]、卵巢癌[11]、结直肠癌[12-13]、肺癌[14]、肝癌[15]、肾癌[16]、头颈部癌症[17]、黑色素瘤[18]和急性髓性白血病[19-20]等癌症中均取得了重要的研究成果。转录组测序指对RNA逆转录产生的cDNA进行测序。研究人员能够根据转录组测序的结果识别RNA表达谱、可变剪切变异和新的转录本。甲基化测序正在用于探究癌症的表观遗传现象。研究结果证明了DNA甲基化和蛋白质组测序结合的潜在预后和诊断价值[21]。


2. 二代测序在癌症相关基因检测中的应用:大约10%的癌症是家族遗传性的。在美国和欧洲,基因测序用于遗传性癌症患者的治疗指导已超过10年。此前,使用最广泛的基因检测技术为Sanger测序,是检测突变的金标准。然而,由于与家族遗传性癌症相关的基因数量众多,并且没有特定的突变热点,因此这种常规的家族遗传性癌症基因检测方法是耗时、高成本和低产量的。NGS的出现为遗传性乳腺癌和卵巢癌相关基因组合的检测提供了很好的平台,目标区域的扩增和测序能够诊断不同类型的变化,包括小片段的插入和缺失、单核苷酸变异等。2020年,美国食品药品监督管理局(FDA)根据TRITON2和PROfound3临床试验结果批准PARP抑制剂芦卡帕尼和奥拉帕尼用于治疗BRCA1/2基因和同源重组通路基因突变的遗传性去势抵抗型前列腺癌患者,这标志着NGS成为指导前列腺癌患者治疗的新标准。在2020年的NCCN指南中,专家组建议对IIIB期及IV期的膀胱癌患者进行NGS测序,肌层浸润型膀胱癌患者的测序数据显示12%~14%患者携带FGFR3突变,20%~22%患者携带PIK3CA突变,12%~17%患者携带ERBB2突变,以上3种突变都有美国FDA批准上市的靶向抑制剂,NGS测序将有助于临床医生识别患者的驱动突变并指导靶向治疗。


Thermo Fisher(Waltham,MA,USA)oncomine Dx Target Test是美国FDA于2017年6月批准的首个伴随诊断(CDx)测试,该测试同时评估与非小细胞肺癌(non-small cell lung cancer,NSCLC)相关的23个基因的变异。批准的变异包括BRAF V600E、EGFR L858R、EGFR 19号外显子缺失和ROS1融合[22]。


2017年11月,美国FDA批准了纪念斯隆凯特琳-可操作癌症靶点综合突变分析组合(MSK-IMPACT)和FoundationOne CDx(F1CDx)用于通过检测遗传变异进行分子诊断[23-25]。F1CDx于2019年获美国FDA批准用作奥拉帕尼一线维持治疗的CDxBRCA-突变的晚期卵巢癌的分子检测[26]。NantHealth Omics Core测序于2019年11月获美国FDA批准。基于WES测序,可报告468个癌症相关基因的TMB和体细胞变异(SNV和插入缺失)。Illumina TruSight oncology 500(TSO 500)针对523个基因进行SNV和插入缺失检测,以及对55个基因的融合和剪切变异进行检测,它还可以检测与免疫治疗相关的生物标志物,例如TMB和MSI。


3. 二代测序在肿瘤特异性生物标志物检测中的应用:除了美国FDA批准的NGS基因检测组合外,许多商业或定制设计的NGS基因组合正在临床实验室中使用,用于癌症诊断、治疗和预后的生物标志物数量不断增加。2017年,美国FDA批准多靶点蛋白激酶抑制剂米哚妥林用于治疗首次诊断且携带FLT3突变的成人AML患者。2017年,美国FDA还批准了米哚妥林用于治疗复发或难治性携带IDH2基因突变的成人AML患者。在2018年,FDA又批准了米哚妥林用于治疗携带IDH1突变的复发或难治性成人AML患者[27]。DNMT3A突变往往与总生存期较短有关[28],并且TET2突变通常与细胞遗传学正常的AML患者的预后不良有关[29-31]。然而,携带TET2突变的患者可能对甲基化抑制剂有反应[32]。ASXL1、KMT2A或者TP53突变通常与预后不良有关[33]。2017年世界卫生组织将存在NPM1、CEBPA和RUNX1突变的AML归为新的疾病亚型[34]。


NGS临床应用的另一个成功例子是在肺癌分子诊断中。几种基因的突变,例如EGFR、ALK和ROS1是可靶向的驱动突变[35-37]。有几种美国FDA批准的EGFR抑制剂,如阿法替尼、吉非替尼、厄洛替尼和奥希替尼可用于携带这些突变的NSCLC患者。携带ALK重排(例如EML4-ALK)的肺癌患者可能受益于美国FDA批准的ALK抑制剂,包括克唑替尼、艾乐替尼和色瑞替尼[38]。携带NSCLC ROS1突变的患者可能对克唑替尼和恩曲替尼敏感,这两种药物分别于2016年和2019年获得美国FDA批准[39-40]。根据美国病理学家协会、分子病理学协会和国际肺癌研究协会于2018年发布的指南,所有晚期肺癌患者都需要检测EGFR、ALK和ROS1的突变,如果这些基因突变是阴性的,则增加检测BRAF、MET、RET、ERBB2和KRAS。NGS测序在肺癌患者中的突变检测是可靠、经济且高效的。


4. 二代测序在泛癌生物标志物检测中的应用:除了疾病特异性生物标志物外,还存在一些泛癌生物标志物,包括MSI、TMB和神经营养原肌球蛋白相关激酶(neurotrophin receptor tyrosine kinase,NTRK)等。MSI是由DNA错配修复(mismatch repair,MMR)系统失活引起的,并且已在许多类型的原发性癌症中发现。2017年5月,美国FDA批准PD-1抑制剂帕博利珠单抗用于治疗MSI高(MSI-H)或MMR缺陷(dMMR)的不可切除或转移性实体瘤的成人和儿童患者[41]。这是第一次在泛癌水平上批准通用生物标志物的应用。此外,美国FDA批准了其他药物,包括纳武单抗(O药)以及纳武单抗和伊匹单抗(Yervoy)的组合,用于治疗具有MSI-H或dMMR的转移性结直肠癌的成人和儿童患者[42, 43]。


NTRK是美国FDA批准的第二个用于癌症治疗的泛癌生物标志物,它基于NTRK融合。涉及的NTRK癌基因家族成员包括NTRK1、NTRK2和NTRK3,在罕见的成人癌症和广泛的儿科癌症中最为普遍,在胶质母细胞瘤等高度侵袭性癌症中的携带率显著增加[44, 45]。2018年11月,美国FDA批准原肌球蛋白受体激酶(TRK)抑制剂拉罗替尼(VITRAKVI),用于治疗携带未知获得性抗性突变的NTRK融合的转移性或不可切除实体瘤的成人和儿童患者[46, 47]。2019年8月,美国FDA批准另一种TRK抑制剂恩曲替尼(ROZLYTREK)用于治疗携带未知获得性抗性突变的NTRK融合的转移性或不可切除实体瘤的成人和儿童患者(≥12岁)。恩曲替尼还被批准用于治疗ROS1阳性的转移性非小细胞肺癌的成人患者[48, 49]。


TMB是另一种泛癌标志物,可用于免疫治疗。TMB可用于从多种癌症的免疫治疗中识别最有可能受益的患者。TMB可以通过靶向基因组合(如F1CDx)、全外显子(如NantHealth Omics Core)或全基因组来检测并计算。TMB的计算和MSI状态的识别可以在一个基于NGS的测序中同时进行。


5. 二代测序在癌症基因组学中的挑战:常用的NGS技术存在一些局限性,如短读长和依赖PCR扩增,会产生无法避免的PCR偏好性,并在检测基因组结构变异和碱基修饰方面存在困难。具有长读长和单分子测序的三代测序(如Pacific Biosystems和Oxford Nanopore)理论上会更好,并且需要更少的起始材料,因三代测度与二代测序相比,其错误率较高且成本较高,故二代测序仍然是临床应用中的主流,而三代测序的应用主要集中在研究基因组组装和表观遗传等领域。


二、三代测序在癌症研究中的应用


癌症是一种主要由基因组异常引起的疾病。不断出现的新型测序技术,帮助研究人员研究癌症基因组,以了解癌细胞的分子状态并揭示其不稳定性,如驱动突变或基因表达异常。三代测序技术使我们能够识别包括复杂结构变异的癌症突变。


现代测序技术正在迅速发展,使我们能够更轻松地识别每个癌症病例中的突变。许多研究机构,如国际癌症基因组联盟(the international cancer genome consortium,ICGC)[50]和癌症基因组图谱(the cancer genome atlas,TCGA)[51],对每种癌症亚型特有的基因组进行了测序、分析和报告。他们主要关注点突变,如SNV和小片段的插入缺失,因为二代测序技术通常用于点突变的检测,其他类型的基因组变异非常复杂。对于最长只有几百个碱基读长的二代测序而言,检测和精确识别各种大小的结构变异(Structural variant,SV)和重复区域中的突变是一项艰难的挑战。尽管已经开发了许多生物信息学工具和分析流程(如Pindel、DELLY2、Manta、SvABA),但检测准确度和精确度仍然有限。二代测序也缺乏每个等位基因的信息,这意味着我们错过了发生突变的等位基因。为了弥补二代测序的不足,长读长的三代测序技术应运而生。


近年来,许多三代测序技术得到了开发和应用。如单分子实时测序(single molecule real time,SMRT)是太平洋生物科学公司(pacific biosciences,PacBio)开发的长读长测序方法之一,该方法基于连接在零模波导中的DNA聚合酶,检测荧光信号。使用SMRT测序,可以获得超过10kb的长读长数据。在最近的一份报告中,大约50%的序列以≥10kb的长度进行测序,这些数据用于构建人类基因组中常见SV的综合数据库[52]。


Nanopore测序仪已由Oxford Nanopore Technologies公司商业化。蛋白质纳米孔排列在膜上,以检测DNA或RNA分子通过纳米孔时电流的变化,从而允许对分子进行直接测序。MinION是一种便携式三代测序平台,初始成本低,每次运行可获得>5Gb的数据。文库制备也很容易进行,每次测序只需约48小时。此外,更大的平台GridIon和PromethION可以实现约10倍于MinION的数据输出。Jain等[53]报道了一种用于生成超长读长(高达>800kb)以对人类基因组进行测序和组装的流程,目的是检测包括重复序列和复杂结构变化的区域。这些长读长序列可用于探测短读长测序仪无法检测的基因组区域,突出了三代测序的优势。


三代测序现在变得越来越普遍,因此,使用三代测序的癌症研究迅速增加并不断取得进展,以破译复杂的癌症基因组。在这里,我们介绍了近期三代测序的癌症研究以及三代测序带来的癌症基因组学的新发现。


1. 三代测序在癌症基因组中的研究:三代测序的优势在于其适用于阐明等位基因突变状态和复杂癌症基因组的完整结构。虽然PacBio和Oxford Nanopore等具有代表性的长读长平台产生的序列碱基质量值低于Illumina等短读长测序平台,但在对大的基因组变异如CNV和SV进行基因分型时可以忽略这一缺点。这种方法已经用于各种疾病的治疗,包括多种癌症。此外,通过单独应用三代测序或与更准确的二代测序相结合,可以对单碱基水平分辨率变异(如SNV和小片段插入缺失)进行基因分型,如使用MinION测序来检测癌症相关基因(如EGFR、KRAS、NRAS和NF1)中的SNV和小片段插入缺失[54]。


三代测序的优势之一是以单等位基因分辨率鉴定基因组突变,如H1975肺腺癌细胞系中的EGFR原发性和继发性突变(分别为L858R和T790M)可通过三代测序进行分型[54-55]。在MinION序列中,研究者发现L858R和T790M突变都位于同一个等位基因中(72%的转录序列),另一个等位基因是野生型(22%的序列;其余6%的序列包括测序错误或次要等位基因部分)[54]。三代测序可能正在成为基因分型的新标准,为抗癌药物的使用提供证据,并为每个人量身定制正确的治疗方案。


此外,分型对于理解非编码突变的功能至关重要。在癌细胞中,启动子和增强子中存在许多突变,其中部分突变会导致异常转录,从而影响基因表达的水平。在癌细胞系中,仅TERT突变基因表达,这表明启动子突变产生了一个转录因子的结合位点并激活了突变等位基因中的转录和表达[56]。使用二代测序数据无法实现启动子与下游外显子区域在等位基因水平的直接关联,因为这些基因座相距数百个碱基,无法由单个或少量短读长序列覆盖。在之前的一项研究中发现,在RERF-LC-Ad1中可以观察到NFATC1基因的调节突变,并通过三代测序对等位基因进行检测,发现这种SNV创建了ETS转录因子的从头结合位点,从而影响NFATC1等位基因特异性激活表达[55]。


三代测序也用于检测SV。SV为>1kb的大型基因组变异,如大片段的插入缺失、倒位和重复,或染色体重排,如易位。为了检测这些变异,首先将长读长序列映射到人类参考基因组,然后利用唯一序列(由可以唯一映射到基因组不同区域的部分组成的序列),分析基因组区域,从而鉴定SV的断点。二代测序也可以使用这种分析方法,但大而复杂的SV和重复区域的鉴定对短读长来说是极为困难的。Norris等[57]尝试使用MinION检测SV,并成功鉴定了CDKN2A和SMAD4肿瘤抑制基因中与癌症相关的SV。Nattestad等[58]利用三代测序和二代测序检测乳腺癌细胞系基因组中的SV。有趣的是,他们发现ERBB2扩增出现在8号染色体的复杂重排中,只能通过三代测序来精确识别。此外,在最近的研究中,研究者使用PromethION对肺癌细胞系和临床样本进行了全基因组三代测序。平均每个样本获得47Gb数据[59]。我们能够通过肿瘤抑制基因中的局部重复、倒位和(或)缺失的组合检测到极其复杂的SV。这些含有SV的基因的功能在转录和蛋白质水平上失去了功能。还可以用相同的方式在临床样本中检测这些复杂的SV。尽管这些复杂的SV也可以通过使用各种生物信息学工具(如GenomonSV[60])从二代测序数据中识别出来,这些工具旨在检测分成两个不同基因座的序列,但使用该方法的误报率相对较高,并且它们的结构无法完全阐明,使得对此类结果的评估变得复杂。


三代测序使我们能够阐明使用传统的二代测序尚未鉴定的异常基因组状态。但作为检测低频突变的关键步骤,DNA文库的扩增成为一项更加艰巨的任务,因为PCR和杂交将片段的大小限制在只有几个kb。为了解决这个问题,开发了Cas9辅助靶向染色体片段(CATCH),这是一种基于CRISPR-Cas9系统分离大基因组片段的方法[61]。Gabrieli等[62]使用CATCH从PBMC获得,并由MinION测序获得了一个长达200kb的大片段,包含了乳腺癌和卵巢癌相关基因之一BRCA1的80kb区域,并成功地以约70倍的覆盖率对BRCA1区域进行了分析。


2. 三代测序在癌细胞的全长转录组检测中的研究:转录组分析也受益于三代测序技术的应用。长读长测序能够完全覆盖全长转录本,因此,转录本亚型的结构可以通过全长互补cDNA测序来确定。特别是可通过三代测序检测到的融合转录本是几种癌症(例如肺腺癌)致癌的主要驱动因素。此外,具有异常结构的转录本极有可能产生免疫细胞可识别的肿瘤特异性新抗原,因此,它们是选择免疫检查点抑制剂的理想标志物。研究人员[63]还证实了融合衍生的新抗原刺激的T细胞反应,强调了对全长转录本进行测序和阐明其完整结构的重要性。

PacBio测序仪可用于全长cDNA测序(isoform sequencing,ISO-seq),以检测剪切异构体和融合转录本。SK-BR-3是作为乳腺癌模型研究最多的癌细胞系,使用PacBio SMRT对其进行全基因组和转录组测序,以鉴定融合转录本和基因组变异,包括CNV和SV[58]。

Nanopore测序仪也可以实现全长转录组的检测。Oikonomopoulos等[64]使用 MinION对全长cDNA进行测序,并且表达丰度对比其他平台(Illumina和PacBio)具有高度相关性。研究者最近使用MinION对肺癌细胞系的全长转录本进行了测序,融合转录本包括CCDC6-RET等。检测到LC2/ad细胞系的驱动突变,并且可以对多种杂合突变,包括与分子靶向药物敏感性相关的SNV(如EGFR突变)进行测序和分型[65]。


3. 三代测序在癌症表观基因组学中的研究:DNA修饰通过转录调控在各种生物事件中发挥重要作用。在癌细胞中,我们经常观察到全基因组低甲基化导致染色体不稳定[66]。此外,高甲基化特异性发生在肿瘤抑制基因启动子的CpG岛中,导致细胞周期调节和错配修复等相关基因沉默[67-68]。亚硫酸氢盐测序是通过将未甲基化的胞嘧啶转化为尿嘧啶以区分甲基化和未甲基化胞嘧啶来分析DNA甲基化状态。因经亚硫酸氢盐处理的DNA会受损和碎片化,因此不适合长读长分析。为了解决这个问题,Yang等[69]在2015年,报道了使用PacBio测序仪开发长读长亚硫酸氢盐方案并在单个连续分子中对血液学恶性细胞系进行甲基化检测。

Nanopore测序仪可以直接检测DNA甲基化。甲基化和未甲基化DNA之间的离子电流可以使用几种计算方法来区分,如Tombo(https://nanoporetech.github.io/tombo)、nanopolish[70]和ignalAlign[71]。此外,目前的Nanopore碱基调用器Flappie(https://github.com/nanoporetech/flappie)能够在触发碱基调用期间识别CpG位点中的5mC甲基化,使我们能够在基因组测序的同时通过碱基轻松分析表观基因组。

MinION作为直接测序平台,能够检测RNA中的碱基修饰,如N6-甲基腺嘌呤(N6-adenine,m6A)。几项研究结果显示,m6A修饰与几种癌症的发生和发展有关,如髓性白血病[72]和肺癌[73],这表明需要对m6A修饰进行深入分析,以识别癌细胞中的未知特征和新的治疗靶点。此外,目前正在单细胞水平应用全长cDNA测序,从而为单个细胞层面上的转录组提供等位基因和同种型水平信息[74]。


4. 三代测序在癌症基因组学中的挑战:相比通过二代测序进行癌症基因组测序,三代测序可以收集更全面的癌症基因组信息,包括复杂的基因组变异、转录亚型、表观基因组碱基修饰等,但三代测序技术仍然存在一些阻碍其在临床测序中应用的障碍。首先,在三代测序平台上,目前碱基准确度约为90%,这是不够的,并且会使点突变的精确检测复杂化。其次,并非总是能够从临床样本中获得足够大且完整的高分子量DNA和全长RNA。手术标本和活检通常保存为福尔马林固定的石蜡包埋组织,用于组织病理学染色和长期储存。来自FFPE的样本通常DNA/RNA高度碎片化且结构受损。此外,三代测序技术仍然缺乏针对少量样品的高产量文库制备和测序规范流程。虽然可以使用全基因组或转录组扩增方法来增加DNA/RNA的数量,但首选仍是对原始分子进行直接测序,以避免扩增引起的样本片段大小限制,并检测分子中的所有碱基修饰。

开发可以充分利用三代测序的分析方法已成为目前生物信息学中最重要的问题之一。我们现在有各种工具用于碱基识别、基因组组装、碱基抛光、映射,特别是对于检测突变,需要精确检测包括SV在内的各种类型的基因组变异。有许多现有的工具可以鉴定SV,但仍需开发工具来纠正三代测序中较高的碱基错误率。


三、小结与展望


本文讨论了二代测序和三代测序在癌症中的应用,二代测序一些研究成果已经应用于临床,为患者早期筛查、预后判断和靶向用药提供了有力的证据。随着测序技术的不断发展和对癌症研究的不断深入,二代测序技术将为癌症治疗的突破提供新的希望。而针对二代测序不足而开发的三代测序也发展迅猛,在转录组测序,表观遗传学,基因组重复区域和结构变异等研究领域具有非常明显的优势,对多种疾病的研究意义重大,已成为未来重要的精准医疗诊断工具。


参考文献


Taylor BS, Ladanyi M. Clinical cancer genomics: how soon is now? [J].J Pathology, 2001, 223: 318-326. DOI:10.1002/path.2794 (2011).

Sosman JA, et al. Survival in BRAF V600-mutant advanced melanoma treated with vemurafenib[J]. N Engl J Med, 2012, 366: 707-714, DOI:10.1056/NEJMoa1112302 .

Comprehensive molecular portraits of human breast tumours[J]. Nature, 2012, 490: 61-70. DOI:10.1038/nature11412.

Banerji S, et al. Sequence analysis of mutations and translocations across breast cancer subtypes[J]. Nature, 2012, 486: 405-409.DOI:10.1038/nature11154 (2012).

Ellis MJ,et al. Whole-genome analysis informs breast cancer response to aromatase inhibition. Nature,486:353-360.doi:10.1038/nature11143 (2012).

Stephens PJ, et al. Complex landscapes of somatic rearrangement in human breast cancer genomes.Natur, 2009, 462: 1005-1010. doi:10.1038/nature08645 (2009).

Stephens PJ, et al. The landscape of cancer genes and mutational processes in breast cancer. Nature, 2009, 486: 400-404.doi:10.1038/nature11017 (2012).

Nik-Zainal S, et al. The life history of 21 breast cancers. Cell,2012, 149: 994-1007.doi:10.1016/j.cell.2012.04.023 (2012).

Shah SP,et al. The clonal and mutational evolution spectrum of primary triple-negative breast cancers. Nature,2012,486:395-399.doi:10.1038/nature10933 (2012).

Nik-Zainal S,et al. Mutational processes molding the genomes of 21 breast cancers. Cell,2012, 149: 979-993. doi:10.1016/j.cell.2012.04.024 (2012).

Integrated genomic analyses of ovarian carcinoma. Nature,2011, 474: 609-615.doi:10.1038/nature10166 (2011).

Comprehensive molecular characterization of human colon and rectal cancer. Nature, 2012, 487: 330-337. doi:10.1038/nature11252 (2012).

Seshagiri S, et al. Recurrent R-spondin fusions in colon cancer. Nature, 2012, 488: 660-664.doi:10.1038/nature11282 (2012).

Comprehensive genomic characterization of squamous cell lung cancers. Nature, 2012, 489: 519-525. doi:10.1038/nature11404 (2012).

Totoki Y, et al. High-resolution characterization of a hepatocellular carcinoma genome. Nat Genet,2011, 43:464-469.doi:10.1038/ng.804 (2011).

Gerlinger M, et al. Intratumor heterogeneity and branched evolution revealed by multiregion sequencing. N Engl J Med, 2012, 366: 883-892. doi:10.1056/NEJMoa1113205 (2012).

Agrawal N, et al. Exome sequencing of head and neck squamous cell carcinoma reveals inactivating mutations in NOTCH1. Science, 2011, 333: 1154-1157. doi:10.1126/science.1206923 (2011).

Berger MF, et al. Melanoma genome sequencing reveals frequent PREX2 mutations. Nature, 2012, 485: 502-506. doi:10.1038/nature11071 (2012).

Ding L, et al. Clonal evolution in relapsed acute myeloid leukaemia revealed by whole-genome sequencing.Nature, 2012, 481: 506-510. doi:10.1038/nature10738 (2012).

Welch JS, et al. The origin and evolution of mutations in acute myeloid leukemia. Cell, 2012, 150: 264-278. doi:10.1016/j.cell.2012.06.023 (2012).

Esteller M. Epigenetics in cancer. N Engl J Med, 2008, 358:1148-1159. doi: 10.1056/NEJMra072067 (2008).

Luthra R, et al. A Targeted high-throughput next-generation sequencing panel for clinical screening of mutations, gene amplifications, and fusions in solid tumors. J Mol Diagn, 2017, 19: 255-264. doi:10.1016/j.jmoldx.2016.09.011 (2017).

Zehir A,et al. Mutational landscape of metastatic cancer revealed from prospective clinical sequencing of 10,000 patients. Nat Med, 2017, 23: 703-713.doi:10.1038/nm.4333 (2017).

Frampton GM, et al. Development and validation of a clinical cancer genomic profiling test based on massively parallel DNA sequencing. Nat Biotechnol, 2013, 31: 1023-1031. doi:10.1038/nbt.2696 (2013).

Cheng DT, et al. Memorial sloan kettering-integrated mutation profiling of actionable cancer targets (MSK-IMPACT): a hybridization capture-based next-Generation sequencing clinical assay for solid tumor molecular oncology. J Mol Diagn, 2015, 17: 251-264. doi:10.1016/j.jmoldx.2014.12.006 (2015).

Hodgson DR, et al. Candidate biomarkers of PARP inhibitor sensitivity in ovarian cancer beyond the BRCA genes. Br J Cancer, 2018, 119:1401-1409. doi:10.1038/s41416-018-0274-8 (2018).

Medeiros BC,et al. Isocitrate dehydrogenase mutations in myeloid malignancies. Leukemia,2017, 31:272-281. doi:10.1038/leu.2016.275 (2017).

Ley TJ, et al. DNMT3A mutations in acute myeloid leukemia. N Engl J Med, 2010, 363: 2424-2433. doi:10.1056/NEJMoa1005143 (2010).

Delhommeau F,et al. Mutation in TET2 in myeloid cancers. N Engl J Med,360:2289-2301.doi:10.1056/NEJMoa0810069 (2009).

Weissmann S,et al. Landscape of TET2 mutations in acute myeloid leukemia. Leukemia, 2012,26:934-942.doi:10.1038/leu.2011.326 (2012).

Chou WC, et al. TET2 mutation is an unfavorable prognostic factor in acute myeloid leukemia patients with intermediate-risk cytogenetics. Blood, 2011, 118: 3803-3810. doi:10.1182/blood-2011-02-339747 (2011).

Itzykson R, et al. Impact of TET2 mutations on response rate to azacitidine in myelodysplastic syndromes and low blast count acute myeloid leukemias. Leukemia,2011,25:1147-1152. doi:10.1038/leu.2011.71 (2011).

Metzeler KH, et al. Spectrum and prognostic relevance of driver gene mutations in acute myeloid leukemia. Blood, 2016, 128: 686-698. doi:10.1182/blood-2016-01-693879 (2016).

Largen M, Mills SE, Rowe J, et al. Purification, subunit structure and partial amino-acid sequence of anthranilate-5-phosphoribosylpyrophosphate phosphoribosyltransferase from the enteric bacterium serratia marcescens. Eur J Biochem, 1976, 67: 31-36.doi:10.1111/j.1432-1033.1976.tb10628.x (1976).

Rosell R, et al. Screening for epidermal growth factor receptor mutations in lung cancer. N Engl J Med, 2009, 361:958-967.doi:10.1056/NEJMoa0904554 (2009).

Cancer G, Atlas RN. Comprehensive molecular profiling of lung adenocarcinoma. Nature, 2014, 511:543-550. doi:10.1038/nature13385 (2014).

D'Angelo SP, et al. Incidence of EGFR exon 19 deletions and L858R in tumor specimens from men and cigarette smokers with lung adenocarcinomas. J Clin Oncol,2011,29:2066-2070.doi:10.1200/JCO.2010.32.6181 (2011).

Shaw AT, Engelman JA. ALK in lung cancer: past, present, and future. J Clin Oncol, 2013,31:1105-1111. doi:10.1200/JCO.2012.44.5353 (2013).

Shaw AT, et al. Crizotinib in ROS1-rearranged non-small-cell lung cancer. N Engl J Med, 2014, 371: 1963-1971.doi:10.1056/NEJMoa1406766 (2014).

Shaw AT, et al. Crizotinib in ROS1-rearranged advanced non-small-cell lung cancer (NSCLC): updated results, including overall survival, from PROFILE 1001. Ann Oncol, 2019, 30: 1121-1126.doi:10.1093/annonc/mdz131 (2019).

Marcus L, Lemery SJ, Keegan P, et al. FDA Approval Summary: Pembrolizumab for the treatment of microsatellite instability-high solid tumors. Clin Cancer Res, 2019, 25: 3753-3758.doi:10.1158/1078-0432.CCR-18-4070 (2019).

Mehrvarz Sarshekeh A, Overman MJ, Kopetz S. Nivolumab in the treatment of microsatellite instability high metastatic colorectal cancer. Future Oncol, 2018, 14:1869-1874. doi:10.2217/fon-2017-0696 (2018).

Overman MJ, et al. Durable clinical benefit with nivolumab plus ipilimumab in DNA mismatch nepair-deficient/microsatellite instability-high metastatic colorectal cancer. J Clin Oncol, 2018, 36: 773-779.doi:10.1200/JCO.2017.76.9901 (2018).

Cocco E, Scaltriti M, Drilon A. NTRK fusion-positive cancers and TRK inhibitor therapy. Nat Rev Clin Oncol, 2018, 15: 731-747.doi:10.1038/s41571-018-0113-0 (2018).

Hsiao SJ, Zehir A, Sireci AN, et al. Detection of Tumor NTRK gene fusions to identify patients who may benefit from tyrosine kinase (TRK) inhibitor therapy. J Mol Diagn, 2019, 21: 553-571.doi:10.1016/j.jmoldx.2019.03.008 (2019).

Ricciuti B, Genova C, Crino L, et al.Antitumor activity of larotrectinib in tumors harboring NTRK gene fusions: a short review on the current evidence. onco Targets Ther, 12:3171-3179.doi:10.2147/OTT.S177051 (2019).

Drilon A, et al. Efficacy of larotrectinib in TRK fusion-positive cancers in adults and children. N Engl J Med, 2018, 378: 731-739. doi:10.1056/NEJMoa1714448 (2018).

Doebele RC, et al. Entrectinib in patients with advanced or metastatic NTRK fusion-positive solid tumours: integrated analysis of three phase 1-2 trials. Lancet Oncol,2020,21:271-282.doi:10.1016/S1470-2045(19)30691-6 (2020).

Drilon A, et al. Entrectinib in ROS1 fusion-positive non-small-cell lung cancer: integrated analysis of three phase 1-2 trials. Lancet Oncol, 21: 261-270. doi:10.1016/S1470-2045(19)30690-4 (2020).

International C, Genome C, et al. International network of cancer genome projects. Nature, 2010, 464: 993-998. doi:10.1038/nature08987 (2010).

Cancer GA, Research N, et al. The cancer genome atlas pan-cancer analysis project. Nat Genet, 2013, 45: 1113-1120. doi:10.1038/ng.2764 (2013).

Audano PA, et al. Characterizing the major structural variant alleles of the human genome. Cell, 2019, 176: 663-675e619. doi:10.1016/j.cell.2018.12.019 (2019).

Jain M, et al. Nanopore sequencing and assembly of a human genome with ultra-long reads. Nat Biotechnol, 2018, 36: 338-345.doi:10.1038/nbt.4060 (2018).

Suzuki A, et al. Sequencing and phasing cancer mutations in lung cancers using a long-read portable sequencer. DNA Res, 2017, 24:585-596. doi:10.1093/dnares/dsx027 (2017).

Sereewattanawoot S, et al. Identification of potential regulatory mutations using multi-omics analysis and haplotyping of lung adenocarcinoma cell lines. Sci Rep, 2018, 8:4926. doi:10.1038/s41598-018-23342-1 (2018).

Huang FW, et al. TERT promoter mutations and monoallelic activation of TERT in cancer. Oncogenesis, 2015, 4: e176.doi:10.1038/oncsis.2015.39 (2015).

Norris AL, Workman RE, Fan Y, et al. Nanopore sequencing detects structural variants in cancer. Cancer Biol Ther, 2016, 17: 246-253. doi:10.1080/15384047.2016.1139236 (2016).

Nattestad M, et al. Complex rearrangements and oncogene amplifications revealed by long-read DNA and RNA sequencing of a breast cancer cell line. Genome Res, 2018, 28: 1126-1135. doi:10.1101/gr.231100.117 (2018).

Li H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics, 2018, 34: 3094-3100. doi:10.1093/bioinformatics/bty191 (2018).

Kataoka K, et al. Aberrant PD-L1 expression through 3'-UTR disruption in multiple cancers. Nature, 2016, 534: 402-406. doi:10.1038/nature18294 (2016).

Jiang W, et al. Cas9-assisted targeting of cHromosome segments CATCH enables one-step targeted cloning of large gene clusters. Nat Commun, 2015, 6: 8101. doi:10.1038/ncomms9101 (2015).

Gabrieli T, et al. Selective nanopore sequencing of human BRCA1 by Cas9-assisted targeting of chromosome segments (CATCH). Nucleic Acids Res, 2018, 46: e87. doi:10.1093/nar/gky411 (2018).

Yang W, et al. Immunogenic neoantigens derived from gene fusions stimulate T cell responses. Nat Med, 2019, 25: 767-775.doi:10.1038/s41591-019-0434-2 (2019).

Oikonomopoulos S, Wang YC, Djambazian H, et al. Benchmarking of the oxford nanopore minION sequencing for quantitative and qualitative assessment of cDNA populations. Sci Rep, 2016, 6: 31602. doi:10.1038/srep31602 (2016).

Seki M, et al. evaluation and application of RNA-Seq by MinION. DNA Res, 2019, 26: 55-65. doi:10.1093/dnares/dsy038 (2019).

Rodriguez J, et al. Chromosomal instability correlates with genome-wide DNA demethylation in human primary colorectal cancers. Cancer Res, 2006, 66: 8462-9468. doi:10.1158/0008-5472.CAN-06-0293 (2006).

Esteller M.Epigenetic gene silencing in cancer: the DNA hypermethylome. Hum Mol Genet,2007, 16: Spec No 1, R50-59. doi:10.1093/hmg/ddm018 (2007).

Herman JG,Baylin SB. Gene silencing in cancer in association with promoter hypermethylation. N Engl J Med, 2003, 349: 2042-2054. doi:10.1056/NEJMra023075 (2003).

Yang Y, et al. Quantitative and multiplexed DNA methylation analysis using long-read single-molecule real-time bisulfite sequencing (SMRT-BS). BMC Genomics,2015, 16: 350. doi:10.1186/s12864-015-1572-7 (2015).

Simpson JT, et al. Detecting DNA cytosine methylation using nanopore sequencing. Nat Methods, 14: 407-410. doi:10.1038/nmeth.4184 (2017).

Rand AC, et al. Mapping DNA methylation with high-throughput nanopore sequencing. Nat Methods, 14: 411-413. doi:10.1038/nmeth.4189 (2017).

Barbieri I, et al. Promoter-bound METTL3 maintains myeloid leukaemia by m(6)A-dependent translation control. Nature, 552: 126-131. doi:10.1038/nature24678 (2017).

Lin S, Choe J, Du P, et al. The m(6)a methyltransferase METTL3 promotes translation in human cancer cells. Mol Cell, 2016, 62 :335-345. doi:10.1016/j.molcel.2016.03.021 (2016).

Volden R, et al. Improving nanopore read accuracy with the R2C2 method enables the sequencing of highly multiplexed full-length single-cell cDNA. Proceedings of the National Academy of Sciences of the United States of America, 2018, 115: 9726-9731.doi:10.1073/pnas.1806447115 (2018).