多指标检测结合算法分析在女性健康中的应用

作者:DDM
2021-12-16

前  言


对许多疾病尤其是癌症而言,单独依靠任何一个单一生物标志物试验都不能提供可靠的临床灵敏度和特异性。为了获得更加合理的临床结果,临床实验室转而结合多种生物标志物检测结果来揭示患者的真实状况。


多指标检测结合算法分析(MAAAS)在解决这一问题时被反复提及,这些试验结合两个及以上的生化或分子标志物的检测结果来获得患者的真实情况和临床信息,并将这些信息纳入算法生成目标疾病临床、预后和预测性信息。由于单一的生物标志物试验的临床灵敏度和特异性不高,MAAAs能通过个体化的风险评估改善疾病监测。


基于是否具有专有算法,MAAAS被分为2大类。具有专有算法的MAAAS例如GenPath的4KScore和Vrrtmilion的OVERA,这两组试验分别用来对前列腺癌和卵巢癌进行风险评估。FDA可能会批准具有专有算法的MAAAS,但也可能不批准,有些试验仅允许在实验室内执行。FDA有批准一些源自商业实验室的具有非专有算法的MAAAS。具有非专有算法的MAAAs例如贝克曼库尔特的前列腺健康指数(PHI)和雅培的卵巢恶性肿瘤风险算法(ROMA),这二者分别用于前列腺癌和卵巢癌的风险评估。


近年来人们热衷于为多种疾病开发MAAAS并进行临床应用,这些疾病包括癌症、急性肾损伤、败血症和先兆子痫等等。然而,产科已经使用MAAA作为筛查和鉴别先天缺陷风险升高如21三体综合症等疾病的标准工具三十多年了。本文要讨论的是与女性健康相关的MAAAS。


卵巢癌


患有附件肿块并疑似卵巢恶性肿瘤的女性可以因就诊妇科肿瘤医师进行手术干预而获益,如果这些女性被分诊到相应附属科室则可以改善患者预后。大部分肿块都是良性的,恶性肿瘤的发生率为13%-21%。对医师而言,准确区分患有良性和恶性疾病的女性无疑是不小的挑战。曾经,医师采用癌胚抗原125(CA-125)来诊断卵巢癌。但是由于这种标志物的诊断灵敏度和特异性都不高,实验室和诊断试剂制造商引入算法来评估出现附件肿块的女性罹患恶性疾病的风险,这些算法包括恶化风险指数(RMI)、OVA1、OVERA和ROMA(表1)。医师将RMI与CA-125、超声检查和更年期状况相结合对手术患者进风险分层,对其他女性,则使用多种血清标志物进行评估,详见下文。


表1.png


2009年,FDA批准了OVA1用于在手术前评估附件肿块为良性或恶性。OVA1是结合血清CA-125浓度、转铁蛋白、转甲状腺素蛋白和载脂蛋白A1、β2微球蛋白以及更年期状况形成的一种专有算法,该算法可以得出0-10的风险评分。OVA1评估患有附件肿块女性的疾病恶变率的灵敏度为92%,而CA-125的灵敏度仅为74%。但是OVA1的特异性较差仅为54%,假阳性率较高,阳性预测值仅为31%。


2016年,FDA批准了OVERA——第二代OVA1,OVERA替代了OVA15种标志物中的2种(转甲状腺素蛋白和β2-微球蛋白),改为人附睾蛋白4(HE-4)和卵泡刺激素(FSH),而且不需要了解更年期状态。OVERA的特异性达到了69%,但灵敏度不变。这两种试验都采用预设的临界值对女性患者进行分类,可以将患者分为低风险和高风险组。


Fujirebio Diagnostics在2010年引入了ROMA——一种非专有算法MAAA。该MAAA利用血清CA-125以及HE-4浓度以及更年期状况对患有卵巢癌需要手术的女性进行分类,可以将患者分为低风险和高风险组。


采用ROMA临界值进行的高、低风险组分类更强调特异性。在特异性为75%时,绝经前和绝经后女性的灵敏度分别为92%和77%。在灵敏度相同时,ROMA的特异性比CA-125更高。


一项结合OVA1和ROMA的前瞻性研究,在146名接受手术确认恶性肿瘤的患者中,OVA1判定肿瘤是否为恶性的灵敏度高于ROMA(97% VS 87%)。但是ROMA的特异性比OVA1更高(83% VS 55%)。美国妇产科学会(ACOG)发布的指南中,将结合使用这两种方法评估附件肿块列为推荐等级B。建议临床医师参考绝经期前或绝经期后状态采用OVA1和ROMA评分对患有附件肿块的女性进行分诊,判定其是否应该去看妇科肿瘤医师。


乳腺癌


医师利用MAAA作为乳腺癌的预后工具,并基于患者的自身生物学特征为患者定制治疗方案。曾经,医师采用免疫组化(IHC)并结合肿瘤大小、肿瘤等级和淋巴结状态形成的数据作为指标指导乳腺癌的治疗。该方法检测雌激素受体(ER)、孕酮受体(PR)和人表皮生长因子受体2(HER2)指导特殊靶向疗法的使用。


maaaa-1.jpg


尽管免疫组化能区分乳腺癌亚型并有助于确定合理的疗法,但是基因表达分析可以获取更多的癌症分子生物学信息,更有助于预测预后和定制疗法。一些基因表达图谱试验目前已经用于乳腺癌患者的诊断,这些方法是对现有技术的补充。


通过这些检测,多种基因的表达水平,单独或结合肿瘤大小或淋巴结状态等信息,就可以通过算法获取乳腺癌患者的预后和预测信息。这些算法生成能把肿瘤分为低、中和高风险的分类——在MammaPrint试验中,患者仅被分为具有良好或不良预后特征的组。该分类与癌症的5-10年复发可能性有关。


基因表达图谱检测还与助于预测患者是否可以因标准激素疗法之外的辅助疗法而受益。处于低风险组的患者很可能在单独采用激素疗法时反应良好,就不再需要辅助化疗。例如在诊断为ER阳性和淋巴结侵入阴性的乳腺癌患者中,Oncotype DX乳腺癌试验可以将基因表达图谱与复发评分(RS)相结合将结果报告为0-100的数字。RS评分较低意味着患者采用辅助化疗获益的可能性很小,因为癌症复发的可能性较低。反之,如果患者的RS评分较高则意味着患者很可能因辅助化疗而获益,因为患者癌症的复发风险较高。当患者的RS值适中(11-25)时,则表明患者能否因化疗而受益的结果不明。一项研究将6711名荷尔蒙受体阳性、HER2阴性、腋下淋巴结阴性且RS值介于11-25之间的女性患者随机分入2个治疗组,这两组分别采用内分泌疗法或内分泌疗法结合化疗。研究结果发现RS值适中的患者不会因辅助化疗而受益,这两个研究组的总存活率相似(93.9% VS 93.8%)。


一些乳腺癌MAAAS如Prosigna能区分乳腺癌的分子亚型。该试验基于50-基因分类算法,该算法与肿瘤大小、淋巴结状态等临床信息相结合,可用于绝经后荷尔蒙受体为阳性的乳腺癌患者。


该试验可将乳腺癌分为4种类型:管腔上皮A型、管腔上皮B型、HER2聚集型和基底样型,每种类型都有不同的预测。例如,管腔上皮A型治疗的典型特征为低扩散性和高荷尔蒙受体表达。该种类型与低风险评分和良好预后有关。而管腔上皮B性的特征就是高扩散性,患者需要接受辅助化疗。


乳腺癌基因表达谱试验的结果会由于基因类型、分析平台、试验开发和确定时采用的患者人群不同而有显著差异。这些基因与细胞增殖、肿瘤生长、存活以及管家基因有关。5-70个基因之间的基因型范围取决于试验(见表2)。


表2.png


试验的仪器平台也会不同。Oncotype DX、Breast Cancer Index以及EndoPrint使用定量逆转录聚合酶链反应试验,而MammaPrint、BluePrint和TargetPrint采用微阵列试验。这些试验分析的基因不同,采用的方法学的不同都可以导致相同患者出现不同的结局。


一项在相同患者人群中比较Oncotype DX试验和Prosigna试验的研究发现了风险分层的重大不同点。尽管这两项试验在高风险和低风险RS组的相关程度超过80%,但是研究发现这两种试验对RS适中组的检测结果仍有巨大分歧。


在对RS值适中组的患者进行分类时,Prosigna将半数以上的患者分入低风险组,而Oncotype DX则将这些患者分入高风险组,基于肿瘤专家的治疗意见这两种试验结果的不同可以导致患者出现截然不同的治疗结局:RS适中组一半的患者可能因Oncotype DX的检测结果而接受化疗,但是基于Prosigna试验的结果,他们可能不需要接受化疗。


这样的检测结果会让临床医师更加迷惑并影响患者结局。因此需要临床实验室和医师严谨地评估确定的临床数据,并理解因为方法学不同导致不同的风险分层之间的差异。


maaaa-2.jpg


有关女性健康的新型MAAA


欧洲的一种新型MAAA应用用于检测先兆子痫(PE)。孕妇的PE的发生率为2%-3%,是导致母亲和婴儿发病和死亡的主要原因。严重的PE导致37周以下胎儿早产。传统的PE筛查方法通过母亲的人口统计学资料和病史推断,这也是ACOG推荐的唯一方法。风险因素包括未产妇、高龄产妇(年龄大于40岁)、BMI≥35kg/m2,采用试管婴儿方法受孕、PE史、PE家族史、慢性高血压、慢性肾病、糖尿病、系统性红斑狼疮或易栓体质等。


在英国,英国国立健康和临床优化研究所(NICE)将发展为PE的高风险定义为存在任意一个高风险因素或任意两个中等风险因素。高风险因素包括孕前高血压病史、慢性肾病、糖尿病或慢性高血压。中等风险因素包括首次妊娠、高龄产妇、两次怀孕间隔大于10年、首次就诊BMI大于等于35kg/m2或家族PE史。ACOG的筛查方法和NICE将每种风险因素视为独立的筛选试验提高了PE诊断率和筛查阳性率。


与传统的PE筛查方法不同,MAAA检测可以形成患者特异性风险评分。MAAA检测可以通过不同的生化和生物学测量结果得出患者的“优先风险”来确定PE筛查风险,该方法采用和母体血清非整倍筛查类似的方法。研究者已经鉴别出怀孕11-13周时5种有用的生物标志物:平均动脉压(MAP)、子宫动脉搏动指数(UtA-PI)、胎盘生长因子(PlGF)和妊娠相关血浆蛋白A(PAPP-A)。


英国的一项多中心研究评估了20168名怀孕11-13周的孕妇。使用基于MAAA的筛查方法获得的PE检测率优于NICE建议的方法。NICE推荐方法的检测率为40.8%,MAAA方法中结合母体因素、MAP和PAPP-A的检测率为54%;母体因素MAP、PlGF相结合的检测率为69%;母体因素、MAP、PlGF和UtA-PI相结合的检测率为82%。


另一个由胎儿医学基金会研发的多变量算法,变量包括母体因素、MAP、UtA-PI和PlGF。在一项涉及35948名怀孕11-13周的孕妇的多中心研究中,MAAA对PE的检测结果优于ACOG和NICE建议的方法。MAAA对PE的检出率为孕期低于32周时,可达100%;低于37周时为75%;高于37周时为43%;假阳性率为10%。ACOG方法对PE的检测率为孕期低于32周时为94%;低于37周时为90%;达到或高于37周为89%;假阳性率为64%。NICE对PE的检出率为孕期低于32周时,为41%;低于37周时,为39%;达到或高于37周时,为34%;假阳性率10%。


尽管使用MAAA筛查PE不是目前的临床实践的标准,但是数据表明生物标志物结合母体因素的筛查效果远高于仅使用母体因素。


maaaa-3.jpg


结  论


MAAA检测领域多样而复杂。多个生化或分子指标结合算法并联合或不联合临床信息可以对患者的疾病进行个体化评估。关于MAAA的临床应用潜力,FDA认为其会产生深远影响但风险也较高。一些MAAA是实验室开发的或正在开发中,由于从事开发工作的公司和实验室不同,最终用户可能无法获得特定分析的性能或临床参数。一些公司和实验室可能不具有反映这些检测潜在风险的数据,如假阴性率和假阳性率。


FDA批准的MAAA都具有可接受的临床灵敏度和特异性。但是不同试验间的差异可能会影响临床决策的制定,临床医师必须密切注意试验间的差异。


人们对MAAA的关注程度日益增加会让越来越多的MAAA出现,但保险的覆盖仍存在障碍。公共医疗目前尚不能报销MAAA的算法部分费用,但此类问题正在逐步得到解决。目前有23种MAAA有CPT代码。其中一些MAAA由免疫或质谱试验检测的生物标志物组成,此类MAAA可结合或不结合临床信息,其他MAAA则由分子遗传标志物组成。


检测指标的科学进步与疾病的复杂程度和患者对治疗的反应有关,临床和分子病理学技术的进步将进一步驱使MAAA的开发和应用。新型MAAA能否促进诊断决策的制定并指导治疗,而且能在临床实验室进行日常应用并成为改善女性健康的护理标准,我们将拭目以待。