用于评估女性卵巢癌风险的第二代多变量指标分析 (MIA2G)

作者:DDM 10448
2021-12-16

简介

为了提高需要切除附件肿块的女性的卵巢癌术前检测水平,我们开发了多变量指标分析(MIA)OVA1。2009年这项试验通过了美国食品和药物监督管理局(FDA)的批准,用于需要切除附件肿块的病例的术前风险评估,并且其效果在先前发表的两项临床试验中得到验证确认。MIA结合了来自Siemens BNII assay(Siemens,Malvern,PA)的载脂蛋白A-1、转甲状腺素蛋白、β-2-微球蛋白、转铁蛋白(TRF)和Elecsys检测癌症抗原125(CA125-II)的生物标志物浓度的结果。与临床评估、CA125-II或修订的美国妇产科医师学会(ACOG)Dearking等人的标准相比,阴性预测值(NPV)达到95%-98%,MIA在检测需要接受附件外科手术的患者的恶性肿瘤方面的灵敏度更高。然而,MIA分析的特异性不是很理想仅为43-50%,由于高假阳性率导致接受检查的人群中阳性预测值(PPV)为30-42%。这些结果预测的许多良性肿块的患者都可能被列为高风险患者,降低了整体的分诊效果。目前的研究的目的是评估第二代MIA(MIA2G)的临床有效性,其中MIA试验被重新设计以提高特异性和PPV,同时保持较高的灵敏度和NPV。我们在本文中报告的MIA2G试验相对于MIA提高了特异性和PPV,而不会影响检测灵敏度、NPV和对早期卵巢癌的检测。


材料和方法

MIA2G算法是从Ueland等人描述的预期使用该试验的人群中提取样本。这项专利算法是从共同作者使用的血清蛋白载脂蛋白A-1、CA125-II、人附睾蛋白4(HE4)、促卵泡激素(FSH)和TRF中取得的。


在确认研究中,使用了OVA500研究中一个独立的前瞻性采集样本的存档中的血清样本。本研究人群与OVA1关键研究采用相同的入选标准,并且作为MIA独立确认研究的一部分,本研究人群之前已对第一代血清生物标志物MIA进行评估。从全美27个研究站点前瞻性地招募符合标准的患者,这些站点都获得了机构审查委员会的批准。所有注册的临床医师都是非妇科肿瘤医师,尽管患者可能已经咨询过或接受过妇科肿瘤医师的手术。入选标准为:年龄为≥18岁的女性,签署过知情同意书,同意静脉切开术,并有盆腔肿块记录,计划手术治疗,3个月内接受过的影像学检查。盆腔肿块是在入选前通过影像学(超声、核磁共振)确认。排除标准包括过去5年中有恶性肿瘤诊断(记录非黑素瘤皮肤癌除外)或接受过妇科肿瘤医师干预的患者。绝经期被定义为绝经超过12个月或年龄大于50岁。收集的病例报告表格上包括人口学和临床病理学信息。


术前采集不超过80mL血样,采集后1-6小时内在采集现场冷冻血清。血清保本采用干冰储存运输至归档站点,接着融化后分成等份并随后储存在-65℃—-85℃的环境中。所有的血清等份只能融化一次,并在测试过程中完全被消耗掉,所以没有任何样品存在>2次冻融循环。MIA2G结合了载脂蛋白A-1、CA125-II、HE4、FSH和TRF的cobas生物标志物浓度的结果。载脂蛋白A-1和TRF为免疫比浊法试验;CA125-II、HE4和FSH试验采用电化学发光检测。


使用软件(OvaCalc,Version 4.0.0,Vermillion,Inc.,Austin,TX)计算MIA2G风险评分,该软件使用5个生物标志物值和专有算法返回无量纲数值评分,评分范围0-10.0。当MIA使用不同的截止值如≥5.0(绝经前)和≥4.4(绝经后)来区分高风险和低风险时,MIA2G使用≥5.0的单独的风险临界值,而无需考虑绝经状态。


在最初的OVA500试验中,临床医生被要求记录体检结果、家族史、影像学、实验室检测和正式的术前恶性肿瘤评估的结果。在由临床医生(非注册医生)进行正式评估的情况下,会记录其转诊医生及其做出预测的临床医生的专业,以及最终为每个病人进行手术的外科医生的专业。为了反映常规的临床判断和转诊行为,医生没有被要求遵循任何特定的预测算法或证实他们的预测。本试验使用相同的前瞻性医师评估(PA)预测恶性肿瘤,单独采用常规临床评估与MIA2G或结合PA进行比较。在每个招募站点记录术后病理诊断并独立复查。


编码样本的MIA2G评分和生物标志物值被提交给一个独立的临床统计学合同研究组织,应用临床信息(Bala Cynwyd,PA),在该组织内,它们被一个受试者鉴别工具匹配到病例报告表格中的信息并用于统计分析。单独为MIA2G、PA和MIA2G+PA计算临床诊断性能标准(PPV敏感性,特异性,NPV)。


分诊决策规则遵循之前为MIA制定的规则。当患者的MIA2G高风险评分或术前PA预测为恶性时,联合检测结果为阳性。因此只有当MIA2G和PA预测均为良性时,MIA2G+PA评分才会是阴性。符合研究招募/排除标准的OVA500人群的一个子人群具有先前MIA研究的评分,这些数据作为对照。


使用软件(SAS 9.2版或更高版本)进行统计分析。灵敏度定义为:(检测阳性/所有为确定恶性肿瘤的受试者)×100。特异性被定义为:(检测阴性/所有非恶性肿瘤受试者)×100。PPV被定义为:(真检测阳性/所有阳性受试者)×100。NPV是定义为:(真检测阴性/所有检测结果为阴性的受试者)×100。总体准确度定义为:(真检测阳性+真检测阴性)/所有受试者)×100。这些临床性能指标以百分数表示,然后是定义该测量的受试者人数,再然后是该测量的95%置信区间(CI)。


结  果

本研究采用前瞻性的标本采集,回顾性盲化评价设计,OVA500试验采用临床解析的血清。从2010年8月到2011年12月,共招募520名受试者,这些受试者都提供了样本。其中一名受试者被发现两次入选,所以对其余519人进行了分析。受试者被排除在最终分析之外的标准是:排除标准失败(招募窗口期前进行影像学检查,手术>12周,之前五年内患有癌症(n=12),主要接触的是妇科肿瘤(n=6),并且没有卵巢病理结果(n=8)。排除之后剩余的493完全可评价的患者进行了MIA2G评分检验。研究对象的人口统计学特征见表1。所有493名受试者的主要接触对象都是非妇科肿瘤医师。临床评估医师的专业是非妇科肿瘤医师的占249例,妇科肿瘤医师占244例。


表一总.jpg


所有受试者的病理诊断以及按绝经情况分层的受试者的诊断详见表1。总体而言,可评估患者的盆腔恶性肿瘤的患病率为19%(92/493)。其中,65例(13%)为侵袭性原发性卵巢恶性肿瘤,17例(3%)为恶性程度低的(边缘)肿瘤。盆腔恶性肿瘤也包括6个转移到卵巢的恶性肿瘤(1%)和4个非卵巢恶性肿瘤(1%)。绝经前受试者的总体患病率为11%,而绝经后受试者的患病率为28%。在可能的情况下,列出原发性卵巢恶性肿瘤的亚型、分期和分级。11例(48%)绝经前女性为早期侵袭性卵巢癌(I/II),24例(57%)绝经后女性为早期侵袭性卵巢癌为。总的来说,401名患者(81%)的疾病为良性。


表二.png

表2显示了MIA2G单独预测恶性肿瘤以及与PA联合预测恶性肿瘤的性能。综上所述,单独采用MIA2G的灵敏度为91%;MIA2G+PA的灵敏度为94%。PA之外增加MIA2G可以正确识别75%的PA遗漏的恶性肿瘤(McNemar测试的P<.001)。MIA2G+PA的NPV为98%。仅采用PA在正确鉴别良性疾病方面表现最好。


图1显示了所有可评估患者的ROC曲线,以及单独使用MIA2G或联合使用PA按绝经状态分层的患者的ROC曲线。ROC曲线来源于临床数据的逻辑回归。马赛克图(图1,D-I)叙述的是高危和低危检测结果与恶性和良性患者的混淆矩阵。这些图表显示了所有可评估女性以及绝经前和绝经后女性在5.0的固定临界值下的奸恶结果。PA和MIA2G在所有案例中的取得了72%的一致性。当PA与MIA2G结合时,灵敏度总体增加2%,特异性比单独使用MIA2G降低4%增加PA对绝经前女性的MIA2G(90%)检测灵敏度没有影响,但在绝经后的受试者中,灵敏度从92%升高到95%。绝经前患者与绝经后患者相比,MIA2G的特异性略高(分别为71%和65%),在增加PA(分别为67%和61%)的情况下,这种差异保持不变(表2)。


技术导航-4-图1.jpg

图1. 单独采用MIA2G以及联合PA的性能

MIA2G的受试者操作特征曲线(ROC):A 所有可评价的女性;B 绝经前女性;C 绝经后女性;单独采用MIA2G(蓝线)和MIA2G+PA(红线)的比较结果。ROC曲线为预测恶性肿瘤的逻辑回归所得。Mosaic临床性能标记图:D到F,仅采用MIA2G;G到I,MIA2G+PA。Mosaic标记图表示为:D和G,所有可评价女性;E和H,绝经前女性;F和I,绝经后女性。Mosaic标记图显示了每个分类中高MIA2G或MIA2G评分相关患者数量的比较。以及具有风险评分的患者的肿瘤是良性还是恶性。Sn灵敏度;Sp特异性。


表三.png

表3总结了根据在卵巢癌组织学亚型及国际妇产科联合会卵巢癌分期(2014年1月1日前)MIA2G对所有按绝经亚组分层的患者中表现。综上所述,MIA2G对上皮性卵巢癌的灵敏度为95%;绝经前女性灵敏度为100%,绝经后女性的灵敏度为93%。MIA2G对非上皮性卵巢癌原发性恶性肿瘤的灵敏度为80%,对低恶化潜在可能的肿瘤的灵敏度为82%。MIA2G对I期卵巢癌的灵敏度为86%,对II期卵巢癌的灵敏度为100%。


表四.png

表4显示的是在所有该血清样品亚组中所有可评价的受试者的MIA3G和MIA临床性能的比较结果,以及与发布的ACOG转诊标准(绝经前女性的≥200U/mL或绝经后女性的>35U/mL)相符的CA125-I临床临界值的。还评价了采用修订的ACOG标准替代绝经前女性≥67U/mL的效果。总之,MIA2G表现出与MIA几乎相同的灵敏度,总体上只少检测到1个恶性肿瘤案例。相比之下,MIA2G的特异性明显高于MIA,并且由于对良性条件下的女性检测性能提高,MIA2G的PPV明显高于MIA,而NPV保持不变。图2还显示了两种方法的比较,显示了所有可评估的女性以及绝经前和绝经后亚组的ROC曲线。值得注意的是,在所有可评估的女性中,MIA2G的ROC AUC均有统计学意义上的改善(MIA2G的AUC为0.924;95%置信区间,0.892-0.956;MIA的AUC为0.862;95%置信区间,0.814-0.911;(P<.001),绝经后女性(MIA2G的AUC,0.919;95%置信区间,0.878-0.960;MIA的AUC,0.855;95%置信区间,0.789-0.921;P<. 01)。绝经前女性的ROC AUC差异无统计学意义(MIA2G,0.921;95%置信区间,0.860-0.981;MIA的AUC,0.899;95%置信区间,0.830 -0.967;P>.1)。


技术导航-4-图2.jpg

图2. MIA2G和MIA的ROC曲线的比较

二代多变量指标分析(MIA2G)(蓝线)与MIA(红线)分析。A 所有可评价受试者;B 绝经前女性和 C 绝经后女性的受试者操作特征曲线。AUC,曲线下面积。


与MIA和MIA+PA相比,MIA2G(95% CI,7.6-17.1)和MIA2G +PA(95% CI,6.4-15.5%)的总准确度分别提高了12%和11%。这表明当MIA2G替代而没有PA的MIA时,61名受试者被从不准确的分类分入准确分类;当MIA2G替代包括PA+MIA替代时,54名受试者被从不准确的分类分入准确的分类。绝经前和绝经后受试者的准确性差异从MIA的10%下降到MIA2G的<1%。绝经后受试者的MIA2G准确率为73%(95% CI, 66.5-78.3%),绝经前受试者的MIA2G准确率为74%(95% CI,68.0-78.4%)。


对于所有可评估女性,单独采用CA125-II的灵敏度为76%(70/92;95% CI,66.4-83.6%),对68%的绝经前女性(临界值200U/mL)和80%的绝经后女性(临界值35U/mL)进行了分层。绝经前女性的特异性为96%;绝经后女性为92%。MIA2G检测出的早期原发性卵巢癌比CA125-II多7例。


评  论

为了改善附件肿块手术的分诊情况,MIA2G的设计侧重于下列关键属性:(1)高灵敏度检测,以避免遗漏任何应提交给专家具有高NPV的结果,以排除低风险结果的癌症;(2)特异性显著提高,减少了PPV结果的出现和升高情况,减少了良性卵巢疾病的误诊;(3)在单个临界值上协调工作,以消除在评估更年期风险方面的不确定性,并消除在患者测试中报告更年期状态的必要性。用于验证MIA2G的样本是前瞻性地从计划进行附件肿块手术的女性患者中收集的。基于OVA500试验的最终病理结果,本研究人群风险高且癌症患病率升高。这里报告的结果显示,MIA2G通过在多个属性上(包括或不包括PA、卵巢癌分期、组织学亚型、绝经前与绝经后状态)与MIA相比较,证明其临床表现等同于MIA或更好,从而实现了设计目标。


MIA2G高风险的结果(40% PPV)与2/5的恶性肿瘤几率相关;而低风险的结果表明98%的肿瘤是良性的。从而将更多的恶性肿瘤转诊到妇科肿瘤医生那里,将更多的良性肿瘤转移到妇科医生那里,有助于改善卵巢癌患者的预后,同时节省医疗费用,以及减少给良性肿瘤患者带来患者的不便和焦虑。MIA2G独立和联合PA均显示>90%灵敏度。值得注意的是,MIA2G显示出的灵敏度相当于或高于其他附件肿块分类的诊断工具,包括单独使用PA和各种CA125-II临界值。单独使用MIA2G与MIA、CA125-II或PA时,NPV均无明显变化。总体而言,MIA2G将较少的恶性肿瘤归类为高风险。MIA2G(假阴性检测)将8例低危恶性肿瘤分为1例非卵巢转移性肿瘤、3例低恶性几率肿瘤、3个I期上皮恶性肿瘤、1个I期非上皮恶性肿瘤。在这8个细胞中,2个被PA(均为1期上皮细胞)归类为高风险,其余6个被PA归类为低风险。PA未能预测92例恶性肿瘤中的24例,假阴性率为26%。MIA2G的假阴性率仅为9%,而MIA2G+PA显示的假阳性率为7%,与PA相比下降了75%。


使用目前的诊断工具和指南预测早期癌症尤其困难。 MIA2G对I期原发性卵巢癌的总体灵敏度与所有卵巢癌分期无统计学差异。对于绝经前和绝经后的妇女,I期和所有早期癌症的灵敏度相同,表明无论绝经与否灵敏度保持不变。表明MIA2G可能是治疗早期卵巢癌的有效工具,在早期卵巢癌的治疗中,干预被证明是最有效的。I期卵巢癌的5年存活率为90%,II期为70%,III期和IV期分别为39%和17%。


所有的浆液性肿瘤在这项研究中被列为高级别恶性肿瘤,MIA2G+PA检出了所有此类肿瘤。MIA+PA遗漏了1例,对于此类关键亚型,灵敏度一致。总体而言,MIA2G与MIA一样,在附件恶性肿瘤的存在的条件下具有高灵敏度且明显和PA相互补充。


虽然高灵敏度和NPV是卵巢癌术前治疗的先决诊断,但MIA适中的特异性和PPV可能会对有效的分类造成障碍。事实上,尽管妇科肿瘤学会发表了一份关于MIA的有利声明,但美国国家综合癌症网络和ACOG等其他20个指南却没有遵循该标准。在本研究中,MIA2G在没有PA补充的情况下特异性比MIA增加15%,与PA结合时增加14%。因此,单独使用MIA2G鉴别的低风险的患者总数从45上升高58%,增加了13%。但在这个人群中,MIA2G的NPV是97%, MIA的NPV是97% MIA。结果表明,MIA2G可能会大幅增加全科医生招募当地治疗的患者的比例,同时在被归类为低风险的病人中维持相当低的恶性肿瘤的可能性。


结论:与MIA相比,MIA2G的特异性和PPC显著较好,灵敏度和NPV没有显著差别。第二代试验显著提高了MIA分诊的效果,而无损对效果十分关键的高灵敏度和高NPV。