临床实验室智能化机器学习预测检测结果对临床诊断决策的价值

作者:Yuan Luo
2021-12-16

作者:Yuan Luo, MS, Peter Szolovits, PhD, Anand S. Dighe, MD, PhD, 和Jason M. Baron, MD

【摘要】目的 虽然临床实验室将大多数检测结果报告为单独的数字、发现或观察结果,但临床诊断通常取决于多项检测结果。整合了实验室数据多个元素的临床决策支持可能有助于提高实验室诊断。方法 利用检测指标铁蛋白进行概念验证时,我们提取了患者的临床实验室检测数据,并应用各种机器学习算法,通过其他检测结果来预测铁蛋白的检测结果。我们比较了预测结果与测定结果,并回顾了选择的病例以评估预测铁蛋白的临床价值。结果 结果证明,患者的基本资料和其他实验室检测结果能够很准确地区分正常与异常铁蛋白结果(曲线下面积高达0.97,留出法测试数据)。病例回顾表明预测铁蛋白结果有时候比测定铁蛋白更能反映患者的潜在铁状态。结论 这些发现提醒患者检测结果中存在大量的信息冗余,并为一种新型临床决策支持提供了潜在基础,这种临床决策支持旨在整合、解读和提升临床实验室检测结果中多种检测项目组合的诊断价值。

【关键词】机器学习;铁蛋白;临床决策支持;统计诊断;填补方法;计算病理学

临床实验室将大多数检测结果报告为单独的数值或类别值。然而,单独看某个检测结果,其诊断价值有限。为了充分利用检测结果进行患者诊断和管理,临床医生通常必须将患者的许多单独的检测结果整合起来,并结合临床数据和医学知识、判断和经验来进行解释。尽管这种人为将检测结果进行整合解读的方法是当前大多数病例的标准做法,但实验室数据整合及分析的计算方法为提升诊断价值提供了巨大潜力。尤其是当许多患者会有连续多年的几百或几千个单独的检测结果,临床医生容易忽略对这些实验室数据集综合分析得出关键结果或重要模式和趋势。此外,重要的诊断信息有时候包含在许多数据元素的微妙或复杂模式中,不借助计算方法难以鉴别。再者,人类大脑在同时考虑大量数据点时面临巨大挑战,即使是最有经验的临床医生,也无法从现有的临床和实验室数据中提取出所有有用的信息。

电子临床决策支持是完善检测结果解读和提高效率的重要工具,利用这个工具可以将诊断数据转化为有用的信息。例如,我们在实验室信息系统中开发和实施了一种算法,以识别具有上升趋势和提示急性肾损伤的肌酐结果并发出警告。同样,我们还证明了可以利用相同样本中其他分析物的测定结果来鉴别假性升高的血糖结果。

虽然基于规则和基于统计学的算法均可以作为临床决策支持的基础,但最常用的决策支持是基于规则的算法。基于规则的算法比统计学算法更易开发、验证、实施和解释,通常可以直接改自指南或文献。但是,临床实践中应用的大多数基于规则的算法是以先前的既定知识为基础来提供决策支持的。相比之下,统计学方法提供了一个将知识发现与知识应用结合起来的机会,从而以先前未知的模式来提供决策支持。

我们在本文中描述了一种对检测结果进行统计学整合的新框架,并且作为概念验证,我们将这个框架用到了接受铁蛋白检测的患者中。铁蛋白是铁储备的标志物,用于诊断铁缺乏症,但仅依靠铁蛋白进行诊断具有误导性。例如,铁蛋白在炎症情况下会升高,那么发生炎症反应的铁缺乏症患者可能获得正常的铁蛋白结果。在本文中,我们首先设想并检验了以下假设:可以根据同一患者的其他检测结果预测该患者的铁蛋白结果。我们证实了这一假设,结果表明,鉴于与其同时进行的其他检测,铁蛋白所提供的信息通常是冗余的。然后,我们研究了铁蛋白和预测铁蛋白不一致的情况,并发现预测铁蛋白在这些情况下可能具有诊断价值。最后,我们提出了这种统计学方法可以用于临床决策支持的三个策略。

一、材料和方法

1. 数据:本研究使用了马萨诸塞州总医院(MGH)的检测数据。MGH是一家位于马萨诸塞州波士顿的三级医院,拥有989张床位。我们在获得医院的机构评审委员会批准后进行了数据收集。数据集包括2013年3个月内收集的所有门诊铁蛋白结果。每个铁蛋白结果都与患者的年龄、性别以及相同标本(患者、日期、时间组合)的“预测变量检测”(predictor test)结果相关联。在极少数情况下,一位患者在同一日期和时间具有不止一个检测结果,则使用均值。由于我们所用的数据提取方法的限制,数值为0的实验室结果(有核RBC除外)从分析中被排除并视为数据缺失。完整的预测变量检测列表见表1。仅包括在医院实验室执行的检测结果;排除即时检验(POCT)结果和在附属医疗中心的卫星实验室执行的检测结果。最终数据集排除了未包含至少两个预测变量检测的数据。按照7:3的比例将案例随机分为训练集和测试集,最终训练集包含3590例,测试集包含1538例。由于数据集相当大,我们认为仅靠随机选择就能够确保训练集和测试集之间相似性的可接受程度,并未进行任何特别分类。补充图1(所有补充材料均可在线访问《美国临床病理学期刊》)为训练集和测试集中铁蛋白数值的Q-Q图,有助于证实训练集与测试集中铁蛋白值的分布十分相似(见表1)。

78.png

2. 数据转换:许多实验室检测的结果都接近对数正态分布。在回归分析中,仅在目标变量采用正态分布的前提下,最小化均方根误差才等于最大似然估计。因而,我们利用自然对数转换方程转换铁蛋白值:y=ln(1+x),其中y是转换的铁蛋白值,x是原来的铁蛋白值。补充图2为Q-Q图,显示铁蛋白值呈近似对数正态分布。我们将这种转换反用于对数铁蛋白的预测值(预测方法概述见下文),以计算未转换单位的预测铁蛋白值。

3. 填补和预测方法概述:我们的大多数分析依靠一个分两阶段的程序。在这个程序的第一个阶段,我们填补了除铁蛋白以外(预测变量检测)的缺失检测结果(未执行检测)。然后,在第二个阶段,我们利用预测变量检测的测定值和填补值,结合年龄和性别来预测铁蛋白检测结果。在这个阶段,我们会预测铁蛋白值(“回归”)以及铁蛋白结果是正常还是异常(“分类”)。虽然根据入选标准,实际上数据集中并没有缺失铁蛋白检测结果,但是我们通过掩盖数据中的铁蛋白结果并将预测铁蛋白结果与掩盖(测定)的结果相比较,评估预测模型的性能和铁蛋白的可预测性。掩盖的测定值在模型性能评估中被视为“基础真值”(ground truth)。填补阶段是必要的,因为第二阶段所用的预测算法无法直接适应预测变量的缺失数据。我们的数据集,像临床实践中获得的大多数临床和实验室数据集一样,包含很多缺失值(残缺项),这在我们的特定分析中代表未执行检测。填补步骤使我们能够通过挖掘各检测结果之间的观测关联(并结合年龄和性别)来推断缺失值,然后将第二阶段所用的预测方法用于我们的数据集。

更具体地说,我们使用了4种不同的填补方法和5种不同的预测(回归或分类)方法。此外,我们用两个不同的预测变量集,训练和测试了每个回归和分类模型的性能。第一个预测变量集仅包含患者的基线数据(年龄和性别)及实验室检测结果,并未区分测定的结果(执行了检测)与填补的结果(未执行检测)。第二个预测变量集在第一个预测变量集的基础上还增加了一组二分变量,说明每个检测结果是测定值(执行了检测)还是缺失值(未执行检测,因此需要填补结果)。我们把仅经过基线数据和实际或填补检测结果训练和测试的模型称为“无残缺项的预测变量集”,把经过基线数据、实际或填补检测结果、以及表明结果为测定值或缺失值(填补值)的二分变量训练和测试的模型称为“有残缺项的预测变量集”。

对于每个预测变量集(2个),我们将每种填补方法(4种)与每种预测方法(5种)进行配对,共产生了40个预测铁蛋白结果的数据集(4*5*2)。使用的4种填补方法和5种预测方法将在下文进行描述。除非另行说明,否则我们用术语“填补”(和“填补方法”)表示缺失预测变量的预测,用“回归”表示铁蛋白数值的预测,并用“分类”表示铁蛋白结果是否正常的预测。

4. 填补方法:使用以下4种填补方法:均值、基于链式方程的多重填补-完整(MICE-full)、基于链式方程的多重填补-选定(MICE-sel)和missForest算法。均值填补方法用每个变量可用值的均值来填补缺失值。MICE-full、MICE-sel和missForest则使用MICE和missForest R包完成(https://cran.r-project.org/)。这些技术在补充方法部分进行了更详细的介绍。将训练数据和测试数据合为一个数据集进行填补,但是在填补之前排除了测试案例所得的铁蛋白结果。这样,填补步骤才不会“泄漏”测试数据集的铁蛋白信息。因此,过度拟合不应使测试数据的分类或回归性能出现偏差,并且测试数据集评估应提供普遍性能的无偏差估计。MICE-full、MICE-sel和missForest旨在提供非确定性输出,以模拟缺失值的不确定性。为了捕获这种不确定性,我们对每个填补算法进行了100次随机初始化,以生成100个填补数据集。相关性和曲线下面积(AUC)的报告值以及灵敏度和特异性的绘制值代表100次填补运行中每个统计量的均值。报告或绘制的预测铁蛋白数值代表100次填补运行的中位数。

5. 回归:使用的4种回归技术为线性回归、贝叶斯线性回归、随机森林回归(RFR)和套索回归(lasso)。我们使用Scikit-learn Python包进行回归分析(http://scikit-learn.org)。有关填补和回归方法的更多技术细节在补充方法部分提供。

6. 分类:铁蛋白结果分为正常(在MGH中心实验室设定的正常参考范围内)或异常。MGH设定的正常铁蛋白下限是女性10ng/mL、男性30ng/mL。虽然铁蛋白也有参考上限(女性200ng/mL、男性300ng/mL),但是我们的目标是鉴别铁缺乏症,所以只有低铁蛋白结果才被视为异常。使用Python Scikit-learn包中实现的逻辑回归进行分类。通过改变逻辑回归将结果归为异常的概率阈值来生成受试者工作特征(ROC)曲线。

7. 单变量分析:为了评估每个预测变量检测对预测铁蛋白的作用,我们计算了每个分析物与对数铁蛋白之间的相关性,用Pearson相关系数r表示。我们还计算了每种检测指标所解释的对数铁蛋白方差百分比(R2),以及每种分析物区分正常与异常铁蛋白值的能力,用AUC(c-统计量)表示。单变量分析基于成对的完整案例,并在R包中完成分析。

8. 案例审核:我们对选定的案例(如结果部分所述)进行了详细的图表审核。由两名病理医师(J.M.B.和A.S.D.)对每个选定案例进行独立审核,他们根据每位患者的电子病历,包括医嘱和铁蛋白检测前后及同时执行的实验室检测结果,来评估患者的潜在铁状态。请注意,病理医师在审核时使用了计算方法无法获得的信息(包括将来的进展),审核结果可作为参考与预测铁蛋白结果相比较。   

二、结果

97%的患者数据收集,除了测定的门诊铁蛋白结果,均包含至少另外两个预测变量检测并被纳入最终数据集。最终数据集由5128个检测结果组成,被随机分为训练集(3590个结果)和测试集(1538个结果)。除了铁蛋白相关检测,在40个其他检测中,每位患者执行的检测中位数为23(四分位距[IQR],11-31)。表1列出了预测变量检测。对于每个预测变量检测,表1还列出了缺失值(并因此需要填补)的百分比、研究人群的中位数和四分位距、以及成人参考范围。图1给出了原始数据并揭示了铁蛋白与其他检测之间的相关性。

70.jpg

图1. 数据集概览和相关性。在此热图中,行代表预测变量(全称见表1),列代表患者案例。单元颜色基于结果分位数(例如,第75百分位=0.75),缺失结果用白色表示。参数按照与铁蛋白的相关性递增排列,案例按照从最低到最高铁蛋白排列。

首先,我们通过检查相关统计量(所有预测方法)和表明测定与预测铁蛋白值之间关系的散点图(选定方法)来说明铁蛋白的可预测程度。其次,我们展示了分类算法预测铁蛋白是否异常的能力,预测质量用AUC衡量。最后,我们展示了每个预测指标与铁蛋白之间的单变量相关数据,以及选定案例的图表审核结果。

1. 铁蛋白数值的可预测性(回归):我们对训练数据和留存法测试数据部分应用了16种不同的填补-回归配对,以鉴别表现最佳的方法。补充表1显示了每对填补-回归方法的测定与预测铁蛋白(均为对数转换)之间的相关性。在无残缺项的数据集中,对留存测试数据表现性能最佳的方法为MICE-sel填补法和RFR,相关系数为0.732。missForest填补法和lasso回归方法对的表现与之相似,在无残缺项的预测变量集的测试数据中相关系数为0.729。我们选择lasso-missForest方法对作为附加评价的基础,包括后面描述的案例研究。

lasso-missForest方法对的回归和偏差图如图2所示,证明了铁蛋白具有很强的可预测性。

71.jpg

图2. 根据留存法测试数据预测的铁蛋白值的回归和偏差图。所示回归图(A,男性患者;B,女性患者;C,偏差)是根据留存法测试数据,使用missForest填补法与lasso回归法(无残缺项的预测变量集)预测的铁蛋白值绘制的。回归图中的黑色水平线和垂直线代表正常范围的下限。请注意,轴线为对数刻度或者绘制的是对数转换数据。 

2. 铁蛋白分类的可预测性:在临床决策中,判断实验室数值的一个关键点往往是结果是否在正常参考范围内。因此,我们想确定我们能不能准确地预测结果是否在正常范围内。图3是ROC曲线,显示了每种填补方法(共4种)和逻辑回归方法根据独立的测试数据进行异常铁蛋白分类的可预测性。总体来看,missForest填补法的性能最好。missForest填补法与逻辑回归方法结合,对有无缺失项的预测变量集进行铁蛋白结果分类时AUC分别达到0.96和0.97。进行回归分析时,有缺失项的预测变量集提供的附加信息价值有限或没有价值。作为阴性对照,对两个预测变量集进行了分类,将铁蛋白结果随机重新分配在患者的预测变量数据中。重新分配后的数据集的ROC曲线如补充图3所示,并且如预期一样,AUC值约为0.5。

72.jpg

图3. 根据留存法测试数据进行铁蛋白分类的受试者工作特征(ROC)曲线,基于假阳性率(1-特异性)绘制填补法加逻辑回归法鉴别异常结果的灵敏度。曲线基于留存测法试数据的预测性能,A和B图分别为无残缺项和有残缺项的预测变量集的ROC曲线。曲线用逻辑回归之前所用的填补方法来表示。

3. 单个分析物的影响:难以解释填补-回归分析中单个分析物的回归系数,因为回归分析既使用了测定值又使用了填补值,因此每个分析物的系数不是仅基于该分析物的测定值。此外,共现性和正则化(regularization)很可能进一步扭曲了回归系数。因而,为了评估单个分析物对铁蛋白预测的潜在影响,我们执行了一系列的单变量分析,如表2所示。我们在本文中呈现了每个分析物的非缺失值与铁蛋白(对数转换值)的两两相关性。同样,为了评估单个分析物区分正常与低铁蛋白结果的能力,表2列出了单个分析物的单变量AUC(c-统计量)。果然,总铁结合力、平均血红蛋白量和平均血红蛋白浓度在分类和回归方面是最有信息价值的指标。

79.png

4. 选定案例审核:假设在某些案例中,预测铁蛋白比测定铁蛋白更能反映患者的铁状态,如图4所示,我们在留存法测试数据集中发现了26个(1.7%)预测铁蛋白与实际铁蛋白高度不一致的案例。在这种情况下,我们把“高度不一致”定义为,在使用missForest填补法和lasso回归进行预测时(使用如前所述在训练数据上训练的模型系数),实际铁蛋白与预测铁蛋白相差10倍或以上。在这26个案例的4例中,预测铁蛋白低于30ng/mL,而测定铁蛋白则高出一个数量级。在这4例中,预测铁蛋白指示铁缺乏症,而实际铁蛋白则没有。因此,我们详细审核了这些案例。在剩下22个案例中,预测铁蛋白高于30ng/mL,预测铁蛋白与实际铁蛋白之间的差异不太可能造成错误分类,所以我们将审核重点放在预测铁蛋白低于30ng/mL的4位患者身上。

73.jpg

图4. 临床审核选定的案例。上图为案例审核的概述。如图所示,预测铁蛋白有时候比测定铁蛋白更能反映患者的潜在铁状态。有关每个案例的更多细节请参见正文和补充结果。

虽然第一位患者(患者1;所有4位患者的更多案例信息请参考补充案例研究)的测定铁蛋白在正常范围内,但根据两位病理医师对病历的审核结果来看,几乎可以确定该患者有铁缺乏症。这位患者的预测铁蛋白无疑更能反映其真正的铁状态。第二位患者(患者2)近期刚刚完成静脉铁剂输注,正处于铁缺乏症的恢复期。预测铁蛋白可更好地反映患者2的铁储备状况或者至少表明患者2的潜在铁状态不是完全正常的。第三位患者(患者3)只有两个预测变量检测可用,因此算法用于预测的数据有限。未来的决策支持算法很可能会排除缺少充分预测信息的患者,如患者3。第四位患者(患者4)具有铁缺乏症历史,尽管在检测时可能不是铁缺乏症,但其血液分析结果较复杂(见补充部分的案例描述)。因而,即使是患者4(测定铁蛋白更好地反映患者当前的铁状态),预测铁蛋白也提供了重要的提示:这个案例更复杂,需要考虑测定铁蛋白以外的更多信息。

三、讨论

这些发现支持我们的假设,即在大多数情况下,考虑到其他可用的检测结果,铁蛋白所提供的信息通常是冗余的。尤其是,我们发现共存数据可高度准确地区分正常与异常铁蛋白结果,AUC高达0.97。铁蛋白数值的预测准确度为中等。结果证明,至少在某些情况下,预测铁蛋白可更好地反映患者的潜在铁缺乏状态。通过更大规模的案例审核在临床上验证预测铁蛋白的价值,也是未来研究的重要方向。

虽然我们的方法有可能发现不同实验室数据元素之间的未知关联,但是铁蛋白的可预测性并不令人惊讶。作为急性相反应物,已知铁蛋白会随其他炎症标志物升高而升高。同样,铁蛋白也会随其他铁缺乏症标志物(如红细胞平均体积)降低而降低。更广泛地说,我们的结果很可能反映了以下事实,即各种生理和病理状态易于影响多种分析物,而这些分析物也能反映生理和病理状态。然而,传统的“人工”解读检测结果的方法缺少量化运用这一知识的方法。因此,我们的方法的主要价值在于提供了自动化运用此类知识来整合检测结果的框架。不仅如此,我们的统计学技术还有助于鉴别分析物之间的微妙未知关联,并将这些关联融合到检测结果整合模型中。

这些发现可应用到新型的临床决策支持中。第一种应用是通过预测铁蛋白鉴别异常的或者错误反映患者潜在铁状态的铁蛋白结果。尤其是,我们的案例分析表明,至少某些远远高于预测值的铁蛋白结果可能没有准确地反映患者的铁状态。我们将评价和验证决策支持标记(flag)的想法,也就是对某些显著高于预测值的铁蛋白结果进行评论。在上述患者1这样的案例中,此类标记会让我们更及时地发现铁缺乏症。由于铁缺乏症可能是严重基础疾病(如胃肠癌)的标志,或者如果儿童具有铁缺乏症而未采取治疗,则会导致发育迟缓,因此铁缺乏症的及时鉴别意义重大。

我们的发现在决策支持中的另一种应用是,使临床医师警惕根据可用检测结果预测的铁蛋白值较低、但是未申请铁蛋白检测且未怀疑铁缺乏症的患者。这些患者可能受益于铁缺乏症评估。预测铁蛋白在这方面的应用仍处于假设阶段,尚待进一步验证。最后,我们需要更好地了解此类模型的最佳拟合方法,以便用于其他机构。其他机构可以采用本文所述的相同方法,但要根据自己机构的数据对模型进行训练。同样,我们可以设想对多个机构的汇总数据进行模型训练的可能性。

此外,铁蛋白提供的诊断信息往往与其他诊断检测提供的信息重复,被称之为“信息”冗余检测。对于很多患者而言,无需进行当前经常申请的某些检测,即可确诊或排除铁缺乏症的诊断。我们认为各种诊断机构和诊断检查均存在信息冗余检测的情况,比传统意义上的狭义的冗余检测(通常仅指意想不到的相同或相似检测的重复检测)更常见。据估计,在美国,这种狭义的冗余实验室检测每年所需的成本超过了50亿美元,这个数字与信息冗余检测的成本相比显得相形见绌。虽然如此,由于铁蛋白检测和本研究所用的大多数其他预测变量检测一般是用自动化分析仪完成的,分析阶段的变量检测成本已达到最低,所以仅排除诊断检查中的铁蛋白检测或少数其他检测而不排除整个的标本采集管或患者数据收集成本,对于给定患者来说节省的实验室成本有限。

我们计划在这一概念验证的基础上,将类似的方法应用于各种其他病理数据,包括解剖病理结果和其他临床实验室分析物。例如,我们假设某些免疫组化结果可以根据标本形态学、临床特征和其他免疫组化结果来预测。未来的决策支持系统可能为临床医师提供一个在某一指定置信水平预测为正常值或异常值的检测清单;而临床医师则主要从高度不确定的预测清单中选择需要申请的检测。同样,我们认为时间趋势(temporal trends)可能在预测某些检测结果方面提供大量信息。

选择用于这类分析的预测变量检测(“特征选择”)需要一定的权衡。例如,在一种极端情况下,我们可以用最常与铁蛋白同时进行的检测作为预测变量,使缺失数据减到最少,但代价是特征集不够完整。另一种极端是包括广泛的预测变量检测,获得更大的数据集但是缺失数据更多。我们需要在这两种极端之间寻找平衡点。对于很多应用而言,最佳的预测变量检测选择代表一个经验性问题,主要取决于模型性能。与模型部署(预期应用)相关的实际考虑将纳入特征选择。需要考虑的另一点是,相对于训练数据集中的案例数,包含太多的预测变量使模型更易于过度拟合。尽管如此,缺失数据更多的广泛特征集对于很多应用来说不是一个问题,只要模型在留存法测试数据中的表现可接受。在本研究中,选定的填补-回归组合(missForest-lasso)在训练数据中的性能仅稍高于在测试数据中的性能(见补充表1),表明过度拟合虽然存在,但是很轻微。虽然lasso回归包含了大量的预测变量,但是由于训练案例的数量较大且lasso具有预期可控制过度拟合的内置正则化程序(见补充方法),所以过度拟合在很大程度上得到了控制。同样,考虑到missForest-lasso方法对进行测试数据分类时的AUC高达0.97,这一分类模型中的过度拟合很可能得到了良好的控制。评估各种预测变量检测子集预测铁蛋白的能力是下一阶段的研究重点。

在本研究中,MICE与missForest填补法组合的表现比MICE与均值填补法组合的表现更好。我们的结果支持Waljee等人的发现,即missForest填补法在填补缺失的实验室结果方面表现良好。我们认为missForest填补法表现良好的原因在于其最适应预测变量数据与铁蛋白结果之间的非线性关系和相互作用。

虽然难以直接比较回归性能与分类性能,但是高准确度的铁蛋白分类与仅中等的回归性能似乎具有一定冲突。对这种明显差异的一种解释是,由于“趋均数回归”,铁蛋白结果动态范围中间的预测最为准确(图2C)。因此,某些预测数值误差可能归咎于测定铁蛋白值接近范围的高端,而预测铁蛋白值相当低但仍在参考范围内。此外,必须训练回归算法,使整个动态范围内的误差减到最低,同时分类算法必须仅使指定分类阈值的误差最小化。

这种方法的潜在局限性在于,只有在数据随机缺失的情况下,填补技术才是无偏差的。实际的临床实践无疑违背了这种假设,因为临床医师通常在期待获得可能的结果时才会申请检测。但是,将一组二分变量纳入我们的铁蛋白预测模型以表明预测变量检测结果是填补值(缺失值)还是测定值(即,使用“有残缺项的预测变量集”),并未提高铁蛋白的预测性能。这些二分变量未能提供预测性信息表明,填补偏差对铁蛋白预测只有很小的影响。另一个局限性是,该方法只代表最低限度的信息冗余,因为不同的机器学习算法会提供不同的结果。因而,实际的信息冗余可能更严重。最后,我们方法研究的是,通过实际临床实践中进行的检测来预测铁蛋白的能力,而不是大规模完整检测结果集的潜在信息冗余。然而,由于很多决策支持方法必须依靠可用的数据,实际数据的预测性能可能最有意义。虽然我们的数据提取技术存在局限性,即将数值为0的结果视为缺失(有核RBC除外),但是我们认为这对整体分析的影响很小。因为大多数分析物和所有关键分析物的最低可报告和/或生理范围均大于0,所以受该局限性影响的结果应该很少。此外,通过稍微增加缺失数据的比率,这种局限性(如有)会使我们的分析低估铁蛋白的可预测性。

总而言之,我们证明了基于同时进行的其他检测结果,铁蛋白结果是可以预测的。这表明常用的实验室数据集可能包含大量冗余信息。更广泛地说,这一工作为新型的临床决策支持提供了一个框架,该框架经过验证和改进后可用于各种分析物。


编译者:王小茜(本刊编辑部)

审校者:杨大干(浙江大学第一附属医院)

杂志后跟_副本.png