机器学习在血凝块检测中的应用前景

作者:编译丨赵来
作者单位:隆化县医院 2024-02-05

赵来,主任技师,1992年毕业于张家口医学院检验系,现任隆化县医院检验科副主任,承德市重点医学学科带头人,河北省临床检验生化专业委员会常委,主要从事临床生化、肿瘤标记物检验和内分泌疾病实验诊断。主持市科技支撑计划课题获市科技进步二等奖一项,三等奖两项。

自血栓与止血领域开展实验室检测以来,其方法学得到持续改进。同行们还记得手工进行凝血实验检测的历史。那时工作量很大,在一天内测试高达40人次凝血酶原时间(PTs)和部分活化凝血活酶时间(aptt)。还要开展一些特殊实验室检测,另外,许多测试,如因子检测和狼疮抗凝物(LA)也使用手动测试,即反复倾斜试管,检测中配用水浴箱和秒表。为了处理大量的标本,检验技术人员引用了各种先进的创新技术,例如,采用一个金属夹子,在一次容纳多达8个试管同时进行水浴和终止孵育过程。第一台自动分析“A-Mate 血凝仪”问世,它使用了大型塑料旋转盘,其上载有反应池用以血凝检测,并配置有蠕动泵和胶管,在一小时内可以完成20人次凝血测试。如进行特殊实验检测,该仪器耗时较长,需要反复实验和探索改变测试的设置,所以这类项目也很少做。后来,为了应对标本数量和检验项目的增长,使用了更大、更高通量的分析仪“A-Mate 血凝仪”,最终替换为ACL-300R,包括MDA-180和最近的Stago Star Evolutions。2021年,韦斯迈所在的大型实验室网络将75台ACL-TOP分析仪引入NSW Health的60个实验室,该网目前每年处理超过100万人次PTs和100万人次APTTs。事实上,仅韦斯迈实验室现在每天就能进行大约400人次PTs和400人次APTTs。而远在地球的另一端,维罗纳医院的实验室每天也要测试大约750个PTs和600个APTTs。

如此高的样本量和不断增加的止血检验项目及复杂的实验流程当然需要比使用“金属夹”更好的方法。事实上,自动化和高通量意味着需要额外注意确保得到合格的样品。因此,仅仅要求PT或APTT测试速度是不够的,我们需要保证这些测试结果的准确性,并且反映了患者的临床状态,而不只是样品的状态。现代化仪器测试结果一般都很可靠;尽管如此,实验室检测中的错误结果也是不可避免的。重要的是,当今分析前的失误是导致测试误差的主要原因。这种分析前的问题一般是由于血液采集不佳,以及在实验室接收之前产生的样品活化和凝血而引起的。主要导致溶血和部分或完全血凝块形成。两者都不容易通过目视检查来识别整个血液状态,除非血块大到足以阻止血液流动;然而,这两种情形都会损害样品质量。通常,样品到达实验室,患者的详细信息和申请的测试项目被输入实验室信息系统(LIS),并马上离心样品。离心沉淀血细胞,把上面的血浆放置在分析仪上进行测试,一般通过LIS自动传达给仪器测试指令,最后测试结果从分析仪输出到LIS里,等待审核。这个过程可以是手动的,也可以通过一系列规则自动完成。一般来说,正常的测试结果通常可以自动验证,但“异常”测试结果需要更高级别的审核。对于任何个体患者,“异常”的检测结果实际上可能是意料之中的(例如接受抗凝治疗)或其他意外情况。在后一种情况下,问题在于测试结果是否真正反映了患者的健康状态,或者结果受到分析前人为因素的影响?

现代仪器可以对分析前的问题进行几种检查,包括所谓的HIL(溶血、黄疸、血脂)。在这种情况下,仪器通常能够消除这些因素产生的光谱效应,得到准确反映被测样品的测试结果;然而,该仪器不能克服HIL的任何生物学影响,因此仍然建议对样品进行回头看。在隐藏有样品凝块的情况下导致差错的凝血测试结果时,通常的检查需要对样品进行更仔细的观察,可用小木棍对样品进行挑拨从而目测到凝块的存在。这是一个耗时的过程,即使做得很好,也可能遗漏小血块,进而影响样本质量。因此,Fang等[1]关于机器学习(ML)在凝血测试中识别血凝块的文献是令人兴奋的。

机器学习的概念本身并不新鲜。事实上,在PubMed上使用“机器学习”进行搜索,至少可以追溯到1967年,结果超过55000个。然而,增加“凝血或止血”这一术语,论文数量减少到105篇,其中80多篇是在过去五年内发表的;因此,这个概念对临床检验领域来说当然是“新”的。许多先前的论文应用ML技术来预测疾病或其严重程度(如危重症患者败血症诱导的凝血功能障碍,急性自发性脑出血患者的凝血功能障碍,甚至COVID-19的检测)。据我们所知,先前还没有关于应用ML确定凝血试验中的标本存在血凝块的论文。

ML被认为是传统统计学的延伸。通常,在监督学习方法中,计算机程序从已经分类的(成熟的)数据中进行训练,以对未分类的(测试)数据进行预测或决策。为了评估其性能,使用子数据集作为训练集,其余部分(其分类算法隐藏)用于执行模拟。可以利用许多模型来完成此任务;每一种算法都有理论上明确的优势,但在许多情况下,算法之间的实际比较是必要的。Fang等[1]在他们的出版物中决定使用反向传播神经网络(BPNNs),这是神经网络分类器中广泛使用的方法。Fang等[1]回顾性地从LIS中检索凝血检测结果,其中192个标本存在血凝块和2889个标本无血凝块(NCD),以此形成用于训练和测试的数据集。使用5倍交叉验证的训练数据集对标准BPNNs和动态BPNNs进行训练和验证,然后在测试数据集上评估计算模型的预测性能。标准和动态BPNNs可以识别样品状态(存在血凝块和NCD),工作特征曲线(ROC)下面积(AUC)分别为0.966(95%CI,0.958-0.974)和0.971(95%CI,0.9641-0.9784)。这代表了非常高的AUC值,这表明在鉴定凝血与未凝血样品时具有很高的灵敏度和特异性。

那么,这是否意味着我们现在有了一种方法来识别鉴定或排除凝结的血样品,而不再需要目测检查?恰恰不是这样。这种识别结果仅作为一种提示,Fang等[1]的数据集对每个样本测试项目包括PT、APTT、凝血酶时间(TT)、纤维蛋白原和D-二聚体。换句话说,该模型需要所有五个测试的结果才能实现预测。在大多数实验室中,PT和APTT是最常进行的检查,而TT、纤维蛋白原和D-二聚体的检查频率要低得多,通常在患者进行凝血检查中<10%。尽管如此,TT、纤维蛋白原和D-二聚体一般是在PT和/或APTT不明原因延长的情况下应专业规范的要求进行的实验,同时也要参考具有潜在作用的患者临床信息。

因此,Fang等[1]的工作,应该被视为研究自动识别(或排除)凝块作为意外异常凝血试验原因的重要的第一步。期待着今后检验同道在这一领域进一步开展研究工作。

参考文献

[1] Fang K, Zheqing Dong Z, Chen X. Using machine learning to identify

clotted specimens in coagulation testing. Clin Chem Lab Med, 2021; 59; 1289-97.

[2] Emmanuel J. Favaloro* and Davide Negrini Machine learning and

coagulation testing: the next big thing in hemostasis investigations? Clin Chem Lab Med, 2021; 59(7): 1177-1179