临床实验数据共享在人工智能和大数据分析中的作用
【摘要】近年来,临床实验室正经历着前所未有的巨大变革,从高效的检测设备配置逐渐向更加集成和以患者为中心的服务转变。与此同时,医疗健康数据的数字化使得诸多的患者相关数据易于获取,从而为人工智能(AI)系统的应用开辟了新的机遇。每天临床实验室生成大量的信息里,患者结果只是其中的一部分。实验室信息系统(LIS)还包括其他“相关”组成数据,例如内部质量控制或外部质量评估(EQA)结果,以及患者临床信息、采血和检查结果传输的时间,这些数据具有大数据特性,诸如体量大、速度快、多样性和真实性,它们在患者的医疗过程中潜藏着巨大价值。尽管实验室医学领域对AI和大数据的兴趣日益增加,但由于缺乏相应的大数据知识和处理技能,以及数据的标准化和数据共享的不足并涉及到监管及伦理问题,这些潜在价值在该领域的应用进展仍然缓慢。更值得关注的是,目前的AI算法仅靠数学假设和模型本身并不足以生成实用的临床诊断工具,特别是生物学参数需要在具体的临床背景下进行评估,才能确保其准确性和有效性。因此,有必要加强实验室和AI专家之间的合作,制定数据共享和规范化管理流程,从而促进有价值的床诊断工具的开发应用。
【关键词】人工智能;大数据;临床实验室;信息流;检验医学
一、临床实验室正面临一场前所未有的转型
历经数年,医学实验室迈上发展的快车道,逐步向大规模集中检测的模式转变,以提高检测效率并降低成本。然而,这种基于实验室测试外包的商业模式并未达到预期效果;事实上,它未能显著降低总体成本。研究表明,在每年一百万次测试量之内,成本与测试量呈现相关性。但是,超过这一水平,成本与测试量的关系不再是线性的,因为相较于测试量,实验室组织方式对最终成本的影响更为显著。重要的是,在过去几十年间,一般化的“传统实验项目”,由于医生都能够正确解读并知晓检验结果的临床意义,通常情况下成本与测试量相关。随着科技和科室管理的进步,以及对人类疾病病理学认识的加深,多种因素促使了临床实验室从商业化思维转变为更集成、以患者为中心的服务理念。实验室逐渐从各自独立转向互为融合和人性化的服务模式。推动这一变化的因素包括实验诊断管理、分子生物学和基因检测的进步以及其他创新技术的临床应用,为实现个性化和精准的实验结果奠定了坚实的基础。另一方面,即时检测(POC)设备的小型化及其在远程医疗中的应用,突显了实验室在床旁检验中的核心作用,并确定了临床实验室未来的新角色。另一个革命性的质变是数字化转型,正在改变所有医疗保健领域,包括医学实验室。这种变革的动力来源于:大量数据的高效管理、新技术系统对数据的整合分析,以及AI的广泛应用。尽管AI在计算机科学中并不是新生事物,但近年来其应用显著增加,主要得益于计算能力的提升。然而,在医院及整个医疗服务系统中,每天临床实验室都会产生海量的高质量信息(例如患者的检测结果),这些信息对于构建基于计算机的算法,如AI工具来说,是有助于提升其诊断准确性和效率的宝贵资源。
二、临床实验室在爆发性增长的医疗大数据中的作用
传统上,临床研究除了包括人口统计学信息外(如年龄、性别、种族等),也常常离不开医学实验室的测试结果。尽管这些研究遵循严格的标准,但一般受到诸如患者招募困难或医疗人员资源(包括时间、专业技能及设备等)稀缺等问题的限制。近年来,随着实验室信息系统(LIS)的广泛应用,使得研究人员能够迅速检索到患者的测试结果,包括大量的历史性数据。因此,某些临床研究正在发生明显的变化,一些研究模式发展更为迅速,特别是那些旨在探索检测结果与异常或正常的代谢数据之间的相关性研究,利用LIS获取的大数据尤为重要。此外,目前医疗保健的数字化转型允许从不同学科和不同患者间获取综合信息。在医疗机构中创建的综合数据仓库,作为“大数据”的公认来源,为使用 AI工具进行数据分析以及其他计算工具如自然语言处理(NLP)铺平了道路,这些工具反过来又能在患者的医疗过程中生成新的资源。
三、现代临床实验室中的信息流动
实验报告的概念由G.D.Lundberg在50年前提出,并创造了“脑与脑间信息流”这一术语,该概念在2011年由Plebani等人进行了重新审定。自Lundberg首次提出这一概念以来,每名患者在实验室检测过程中生成的信息类型和数量一直在不断增加。除了临床结果和人口统计学参数外,LIS可能还包括其他“相关”的复合数据,如内部质量控制(仪器)或外部质量评估(EQA)结果,以及检测申请时间和血液采集或检查结果传输的时间。然而,更详细的搜索发现,实际上临床实验室每天可以生成的信息量很大,尽管其中大部分信息在LIS中只作部分记录。这些信息可能包括分析前数据(如复检间隔、额外的饮食信息、生活方式、样本存储条件或处理情况、溶血的存在)。分析中数据(例如性能和方法学验证、自动检查样本质量或样本类型是否匹配、仪器自行检查或复杂的数据处理)。分析后数据(例如基于患者检测结果的临床决策支持系统的建议、医生查看结果的时间、传达危急值结果的时间)(图1)。
注:箭头表示信息流向实验室信息系统(LIS)(绿色箭头),以及相反方向(红色箭头)从LIS流向其他的外部信息工具,这些工具可能包括人工智能(AI)算法。
图1. 修改后的“脑到脑循环”图,展示了临床实验室内的信息流动
这些数据具有鲜明的特性,如数据量大、数据类型繁多、处理速度快和真实可信,令人瞩目的是可以为医护人员、实验室工作人员和制造商的技术人员带来可观的价值。由于具有大数据的特质,因此可以认为实验室每天都在持续生成大数据。此外,实验室定期维护实验室测试目录,这些目录可供实验室工作人员、医生和相关工作人员使用(图1)。
目前,已经成功研发了几种数据处理工具(有些基于简单的“如果-那么”算法,有些则基于复杂的人工智能技术),并在某些情况下,这些工具已集成到“脑到脑循环”的分析前、分析中或分析后阶段。例如,不同的信息技术需求管理工具已被开发和应用,以确保在特定语境中给出适当的分析请求。如AI在COVID-19快速检测结果的解释中具有相当的出色表现。实验室医学中AI应用的另一个例子是使用机器学习工具进行多参数综合分析,这种方法比单独使用单个血液学参数(如MCV)更具非凡的效果。另一项研究显示,基于AI的规则用于实验室结果的自动审核,与实验室专业人士的判读高度一致[13],而其他机器学习(ML)方法也已被用于预测癌症患者的血栓栓塞风险,在识别患者疾病风险的方面从而促进了临床医生和实验室的积极合作。
实验室在分子生物学异常检测--基因突变、代谢组学改变和蛋白质组学测试(如用于检测淀粉样变性的MALDI-TOF/MS分析)方面的检验能力不断提升,为实现实验结果的精准性诊断成为可能,同时对实验室的工作流程提出了更高的要求。首先,获得的大量信息需要足够的基础设施来存储数据,以满足国家法规的要求。其次,由于结果并不能立即进行处理,因此需要包括AI工具在内的软件为基于云计算的,从而引发了有关数据所有权和云存储时间的问题。第三,其他基于网络的资源(例如,用于检查和描述遗传学中罕见点突变的工具,或用于肽段模式的蛋白质组学检测工具)通常由操作这些技术的实验室医学专家使用。
四、AI与大型实验室数据的融合
AI成为一种引人注目的临床决策系统,从传统的关注人群平均水平到个体化临床决策的转变。这场变革得益于可用的纵向数据和灵活的ML方法的应用。因此,当前推动AI技术领域期望值上升的关键因素在于医疗大数据的日益可获取性。
LIS的逐步完善使得在短时间内用相对较少的资源就可采集到大量检验结果已成为可能。然而,在大多数情况下,为了机器学习的应用,需要将实验室数据与患者的其他临床数据(如诊断、疾病复发和合并症)整合起来。实验室和临床数据整合包含横向和纵向两种方式,横向整合即患者在不同时间点进行的不同检测和检查所获得的数据的纵向视图。垂直整合包括实验室的医疗记录、不同医学专科(如心脏病学和放射学)的临床记录,以及患者自身提供的信息数据(如使用可穿戴设备或集成到皮肤的智能传感检测设备)。由于存在不同的数据结构,目前在不同部分的医疗数据库中,患者记录储存呈现分散状态,使其开发应用受到了限制。结构化数据源(如实验室检测、患者的入院和出院日期)一般可以通过适当的软件很容易整合,而非结构化数据源(如住院期间收集的临床笔记和观察)往往存在很大差异,包含多种没有标准化的数据。对于非结构化数据,基于云的自然语言处理(NLP)技术等工具可以帮助从医疗记录的自由文本中提取信息,但这些系统在模拟临床工作流程的环境中尚未进行充分评估,其准确性和公平性存在一定局限性。未来,随着商用的可穿戴医疗设备技术逐渐成熟,使其可以作为芯片实验室(lab-on-a-chip)使用,不仅用于住院患者的连续监测[例如便携式即时护理(POC)系统],还用于需要密切监测并在医学参数变化时迅速做出临床决策的门诊患者。在特定情况下,已有的可穿戴系统(如消费性可穿戴设备)可以持续监测心率、体温、电导活动和运动,用于评估生命体征。以上这些数据被用于训练AI算法,可以预测临床实验室检测结果的变化,从而能够及时发现患者生命体征的异常变化。
五、AI在实验室医学中面临的挑战和困难
近期两项研究揭示了数据分析与AI技术的方法和模型在实验室医学及其他医学专业领域的创新应用。结果表明,医学界对AI的应用兴趣逐渐提高,2017年至2021年间发表的文章数量有所增多,但在44篇文章中,只有8篇(18.2%)来自实验室医学研究团队,其余文章由其他学科的研究人员撰写。且临床上的应用还存在多种困境。从狭义的角度来看,第一个限制因素可能源于社区实验室在人工智能领域专业知识的不足,而这恰恰是推动创新研究和突破应用瓶颈的关键所在。实际上,在美国实验室医学利益相关者的一项最近的网络调查中,绝大多数参与者认为,尽管医疗领域对AI的专业知识储备仍显不足,且需满足若干基础条件,但AI技术有望在不久的将来为医疗行业创造出可观的价值。从广义上看,实验室的数字化革命,还包括新的专业领域,如临床生物信息学、与数据的沟通和互动技能,以及信息学技能。为了提高检验医学专家的数字技能,需要认识并以培训弥合教师和学生之间的差距,专业学会在这一过程中也扮演着重要角色。第二个困境可能是患者临床记录(如诊断、合并症、临床参数和治疗药物)的访问受限。为确保AI和ML算法具备临床实用性,其开发过程应充分利用数据和临床结果的多重再利用机制,从而实现高效的数据驱动学习。这与实践操作中的情况不同,即在临床研究中,实验室结果仅在特定条件下被收集并与患者的临床数据整合,然后再应用于ML。这一固化的模型数据对应关系必须加以改进,以促进ML的广泛应用,同时也因为ML算法可以从持续的数据变化中获得精确预测,并随着时间的推移使算法不断忧化。
从“全球视角”来看,AI实施的相关限制包括数据质量和结果标准化、法律属性和数据隐私问题以及IT技术的安全。目前,AI工具需要巨大的数据集,而这些数据往往无法由单个实验室提供。患者的电子记录或其他IT数据的基础结构(如实验室检测结果)的交换也存在很多困难:即使数据已经根据通用数据结构进行了映射,也不一定能进行数据整合和分析。在不同实验室,只有有限的一组分析物被充分标准化,才能确保数据的可比性。为此,通过逻辑观察标识符的名称和代码(LOINC)来实现实验室检测名称的编码通用,这一点至关重要。且要求实验结果的计量单位必须是机器可读的,以实现实验室间结果的互通和交换。此外,尽管达到了数据的标准化和互通性,但不同性能的测量设备对测试结果的影响也不同,设备检验结果的目标值(由外部质量评估方案认可)只有在预设的数据库(如EUDAMED)中共享才能确保数据的有效性。解释性评论是实验室报告的重要组成部分,应标准化并条理清晰兼有针对性,以便医生更好的解读测试结果的临床意义,从而提高决策效率。并能在多学科团队中,共享这些评论。AI涉及的伦理和规范问题同样至关重要。例如,患者同意将其个人健康数据用于接受某些治疗,并不意味着这些数据可以在AI中应用。此外,实时AI相应的规范必须与现有法规(如国家法规)和数据保护法规[包括2018年的《通用数据保护条例》(GDPR)]一致,还必须符合《欧洲联盟基本权利宪章》及其他相关条款。
最后,应强调的是,即使数据科学家可以设计和生成优秀的AI算法,实验室专业人员的积极参与在提供准确数据分析和解释的整个过程中同样起到关键作用。从实践角度看,特别是当生物学参数未在适当背景下评估时,没有考虑到相关的实验室医学概念(如生物变异、分析目标和分析变异)的情况下,理论上算法的数学假设不一定完全具有临床实用价值。
结论:在医疗实践中,临床检验与其他医学专科一样发挥着不可或缺的作用,其不仅协助临床医生的诊疗工作,同时也为患者提供精准化、个性化的检测服务。“临床实验室管理”这一概念涵盖了检验全过程,未来以患者为中心的服务理念将驱动检验医学产生重大变革。与此同时,技术进步和数字化革命正在为精准医疗提供越来越多的支持,精准医疗基于个体化检查和实验室检测结果,为患者制定具有针对性的个性化治疗方案。传统的检验医学模式的改变,既从脱离临床诊断和治疗路径的“独立工厂”转变为早期诊断、评估预后和个性化医疗的重要数据源,并借助AI及其工具(如ML)得到有力的支持。这些技术在医疗保健领域得以发展完全基于其(包括实验室数据)大数据的广泛可用性,但目前需要新型的数据工程师,借以分析处理原始信息并改进患者的医疗方案。检验医学专家的能力和技术水平还不能完全精通机器学习的理论知识,因而迫切需要加强实验室人员和AI专家之间的合作,协调和管理这项技术的实施过程,以促进其有效的开发应用。否则,可能会出现一个缺乏实用性的高科技荒漠,既无益于实验室,也无益于患者。
编译节选自:Clin Chem Lab Med 2022; 60(12): 1875-1880
【译者建议与思考】当前,医保部门的飞行检查已深入医疗工作的核心领域—临床诊疗规范,而临床检验则屡屡成为检查的重点对象。传统的检验项目组合被标签化为"过度检查",行业内长期沿袭的运作模式正面临严峻挑战。然而,若完全打破既有的组合模式,采用单项临时调度的方式,不仅不利于临床医生的灵活执行,也难以充分发挥检验项目的诊疗功能—毕竟能够全面掌握检验项目临床意义的医生寥寥无几。这种局面最终导致检验工作量异常萎缩,甚至出现成本核算倒置,进而阻碍检验新技术的推广应用。破局之道在于依托临床检验数据管理软件公司,基于临床诊疗规范、指南和专家共识,开发智能化诊查检验项目组合软件,并将其兼容整合到现有的HIS、LIS系统中。这种智能化组合系统既能满足不同疾病的诊断和鉴别诊断需求,方便医生快速做出临床诊查决策,为实现精准医疗和个体化诊疗奠定基础;又能有效杜绝盲目的项目组合和过度检查,满足医保部门对临床诊疗的规范化要求。同时,该系统还能促进检验项目的饱和应用,充分发挥实验诊断在临床诊疗中的重要作用。
挑战中蕴藏着巨大商机。在整体经济环境低迷的背景下,谁能敏锐洞察并把握这一新机遇,谁就能在医疗信息化领域开辟新的增长点,并迎来蓬勃发展的新局面。