测量不确定度•再认识与再思考 ——测量不确定度回顾

作者:DDM
2021-12-16

测量不确定度是“表征合理地赋予被测量之值的分散性,与测量结果相联系的参数”,是与测量结果关联的一个参数,用于表征合理赋予被测量的值的分散性。它可以用于“不确定度”方式,也可以是一个标准偏差(或其给定的倍数)或给定置信度区间的半宽度。该参量常由很多分量组成,它的表达(GUM)中定义了获得不确定度的不同方法。《临床实验室》一直致力于推动实验室质量管理、风险管理等相关工作。自ISO 15189 2012版实施以来,编辑部不断收到读者关于“ISO 15189 2012版与2007版有何不同”及相关问题。为使广大读者更好的理解ISO 15189及相关内容、为更好的开展测量不确定度国家标准宣贯工作,本刊联合中国合格评定国家认可中心于2015年伊始开设“测量不确定度”专栏,邀请业界专家撰写相关文章,宣贯内容涉及专家导论、测量不确定度基本概念、国际研究进展、国内测量不确定度研究进展、应用中的问题、案例讨论等。


2014年,国家标准《合格评定 生物样本测量不确定度的评估与表示》的制定工作正式启动,该标准定位于合格评定领域有关生物样本的测量不确定度的评估与表示。中国合格评定国家认可中心吕京老师在“关于制定国标《合格评定 生物样本测量不确定度的评估与表示》的思考”中从偏移的获得和修正、精密度的条件、浓度问题、多台设备问题、定期评审和再评估、结果报告和应用、检验前程序等方面出发阐述在临床检验中应用top-down方法评定测量不确定度需关注的问题。从风险管理的角度看,目标不确定度越大实验室结果失控的风险就越小,但导致结果的可利用性降低或增加临床决定的风险,这显然不是临床检验的追求。因此,认识并控制结果的不确定度非常重要。据笔者了解,在某使用兴奋剂的法庭辩论中,律师已经提出了测量不确定度的问题。文章本文提出了在制定国标《合格评定 生物样本测量不确定度的评估与表示》过程中关于医学检验结果测量不确定度的一些思考,希望引起大家的讨论,为国标的制定提供有益的输入。


从1870年国际米制公约组织提出的测量“误差”概念,到上世纪70年代“测量不确定度”术语被国际计量学会接受成为最重要的计量学术语之一,人们对测量质量的追求与要求出现了质的飞跃。生物样本测量作为测量科学的重要分支20世纪后期得以迅速发展并在人们的生产生活中发挥越来越重要的作用。长期以来医学界和计量界在计量学术语的使用和解释上存在差异,新版的VIM首次涵盖了化学和医学测量,并纳入了计量溯源性、测量不确定度、标称特性相关的概念,而且很多术语根据不同观点产生了一种折中方案,在使用时应加以注意。北京航天总医院陈宝荣与孙慧颖两位老师在《测量不确定度评定相关的基本概念介绍》中介绍国际计量学基本词汇和通用术语工作组对相关概念的界定,测量不确定度评定相关的基本概念包括量、国际单位制、量值、标称特性、测量、被测量、测量程序、参考测量程序、原级参考测量程序、测量结果、测量误差、量的真值、约定量值、测量准确度、测量正确度、测量精密度、测量误差、系统测量误差、测量偏倚、随机测量误差、重复性测量条件、测量重复性、期间精密度测量条件、期间测量精密度、复现性测量条件、测量复现性、测量不确定度、定义的不确定度、测量不确定度的A类评定、测量不确定度的B 类评定、标准测量不确定度、合成标准测量不确定度、相对标准不确定度、不确定度报告、目标不确定度、扩展不确定度、包含区间、包含概率、包含因子、校准、计量溯源性、计量溯源链、测量模型、影响量、修正、测量系统、示值、测量区间、测量系统的灵敏度、分辨力、检出限、准确度等级、最大允许测量误差、参考物质/标准物质、有证标准物质、标准物质的互换性、参考量值、计量、计量学、比对、示值误差、测量仪器的检定、强制周期检定、检定证书、检测、能力验证、期间核查、溯源等级图、量值传递、验证、确认、参考测量实验室,只有正确理解这些基本概念,才能做好测量不确定度评定相关工作。


21世纪初,国际标准化组织发布了一系列有关测量结果溯源性的导则文件,对医学实验室测量质量与量值溯源提出更高要求,加速了检验医学领域接受并使用测量不确定度评定检验结果的测量质量。北京航天总医院陈宝荣与孙慧颖两位老师在《医学实验室测量不确定度的评定》中指出测量不确定度是反映测量量值可靠性的客观指标。通过评定测量不确定度,实验室将逐步认识并愈发重视优化测量程序、优选检验产品的重要性,提高测量技术,最终解决测量量值的溯源性问题。医学实验室可根据预期目的的不同选择使用自上而下(top-down)与自下而上(bottom-up)二种方法之一评定测量不确定度。比较而言,“自上而下(top-down)”方法更实用、简便和经济,也基本能满足行业管理要求。医学实验室采用“自上而下”法评定测量阶段测量不确定度的数据来源主要有3种途径:从实验室外取得、实验室常规工作中所得和实验室间能力验证的数据。测量不确定度可以采用分布图或数值等方式表示和报告。测量不确定度分布图描述了在测量区间内测量不确定度随浓度变化的情况,通常可反映某特定测量过程测量结果与其测量不确定度变化的特性,常表现为一条曲线。由于各种原因医学实验室有时可能需改变原有测量系统或测量条件,此时需根据已改变的测量情况重新计算已评定的测量不确定度,常见原因如测量阶段的任何重要不确定度来源出现显著变化;评定的测量不确定度结果不在测量程序期望的性能范围或者未达到目标不确定度的要求,需要系统审核不确定度的来源和组分;采用“自上而下”法评定的测量不确定度明显不同于采用“自下而上”法的评定结果时。随后,两位老师从测量不确定度评定总则、评定步骤、单一输入量引入测量不确定度分量的评定、合成标准不确定度的评定、扩展不确定度U的评定五个方面详细说明“自上而下”法评定测量不确定度。完整的测量结果一般应报告其测量不确定度。报告测量量值结果所包含的内容取决于其预期的用途,应尽量提供足够的信息以便有新的信息或数据时可重新评价结果。一般情况下,应包含以下4项主要信息:被测量的最佳估计值、扩展不确定度、计量单位以及相应的置信水平四部分内容。某些情况下可能还需给出完整的测量量值结果的报告。完整的测量量值结果报告除报告的基本内容外还应包括或者引用下列信息:明确说明被测量Y的定义;根据实验观察值及输入数据进行测量结果及其不确定度计算的方法描述;在计算和不确定度分析中使用的所有修正值和常数的数值和来源;所有不确定度分量的清单,包括每一个分量是如何评价不确定度的完整文件。测量不确定度在实验室中可改进测量质量、优选测量程序与检验产品、加强与临床联系。


目前,不确定度评定主要包括GUM不确定度框架法和蒙特卡罗方法,其中GUF来自计量导则联合委员会于1993年发布的《测量不确定度表示指南》,MCM来自JCGM于2004年发布的GUM补充文件《分布传播用数值法》,即用MCM进行不确定度的分布传播。2008年JCGM对GUM Sup.1进行了修订,更名为《使用蒙特卡罗方法的分布传播》。南通大学附属医院检验科王惠民等四位老师在《蒙特卡罗方法评定测量不确定度》中从MCM评定原理、评定不确定度步骤、评定LDH活性浓度不确定度实例三个方面系统地介绍了如何用MCM评定不确定度,MCM具有很强的适应性,可弥补GUF的不足。在检验医学领域,不确定度值可使同一实验室在不同时间点或不同实验室间的检验结果具有可比性,因此准确评定各检验项目的不确定度值至关重要。而大多数检验项目的实际测量模型不呈线性,且输出量也不服从正态分布,如果采用传统的GUF评定其不确定度,将使不确定度值评定结果不准确,从而导致检验结果不具可比性。因此,为了使各检验项目的不确定度值准确可靠,应采用MCM评定其不确定度,使各检验结果间具有可比性。当同一实验室在不同时间点的检验结果具有可比性时,医生可根据检验结果准确判断患者病情变化,及时调整用药剂量或治疗方案,提高疗效;当不同实验室间的检验结果具有可比性时,可避免患者换院治疗时的重复检验,减轻患者经济负担,同时为社会节约医疗资源。检验结果具有可比性为检验结果一致化的实现提供了现实可行的途径,必将大力促进检验医学的发展,缩小与发达国家在该领域的差距,开创检验医学的新纪元。


中国合格评定国家认可中心吕京老师在《再谈测量不确定度》中指出测量的目的是确定被测量的值,测量结果通常只是被测量值的近似值或估计值。因此,完整的测量结果需要同时附有结果的不确定度声明。影响测量结果的潜在因素很多,如被测量的定义不完整;被测量定义的复现不完善;所测量样本的代表性不足;对测量受环境条件的影响认识不足或对环境条件的测量或控制不完善;人员读数误差;仪器分辨力或识别阈值的限制;测量标准和标准物质的量值不准确;从外部得到并在数据约简算法中使用的常数和其它参数的值不准确;测量方法和程序中的近似和假设;在看似相同条件下,重复测量过程的变异性;尚未认知或未识别的因素。参考测量活动的目的是提供计量学服务,应优先采用bottom-up 方法评定参考测量结果的不确定度。对运行良好的测量程序,可用top-down方法或MCM验证bottom-up方法评定的测量不确定度。在非线性模型或输出量的概率密度函数(PDF)明显背离了正态分布或t分布的条件下,用MCM可能更适宜。测量结果取决于被定义的测量条件,而测量条件(人、机、料、法、环等)只是相对稳定。因此,需要对实验室的CMC和不确定度定期评审、评定。不同实验室对测量条件控制的程度不同或用于评定测量不确定度的条件/数据不同,只有在合理的条件下,不确定度的大小可表征测量质量,否则可能带来误导。合理评定、合理表达测量结果的不确定性同样重要。须牢记,认识和评定测量不确定度应基于质量改进和更好应用测量结果的主观需求,了解风险,控制风险,并追求卓越。


国内很多学者曾讨论医学实验室是否有必要评定测量不确定度以及采用什么评定办法,这很难给出一个结论。随着科学发展,近年来不少组织、专家提出不少新的标准和建议。我国CNAS也曾发布技术报告CNAS TRL-001“医学实验室—测量不确定度的评定与表达”,但缺乏国际公认的权威意见。最近国际权威组织,如ISO、ILAC等相继发表一些标准和导则,肯定了不少建议和意见。现在再回头看,似乎可以肯定当时的一些意见和建议。杨振华教授在《是否可以对医学实验室评定不确定度争议做一小结》中对此议题提出自己的看法。不仅在我国存在医学实验室应不应评定不确度的争论,国际上存在已久。医学实验室是否可以只评定测量过程,而不是GUM倡议的全测量过程的不确定度;能否不用GUM的“自下而上”,改用“自上而下”的办法评定不确定度;能否用医学实验室实际工作数据,不需增加附加的试验来评定不确定度。在这些间题上,检验学与计量学专家之间存在严重分歧和争论。计量学专家往往认为检验学家提出的意见有违GUM原则。直到最近几年,才逐步取得共识。杨教授在文中逐个讨论医学实验室是否可以只评定测量过程的不确定度、能否如采用“自上而下”办法取代经典“自下而上”评定不确定度办法、获取什么数据来评定医学测量结果的不确定度这三个争论问题和初步共识。通过长期的讨论,国际上已认可医学实验室可以只评定测量过程的不确定度,已有使用“自上而下”的办法评定测量过程不确定度的国际标准ISO 11352。我国检验界可考虑在这些目前国际上已达到共识标准的基础上,制定一个根据医学实验室可得到的资料和数据,简单而又实用的评定测量结果不确定度的标准。


测量不确定度概念进入医学检验领域已有十多年时间,在此期间,关于医学实验室“该不该评”及“如何评”测量不确定度问题国内外一直争议不断,但总的趋势是不确定度概念逐渐被接受,医学实验室测量不确定度评定方法也逐渐明晰。卫生部临床检验中心主任陈文祥教授在《医学实验室测量不确定度评定》中指出杨振华教授在多年研究基础上撰写《是否可以对医学实验室评定不确定度争议做一小结》,简单回顾该不该评的争论,主要论述如何评的问题,读后深受启发。医学实验室不确定度评定在过去十年间经历了从基本不认同到基本接受的历程。不确定度是在误差理论基础上提出的代表测量值分散性的一个综合指标(似临床检验中的总误差),其合理性和科学性是强调全面考虑测量影响因素和消除发现的明显系统误差,这也就是不确定度提出和逐渐被接受的原因。阅读杨教授文章可以发现,在过去十几年间,测量不确定度概念在医学检验界不断被接受,医学检验不确定度评定主要技术问题也在逐步提出解决方案。随着相关工作的进一步开展,测量不确定度可望在医学实验室得到更多应用。


杨振华教授与陈文祥教授为2015年的“测量不确定度”画上了句号,2015“测量不确定”栏目的宣贯,同时是对“测量不确定”的再认识,希望“测量不确定”更好的应用于医学实验室。