医学实验室测量不确定度评定 ——杨振华教授《是否可以对医学实验室评定不确定度争议做一小结》浅析
测量不确定度概念进入医学检验领域已有十多年时间,在此期间,关于医学实验室“该不该评”及“如何评”测量不确定度问题国内外一直争议不断,但总的趋势是不确定度概念逐渐被接受,医学实验室测量不确定度评定方法也逐渐明晰。杨振华教授在多年研究基础上撰写《是否可以对医学实验室评定不确定度争议做一小结》,简单回顾该不该评的争论,主要论述如何评的问题,读后深受启发。
“该不该评”问题原本可以不是问题。测量活动中评定测量不确定度实际上已不存争议,按现代测量理论,测量过程仅给出测量值是不够的,还需给出测量值的可能分散性或“可靠”程度,两者才构成完整的测量结果,一方面是测量结果比较的需要,另一方面是评判测量能力或结果质量的需要。反映测量值分散性的目前国际公认指标是测量不确定度,这就是为什么在众多测量相关国际标准中都提出不确定度要求,在部分领域的测量实践中也已广泛使用不确定度。定量医学检验属于测量,在不确定度评定问题上当然不应例外。在医学检验不确定度问题上存有争议,大概有两方面的原因,一方面医学检验已多年使用“总误差”,尤其在质量评价活动中,其作用与不确定度类似,引入不确定度似在改变“习惯”,而习惯的改变往往产生争议,也需要时间;另一方面,医学检验是高度复杂的测量,而且除“测量”环节本身外还有许多其他相关环节,其不确定度评定有许多需要研究的问题,结论如何,肯定也有一个讨论的过程。
就像杨教授文中指出的,医学实验室不确定度评定在过去十年间经历了从基本不认同到基本接受的历程。这大概也是事物发展的规律,总有一个认识过程。就像不可能将不确定度拒之门外一样,也很难想象一夜之间总误差会被不确定度完全取代。实际上不确定度和误差并不是矛盾的,而是交融的,不确定度评定中也离不开误差概念,如不精密度(随机误差)、偏倚(系统误差)等,这些概念不会因不确定度的出现而消失。不确定度是在误差理论基础上提出的代表测量值分散性的一个综合指标(似临床检验中的总误差),其合理性和科学性是强调全面考虑测量影响因素和消除发现的明显系统误差,这也就是不确定度提出和逐渐被接受的原因。
杨教授在文章中归纳十多年来关于医学实验室不确定度评定的主要技术讨论,介绍讨论进展情况。杨教授归纳的医学实验室不确定度评定的三个主要技术问题分别是:医学实验室是否可以只评定测量过程的不确定度,能否用“自上而下”的办法评定不确定度,以及能否用医学实验室实际工作数据评定不确定度。这些问题也就是医学检验不确定度该如何评定的问题。“如何评”问题是技术或方法问题,但在很大程度上也会影响人们对不确定度概念的接受情况,一件难懂、不好做的事情,一般接受起来会比较困难。关于医学检验不确定度来源考虑,的确,影响检验结果的不只是检验测量一个环节,还有分析前和分析后因素,甚至还包括个体生物变异,临床上使用检验结果时确应考虑所有这些因素。大概是基于这样的考虑,杨教授文中提到的前期版本的ISO 15189及曾经的ISO 25680草案“医学实验室测量不确定度计算和表示”中提到的不确定度都包含上述各因素。这种考虑可能临床上有一定合理性,但使不确定度评定复杂化,部分不确定度分量难以获得或有太多的多样性,从测量角度上讲,这样评定的不确定度可能也偏离了“测量不确定度”本身含义,给测量不确定度赋予了过多功能。将不同问题分别考虑,或将其他问题用另外的方式处理,不失为一种现实而又合理的处理方式,这大概是为什么在新版(2012年)ISO 15189中将测量不确定度评定集中于测量过程本身。
影响不确定度使用的另一个可能因素是其“繁琐”的评定过程。GUM是不确定度评定的原则性文件,字面理解,GUM给出的不确定度评定方式是,将测量模型化,明确影响测量的各种因素,分别评定各因素的不确定度贡献,最后将各不确定度分量合并,即所谓的“自下而上”的评定方式。上述曾经的ISO 25680草案基本采用此种方式。此种方式的积极意义在于,通过不确定度评定可以发现影响测量的主要因素,有利于测量质量改进,不确定度评定过程还可起到标准化的作用。但对于复杂测量(像临床检验),影响因素众多,这种“自下而上”的评定可以变得非常复杂,有些不确定度分量可能还很难获得,或需另外做许多实验。值得注意的是,在更多情况下,不确定度评定不是为了研究测量过程,而主要是为了提供测量值的分散性信息,这时的不确定度评定,在遵循基本原理的前提下,显然是越简单越好。GUM其实考虑到这些情况,在其“现实考虑”(3.4)中指出,“只要可能,利用基于长期定量数据的经验测量模型,以及利用显示测量是否统计上在控的核查标准和控制图表,应是获得可靠不确定度评估的部分途径”(3.4.2);GUM在说明测量模型化时指出,“输出量所依赖的输入量又可视作被测量,它们本身又依赖于其他量”(GUM 4.1.2),此表述的反向释义可以是有些输入量可合并考虑;GUM也在描述不确定度B类评定时指出可用信息包括“以前测量数据”(4.3.1),并认为B类评定与A类评定同样可靠(4.3.2)。大概是基于以上考虑,像杨教授文章中所叙述的,近年许多专业测量领域,主要化学测量领域,根据GUM的基本原理,提出本领域测量不确定度评定指南或建议文件,强调质量控制数据或方法确认数据的利用,不去逐一考虑现有数据所能覆盖的具体不确定度分量,亦即主要采用“自上而下”评定方式。这种评定方式的实用性是不言而喻的,它不违背GUM原理,其可靠性至少不逊于“自下而上”的方式,因此可能是医学实验室应主要采用的不确定度评定方式。
上述两个主要技术问题处理方案的提出可使医学实验室不确定度评定大大“简化”。杨教授文章中最后提出主要利用室内质控数据和校准物定值不确定度的医学实验室不确定度评定建议,的确,除外某些特殊或不合理情况,室内质控数据和校准物定值不确定度已涵盖影响检验结果分散性的诸多因素。
总之,阅读杨教授文章可以发现,在过去十几年间,测量不确定度概念在医学检验界不断被接受,医学检验不确定度评定主要技术问题也在逐步提出解决方案。随着相关工作的进一步开展,测量不确定度可望在医学实验室得到更多应用。