是否可以对医学实验室评定 不确定度争议做一小结

作者:杨振华
2021-12-16

国内很多学者曾讨论医学实验室是否有必要评定测量不确定度以及采用什么评定办法,这很难给出一个结论。随着科学发展,近年来不少组织、专家提出不少新的标准和建议。我国CNAS也曾发布技术报告CNAS TRL-001“医学实验室—测量不确定度的评定与表达”,但缺乏国际公认的权威意见。最近国际权威组织,如ISO、ILAC等相继发表一些标准和导则,肯定了不少建议和意见。现在再回头看,似乎可以肯定当时的一些意见和建议。读者有可能对此问题提出更进一步的看法,本文拟对此议题提出看法,希望大家提出批评和建议,继续为医学实验室溯源和评定测量不确定度(以下简称不确定度)制定一个更实用的导则。


一、争论的历史发展


不仅在我国存在医学实验室应不应评定不确度的争论,国际上存在已久。1993年七个国际学术团体公布评定测量不确度的国际标准GUM*时,就得到以欧洲学者为主导的国际临床化学和检验医学联合会(IFCC)的大力支持。另一方面,美国临床化学学会(AACC)对评定不确定度很冷淡,其学会杂志《临床化学(Clinical Chemistry)》在整个20世纪就没有刊登过一篇有关不确定度的学术论文,直到2005年才在“观点/反对观点(point/counterpoint)”栏目中同时刊登正、反两方面文章。正方是美国著名学者Krouwer的“Critique of the Guide to the Expression of Uncertainty in Measurement Method of Estimating and Reporting Uncertainty in Diagnostic Assays”认为商业性诊断检测无需评定不确定度,反方是丹麦学者Kristiansen写的一篇应评定测量不确定度论文:“The Guide to Expression of Uncertainty in Measurement Approach for Estimating Uncertainty: An Appraisal ”,从主编安排可以看出美国学者不赞同医学实验室评定不确定度。

但同时美国检验界也开始转变观点。美国知名的标准制定机构——临床和实验室标准研究所(CLSI)与IFCC合作制定导则EP 29-A“检验医学中测量不确定度的表达”。从2005年开始,历经欧美学者多年争议和讨论,2011年底终于正式颁布。2012年美国反对评定不确定度主要学者Westgard在其网站上指出美国临床实验室也应考虑评定不确定度,欧美学者取得初步共识。但这绝不是争论的结束,在如何以及用什么办法评定不确定度问题上,一直存在如下问题:

---医学实验室是否可以只评定测量过程,而不是GUM倡议的全测量过程的不确定度;

---能否不用GUM的“自下而上”,改用“自上而下”的办法评定不确定度;

---能否用医学实验室实际工作数据,不需增加附加的试验来评定不确定度。

在这些间题上,检验学与计量学专家之间存在严重分歧和争论。计量学专家往往认为检验学家提出的意见有违GUM原则。直到最近几年,才逐步取得共识。下面将逐个讨论此三个争论问题和初步共识。


二、医学实验室是否可以只评定测量过程的

不确定度


实际上这不只是医学实验室的问题,而是检测实验室(ISO 17025将其称为testing laboratory),以区别校准(参考实验室)普遍面对的困难。GUM介绍的“自下而上”评定不确定度办法过于复杂、繁琐,且很难比较采用此法评定的不确定度结果。但争论双方都公认参考实验室在评定参考方法/参考物质的不确定度时不得不采用“自下而上”的办法。


作为检测实验室类别之一的医学实验室如何评定不确定度不但是一个热点,还是一个难点。早在20世纪初,ISO在公布ISO 15189的同时,就开始制定医学实验室评定不确定度标准的工作,即ISO 25680,历经九稿均未通过,原因估计为此稿主要由计量学家书写,应用“自下而上”办法,不为检验学家所接受。现改由澳大利亚检验专家White书写。在其初稿中,认为2CV可以相当扩展不确定度。计量学家很难接受此类观点。目前正在反复修改重写中,恐怕不是短期就能制定好,并投票通过的。


从历次国际认可医学实验室标准ISO 15189对不确定度要求的改变,可以看出专家们对医学室验室评定不确定队识的变化和进步:

2003年第一版和2007第2版在“保证检测程序的质量”章节中对不确定度有如下2段简短要求。第一段为“5.6.2 适用且可能时,实验室应确定检验各种办法结果的不确定度。应考虑所有重要的不确定度分量”,此段似为计量学家和检验学家争论的妥协结果。“实验室应确定检验各种办法结果的不确定度。应考虑所有重要的不确定度分量”,很可能是计量学家的要求,可能因为检验学者提出众多的困难,不得已在前面加上“适用且可能时,”但对什么是适用和可能,各人有各人理解。往往在认可时,实验室只选少数几个项目,按下一段叙述要求评定不确定度“不确定度来源可包括采样、样品制备、样品部分的选择、校准品、参考物质、输入量、所用设备、环境条件、样品状态和操作人员的变更”,此要求涵盖了整个检验过程(测量前、测量中和测量后三个过程)。据此,实验室不得不按经典“测量不确定表达导则(GUM)”建议的“自下而上”办法评定不确定度。


在认可工作中,要求医学实验室按此严格执行,几乎是不可能或不现实的,检验科不得不采用一些变通办法。本世纪初流行的做法就是以两个标准偏差(s)相当于扩展不确定度(U)。例如英国临床病理认可组织(CPA)在2000年颁布了一个导则,叙述在评审实验室时,评审员可以认同以2s相当U。其结果正如美国专家Westgard“医学实验室质量管理vs测量不确定度”一文,用幽默语言将ISO 15189:2007评定MU过程讽刺为“测量不确定度可能成为在实验室进行的没有意义的计算,把它展示给评审员,他再发证证明实验室进行了无意义参数的计算,以符合全球(ISO)标准,如果在原理和实践上,它们(ISO标准)都不正确的话,它就失去意义和价值。”确实是这样,ISO 15189:2007中没有说明评定不确定度目的,只是为通过实验室认可不得不做的表面文章。


ISO 15189 2011年第3版作了明确修改,用一个完整章节“5.5.2.1测量不确定度评定”做了较完整的叙述:“实验室应为检验过程中用于报告患者样品被测量值的每个测量程序确定测量不确定度。..........”此段话对前二版做了顛覆性修改。不是按GUM要求应评定测量前、测量和测量后全过程的不确定度,改为“检验过程中...被测量值的..测量不确定度”,可能怕对什么是检验过程产生误解,添加注1说明“与实际测量过程相关联的不确定度分量从接收样品启动测量程序开始,至输出测量结果终止”。如使用自动分析仪此过程应是开始于将样本放入仪器样品杯后,开启自动分析仪,不是从实验室接受样品开始,为使用“自上而下”评定不确定度办法提供可能。


将上两版的“适用且可能时”修改上升为“每个测量程序确定测量不确定度”,此项修改可能反映了计量界希望医学实验室能重视评定不确定度工作。要求医学实验室能按计量学要求,探讨如何结合医学实验室的实际工作,“报告患者样品被测量值的……测量不确定度”。医学实验室不可能像既往认可时,从文献找几个实例报告评审员就可,不得不认真评定不确定度并“定期评审测量不确定度的评估结果”。


这是第一次在国际标准,而不是在地区或国家标准中明确规定医学实验室可以只评定测量过程的不确定度。这并不是说测量前、后影响量不重要,只是一些测量前后影响量与检测实验室关系不大,例如采样是一个重要影响量,但常由送检单位负责。检测实验室不得不在报告单声明测量结果只与该送检样本相关。此观点一开始不易为计量学家所接受,经过长期争论最终才被国际标准接受。


这些要求的变化明确了医学实验室可以评定测量过程的不确定度,第一次在国际公认的ISO导则中肯定此点,为应用“自上而下”办法评定不确定度提供了可能。


三、能否如采用“自上而下”办法,取代

经典“自下而上”评定不确定度办法


确定了医学实验室可以只评定测量过程的不确定度,则不难使用所谓“自上而下”评定不确定度办法,也就是不需寻找出每个影响量,而是根据经典误差理论,认为测量结果的误差主要来自系统误差和随机误差,对于医学实验室而言,找出此二个误差不是一件困难的事。系统误差可以通过计算偏移求得,从实验室室内质检数据很容易了解测量结果的实际随机误差。


在GUM颁布后,检测实验室就提出了:是否有简单易行的评定测量不确定度办法?由检测实验室组成的欧洲学术团体——欧州国家测量联合会(EuroLab)相继在2002、2006和2007年公布了3个文件专门探讨评估不确定度的各种办法,提出了除GUM办法外,检测实验室还可以用所谓“经验办法”评定测量过程的不确定度。EuroLab在其3个文件中,系统发展了根据偏移和室内质控数据评定不确定度办法。2002年文件曾取名为“黑箱(blackbox)”办法,说明与经典方法相比,人们并不了解影响偏移和不精密度的每个影响量,2007年标准将其改名为“经验(empirical)”办法。


著名的北欧标准制定机构“北欧检测协作组织(Nordtest)”在1997年公布了标准TR 537《环境实验室计算测量不确定度手册》,不使用经典GUM“自下而上”,只使用偏移和精密度数据评定不确定度的办法。在2003年和2012年分别颁布第二版和第三版标准,它将此类办法命名为“自上而下”评定不确定度办法,与目前学者习惯将经典GUM评定不确定度办法称为“自下而上”办法相对应,非常形象地表达这两类评定办法的差异,为大多数检测实验室工作者接受。


“自上而下”评定不确定度办法虽然已存在十余年,但未为计量学家广为接受。它似乎违背GUM基本原则,没有找出影响测量结果的每个影响量并评定它们对确定度的贡献。因此尽管检测实验室已应用多年,直到2012年ISO颁布了只用“自上而下”评定不确定度国际标准,即ISO 11352“水质-基于有效性和质量控制数据的不确定性测量评估 ”,此文件由负责制定水质量标准ISO/TC147的技术委员会制定。


该文件引言中说:“ISO/IEC98-3*叙述了评定测量不确定度的基本原则。根据评定目的和可得到的数据,还有几类评定测量不确定度的途径;EuroLab的TR 1对主要办法给出了综述,本国际标准特定了一系列程序,实验室可以使用基于质控结果和确证数据的办法来评定它们测量结果的测量不确定度。此文件是专为不全面了解计量学或统计学的分析家而组织的,应用NEN7779和Nordtest TR 537作为制定此国际标准的基础,采用的是“自上而下”的办法,相对于ISO/IEC 98-3采用的“自下而上”的策略。


将评定的不精密度和与偏移相关的不确定度合并为一个测量不确定度在统计学上是可接受的,此办法的数据来源是方法确认和分析质量控制,此国际标准确定的实验办法能较广覆盖常规使用分析方法时的变异来源。”


这段话明确将“自上而下”评定不确定度的办法与GUM的“自下而上”评定方法并列,并特别提出“此文件是专为不全面了解计量学或统计学的分析家而组织的”。换言之,此国际标准的原则应也适用于医学实验室,为医学实验室应用此类简单的评定不确定度办法给于强有力的支持。


四、获取什么数据来评定医学测量结果的

不确定度


ISO 11352在引言中称“根据评定目的和可得到的数据,有多种评定测量不确定度的途径”,此标准主要用于水质检查。在评定不精密度方面,这些实验室与医学实验室一致,都是使用室内质控数据,也就是都能得到实验室内复现性数据。但在评定偏移时,2者情况不尽相同。此国际标准提出可从3个方面计算偏移的不确定度,即:

“--分析合适的参考物质;

   --参加实验室间比对;

   --以合适样本进行回收实验”。

水质检测实验室由于基体简单,容易得到各个级别的互换性参考物质,不难通过与参考物质比较求得偏移,此外,这些实验室在一国或一个区域内,数量不多但都管理较严格,测量结果相当可靠。当缺乏参考物质时,还可考虑通过室间比对数据估算偏移。为了使此法得到比较可靠的偏移,规定了至少要通过6个或6个以上室间比对结果来评估偏移,还专门设立一个此办法特有的术语,即实验室和方法偏移以及特定的计算方法,水质检测实验室使用上述办法都有困难时,最后还可以通过回收实验来计算偏移。


但对医学实验室而言,使用此3方面数据都存在一定困难。首先医学实验室不易得到合适的具互换性的参考物质,主要因为医学实验室测量样本来自生物体,基体含复杂成分,而水质测量样本的基体简单,不似生物测量所用参考物质必须具有互换性,才能用于正确度确认或验证。为得到正确的偏移,需要判断参考物质的互换性,这显然不是大多数医学实验室所能做到的。其次医学实验室虽然几乎都参加能力比对,但并不是所有能力比对计划质量不错,数据可靠。一些能力比对结果的平均值存在不一定真实可靠和前后不稳定等情况,由于必须至少6个能力比对结果才能评定,常需收集2年乃至更多时间的数据。至于最后一个办法,使用加标样本进行回收实验由于基体效应,一般不认为适用于检验医学。


那么医学实验室从哪儿可收集到可用于评定不确定度的偏移数据?

偏移的不确定度与计量溯源密切相关,在整个校准等级中,每一层次的测量程序和校准品都应有与其相关的测量不确定度,而且下一层次的测量程序/校准品的不确定度应包含上一层次的不确定度。医学实验室是校准等级的终用户,如果样本测量结果是使用IVD企业提供的产品校准品进行校准后,按厂家规定的测量程序得到的,则知道产品校准品的不确定度以及医学实验室校准产生的不确定度,不难计算出偏移的合成不确定度。


谁可提供产品校准品赋值的不确定度?

ISO 17511:2003在第8章“体外诊断医疗器械使用说明中应给出的计量学溯源性信息”中,明确要求“EN273:2001适用,用户需要,制造商也具备时,制造商应向专业用户提供校准品和正确度控制品赋值的不确定度。”在2015年第二版修改稿中更明确为“8.2终用户有要求,必需提供产品校准品和正确度质控物质赋值的不确定度”。


对医学实验室而言,假如可以利用厂家提供的产品校准品的不确定度和实际工作中所得到的室内质控和校准数据,无需添加额外工作就可评定不确定度,无疑将极大推动医学实验室评定测量结果不确定度的工作,这将是医学实验室容易接受的评定不确定度的办法。


五、小    结


通过长期的讨论,国际上已认可医学实验室可以只评定测量过程的不确定度,已有使用“自上而下”的办法评定测量过程不确定度的国际标准ISO 11352。我国检验界可考虑在这些目前国际上已达到共识标准的基础上,制定一个根据医学实验室可得到的资料和数据,简单而又实用的评定测量结果不确定度的标准。


参考文献

1. Guide to the Expression of Uncertainty in Measurement (GUM). BIPM, IEC, IFCC, ISO, IUPAC, IUPAP, OIML. International Organization ofStandardization, Geneva Switzerland, 1 st Edition 1993, Corrected and reprinte.

2. Quantifying Uncertainty in Analytical Measurement. EURACHEM/CITACGuide, 2nd Edition, 20003.

3. Measurement Uncertainty in Testing, Eurolab Technical Report No. 1/20023.