总分析误差:从概念到应用

检验视界网 2014-03-24

                                   James O.Westgard,PhD   Sten A.Westgard,MS

       今天,临床实验室为了确保及时和准确地发出报告,面临着实施质量体系和新的风险管理指南QC不断增加的压力。然而,在这些努力中还有一个问题常被忽视,那就是检验项目的实际质量目标或要求。简言之,检验专业工作者应当回答:一个检验项目需要做得多好呢?当实验室打算回答这个基本问题的时候,另外一些问题很快就出现了——实验室应如何确定质量目标?实验室应如何验证所用的分析方法能够满足目标?以及实验室确保在日常检测中达到这些目标的最佳途径是什么?

       管理分析质量的有效体系能在总分析误差(total analytic error
,TAE)概念的基础上形成,这是评估检测质量和设定检测质量目标二者很有用的度量。诸如西格玛度量(Sigma metrics)、方法决定图(method decision charts)、西格玛统计质控(SQC)选择图(Sigma statistical quality control selection graphs)及操作过程规范图(charts of operating specification)这些也都是有用的。本文综述了TAE的概念,包括其在管理实验室检测过程分析质量中的估计和应用。

一、基本概念

       Westgard、Carey和Wold三人于1974年介绍TAE的概念,为判断方法性能的可接受性提供了较定量的方式(1)。在当时,实验室考虑的做法将精密度(不精密度)和准确度(不准确度、偏移)分为误差的各个来源,并分别评价它们的可接受性。

       这种做法源于传统分析实验室,在那里通常进行重复检测以减小不精密度的影响,留下的偏移成为评价检测结果质量的主要因素。但就我们所知,临床实验室均对每个患者标本只做一次检测。因此,一个检测结果的分析质量就依赖于方法的精密度和准确度全部或总体的影响。

       临床实验室实际工作的这种差别促使引入TAE概念。很快,这些作者建议,依据观察到的误差相对于既定允许总误差(allowable total error,ATE)的大小来判定方法性能的可接受性。由于术语学和缩略语有时会使这个概念的讨论复杂化,也由于FDA(食品和药品管理署)对TAE和ATE这些术语的偏爱,它们还将在本文其他部分讨论中使用,且这些缩略语看来会成为临床检验标准词汇。

二、总分析误差的估计

       为使这个概念付诸实践,这些作者建议,实验室可以通过方法比较实验估计得到偏移(bias)和重复实验估计的精密度相结合来估计TAE。于是,使用标准差(SD)或变异系数(CV)的倍数,得到分析误差95%的可能性或限值的估计:TAE=bias+2SD (或TAE=bias+1.65SD单侧)(图1)。

       图示为原始文献术语表达总分析误差或总误差: RE(随机误差)、SE(系统误差)、TAE或TE(总分析误差)、Bias(偏移,不准确度)以及SD(标准差)。

       在Westgard、Carey和Wold提出这些定义之后,有些分析工作者认为应当考虑另外一些误差成分,诸如影响个别病人标本的干扰、有时被认为是随机偏移。为包括这样的影响,Krouwer建议通过与参考方法比较直接估计TAE(2),临床实验室标准化研究院(CLSI)随即形成了使用这一方法的导则文件EP21A(3)。

       这种直接估计方法最少需要120个病人样本,主要用于生产厂商对新方法所进行的大量验证研究。美国医疗保险和医疗救助服务中心(CMS)为符合CLIA法规对临床实验室建议:最少用20个质控样品来估计精密度,并以同样数量的患者样品来验证生产商声明的偏移。因此,结合重复检测和方法比较实验的结果做出TAE的初步估计更为实用。实验室还可以通过使用长期SQC数据持续估计、以及能力验证(PT)或室间质量评估调查(EQAS)定期估计偏移。

       今天,体外诊断厂商一般会提供精密度和偏移的声明,不是TAE。所以,临床实验室必须分别估计精密度和偏移以验证厂商的声明,除了FDA分类的简易检测项目。FDA建议,在这些检测项目开始用于临床研究前,生产厂家必须通过建立ATE的标准来客观评价每个新的方法和设施(4)。

       FDA目前要求厂商以“所有来源误差(系统的和随机的)的组合,通常表达为包含工作方法和比较方法间观察到差异的特定比例(例如95%)的区间”来评价TAE。该机构进一步要求在三个决定水平浓度下,每个水平至少用120个患者样品,这意味着厂商必须进行360个患者样品的比较实验。

三、允许总误差的目标(Goals for Allowable Total Error)

       鉴于ATE是用来评价检测程序的质量的,其实用价值取决于与检测结果预期用途所要求的质量相比较。该定义即为误差量,即不使检测结果解释无效允许的误差大小。

       实验室工作者能从许多国家和国际PT和EQA计划中发现推荐的ATE。此外,Ricos及其同事在西班牙(5)已经建立了生物学目标的数据库(可从www.westgard.com 网页获得)。这个数据库依据发表的生物变异资料,包括超过300个被测量(measurands)。它也按照Fraser综合允许SD和偏移的导则,提供了允许SD、允许偏移(bias)和允许的生物总误差(6)。

四、操作性能指标(Operating Specifications )

       实验室人员设定某检测项目(分析物、被测量)ATE目标很方便,但要实现目标则是另外一回事。后者要求在现实工作中可以实施的具体做法。比如,美国病理学会(CAP)对于HbA1c能力验证调查的可接受性能的指标是7%。为了实现这个目标,实验室必须选择具有相应稳定的精密度和偏移性能的方法,并运用正确的SQC去检出引起不稳定的分析问题。

       我们使用术语“操作性能指标(operating specification)”描述用于某检测程序的允许精密度和允许偏移,和在实际操作水平下为监视性能必要的控制规则和控制检测数的SQC,确保实验室实现既定的质量目标。这种做法与ISO15189的要求完全一致(7):
5.5.1.1“实验室应选择预期用途经过确认的检验程序”,
5.6.1.1“实验室应设计质量控制程序,因验证达到预期的结果质
量”。

       ISO在这里使用预期用途和结果的质量来描述质量目标或要求。这样的质量目标意味着指导方法的选择和SQC程序的设计。将精密度、偏移和SQC的相应组合成为实现既定质量目标的最终做法。

五、应用工具

       对于简易的检测项目(waived tests),FDA要求厂商确定ATE并评估TAE(总分析误差),而CLIA的法规也没有要求实验室验证(或确认)方法性能或进行SQC,除非厂商说明书有特别要求。对于非简易的检测项目(non-waived tests),它们占了临床实验室检测项目的大多数,CLIA法规要求实验室验证厂商的精密度和偏移等性能声明,每天至少作两个水平SQC程序,并成功地参加定期PT调查。

       我们相信对所有方法,简易的还是非简易的,由ATE目标确定的质量是一个更优化的系统所要求的。另外,实验室也被要求参加所有方法的PT,包括简易方法。目前,应建议实验室通过确定他们自己的质量目标并使用以下一些工具实施更优化的分析质量管理。
1. 西格玛度量(Sigma metrics)  
       最初推荐的总误差指标是ATE≥ bias+2SD,以后的文献建议ATE≥bias+4SD(8),随着采纳6西格玛概念(9)后,建议ATE≥bias+5SD和ATE≥bias+6SD。

       应用6西格玛容许限相当于实验室的ATE限值,并将西格玛度量计算定义为:(ATE-bias)/SD或 (%ATE-%bias)/% CV,以确定检测质量(图2)。西格玛度量越高,检测流程的质量越好。工业指南建议常规生产流程至少为3-西格玛质量。随着西格玛的增加,SQC变得容易和有效;所以,实验室应用CLIA每批分析两个水平控制品的最低要求时,最好是具备5~6西格玛质量的方法。

2. 方法决定图(Method decision chart)
       只要实验室确定了ATE,以图示方式评价某个实验室检测项目质量的西格玛度量的工具(方法决定图)很有用。方法决定图上:y-轴(允许偏移)的读数应从0到ATE值,x轴(允许精密度)则从0到0.5ATE值。ATE、偏移和精密度的计量单位必须相同,可以是浓度或者百分值。从y轴的ATE顶点向x轴的各个ATE/m点绘制的各个直线,分别代表不同ATE指标(m为总误差指标中的SD或CV的倍数)。

       图3是糖化血红蛋白c(HbA1c)项目根据CAP的PT指标(ATE=7%)要求的方法决定图例子。为评价一个方法的质量,实验室应画出代表观察到的偏移(y-值)和观察到的SD或CV(x-值)的方法性能运行点(operating point)。例如,某HbA1c检测方法的偏移为1.0%、CV为1.5%,它的方法性能运行点A落在相当于4西格玛的直线上。为确认其是否正确,实验室也应计算西格玛度量,即西格玛=(7.0-1.0)/1.5=4.0。

       这是HbA1c使用CAP的PT指标7%为ATE的方法决定图示例。y-轴为允许不准确度(%偏移),x-轴为允许不精密度(%CV)。从左到右的斜线分别代表6-西格玛、5-西格玛、4-西格玛、3-西格玛和2-西格玛的质量。方法性能运行点(A)显示具有1.0%偏移及1.5%CV的某方法,展示了为4-西格玛质量。
3. 西格玛统计质控(SQC)选择图(Sigma SQC selection graph)
       采用SQC程序,实验室能够使用统计方法来监视和评价检测系统,包括使用各种图示直观评价关键步骤的一致性(consistency)和鉴别值得关注的不常见状况。使用功效曲线(power curve)可显示与出现误差大小关联的拒绝概率(probability for rejection)。图4给出了几个不同SQC程序的功效曲线,并以4西格玛为例。正如所预期的,随着误差变大,误差检出概率(Ped)也随之增大,需要增加质控检测数、以及更多质控规则。图中功效曲线的y截距说明假性拒绝概率(Pfr)也略有增加。

       一个合适的SQC程序对医学重要误差提供了高Ped及低Pfr。实验室也可由检测项目的质量目标和方法的偏移与精密度计算出具有医学重要性的误差大小,即临界系统误差(DSEcrit):DSEcrit=[(ATE-bias)/SD]-1.65,式中1.65是将错误检测结果的风险减至5%所选定的因子。注意(ATE-bias)/SD代表检测过程的西格玛度量,也就是西格玛=DSEcrit+1.65。这一关系允许该图采用重新标示为西格玛尺度(见图4顶部的水平标尺)。实验室为选择合适的SQC程序,绘制出对应于该检测过程的西格玛度量的垂线。本例中,实验室可选择12.5s单一规则(N=4)或13s/22s/R4s/41s多规则(N=4)。指导使用西格玛度量为工具选择SQC程序可见CLSI C24A3(11)。

       y-轴为拒绝概率,x-轴为系统误差的大小(表示为SD或CV的倍数),而方法的西格玛尺度(sigma scale)在图的顶部。从上到下的各个曲线代表箭头右侧从上到下不同的SQC程序。在选择的西格玛处(即图中黄色箭头在x轴处指的那点)绘制一条蓝色竖线,代表具有4西格玛质量的检测方法,图解选择的两种SQC程序每批都需要4个质控检测。右栏上的Pfr为假拒绝概率,Ped为误差检出概率。
4. OPSpecs图(Chart of operating specifications,操作过程规范图)
       这一工具将某方法观察到的精密度和偏移,与要求的SQC联系起来,应用与方法决定图相同的公式。它使用“误差预算(error budgets)”的数学等式描述各种误差分量与既定质量目标的关系。起始点(starting point)是总误差预算量,由偏移加上SD或CV的倍数组成。加上体现SQC方案灵敏度特征的因子,则给出分析质量策划模式(12)。若进一步将分析前变量及个体内生物变异的考虑在内,提供了临床质量策划模式(13),它将检测结果中具有医学重要性变化与精密度、准确度及SQC联系起来。

       图5为实验室可怎样展示这些模式(称为OPSpecs图)的结果,该图使用确定的质量目标,y-轴为允许偏移、x-轴为允许SD或CV。方法性能运行点代表观察到的方法偏移(y-值)和观察到的方法不精密度(x-值)。图中的这些直线则表示不同SQC程序的允许范围。

       在方法性能运行点(如图示的A点)以上的任何一条直线都确定一个SQC程序,将提供至少有90%的可能性检出医学上重要的系统误差。每个SQC程序的质控规则和质控检测数已在图右侧方框内注明,图中的各个线从上到下依次对应方框中从上到下的SQC程序。若以偏移为1.0%、CV为1.5%的某HbA1c方法为例,由方法性能运行点A可见,能用12.5s单一规则方案(N=4)或者13s/22s/R4s/41s多规则方案(N=4)得以有效控制质量。

       用采纳CAP的PT指标(允许总误差=7%)的HbA1c为例说明OPCpecs
图。y-轴为允许不准确度(%偏移)、x-轴为允许不精确度(%CV)。在3.0西格玛(3.0 sigma performance)线以下的直线分别代表不同的SQC程序,如右侧方框注明的。点A表示具有1.0%偏移及1.5%CV的某方法,图解说明选择的这两个SQC方案每批都需要作4个质控检测。
5. 标准化的方法决定图和OPSpecs图(Normalized method decision and OPSpecs charts)
       对确定了质量目标的每一个检测项目而分别制备方法决定图和OPSpecs图是一种挑战,实验室也可选用y-轴刻度为0~100%、x-轴刻度为0~50%的标准化图。将方法性能运行点的坐标计算为既定误差目标值的百分数。比如,一个方法的ATE为7%,偏移为1.0%,CV为1.5%,这时方法性能运行点坐标被调整为y-值14%、x-值21%。标准化图的好处是将具有不同质量要求的不同检测项目放到同一张图上。例如,即时检测(POCT)葡萄糖(ATE=15%)、实验室葡萄糖检测(ATE=10%)和HbA1c(ATE=7%)可以呈现在同一张方法决定图或OPSpecs图上。而且,实验室可以将在同台多项分析仪上的所有检测项目都放到同张图上。

六、实现实验室检测的质量(Achieving Quality in Laboratory Testing)

       作为实验室工作者,我们的使命是向临床医师提供对患者诊断和治疗决策的准确和有用的信息。理解如何建立检测项目的质量目标、并通晓如何实现这些目标是这个使命必须的。

       本文仅仅是TAE和ATE概念简要介绍,若需了解更详尽的有关内容(质量目标的其他讨论、质量目标资料、其他应用实例和更多的参考文献)可在线获取。

参考文献

1 Westgard JO, Carey RN, Wold S. Criteria for judging precision and accuracy in method development and evaluation. Clin Chem 1974;20:825–33.
2 Krouwer JS. Estimating total analytical error and its sources. Arch Pathol Lab Med 1992;116:726–31.
3 Clinical and Laboratory Standards Institute (CLSI). Estimation of total analytical error for clinical laboratory methods. CLSI EP21-A 2003.
4 Food and Drug Administration, Center for Devices and Radiological Health, Office of In Vitro Diagnostic Device Evaluation and Safety. Guidance for industry and FDA staff: Recommendations for clinical laboratory improvement amendments of 1988 (CLIA ) waiver applications for manufacturers of in vitro diagnostic devices. 2008.
5 Ricos C, Alvarez F, Cava JV, et al. Current databases on biological variation: Pros, cons, and progress. Scand J Clin Lab Invest 1999;59:491–500.
6 Fraser CG. Biological variation: From principles to practice. Washington, D.C.: AACC Press; 2001.
7 International Organization for Standardization (ISO). Medical laboratories—Requirements for quality and competence.
International Standard 15189:2012. 3rd Ed. 2012.
8 Westgard JO, Burnett RW. Precision requirements for costeffective operation of analytical processes. Clin Chem1990;36:1629–32.
9 Westgard JO. Six sigma quality design and control: Desirable precision and requisite QC for laboratory measurement processes. Madison, Wis.:Westgard QC; 2001.
10 Westgard JO. Basic method validation, 3rd ed. Madison, Wis.:Westgard QC; 2008.
11 Clinical and Laboratory Standards Institute (CLSI). Statistical quality control for quantitative measurement procedures: Principles and definitions. CLSI C24A3 2006.
12 Westgard JO. Charts of operational process specifications (“OPSpecs Charts”) for assessing the precision, accuracy, and quality control needed to satisfy proficiency testing criteria. Clin Chem 1992;38:1226–33.
13 Westgard JO, Hyltoft Petersen P, Wiebe DA. Laboratory process specifications for assuring quality in the U. S. National Cholesterol Education Program. Clin Chem 1991;37:656–61.
14 Westgard JO. Managing quality vs. measuring uncertainty in the medical laboratory. Clin Chem Lab Med 2010;48:31–40.

 

       本文原载于September 2013 Clinical Laboratory News: Volume 39, Number 9:Total Analytic Error ,From Concept to Application 作者:James O. Westgard,PhD,威斯康辛大学病理和检验医学系终身荣誉教授,麦迪逊州Westgard QC公司负责人;Sten A. Westgard,MS,负责麦迪逊州威斯康辛Westgard QC公司。

                                                                                汪子伟译,冯仁丰校

                                                                                     编辑:范伟伟

反对 0 收藏 0 评论 0