临床生化检验西格玛度量评估和应用

检验视界网 2014-02-11

                        卫生部北京医院,卫生部临床检验中心——康凤凤 王治国

       六西格玛(6σ)管理法起源于美国20世纪80年代兴起的一场质量革命,最早应用于摩托罗拉公司,在公司盈利和客户满意度上取得了令人瞩目的成绩。此后6σ管理法逐步推广到像GE、IBM等著名跨国公司,并在20世纪90年代形成了一股6σ风暴。6σ质量管理在检验医学中的应用最早是由国外学者Nevalainen提出,通过将实验室差错或缺陷率转化为σ水平,从而对实验室检验过程进行评价和管理[1]。2002年,本文作者王治国首次将6σ思想引入至临床实验室质量控制[2-6],即将实验室检测性能通过西格玛度量值而量化,以便于实验室建立最优Westgard质控规则。

一、西格玛度量估计方法

       6σ思想在临床检验的领域应用可概况为两方面:
       1)检测系统或检测方法的性能评估,或用户对检测系统的厂家声明的验证;
       2)通过西格玛度量值设计最优的质量控制方案。方法性能的评估数据也是利用西格玛度量值设计质量控制方案的必要前提。
       通常有两种方式可以计算西格玛度量值,一种是将过程缺陷率直接转化为西格玛值,另一种是通过描述过程变异,结合质量要求计算西格玛值。可以从数据性质的角度来理解这两种方法的特点:离散数据和连续数据。离散数据以“是”或“否”,“男”或“女”,“有”或“无”表示。连续性数据指的是连续测量的数据,如长、宽、高或重量。
       当评价分析前和分析后过程的质量时,数据通常是离散性,即患者身份是正确的或错误的、是否有腕带、标本是否溶血、周转时间是否满足要求、试验结果是否通知临床,通常采用第一种方法,通过监测过程输出,持续累计缺陷,计算每百万缺陷数(Defects Per Million,DPM),然后通过查表将其转换成西格玛度量值,如表1所示。例如,通过持续监测,某实验室每月平均收到6万个标本,其中平均20个标本由于标本溶血、标本量不足、标签问题等被拒收,则该实验室的标本不可接受率以DPM表示:20/60000=333DPM,转化为西格玛度量值为4.9-5.0。
       而检测结果通常是连续数据,检测结果的变异不是简单的“是”或
“否”,“正确”或“错误”。试验结果具有预期的误差分布,其由测量程序的精密度和偏倚确定,多采用第二种方法。明确质量规范后,通过评估检验过程的不精密度和偏倚,按照公式σ= (TEa-Bias)/CV(TEa:Allowable Total Error,允许总误差;Bias:偏倚;CV:Coefficient of Variation,变异系数)计算西格玛度量值,从而建立正确的质量控制方案。例如,依据我国室间质量评价计划的可接受性能标准,胆固醇检测的质量要求允许总误差为10%,精密度评价表明CV为1.5%,方法比对研究显示Bias为1.0%,则σ=(TEabias)/CV=(10%-1%)/1.5%=6.0,所以该项目可采用最简单的质量控制方案就足以充分监控该过程的稳定性,如采用13s控制规则,每批2个检测的质控策略。

二、西格玛度量估计要素

       从上述公式可以发现,保证西格玛度量值估计的准确性和可靠性的前提是准确地评估偏倚和精密度,及合理地选择适当的质量要求。偏倚可通过方法比对研究、正确度验证计划及室间质量评价活动进行估计,具体方案可参考美国临床和实验室标准化研究院(CLSI)EP9文件[8]。方法比对研究是通过比较被评价方法和参比方法之间的差异估计方法的偏倚。正确度验证计划是一种特殊的方法比对试验,参加实验室通过重复检测新鲜冰冻血清,将检测结果同参考方法结果进行比较,从而估计检测过程的偏倚。在室间质量评价活动中,参加实验室将检测结果与公议值比较估计偏差。需要注意的是室间质量评价活动的靶值并非真正意义的真值,以此估计的“偏差”与检测过程的真正“偏倚”不完全一致。精密度研究可参考
CLSI EP5[9]文件,采用至少两个浓度水平的标本进行重复检测进行估计或利用已有的室内质量控制数据计算的变异系数。
       1999年,国际理论和应用化学联合会(IUPAC)、国际临床化学和检验医学联合会(IFCC)和世界卫生组织(WHO)在瑞典斯德哥尔摩召开了关于检验医学质量规范建立的协商一致会议,该会议通过了一个质量规范层级模型:
Ⅰ评价特定临床背景下分析性能对临床决策的影响
Ⅱ评价一般情况下分析性能对临床决策的影响:
A. 基于生物变异的数据
B. 基于临床医生的分析
Ⅲ公布的专业建议:
A. 来源于国家或国际专家小组
B. 来源于当地专家小组或个体专家
Ⅳ由监管机构或室间质量评价组织者制定的质量规范
A. 由监管机构制定
B. 由室间质量评价组织者制定
Ⅴ基于当前技术水平的目标
A. 能力验证和室间质量评价数据已证明
B. 已发表的特定方法学
       该层级模型共包含5个不同水平的质量规范建立方法,可总结概况为三大类:
       1)协商一致驱动。该方式包括当前技术水平目标和监管者制定的目标,其目的是为大多数实验室或大多数方法能满足要求,因此该方式并不能真正客观地评价性能,甚至可能会掩盖较差的方法,从而对患者产生不良的影响;
       2)生物学驱动。通过生物学变异数据明确方法应满足的变异要求,该方式以较高的要求客观的评价方法性能,但忽略了当前的技术能达到的实际水平,而应作为检测方法最终应达到的目标;
       3)临床应用驱动。根据不同的临床应用(诊断、治疗、预后监测等),确定不同的质量规范。如Karon等[10]分析了医疗记录及葡萄糖检测结果,明确临床医生如何做出胰岛素剂量决策。通过模拟来确定分析误差达到多大时将影响胰岛素剂量,从而确定该临界误差。该方式并未考虑当前技术水平,而反映了检测结果的临床应用。

三、质量规范(目标)的选择

       斯德哥尔摩层级模型表明最理想的质量规范应建立在临床医生如何使用检测结果的基础上,这种质量规范通常高于协商一致的目标,低于生物学目标。但这种质量规范的获得往往不容易,即使对广泛应用于临床的检测,其质量规范也存在很大的不一致。Friedecky等[11]总结了多个生化检测项目的不同质量规范,表2展示了总蛋白和白蛋白的不同质量规范或可接受标准。

       可以发现合适的生物学目标相对其他质量规范要小得多,尤其是白蛋白的Rilibak质量规范高达20%。生物学规范是一种完全的循证方式,而西班牙最低公议值的最小质量规范是保证90%的实验室能满足要求,不考虑试验的实际性能如何。
       对总蛋白而言,RCPA目标同生物学目标接近,剩余三个质量规范与我国室间质量评价标准接近,因此,以合适的生物学目标(3.4%)和我国室间质量评价标准(10%)为例,通过方法决定图讨论总蛋白的合适质量规范。图1是以适当的生物学质量规范作为质量规范的方法决定图,图2为我国室间质量评价标准作为质量规范的方法决定图,比较四个检测系统的性能。由图1可以发现,如果将3.4%作为质量规范,所有方法都不能满足要求。过于严格的质量要求对发现较差性能的检测方法也没有帮助。而图2表明尽管我国室间质量评价标准相对较宽,没有一个方法能达到世界级水平。大多数方法的检测性能处于边缘或较好区域内,这意味着实验室采用这些方法时,需要加强质量控制方案,最好采用Westgard多规则质控。因此,即使将10%作为质量规范,实验室仍然需要谨慎选择方法。

       对白蛋白而言,生物学质量规范最严格为3.9%,Rilibak质量要求最宽为20%,RCPA、SEKK和最低公议值同我国室间质量评价标准较接近。分别以适当的生物学质量规范、Rilibak质量要求和我国室间质量评价标准为质量要求,利用方法决定图讨论白蛋白的合适质量规范。图3、4和5分别为对应的方法决定图。同样,生物学质量规范依旧很难达到。可以发现Vista系统的两个点与另外两个点相距很远,这可能是某个研究存在偏倚所致,需要进一步的数据来说明。如果将3.9%作为质量规范,所有方法都不能满足要求。过于严格的质量要求对发现较差性能的检测方法没有帮助。图4显示了几乎所有方法都能达到世界级水平,如果将20%作为合适的质量要求,对性能评价没有帮助。图5表明有部分方法可达到世界级水平,而大部分实验室的性能在4σ-5σ之间,这意味着这些方法需要采用Westgard规则来合理地监测方法性能。

       没有一个质量规范是完全没有缺陷的,实验室应谨慎选择质量要求,确保满足监管要求的同时,尽量同检测的临床应用要求相一致。对总蛋白检测,我国室间质量评价标准相比其他质量规范更符合实际情况,能区分方法性能,但也需要加强质量控制才能达到世界级水平,而生物学质量规范过于严格,所有的方法都不可接受,这样的质量规范除了用于仪器研究和设计,对临床实验室无太大意义。而厂家应加强方法建设,确保能达到10%,并朝着最终的3.4%的方向而努力。对白蛋白检测,同样我国室间质量评价标准更切实,有一定的能力区分方法性能。Rilibak质量要求几乎对所有方法都能轻易满足,而生物学质量要求对现有的方法都难以达到。

四、六西格玛质量控制设计实例

1 方法比对研究和精密度研究
       被评价检测系统为Roche Integra 400+,比对仪器为Hitachi 917,比对数据来源于一周的患者标本分析。精密度研究包含两个:一个是10个标本的批内重复性实验,另一个是25个标本的日间重复性实验,来源于常规室内质控数据。表3展示了两个生化分析仪总蛋白和白蛋白检测的方法学比对和精密度研究(批内和日间)相关数据。

2 西格玛度量值计算
       如前所述,采用我国室间质量评价标准作为质量要求,白蛋白和总蛋白的质量要求均为10%,分别计算批内西格玛度量值和日间西格玛度量值,如表4所示。可以发现如果采用批内不精密度估计西格玛度量值,西格玛水平为20左右。这些不精密度值来于批内研究,一个批次的变异不足以用来估计实验室的批间或日间出现的误差和变异。因此,这些数据不能真正代表对仪器的变异评估,需采用日间不精密度研究数据重新计算西格玛度量值。日间西格玛度量值明显小于批内西格玛度量值。

3 质量控制设计
       毫无疑问,本研究Roche Integra 400+仪器的白蛋白和总蛋白检测
性能都较好,但是应该使用什么质控规则?进行多少次质控?这涉
及到质量控制设计的相关问题。从表4可以看出检测性能可因浓度
水平的不同而不同,哪一个才是血糖真正的西格玛度量?通常推荐
计算临床决定水平的变异系数和偏倚,然后使用这些估计值来计算
这个水平上的西格玛度量。
       根据西格玛度量值设计质量控制方案最简单的方法是根据经验进行设计,表5为基于西格玛度量值推荐的最低的质控要求。本研究中总蛋白和白蛋白最简单的质控规则为13.5s,N=2。

       此外还有很多质控设计工具, 包括标准操作过程规范图(OPSpecs)、西格玛水平图、QCCS2008,QCCS2008为本作者开发的
可自动为检测项目选择规则的软件。

五、结论

       值得一提的是,六西格玛管理并非万能的,甚至有时是“不可靠”的,尤其对于那些厂家声明中表示仪器有很高的西格玛度量时应警惕,实验室使用该仪器前应先检查和验证厂家提供数据的可靠性。如本文中的应用实例中,如果采用批内不精密度估计值的,得到的西格玛度量值就会高很多,但这并不是仪器真正的性能。而且厂家提供的研究可能是基于小样本量、短时期等数据。此外,临床实验室还需考虑:如果一个检测系统(或仪器)中各个检测项目的性能不同时,应如何进行常规质量控制?理想的解决方法是对不同的分析物采用不同的质量控制。虽然短期内可能会增加实验室的工作负担,但从长远角度看,合理设计质量控制方案不仅能保障实验室检测结果的准确性和可靠性,更能降低实验室的运行成本。

参考文献

[1] Nevalainen D,Berte L,Kraft C,et al.Evaluating laboratory
performance On quality indicators with the six sigma scale.Arch Pathol Lab Med, 2000, 124: 516-519.
[2] 王治国. 6σ质量标准在临床实验室质量控制的应用(Ⅰ). 上海医学检验杂
志, 2002, 17(2): 125-127.
[3] 王治国. 6σ质量标准在临床实验室质量控制的应用(Ⅱ). 上海医学检验杂
志, 2002, 17(3): 189-190.
[4] 王治国, 王薇, 李少男. 临床化学检验项目的σ水平的计算及质控方法的选
择. 检验医学, 2009, 24(1): 71-73.
[5] 康凤凤, 王治国. 六西格玛在临床化学检验质量控制中的应用. 临床实验室, 2013, 7(1).
[6] 康凤凤, 王治国. 临床血液学检测系统性能评价与质量控制设计——6σ法.临床实验室, 2013, 7(2).
[7] 王治国. 临床检验6σ质量设计与控制[M]. 北京: 人民卫生出版社, 2012.
[8] CLSI EP9-A3. Measurement procedure comparison and bias estimation
using patient samples; approved guideline—third edition[S]. CLSI, 2013.
[9] CLSI EP5-A2. Evaluation of precision performance of quantitative
methods; approved guideline—second edition[S]. CLSI, 2004.
[10] Karon BS, Boyd JC, Klee GG. Glucose Meter Performance Criteria for
Tight Glycemic Control Estimated by Simulation Modeling. Clin Chem. 2010 ,56(7):1091-1097.
[11] Friedecky B, Kratochvila J, Budina M. Why do different EQA schemes
have apparently different limits of acceptability? Clin Chem Lab Med. 2011
Apr;49(4):743-745.

                                    摘自定向点金《临床实验室》杂志2014年第一期
                                                               编辑:范伟伟

反对 0 收藏 0 评论 0