为连续工作分析仪的(患者标本数)限定区间操作设计的基于风险的SQC计划

作者:冯仁丰、张凯、姜妤
2021-12-16

Planning Risk-Based SQC Schedules for Bracketed Operation of Continuous Production Analyzers

为连续工作分析仪的(患者标本数)限定区间操作设计的基于风险的SQC计划

James O. Westgard,1,2* Hassan Bayat,3 and Sten A. Westgard2


背景:为消除患者风险,CLSI为SQC指南(C24-Ed4)中推荐了新的“限定区间[bracketed]”的统计质量控制(SQC)。(患者标本数)限定区间SQC要求在检测(限定)的一组患者样品前后,均有一个QC事件(检测QC样品)。在最佳化的QC安排中,需要着重考虑QC的频率或运行的样品多少,以保证检测质量,并有助于高产量分析系统的连续操作获得相应的报告结果。

方法:依据Parvin患者风险模型和CLSI C24-Ed4对建立QC计划的建议,研究了最佳患者标本数限定区间SQC计划的不同规划。使用了一个基于Sigma-度量患者标本批量的计算图表,去评价不同Sigma性能过程下的不同QC计划。

结果:对于较高的Sigma性能,一个有效的SQC方式应用了多级的QC程序,要在分析仪检测开始时设计一个“启动”QC事件,并在整个运行中定期地“监视”QC事件。文章给出了具有6-σ、5-σ、和4-σ性能测量程序的QC计划应用示例。

结论:可以采用多级SQC设计以有效控制具有高σ性能的连续工作分析仪,这些SQC设计应用了一个启动QC事件以及后续定期监视或限定区间的QC事件。这样经过最佳化的设计可以把对患者造成伤害的风险降到最低。


CLSI于2011年推荐了风险管理原则用于发展质量控制计划;并在2016年形成了选择/设计以风险为基础的统计质量控制(SQC)程序。以风险为基础的SQC程序的“目标是利用一种QC策略,可以可靠地在超出临床质量要求之前检出性能上的变化同时将假拒绝的频率降到最低。利用合理的检测和评价QC样品的频率,最小化可能受到潜在影响的患者结果数量。因此,C24Ed4定义了下列条款: 

质量要求(Quality requirement)——某产品或服务适合其预期用途所必须的特性指标。注:对于实验室的检测程序,质量要求通常表达为一个允许总误差(TEa)。若患者结果的检测误差超出了TEa,则检测结果不符合质量要求。

QC策略——检测QC物质的数量,QC结果的数量,以及在每个QC事件中使用的QC规则,和QC事件的频率。

QC事件(QC event)——发生一个或多个QC检测,和评价QC结果使用的某个QC规则。


传统意义上说,SQC设计关注在选择QC规则和QC结果数量,这是为了达到误差检出(Ped)的高概率同时保持假拒绝的低可能性率(Pfr)所必须的。举例来说,Ped的目标为≥0.90或≥90%的可能性,去检出医学上重要误差,如来自TEa和观察到的方法正确度(Bias)、和观察到的方法不精密度(SD),计算的临界系统误差:1531362447718068105.jpg

其中1.65为有5%的检测结果在单侧情况下超出允许误差的可能性。Pfr的目标已经是≤0.05或5%或更低的超出假拒绝的可能性。目前已经开发了多种多样的SQC设计工具,如功效函数图、Sigma-度量临界误差图、操作规范图以及经过简化的工具如Westgard Sigma Rules。但是,这些工具没有提供连续分析过程操作中确保连续报告结果质量所需的SQC频率选择以及SQC设计参数。


Parvin开发了用于患者风险参数计算的患者风险模型—MaxE(Nuf),该模型对SQC频率最优化十分重要。根据SQC计划叙述实际实施的SQC频率。C24-Ed4讨论了为批量操作、连续操作(又称“限定区间”QC)和关键控制点操作建立SQC计划的方法。为了明确起见,C24-Ed4叙述的操作模式如下:

“批量(Batch)QC:指的是被某种程序测量一组患者标本的情况。该程序确定了开始和结束时间且在该时间区间内对所有标本完成全部测量。”

“在连续模式中,QC样品定期地随同患者标本一起检测。对近期QC事件的QC结果的解释,反映检测程序的近期状态。如果近期QC样品结果为可接受,则可假设从最后一次可接受的QC事件开始测量程序仍然稳定,因此在那个区间内检测的患者标本结果很可能是可接受的。这个类型的QC计划可以被称为‘限定区间[bracketed] QC’,因为在‘限定区间[bracketed]’的开始和结束时的结果被用于确认了在‘限定区间’内检测的病人结果是可接受的。”


关键控制点QC指的是能改变测量程序性能的计划内事件…当以连续模式操作并遇到关键控制点时,有必要在该事件前后验证测量程序的性能。


对于高产出的连续过程,应该应用关键控制点(CCP Critical Control Point)和限定区间SQC。


无论何时只要发生重大变化,甚至可能是每天发生的变化,都需要CCP SQC来评估,如由于日常试剂的制备、试剂批号的更换、每日停机后的预防性保养、环境条件的变化,甚至可能是操作者的变化等可能导致变化发生的来源。然后,实验室应遵循限定SQC事件进行发送和报告患者检测结果。一种常见的方法是对限定区间内的两个QC事件使用相同的控制规则和相同的控制检测数量;但是更加经济有效的方法是考虑采用多级SQC设计,即一种控制程序包含2种或多种不同的设计,酌情从一种设计切换为另一种设计。例如,多级控制程序要有用于初始化检测的‘启动’设计、用于启动后常规运行的‘监视’设计以及用于评审在一个较长的周期内不只一个单批检测的控制数据的‘回顾性’设计。对高产出分析仪而言,采用多级SQC的优势是确保在开始操作时达到预期用途的质量(启动设计);周期性报告患者检测结果时确保质量连续可接受(监视设计);确保发生问题时实验室可进行评估,鉴别需要重新检测的患者标本。本文的目的是阐明这样的QC计划可以在多大程度上消除患者风险。


材料和方法


评估患者风险和SQC运行大小

Parvin的风险模式侧重于计算不可靠的最后患者检测结果数上的最大预期数量,即MaxE(Nuf)为了确定SQC或运行样品批量的大小,可以典型地设定在QC事件间最多增加≤ 1个错误患者结果作为目标。然而,该模型和计算是很复杂的,因此Yago和ALcver已经为单一规则的SQC程序开发出了电子数据表,Bayat为多规则SQC程序开发了电子数据表。这两组研究者提供的计算图表显示了MaxE(Nuf)和分析过程观测到的Sigma度量之间关系。可以进一步调整这些计算图表,以展现为使MaxE(Nuf)=1必须的运行样品批量大小作为Sigma度量直接函数,它们的应用已经在HbA1c的范例中详细阐明。参考文献11中的计算图表包括下列SQC程序:

• MR N4代表了每个QC事件检测4个控制品、使用一个13S/22S/R4S/41S的多规则,其假拒绝可能性为0.03或3%(Pfr=0.03);

• 1:3s N4是每个QC事件使用4个控制品检测、以13S为单一规则的程序,Pfr=0.01;

 • MR N2是每个QC事件使用2个控制品检测、使用13S/22S/R4S的多规则程序,Pfr=0.01;

 • 1:3s N2是每个QC事件使用2个控制品检测、使用13S的单一规则,Pfr=0.00;


• 为了设计多步骤SQC程序,添加了仅检测一个控制品检测的单一规则SQC程序,如下:

• • 1:2s N1,是每个QC事件使用1个控制品检测、以12S为单一规则的程序,Pfr=0.05。 

• • 1:2.5s N1是每个QC事件使用1个控制品检测、以12.5S为单一规则,Pfr=0.01。

• • 1:3s N1是每个QC事件使用1个控制品检测、以13S为单一规则,Pfr=0.00。


设计一个SQC计划的方式

1、定义分析检测过程的质量和工作量要求,尤其是以TEa形式定义预期用途要求的质量、在一个工作日或某时间阶段内分析患者样品的最大数量、以及要求的报告区间。

2、从性能确认资料中,确定检验程序的不精密度(SD、CV)和不正确度(Bias)。

3、按照浓度单位(TEa - | Bia s |)/ SD或以(% TEa - % | Bias |)% CV 的百分比单位计算Sigma度量值。

4、在计算图表1中,在观察到的Sigma度量值处绘制垂线。

5、阅读图1中y轴上的值,估计候选的SQC程序的最大批量大小,y轴上的值相当于对Sigma度量值垂线和各个SQC的程序线的交叉点所示的值。

6、通过鉴别控制规则和来自计算图表右侧方框图例的N,确定一个批量大小大于和或等于规定检测工作量的开始SQC设计。对于这个CCP QC事件,验证错误检测的可能性高,从功效函数图检测关键系统误差的可能性为90%或较好的Ped≥0.90(如图2)。

7、确定一种批量大小大于或等于要求的报告区间的监视SQC设计。从功效函数图中,证实假拒绝的可能性低,较好的Pfr≤0.05,或假拒绝率为5%。

8、准备SQC安排,为每个QC事件确定病人标本检测数和被分析的控制品数。

实验室质量控制-1.jpg

图1. 为连续产出分析检测过程的限定的操作,在QC事件间预估患者样品数量的Sigma-度量SQC批量大小的计算图表。

运行批量样品数大小为y,而观察到的Sigma度量为x值。右侧的方框确定了QC事件中使用的控制规则和总的控制检测数(N)。MR N4代表了N=4的13S/22S/R4S/41S的多规则程序,MRN2代表了N=2的13S/22S/R4S控制规则。单一规则程序使用13S控制规则且N分别为4和2时,分别以1:3sN4和1:3sN2表示。虚线代表了单一规则程序,如N=1的13S、12.5S、和12S。除了N=1的12S规则的预期的假拒绝率为5%外,其余的预期假拒绝率为3%。


实验室质量控制-2.jpg

图2. 包括在Sigma度量的SQC批量大小计算图表中的SQC程序的功效函数图。

y轴为拒绝可能性,x轴底部为医学上重要的系统误差(SE,以s倍数表示);x轴顶部为Sigma度量值。在图右侧方框内,为相当于控制规则和控制检测数/QC事件(N)的各个功效曲线(从上到下)。Pfr是假拒绝的可能性。R是检测中控制规则应用的运行数,1代表了在各个QC事件内应用了所有的规则。


结 果

图3为一个应用示例,图内x轴为Sigma度量值的大小;粗的垂直线代表了具有观察到的5 Sigma性能的某个检测程序。每条虚线代表了在图右侧方框内的不同SQC程序,它们与5 Sigma垂线的相交点,代表各个SQC程序若实现5-Sigma下相应可控制的运行大小的值,标记在y轴上。注意≥1000的批量被指定采用MRN4程序,因为交叉点超出了数值范围。

实验室质量控制-3.jpg

图3. Sigma度量SQC批量大小计算图表

(本图为5-Sigma质量检测过程的应用示例)。


表1确定了多个SQC程序及其最大运行批量,范围为50~1000个患者样品。表1展现了对3个不同的工作量条件设计的SQC计划。方式1代表了最大工作量1000个患者样品,要求报告的区间是200个患者样品;方式2则分别为500和125;方式3代表分别为200和50。在可能的情况下启动设计的运行批量应该尽可能接近最大患者工作量;监视设计应该总是选择与要求报告区间同样大小的运行批量。启动设计确定了第一个QC事件(1个CCP)的控制规则和控制测量数量;监视设计确定了支持患者检测结果报告的后续限定QC事件的控制规则和控制测量数量患者。

1531363531(1).jpg

最大的运行大小与图4中由Sigma-度量的运行图表确定的候选SQC程序对应。工作量指标展现了3种最大病人样品工作量和要求的报告区间方式,可引出不同的启动操作和监视设计,以及不同的SQC安排。


实验室质量控制-4.jpg

图4. 4-Sigma和6-sigma质量检测过程的应用示例。

X轴上的垂直线与多条SQC线的交叉点确定了Y轴运行批量大小的值。


这个示例应用了2个水平的控制品(C1、C2),这也是医学实验室通常采用的同时被行政管理机构广泛接受(如,US CLIA要求的最低SQC)的做法。方式1中,最大的工作量是1000个患者样品,在启动QC事件中分析两个水平控制品两次(13S/22S/R4S/41S,N=4),但在每个后续限定QC事件中,每200患者样品(13S、N=2)仅分析1次。方式2中,最大工作量是500个患者样品,在启动QC事件中2个水平控制品仅分析1次(13S/22S/R4S,N=2),后续所有的限定QC事件每125个患者样品仅分析1个水平的控制品1次(12.5S,N=1)。方式3的最大工作量为200个患者样品,启动QC事件中分析2个水平控制品(13S,N=2)1次,后续每个限定QC事件中,每50个患者样品仅分析1个水平的控制品1次(13S,N=1)。13S、N=2的启动设计达到的Ped为0.86,稍低于要求的0.90,但13S/22S/R4S多规则程序可以实现(Ped=0.94)。在这个情况下是否实施单规则或多规则设计,采取一些近似估计和判断对实际应用是必要的。最后表1估计了合适的费用,即在过程可控时SQC的费用。在考虑的3个方式中,SQC分别消耗了1.4%、1.2%和3.0%的产出能力。


图4显示了4-Sigma和6-Sigma二者的质量过程的应用。对于6-Sigma的性能,适当的运行批量大小均≥1000个患者样品,除了使用13S、N=1的程序,它的运行批量大小约370个患者样品。简而言之,启动的QC事件可使用一个13S规则和N=2(2个水平控制品各自有一个结果,遵照了美国CLIA法规),后续所有限定QC事件可使用相同的规则和N=1。可以选择≤370个患者样品的报告区间进行实时报告。QC成本可低至每1000个分析作5次控制,或占输出的0.5%。


对于4-Sigma的性能,运行批量大小详见表2。对于13S/22S/R4S/41S和N=4的多规则程序而言,最大运行批量大小接近200个患者样品(图上约190,但实际实践时多为估计或近似)。对于工作量为1000个样品且报告区间为200个样品的情况,这个N=4的多规则应该用于启动QC事件以及后续每200个样品的限定QC事件。对于最大工作量为500个样品且报告区间为125个样品的情况,启动和后续限定QC事件均需要相同的多规则程序。

表2. 4-Sigma质量检测程序的SQC计划

1531364142(1).jpg

最大的运行大小与图4中由Sigma-度量的运行图表确定的候选SQC程序对应。工作量规范展示了3个选项的最大患者工作量和要求的报告区间,导致不同的启动和监视设计以及不同的SQC计划。


对于工作量为200个样品的情况,启动QC事件也需要相同的多规则程序,但一个每50个样品的限定QC事件需要12S、N=1程序进行监视。然而很少建议采用12S控制规则,因为假拒绝率很高。该规则被局限在使用N=1时使用,只有这种情况下这个程序的最大可容忍假拒绝率为5%。当满足该规则,检测质量为可接受,可以报告患者结果。若违反该规则,则患者结果需挂起直至获得下一个控制检测结果为止。然后应该评价该QC事件,如果发生第二次失控(22S或R4S),则应该拒绝该批结果;如若不然,则该批结果可以接受,并报告患者结果。在此处应用多规则程序作为“回顾性”设计,审查选项1中200个患者样品区间采集的4个控制结果,可提供更快捷的患者检测结果报告。


对于Sigma度量<4.0的检测程序,SQC策略和计划会变得更加困难和昂贵。例如,从计算表图的检查中,一个3.5-Sigma过程使用13S/22S/R4S/41S、N=4的多规则程序时的最大批量运行为50个患者样品。对限定区间操作而言,每1000个患者样品需要84次控制检测,或是患者检测结果产出的8.4%。


对于质量<3.5-Sigma的方法,即使使用了较高的N和多规则程序,也会需要较小的患者样品的运行批量或更高的SQC频率。较好的补救措施是选择能达到较高Sigma质量且更容易控制的较好的测量程序。


讨   论


近期对近1000家实验室的调查发现,约50%的实验室表示每天仅在一个分析批运行开始时做一次分析控制;换句话说,他们仅实施了一次SQC事件,仅进行了一个阶段的SQC。其他的50%实验室依据分析的患者样品数量,全天或在全天特定的区间内实施了某种形式的限定的或定期的分析,尽管他们检测报告的做法不同且原理和设计也并不一致。这意味着建立更加客观且优化程度更高的限定SQC尚需付出极大的努力。2016年的CLSI C24-Ed4文件通过强调以风险为基础的SQC为这一目标提供了指导。该文件含蓄地建议连续产出过程需要限定操作,并强调应该设计详实SQC计划并加以实施。


SQC计划为实验室提供了QC策略的“操作定义”。Deming讨论了操作定义的需求,叙述做什么和包括为确保达到(实现)要求的质量的程度,如应在3次铃响内接听来电。对实验室应用而言,这可能简化为“在60分钟内提供检测结果”,对时间的度量给出了可接受服务的一个评估。或者,它会更加复杂如“提供误差在10%以内的检测结果”,这取决于检测程序的不精密度和不正确度,以及对评估性能是否达标至关重要的QC。在实验室实践中,SQC计划将SQC理论与原则、预期用途所需质量、观测到的测量程序性能、要求的SQC程序性能集合在一起;在风险管理的年代,质量较差的结果导致对患者造成伤害的风险的升高。


C24-Ed4文件强调了这个复杂的问题,并提供了依据质量管理和风险管理原理开发SQC策略的“路线图”。结果应该是一个叙述了被分析的控制物质水平的个数、每个物质被分析的时间次数、评价控制结果使用的控制规则和QC事件的频率或运行批量大小等内容的SQC计划。实验室面临的困难是如何将近60页的指南转化成一个设计SQC计划的实际程序。需要较详细的方法学和设计工具促进这样的SQC计划形成。


这个任务的复杂性随着对诸多参与因素的认识而渐渐浮现。这些因素包括:预期用途要求的质量(TEa);检测程序观察到的精密度和正确度(CV、bias);SQC的策略(控制规则、控制结果数量、SQC频率或运行批量大小);SQC程序的性能特性(Ped、Pfr)以及因增加了错误检测结果对患者造成危害的风险等,就像Parvin的风险模型和MaxE(Nuf)的风险参数所描述的那样。


另外,应用必须考虑各个实验室最大的工作量(即要检测的患者样品量)情况和要求的报告区间。在认识到C24-Ed4文件的关注点是原则和后果,却没有提供任何详细的应用示例或特定的工具支持实验室的应用,实验室面临的困难变得更加明显。因此需要更多的指导,特别是有助于实验室应用这些概念、原则和建议的简单的图示工具。这里的Sigma-度量的SQC运行批量计算图表,展示了为限定操作运行设计SQC计划的一种工具的实际应用。 


设计限定SQC的重要原则是将初始的SQC事件考虑为一个需要高误差检出率的关键的控制点(CCP)。许多法规要求每天运行SQC,所以分析性能的一些关键点必须每天验证,如保养后、试剂更换、环境条件的变化、操作者变更以及实施新的校准。一旦分析性能被启动的CCP QC事件证实,后续的监视则可采用较为简单的规则和较低的N。原则上,起监视作用的SQC程序应该具有非常低的假拒绝率,即使以降低一些误差检出率为代价,也要在两次假拒绝之间实现尽可能长的间隔。如果出现这样的情况,一个SQC程序不可既有较高的误差检出率又有很低的假拒绝率;因此多级程序的方式使得较高误差检出率和较低假拒绝率的设计成为可能。该设计的应用,取决于预期是否存在较高的误差率(使用启动的CCP设计)或较低的假拒绝率(使用监视设计)。


在这里叙述的方法中,我们建议应该具有监视QC事件的设计最大程度上降低要求的报告区间的患者风险。原则上,Parvin的模型假设对限定操作中的所有QC事件采用相同的SQC设计。给出的限定区间大小(即检测患者样品多少)主要取决于SQC程序误差检出能力,且假设CCP事件的误差检出率将总是大于或等于后续限定事件的误差检出率,建议的运行批量大小将是安全的,并与以后运行中的第一次限定区间操作事件相应,和Parvin模式为以后的限定事件严格地一致。许多实验室认识到了定义要求的报告区间的价值,其价值体现在患者样品需要重新分析时的快速响应服务和高性价比操作。该报告区间取决于分析仪的速度以及预期用途所需的临床服务,因此它将随着个体实验室应用的不同而变化。

  

多步骤设计的经济性取决于检测过程的Sigma质量。Sigma度量为5.0或更大的过程可采用简单的SQC设计,配合大工作量,提供反馈迅速的患者报告并保持了相对较低的成本。


4-Sigma过程则需要更大付出努力:SQC程序要求更多的控制结果、需要多规则结果、运行批量将更小。对于≤ 3.5-Sigma的过程,甚至需要更复杂和昂贵的SQC策略。一个做法可以是为累积提供限定QC事件的控制测量的回顾性审查增加第三SQC设计。另外,还可能实施一个移动均值类型的SQC程序,有效地评价特定控制结果的数量,或采用控制结果的移动窗口,提供要求的误差检出和运行批量规模。这样的一个程序也被建立在患者数据上,尽管性能的评估和最佳化要困难得多且要求更先进的工具,尤其是要考虑定量方式的患者风险。

  

实施多级限定SQC设计需要SQC软件的革新。这许多年前已经显示出具有可行性,但它将需要应客户的需求以取得供应商做出可以推广使用的革新。同时,可能随着使用简单的单规则设计如不用于N=2的开始设计以及N=1的监视设计实施高Sigma质量方法。通过为启动设计连续安排多个控制品,并为报告区间辅以适当的后续监视控制,可以非常容易地实施多规则设计。多重检测系统将需要更多的策略来系统化设计以为不同的检测项目提供适当的性能。实际应用将需要合理的估计、明智的选择和逻辑的适应。除了这些困难外,实验室将因更加客观的限定SQC操作设计而获益并将通过实施限定SQC降低患者的风险。 


翻译:冯仁丰老师

审校:张凯、姜妤


实验室质量控制-5.jpg