临床实验室分析质量目标的共识 第二篇

作者:冯仁丰 24329
2021-12-16

斯德哥尔摩会议15年后重新确定分析性能指标的做法

冯仁丰.jpg

冯仁丰教授,出生于1942年,1965年毕业于上海科技大学生物物理化学系,1965年10月进入上海市立医学化验所(后改为上海市临床检验中心),直到2002年11月退休。1984年-1998年为该单位的所长、中心主任、杂志主编。冯仁丰教授长期研究和关注、实施临床实验室的质量管理,颇有体会。1994年10月起享受国务院特殊津贴。


摘要:为了确保临床实验室的检测质量,满足患者和临床对实验室的需求,长期来临床实验室一直致力于研究、探索、建立分析质量指标。这是衡量临床实验室每天对患者检验的报告结果,是否实现了质量的重要标准。1999年在斯德哥尔摩会议上确定了如何建立质量指标的五个等级做法。经历了以后15年的不断努力和实践,2014年欧洲临床化学和检验医学联合会(EFLM)在意大利米兰召开了第二次国际会议,期望重新确定分析性能质量。会议对斯德哥尔摩会议的声明进行了重新审核,对原先确定的五个等级建立分析质量指标做法,简化为三个等级。而且还提出了其他的提议。


关键词:分析性能质量指标(Analytical performance quality specifications);临床后果(Clinical outcome);生物变异(Biological variance);操作水平(the State of the Art)


欧洲临床化学和检验医学联合会(EFLM)为了激励和改善检验医学在科学、专业和临床上的重要性,近期决定召开系列会议,每半年举办一次。2014年11月,在意大利米兰召开了第一次会议,议题是“斯德哥尔摩会议15年后重新确定分析性能指标”。该会议是在米兰大学检验医学的计量溯源性中心(CIRME)和欧洲联合研究中心委员会的参考物质和测量研究院(IRMM)合作下组织的。有来自五大洲41国家的215名参加者,代表来自临床实验室、EQA提供者和其他专业组织、以及体外诊断(IVD)厂商。会议非常成功。


1999年的斯德哥尔摩会议是一个里程碑,期望实现如何设定质量指标、以及建立等级模式的协同[2]。Fraser C是斯德哥尔摩会议的副主席,这次会议他不仅对1999年会议进行了历史回顾;而且对实验室质量指标的历史做了一般的调查[3]。他强调重新审核这个等级的时间已经到了,要研究什么范围依然是正当的,或应进行修改或扩充,这是EFLM会议的最终目标。


会议分为五个内容。首先是从临床需求、生物变异数据或检测程序的操作水平为基础的性能指标三个内容,探讨可能性和利弊关系。在代表检测项目评价的EFLM工作组(WG)的报告中,Horvant等[3]讨论了与某个做法的模式有关的后果(结果)的复杂性,研究分析性能对医学决定和患者管理的影响。同时确认了这些评价类型是困难的,对检验医学的所有被测量是不可能的,作者认为这个方式是设定指标的“金标准”。下一个,Per Hyltoft Peterson,他是另一个1999会议组织者之一,展开的讨论包括模拟研究做法去模拟了解临床后果的可能性,以及分析性能对其的影响[4]。作为一个示例,研究了分析性能对使用HbA1c诊断糖尿病、以及以血清胆固醇浓度确定个体的冠心病风险的影响。Thue和Sandberg依据临床医生如何使用实验室检测,讨论性能指标[5]。这些作者的看法,在临床医生的行为间有很大的变异,会限制这个方式的角色,它仅仅反映了临床医生的期望,而不是应去设定的一致指标。


Ricos组回顾了使用生物变异数据导出分析指标的基本原理,阐述了全球分享应用这个方式的西班牙计划的EQA数据[6]。但是,Carobene指出目前可用的生物变异数据有很多问题[7]。例如,任何时间的个体内CV大于33.3%,指示了个体变异分布不是正态的,所以现有的变异数据很不合适。另外,许多生物变异数据当时使用了已经过时的方法学或检测系统获取的,不能适合现有的分析手段,需要尽早更新。除了对有关信息可靠性的疑问外,这个作者确认了生物变异数据库的重要性,但是,应仅包括相应有说服力研究的结果。Bartlett等[8]代表生物变异的EFLM工作组,为对生物变异文献有标准化的评估,展现了关键的评价检查清单。该检查清单证实了报告这个类型研究的关键要素:样品收集的方法、个体和样本数、

人群类型、样品分析和数据。这个检查清单也可被用于指导,如何实施生物变异的研究。


Haeckel和合作者给我们一个统计学的综述,可用于模式对检测现有操作水平导出的性能指标的一些固有缺点[9];Matthias Orth讨论了德国在政府行为监督临床实验室质量中,形成的德国管理法规的经验,从通用的管理要求导出的性能指标[10]。


会议的第四个学术讨论了不同情况下的性能指标。Schmmel和Zegers认为必须正确实施校准等级的需求,以及通过技术上改进参考方法和参考物质,控制和消除参数对检测不确定度和系统偏移的影响[11]。Panteghini和他的组,叙述了通过完整的溯源性链,提议检测不确定度来确定允许限值的指标[12]。IVD厂商将需要承担更多的责任,它们的校准品与分析系统的其他组分(平台和试剂)结合使用时,报告关联的结合(扩展)的不确定度。这要远多于它们现在提供的信息;目前它们仅提供校准可溯源的较高等级参考的名字。


Ceriotti等讨论了如何确定在内部质量控制(IQC)实践中的显著偏差,通过传递不确定度的计算到IQC[13]。Oosterhuis和Sanberg展现了将“操作水平”结合生物变异,去计算性能指标的模式。这个模式的的中心是参考限值和参考改变值的有效性[14]。另外,他们提示读者,通过加入性能指标为最大允许不精密度和最大允许偏移去估计总误差,在原则上不是有效的。Nordin认为,在建立分析质量指标之前,必须首先明确说明是“定性”实验室检测的定义[15]。会议的最后,Plebani组[16]和Sikaris[17],从全面分析质量上,提出了他们酝酿已久的分析前和分析后阶段的质量指标。


在会议召开开始,会议学术计划委员会将会议的协同声明以草案形式分发给所有与会者,作进一步讨论。尽管,等级的本质原先是1999年建立的,但这次会议促进简化和需要做较好的解释。基本上,确定分析性能指标建议的方式,应依据分析性能对临床后果的影响,或依据被测量的生物变异。关注的主要导向被测量和它的生物和临床特性,所以一些模式较好地适合某些被测量。关于分析前和分析后的阶段,将是进一步包括这些分析阶段之外的性能指标的时间了。这些指标应理想地遵循如分析阶段那样的相同模式。


会议的重要成果是创建了EFLM检验医学性能指标的特别小组(TF-PS)。在TF-PS之下已经建立了五个任务和会后工作组(TFG),继续进行以下的工作:

TFG 1:将不同的项目设定在本会议协同声明确认的不同模式,

        给出一个综述和为什么这些项目被指定在不同模式的原因;

TFG 2:确定EQA组织者最常用的被测量的性能指标;

TFG 3:如何使用总误差概念和如何将偏移和不精密度可能综合为

        性能指标,提出一个提议;

TFG 4:如何为分析前和分析后阶段产生性能指标,提出一个通用

        提议;

TFG 5:使用一个关键(临界)评估清单,去评价生物变异的文献,

        和从论文中提取要点信息以及从EFLM网页上的数据库总结

        被选定的信息。


本次会议发布的协同声明中,简化了等级,成为三个不同的模式去设定分析性能指标。一致同意,这些中的一些模式可较好地适合某些被测量,但某些不一定。


 模式1. 依据分析性能对临床后果的影响

原则上,这可以用研究的不同类型去做:

1.直接后果的研究 - 研究检测分析性能对临床后果的影响;

2.间接后果的研究 - 研究检测分析性能对临床分类或决定的影响,由此对患者后果的可能性,如通过模拟或决定分析。

这个方式的优点是,它着重分析性能对与患者和社会关联的临床后果的影响。主要的缺点是,它对检测项目做出临床决定和临床后果间联系是直接和强烈的才有用。而且,来自直接或间接后果研究导出的分析指标,将经常被非常依赖实际使用的检测方法、研究的人群和卫生保健设定等近期检测质量和结果的影响。


 模式2. 依据被测量生物变异的组分

期望尽力消除“分析变异”对生物变异的影响。优点是它可应用于大多被测量,可建立以人群为基础或以主题特定的生物变异数据。这个方式的局限性,包括需要仔细评估生物变异数据的关联和有效性,如存在‘恒稳态’、相应的时间区间、近期疾病间的影响和被测量浓度的影响。


 模式3. 依据操作水平(State of the art)

这与技术上可实现的分析性能最高水平有关。另外,它可被确定为被多少比例的实验室实现的分析性能。如果最好的实验室仅能实现需要的某个质量和较好的质量(按照模式1或2),则要求在技术上改进。如果大多实验室可实现某个质量,则不符合这个水平的实验室,会需要改变他们的实践。

这个模式的优点是,操作水平的性能数据随手可用。缺点是,在什么是技术上可实现的,和什么是需要消除‘分析变异’对生物信号的影响、或需要得到一个改进的临床后果间会没有关系。


解释说明


应注意,三个模式使用了不同的原则。该等级假设高质量研究或数据对每个模式是可用的。提议的分析性能指标应总是与基本原理的声明、在建议后面证据的来源和质量有关。


一些模式将较好地适合某些被测量,(有些被测量不太适合)。所以建议,有一个清单列出指定被测量与不同模式。性能应倾向以模式1和2确定。有些情况下,它与不同模式结合会是缺点。

当项目具有多个预期临床应用时,一些被测量可具有确定的不同性能指标。例如,在急诊部门通过模拟检测对可能的患者后果的影响,来确定血液葡萄糖的性能指标(模式1b);对1型糖尿病自我监视血液葡萄糖可通过临床后果研究(模式1a)、或通过依据生物变异较一般的方式(模式2)。


分析性能指标的应用可以依据它的用途予以调节。例如,用户可以是参考物质提供者、生产校准品的体外诊断厂商、室间质量评估发送物质的组织者,或提供患者结果各个实验室。为使用序数和率度量的检验(定性或半定量检验)设定性能指标,应按照上述三个模式之一。


分析前和分析后阶段的性能指标


要懂得,对于患者诊疗,全面(分析前/分析中/分析后)检验过程的质量最优化是最根本目标,所以应去建立全面检验性能指标。原则上,分析前和分析后的实验室过程的性能指标,应遵循与分析性能指标相同的模式。在这些外加阶段的组分可以用数值表达时,它们应被加入到确定检验性能指标中。在其他情况下,分析前和分析后的性能指标,将被各自的质量指标做最佳的表达,应反映上述的模式1和模式3。


第一次EFLM战略会议的学术计划委员会(SPC)提议了简化等级,以三个模式确定分析性能指标。SPC鼓励用户去扩展那些指标达到全面检验过程。以最高的可能等级模式确定分析性能是最合适的。检测的预期用途、被各个相关使用分析性能指标的实际目的、以及超出每个模式可用的证据质量等,会是调整最佳方式的选择。

 

参考文献:

1.Defining analytical performance specifications 15 years after Stockholm conference. Panteghini S,Sandberg S. Clin Chem Lab Med 2015;53: 829.

2.Kallner A,McQueen M, Heuck C. The stockholm consensus conference on quality specifications in laboratory medician,25-26 April 1999. Scand J Clin Lab Invest 1999;59: 595.

3.Fraser CG. The Stockholm consensus conference on quality specifications in laboratory medicine. Clin Chem Lab Med 2015;53:837.

4.Horvath AR, Bossuyt PM, Sandberg S, St John A, Monaghan PJ, Verhagen-Kamerbeek WD, et al. Setting analytical performance specifications based on outcome studies -- is it possible? Clin Chem Lab Med 2015; 53:841.

5.Thue G, Sendberg S. Analytical performance specifications based on how clinicians use laboratory tests. Experiences from a post-analytical external quality assessment programme. Clin Chem Lab Med. 2015; 53: 857.

6.Ricos C, Alvarez V, Perich P, Fernandez-Calle P, Minchinela J, Cava F, et al. Rationale for using data on biological variation. Clin Chem Lab Med 2015; 53:863.

7.Carobene A. Reliability of biological variation data available in an online databese: need for improvement. Clin Chem Lab Med 2015; 53(6): 871.

8.Bartlett WB, Braga Federica, Carobene A, Coskun A, Prusa R, Fernandez-Calle P, Roraas T, Jonker N and Sandberg S, on behalf of the Biological Variation Working Group,European Federation of Clinical Chemistry and Laboratory Medicine (EFLM). Clin Chem Lab Med 2015; 53(6): 879.

9.Haeckel R, Wosniok W, Streichert T. Optimizing the use of the “state of the art” performance criteria. Clin Chem Lab Med 2015; 53(6): 887.

10.Orth M. Are regulation-driven performance criteria still acceptable ? - The German point of view. Clin Chem Lab Med 2015; 53(6): 893.

11.Schimmel H, Zegers I. Performance criteria for reference measurement procedures and rference materials. Clin Chem Lab Med 2015; 53(6): 899.

12.Braga F,Infusino I, Panteghini M. Performance criteria for combined uncertainty budget in the implementation of metrological traceability. Clin Chem Lab Med 2015; 53(6): 905.

13.Ceriotti F, Brugnoni D, Mattioli S. How to defien a significant deviation from expected internal quality control result. Clin Chem Lab Med 2015; 53(6): 913.

14.Oosterhuis W P, Sandberg S. Proposal for the modification of the conventional model for establishing performance specifications. Clin Chem Lab Med 2015; 53(6): 925.

15.Nordin G. Before defining performance criteria we must agree on what a “qualitative test procedure” is. Clin Chem Lab Med 2015; 53(6): 939.

16.Plebani M, Sciacovelli L, Aita A, Pelloso M, Chiozza ML. Performance criteria and quality indicators for the preanalytical phase. Clin Chem Lab Med 2015; 53(6): 943.

17.Sikaris K. Performance criteria of the post-analytical phase. Clin Chem Lab Med 2015; 53(6): 949.

18.Sandberg S, et al. Consensus Statement.Defining analytical performance specifications: Consensus stantement from the 1st strategic confenrence of the European Federation of Clinical Chemistry and Laboratory Medicine. Clin Chem Lab Med 2015; 53:833.

昆涞质量管理解决方案.jpg