基于CLSI EP28-A3c的临床实验室参考区间建立与转移及验证

作者:曾洁 张传宝
作者单位:北京医院 国家卫生健康委临床检验中心 2023-01-30

张传宝,研究员,博士研究生导师。现任国家卫生健康委临床检验中心生化室主任。学术兼职:中国医院协会临床检验专业委员会副主任委员兼秘书长,中国医学装备协会现场快速检测(POCT)装备技术分会副会长。

研究方向:临床生化检验参考系统建立与应用,临床生化检验质量管理。获奖情况:北京科学技术进步三等奖(第三完成人);中华医学科学奖二等奖(第二完成人);中国计量测试学会科学技术进步奖二等奖(第一完成人)。以第一作者或通讯作者发表论文100余篇,其中SCI收录40余篇。



曾洁,副研究员。现就职于国家卫生健康委临床检验中心,负责十余项全国实验室室间质量评价计划,如特殊蛋白、血清降钙素原、电解质正确度验证计划等,主要研究领域是参考体系的建立及应用,包括参考方法、参考物质和参考区间。


学术兼职:CNAS医学参考实验室实习评审员,CNAS 能力验证计划提供者技术评审员。



参考区间是解释检验结果的必要参照。参考区间建立需要大量的人力、物力,美国临床和实验室标准研究所(Clinical and Laboratory Standards Institute,CLSI)在上世纪九十年代开始发布相关指南指导实验室建立参考区间,最新版是2010年10月颁布的第三版的修订版——EP28-A3c《临床实验室参考区间定义、建立和验证》(下文简称“EP28-A3c”)[1]。在EP28-A3c中,工作组介绍了参考区间建立的流程及注意事项,探讨了参考区间建立的现状,特别是工作组意识到只有极少数实验室有能力建立参考区间,包括体外诊断企业在内的大多数实验室都很少研究参考区间,其中一个最重要的原因就是很难收集足量的参考个体样本(n=120)。鉴于此,工作组认为对于单独的实验室来说,可以更多关注对已有参考区间的验证,不仅相对简单且更具有可行性。


基于中国人群的大规模的系统性的参考区间研究始于2010年,由中国医科大学附属第一医院牵头,开展了临床常用检验项目中国成年人的参考区间研究[2],先后发布了13个卫生行业标准(所有卫生行业标准都可以在中华人民共和国国家卫生健康委员会官方网站查询并免费下载,http://www.nhc.gov.cn/wjw/s9492/wsbz.shtml),涉及临床生化、免疫和血液领域数十项检验项目。其后由北京儿童医院牵头,开展了基于中国人群的大规模儿童参考区间研究,其中也包括了19岁及以下的青少年,为0-19岁中国人建立自己的参考区间[3]。这两个大型参考区间的研究为我国健康事业的发展起到了重要的支撑作用。除此以外,还有老年人群及更多项目的参考区间研究工作正在研究中。


随着参考区间卫生行业标准的发布和宣贯,我国实验室也越来越关注参考区间的来源和使用。同样的,我国实验室也面临着国际上同行遇到的困难,即不知道如何选择参考个体、难以收集足够数量的样本等。鉴于此,本文将基于EP28-A3c简要介绍单个实验室参考区间的建立方法,以及对已有参考区间的转移和验证方法。


一、参考区间的建立


简言之,参考区间建立需要按事先规定好的标准从参考人群中筛选出表观健康的参考个体,组成代表性的参考样本组,样本量至少120例,若需要按性别、年龄等因素分组,则每组样本量至少120例。使用经过评估性能满足要求(线性、精密度、正确度、溯源性等)的检测系统测定样本,须保证检测结果剔除离群值后至少有120例,绘图得到参考分布。使用非参数方法计算参考分布的第2.5th和第97.5th的值,就是对应的参考下限和参考上限,参考区间就是包含上下参考限在内的区间。


1. 建立参考区间需要统筹计划,EP28-A3c概括为下列步骤[1]:

(1)文献检索,归纳生物学变异和分析干扰的来源并形成清单。若检验项目较新,文献信息少,前期需做相关研究。

(2)制定选择(或排除)和分组标准。设计调查问卷,按标准筛选参考个体。

(3)研究需遵守法律法规,通过伦理委员会审批。对所有参与者签署知情同意书。

(4)按调查问卷和其它健康评估结果分类潜在的参考个体。

(5)从参考样本组中剔除符合排除标准或缺乏良好健康评估的个体。

(6)根据参考限所需的置信区间确定参考个体的数量。

(7)样本收集前准备,按常规工作中对患者的准备方式正确和一致地准备参考个体。

(8)参考个体的样本收集和处理方式与日常患者的方式一致。

(9)在明确规定的条件下,按日常分析患者标本各自的方式分析参考个体标本并获得参考值。

(10)检查参考值数据并绘制柱状图(直方图)来评价数据的分布。

(11)识别数据潜在误差或离群值。

(12)参考值分析,比如选择估算参考限和参考区间的方法、判断并对参考区间进行分组等。

(13)记录上述所有步骤。


2. 筛选参考个体:步骤(1)用于确定健康相关的参考个体。定义“健康”很难,需要结合临床实际情况,标准太宽或太严都无法获得适宜的参考区间。EP28-A3c[1]中提到的排除标准包括(但不限于):饮酒、献血状况、血压异常、药物滥用、服用处方药、服用非处方药、环境、空腹或餐后、遗传因素、既往或近期住院史、近期是否生病、哺乳期、肥胖、职业、口服避孕药、怀孕、近期是否进行过手术、吸烟、近期是否输血、维生素滥用等。分组标准包括(但不限于):年龄、血型、昼夜节律、饮食、族裔背景、运动、空腹或餐后、地理位置、样本采集时的姿势、种族、性别、月经周期、孕期和吸烟等。步骤(2)和(4)是在步骤(1)的基础上设计调查问卷,问卷内容要详细,填写要简单。


3. 确定参考个体样本量:步骤(6)确定最小参考个体样本量,EP28-A3c推荐的最小样本量是120例。置信限或置信区间(confidence intervals,CIs)是一个容易被忽略的概念,在参考区间建立中它是确定样本量的重要参数。若要估计非参数方法得到的参考限的90%CIs,样本量至少需要120例;若需要估计95%CIs则样本量需要增加153例。参考限90%CIs的宽度不宜大于自身参考区间的0.2倍。若CIs太宽,则需要扩大样本量。虽然不同计算方法会影响CIs宽度,但主要因素仍然是样本量。


4. 质量控制:步骤(7)和(8)明确分析前质量控制,步骤(9)明确分析质量控制。质量控制在参考区间建立、转移和验证中都至关重要。参考区间研究前,实验室需要梳理、评估和规范质量控制的全过程,包括分析前参考个体的准备、采样方式、样本运输和保存方式等,以及分析中的仪器状态、试剂效期、质控结果等。注意建立参考区间所用质量控制方案应与实验室日常质量管理方案一致。若不一致,得到的参考区间无实际意义,无法合理的解释临床结果。另外,应用其他实验室建立的参考区间时,评估两个实验室质量控制的一致性也是参考区间能转移的重要前提和基础。


EP28-A3c[1]提到的分析前质量控制考虑的因素包括(但不限于):①个体准备阶段:生活习惯、空腹与餐后、禁用药物制剂、药物治疗方案、与生物节律有关的取样时间、身体活动、采集前的休息时间、压力等。②样本收集阶段:采集期间的环境条件、时间、体位、标本类型、采集地点、现场准备、血流、设备、采集技术、止血带时间等。③样本处理阶段:转运、凝集、分离血浆或血清、保存、分析前准备。


分析质量控制的因素:必须详细描述所用方法,报告批间分析变异、检测限、线性、回收率和干扰特性,特别是方法的正确度和结果量值溯源性(溯源到更高一级的检测方法或者物质)。其它因素如仪器/设备、试剂(包括水)、校准品和校准方法等。参考区间建立还必须包括方法的再现性,比如人员之间的变异,相同仪器不同实验室间的变异等。总而言之,所有影响检测质量的因素都要考虑和审核。


5. 数据统计:步骤(10)、(11)和(12)是参考值的数据处理过程。


(1)离群值:先目视检查绘制的柱状图,然后通过Dixon法[4]或Tukey法[4]两种统计方法判断离群值。注意:第一,统计学上离群不一定是真正的离群,需要结合整个过程确定是由某种因素引起的错误才能剔除。第二,若剔除离群值,则应补充参考个体,保证检测结果数量不少于120个。


(2)估算参考限和参考区间:采用非参数方式估计参考区间,即将数据从小到大排列,计算第2.5位百分位数和第97.5位百分位数的值,就是参考区间的下限和上限[4]。对于新生儿、儿童和老年人群,即使无法获得120例的样本,也要采用非参数方法统计参考区间,或者选用稳健统计方法计算。


(3)参考区间分组:对于已有临床应用经验的项目,在步骤(1)就能确定是否分组,若无明确临床意义一般无需分组。反之,若认为亚组(如性别、年龄等)可能有临床意义,则需分组且每个亚组的样本量至少为120例。对于分组信息难以收集的新项目,一旦满足分组条件,则每组至少需要120例样本。利用标准正态偏倚检验(standard normal deviate test)可以辅助判断是否分组。方法是按式(1)和式(2)分别计算统计量z和z*,其中x1、x2分别代表两个亚组的均值,s1、s2代表两个亚组的方差,n1、n2、naverage分别代表两个亚组的样本量和样本量均值。

式(1)

式(2)


注意该统计基于正态分布,若原始数据分布呈高度偏态,则需要进行简单的数学转换(如log转化)将其正态化后再进行计算。将z与z*比较,若z>z*,则建议对参考区间分组。另外,如果其中一个分布的标准偏差很大比如s1≥1.5s2,也建议分组。当超过2个亚组需要进行比较时,EP28-A3c尚无推荐方式,需要统计专家的协助和进一步研究。


二、参考区间的转移


建立参考区间投入巨大,不可能要求所有实验室都能建立各自的参考区间。鉴于此,EP28-A3c提出了转移参考区间,即用相对经济、省力的方式将已有的经仔细研究的参考区间从一个实验室转移到另一个实验室,从而减轻实验室建立参考区间的负担。参考区间转移的前提条件:一是被转移的参考区间研究非常详细,得到的参考值是可靠的;二是本实验室与参考区间提供者的分析前质量控制是一致的。在此基础上,转移就只需要考虑分析系统的可比性和检测人群的可比性这两个问题。


1. 分析系统的可比性:若实验室已按EP28-A3c方式对本地人群建立了参考区间,检验项目的检测方法和参考人群明确,实验室决定对该项目采用新检测方法,则可利用CLSI EP9[5]方式的方法比对数据判断已有参考区间是否需要更新。实验室无需收集大量的参考个体标本,可使用包括患者标本在内的任何新鲜标本来评估新、旧两个方法之间的关系。若两种方法的不精密度相当,干扰已知,所用校准品相同或可比,检测结果具有可接受的可比性,则参考区间可被转移。


2. 注意事项:(1)应尽可能按EP9文件的方式进行方法比对,样本浓度要充分覆盖代表性的检测范围。(2)线性回归得到的截距相对于参考区间而言较大时,新方法不能进行简单的转移,建议实验室使用来自参考个体的样本重新建立参考区间。(3)方法比对的最适方法不一定是线性回归。例如Na的参考区间很窄并且都是离散的整数。在这种情况下,简单的均值偏差也可以用于修正参考区间。(4)即便实验室可以利用回归方程的数学关系重新计算参考区间,EP28-A3c强烈鼓励实验室使用小样本参考个体(如:n=20)来验证参考区间,并且若其中一个亚组的参考区间通过了验证,则无需再验证其他亚组。


3. 参考人群的可比性:若临床实验室想转移由其他实验室(或体外诊断企业)以相同分析系统或者具有可比性的分析系统建立的参考区间,则转移就是比较参考人群可比性。若参考人群是可比的,EP28-A3c建议实验室仍需按三种参考区间验证方式之一验证转移的参考区间。


三、参考区间的验证


参考区间验证就是评估转移的参考区间的可接受性,方式包括参考个体评估;使用小样本量参考个体进行统计验证(如n=20);使用较大样本量的参考个体进评估(小于120例)。

1. 参考个体评估:通过仔细检查原始参考区间研究的各个因素,主观判断转移的可接受性。前提是(1)要充分描述和评议参考人群的所有人口统计学差异和地理分布;(2)充分比较和明确分析前和分析过程的细节,包括分析性能、全部参考值、估计参考区间的方法等。若实验室与原始研究相比,这些条款都能一致,则参考区间可以转移且无需任何验证研究,仅需要记录评议的条款和过程。


2. 使用小样本量的参考个体进行验证:实验室可以使用较小的样本量(n=20)来验证想要转移的参考区间。同样的分析因素和分析前因素,实验室都需要与被转移实验室一致。并且,若已知实验室所在地理位置或人口特征与被转移的人群之间有明显不同,则支撑参考区间转移的证据不足。


如前文所述,依据规定的纳排标准选择参考个体、收集并检测样本、最后获得20个不含离群值的检测值。判断方式:(1)若20个检测结果中有1-2个(或者小于10%)值超出原始参考区间,则验证通过,实验室可以使用厂家提供的或者其他实验室报道的95%参考区间。(2)若有3-4个结果超出了参考限,则需要重新收集20个没有离群值的参考个体的样本,若超出参考限的数量≤2,则验证通过;反之,若仍有3个及3个以上的结果超出参考限(或者在第一次评估中有≥5个结果超出参考限),则实验室应仔细检查分析测量程序,并考虑两个人群是否存在生物学特征上的差异以及是否需要建立自己的参考区间。


3. 使用大样本量的参考个体进行验证:当检验项目的参考区间对解释当地临床结果至关重要时,实验室可以做一个较大样本量(如n=60)的参考区间转移和验证评估。实验室的分析因素和分析前因素需要与原始参考区间研究的一致。样本量越大统计效能越高,越能发现原始参考区间研究与实验室本地人群之间的差异。同样的,若已知实验室所在地理位置或人口特征被转移的人群之间有明显不同,则支撑参考区间转移的证据不足。


如前文所述,依据规定的纳排标准选择参考个体、收集并检测样本、最后获得足够数量不含离群值的检测值。将这套检测值与原始参考区间进行比较,方式可使用标准正态偏倚检验。若检验得到两个人群没有明显差异,则参考区间可以转移。反之,若两个人群存在显著差异,则需要进一步比较,或者增加样本量建立自己的参考区间,还可以使用稳健统计方法直接计算小样本量参考区间。对于后者,实验室需要对每个检验项目单独评估,由稳健统计得到的参考区间的置信限是否足够窄,是否能满足临床解释的需要。


四、小结


检验项目参考区间建立、转移和验证是一项系统的、长期的、持续的工作,需要检验行业共同努力。企业提供好的具有溯源性的检测方法,实验室运行好的分析前质量控制程序和分析质量控制程序,保证实验室间检测结果的可靠性和一致性,才能节约公共资源,最大限度的减少参考区间建立的负担和发挥已有参考区间的作用。


参考文献

CLSI EP28-A3c Defining, Establishing, and Verifying Reference Intervals in the Clinical Laboratory; Approved Guideline—Third Edition [S]. Clinical and Laboratory Standards Institute, 2010.

Jia K, Zhang C, Huang X, et al. Reference intervals of serum sodium, potassium, and chlorine in Chinese han population and comparison of two ISE methods [J]. J Clin Lab Anal, 2015, 29(3): 226-34. doi: 10.1002/jcla.21755.

Peng X, Peng Y, Zhang C, et al. Study group of pediatric reference intervals in China (PRINCE). Reference intervals of 14 biochemical markers for children and adolescence in China: the PRINCE study [J]. Clin Chem Lab Med, 2022, 60(10): 1627-1639. doi: 10.1515/cclm-2022-0299.

曾洁, 陈文祥, 申子瑜, 参考区间研究现状概述[J]. 中华检验医学杂志, 2010, 33(6): 570-573. doi: 10.3760/ema.j.issn.1009-9158.2010.06.022

CLSI EP9-A3 Measurement Procedure Comparison and Bias Estimation Using Patient Samples; Approved Guideline-Third Edition [S]. Clinical and Laboratory Standards Institute, 2013.