对体外诊断试剂参考物质互换性的思考

作者:王军
作者单位:北京水木济衡生物技术有限公司 2023-03-29

王军,正高级工程师,北京水木济衡生物技术有限公司总经理。近20年体外诊断行业工作经验,从事过体外诊断试剂研发,后在国家级医疗器械检测中心长期从事体外诊断产品检测和标准化工作。社会兼职:ISO/TC212专家、全国医用临床检验实验室和体外诊断系统标准化技术委员会(SAC/TC136)委员、全国生物样本库标准化技术委员会(SAC/TC559)委员、全国生物计量技术委员会(MTC20)委员、全国临床医学计量技术委员会(MTC21)委员、全国卫生产业企业管理协会医学检验产业分会副会长、全国卫生产业企业管理协会实验医学专业委员会常务委员、中国医疗器械行业协会现场快速检测(POCT)分会常务委员等。

互换性与溯源性具有紧密相连的关系,新版ISO 17511非常强调参考物质的互换性。一直以来,笔者对互换性的理解也是似是而非,也有很多迷惑不解之处。现就笔者对互换性的理解、认识与思考加以论述,供同行交流与借鉴。

一、互换性的基本概念及发展演化

最近时期,笔者查阅了大量文献,并一遍一遍地去阅读、去学习、去体会,逐渐对互换性有了更深一层的认识。这个过程中,也体验到了学习的乐趣以及享受过程之美,当突然理解一句话含义的时候,当一个观点震惊到自己的时候,当金句在脑海里回味的时候,大师们的智言妙语真的可以让人豁然开朗,刷新三观!在此,笔者将自己的学习收获分享给大家,希望能对同仁们有所帮助。这仅仅是本人对互换性的一得之见,仅供分享与交流。

对于“互换性”这个概念其最早提出是在20世纪70年代,美国纽约州的公共卫生实验室沃兹沃斯中心生物化学实验室Robert Rej教授团队在进行临床酶活性检测中,发现一些商业质控品在不同方法学间的差异,它与病人血清不一样,因此于1973年首次提出“commutability”这一概念。Robert Rej教授研究发现由于质控品中酶的来源、同分异构体、酶分子的完整性、溶液基质等因素(如表1所示)以及质控品制备中冻干、添加工艺的引入(如表2所示),会导致一些质控品与临床样品有差异。

实验室所用的检测系统(方法)之间有差异,表现在所用底物及底物浓度、辅助因子、缓冲液体系、pH、温度等不同,不同的样品与这些检测系统的反应行为“behave”就不一样。图1给出了一个解释示例,图1中左图的箭头表示测量条件的改变,对于测量条件的改变,每种质控品反应不一样,质控品A代表的对测量条件改变不敏感,质控品B代表的是对测量条件适度敏感,质控品C代表的是对测量条件变化产生显著变化。如果质控品B的“behave”与临床样本的“behave”一致的话,质控品B是可用的,质控品A和质控品C则不能用。如果质控品A用于室内质控,即使实验室测量结果发生了偏倚而质控品A也监控不出来,如果质控品C用于室间质评或能力验证,则可能发生实验室误差小但被判为不合格。

图1. 不同质控品随着测试条件变化而表现出不同反应的示例

Robert Rej教授认为质控品产生的这种误差不同于“interference”(干扰),也不同于“matrix effect”(基质效应),“interference”和“matrix effect”这两个术语不足以准确描述这种误差。在临床化学中,“interference”是指被测物浓度因样品特性或其它成分的影响而出现的临床显著性偏差,这种影响可见于检测系统的非特异性、指示反应响应不佳、被测物活性抑制等情况。“matrix”是指一个物质系统中除分析物之外的所有成分,“matrix effect”是指除被测量以外的样品特性对特定测量程序测定被测量以及测量值的影响。某个基质效应的明确原因即为一个干扰。于是Robert Rej教授团队引入了“commutability”这一术语来识别校准品、质控品的特性,以区分替代样品和真实的患者样品差异性。使用“commutability”是想要表达“exchangeable”、“convertible”这样的意思。Robert Rej教授最初使用“matrix-mimic of the specimen”这个词,后来也是经过相当困难的选择之后才确定最终用“commutability”。曾经也有专家想用“representativeness”或者“fidelity”取代“commutability”,但最终没有推行开。互换性意味着患者样品在任何两种分析程序之间的关系也适用于具备互换性的参考物质,参考物质在方法间的特性与真实临床样品方法间的特性具有可比性。尽管最初“commutability”是从临床酶活性检测中发现的,但逐渐地在其他临床检验项目中也发现了类似问题。90年代开始临床检验界逐渐接受了参考物质应具备“commutability”(互换性)这一属性。

1998年欧洲议会和理事会签署了一项关于体外诊断器具的指令(Directives 98/79/EC),其中关键一条内容是要求体外诊断试剂的校准物和质控物定值应溯源到已有的高一级别的参考方法或参考物质。该指令推动了临床检验计量溯源性的发展,为了配合该指令的执行,1999年欧盟制定了5个欧洲标准,这5个标准后来被ISO直接引用成为国际标准,这5个标准就是大名鼎鼎的ISO 17511(关于医学检验溯源)、ISO 18153(关于临床酶测定溯源)、ISO 15193(对参考测量程序的要求)、ISO 15194(对参考物质的要求)、ISO 15195(对参考测量实验室的要求)。其中,ISO 15194(EN 12287:1999)中对互换性进行了明确定义并对参考物质互换性提出了要求。

ISO/IEC99:2007《国际计量学基本通用术语》(VIM)中第一次列出了“标准物质的互换性(commutability)”的定义:参考物质的特性,该特性通过由两个给定测量程序得到的、对参考物质中某一规定量的测量结果以及对其他特定物质测量结果关系之间的接近程度来证明”。VIM中增加该术语,表明了其他领域也认识到了该问题。参考物质可互换的概念起源于临床检验领域,但是参考物质的互换性绝不仅仅存在于该领域,只要存在被测量的定义、基质效应等问题,就会存在互换性问题,在农药、兽药残留测定等其他领域,大家也逐渐认识到参考物质互换性的重要。

Robert Rej教授团队对互换性研究了20多年,并首次创造了这个概念。又20多年过去了,行业还在对该问题继续研究中,即使今天也没有说研究特别透彻,这正是我们临床检验和体外诊断的特殊性所在。

二、互换性的意义与重要性

综上所述,美国纽约州的公共卫生实验室沃兹沃斯中心生物化学实验室Robert Rej教授团队在进行临床酶活性检测中,发现一些商业质控品在不同方法学间的差异,这与病人血清不一样,因此于1973年首次提出“commutability”这一概念。随后科学家们在其他临床检验项目中也发现了类似问题,业界逐渐接受了参考物质应具备“commutability”(互换性)这一属性。如今,过去了40多年,“commutability”的定义与当初相比也发生了一些扩展,随着实践工作的进展,大家对互换性的认识也逐渐加深。下面我将介绍另一个重要人物W. Greg Miller教授,Miller教授是美国弗吉尼亚联邦大学病理系主任,他是全球著名的标准化专家,一直致力推进医学实验室标准化和一致化。Miller教授发表了很多论文,特别是他陆续发表了三篇关于互换性的综述文章,这三篇文章阐述“commutability”的演变与发展,对我理解“commutability”有很大帮助,在此分享给大家。本篇重点介绍Miller教授2006年在《Clinical Chemistry》上的题为“Why Commutability Matters(互换性为什么很重要)”的文章。

互换性与溯源性是紧密相连的。无论医学实验室使用什么检测系统,病人样品的结果应具有可比性,这是医学实验室的目标。要想实现这一目标,建立计量溯源性是一条有效的路径,即常规的方法(检测系统)尽可能溯源到现有的高级别的参考物质和参考方法。在医学实验室研究计量溯源性过程中,逐步发现参考物质互换性的重要。参考物质被用于建立或验证计量溯源性,它有一个赋值,该值代表了对真实值的最佳估计,由参考测量程序赋值,或在没有参考测量程序时由一致化程序确定该参考物质的浓度(或活性)。当某个参考物质用于常规方法时,必须在所有使用该参考物质的常规方法间确认其互换性,这样就能确保当测量患者样品时,无论实验室使用何种常规方法,患者样品的结果具有可比性。当某个参考物质的互换性没有被确认,常规方法的结果就不能被合理地与参考物质的定值做比较,因为观察到的偏倚可能是因为参考物质不具有互换性引起,也有可能是因为常规方法本身方法学特性差异导致。

参考物质的不互换是由基质效应和被测量非天然分析物两个原因引起。基质效应或基质偏倚是由参考物质与临床样品之间的样品基质差异引起。样品基质包括除分析物本身外的物质系统的所有组成部分。基质效应定义为样品的一个性质对测量及测量结果有影响,与分析物的存在无关。另外分析物的非天然形式,如非人源的酶、非生理的分子的结合(如双牛磺酸胆红素),或对人来源分离出的蛋白复合物做了修饰,都可以产生与天然形式分析物不同的测量信号。

要注意的是,任何分析方法都可能存在分析特异性的限制,尤其是对免疫分析,抗体特异性(例如,针对一个分析物的不同抗原表位)在不同的测量方法中可能不同。在进行参考物质互换性评价的时候,有的情况下,对临床样品缺乏特异性,是由于方法引起的,而不是参考物质不具备互换性。

使用不具备互换性的参考物质校准常规测量程序,非但不能改善,反而可能导致这些测量程序测试临床样本时结果的一致性变得更差。因此这样的参考物质,只能适用于校准等级中校准较高级别的方法(例如气相色谱串联质谱法、高效液相色谱法、原子吸收光谱法等参考方法),而不能直接校准常规方法。如果直接校准常规方法可能导致溯源是无效的,或者迫使制造商在其内部产品校准过程中增加额外的调整步骤,这些步骤在一定程度上增加了赋值的不确定度。我阅读了Miller教授文章附的参考文献,用这些参考文献里面讲到的实例来进一步阐明若使用不具备互换性的参考物质引起的后果。

第一个例子是美国上个世纪90年代初开始的血脂测定标准化研究,VA、CAP和CDC几个部门合作进行了一项研究,研究的目的是量化能力验证用参考物质基质效应引起的偏差大小。结果显示,有的实验室在新鲜血清样本中验证了胆固醇测量的准确度,但对某些不具备互换性的PT样本表现出显著的基质效应偏差,具体如下表所示。

第二个例子见美国NIST 2000年主办的关于临床实验室测量计量溯源性的研讨会,多位参会专家的报告阐述由于校准等级中使用了不具备互换性的校准品而导致临床实验室测量结果不可比的实例。相关研究可见NISTIR 6742《Proceedings of the Workshop on Measurement Traceability for Clinical Laboratory Testing and In Vitro DiagnosticTestSystems》。

三、互换性仍然很重要

根据W. Greg Miller教授2013年在《Clinical Chemistry》上发表的《Commutability Still Matters(互换性仍然很重要)》的文章。互换性是参考材料的一种属性,对于相同的被测量,参考物质的值与具有代表性的临床样本的测量值在2个或更多测量程序之间具有相同的关系。对于哪些参考物质应要求具备互换性?一是当一个参考物质用作临床实验室常规测量程序的通用校准品时;二是用于外部质量评估(能力验证)计划,以评估测量程序之间的一致性时;三是体外诊断制造商用于给产品校准品赋值的参考物质。常规测量程序的产品校准品,如果溯源到一种不具备互换性的参考物质,可导致不同常规程序的患者样本缺乏一致性。

Miller提到了同期的《Clinical Chemistry》上IRMM(Institute for Reference Materials and Measurements)的Ingrid Zegers等人发表的题为《The importance of Commutability of Reference Materials Used as Calibrators:The Example of Ceruloplasmin(用作校准品的参考物质互换性的重要性:铜蓝蛋白的示例)》的文章,在此也稍微介绍一下这篇文章。ERM-DA470是大家非常熟悉的参考物质,血清基质,含有15种血清蛋白的赋值,这15种蛋白也是从人血清中纯化制备的。15种血清蛋白的赋值由欧洲、美国及日本共27家实验室共同参与,定值虽然是常规方法(免疫透射比浊法、免疫散射比浊法、凝胶免疫扩散法),但操作程序和统计方法作了严格规定。作为一种复合的参考物质,DA470使用后显著降低了实验室间的检测差异。1995年对法国众多实验室的研究表明,实验室间的CV在使用统一的DA470校准后有了显著提升,未使用前CV为10.0%~24.1%,使用后为5.8%~12.2%,且准确度也有明显改善。在ERM-DA470快用完后,又推出了ERM-DA470k,将470的值传递给470k。但是,在标准化的过程中,发现470并未实现铜蓝蛋白检测的一致化,究其原因,是因为470中的铜蓝蛋白不具有互换性造成的。因此,在470k中去掉了铜蓝蛋白这一项的赋值。Zegers在《The importance of Commutability of Reference Materials Used as Calibrators:The Example of Ceruloplasmin(用作校准品的参考物质互换性的重要性:铜蓝蛋白的示例)》这篇文章中的主要研究结果如下:

1. 方法学比较:各种方法间的平均CV为1.7%~6.1%,方法学配对比较,采用Passing-Bablok回归分析,Pearson相关系数r均>0.98,这说明不同方法间有很好的相关性。但是,方法学比对的斜率从0.56~1.42,这说明方法学间的差异比较大。

2. DA470的互换性:在有些检测系统如Roche Integra、Roche Hitachi、Dako Hitachi和AU2700间的组合,470表现出互换性,但是470在Dako Hitachi与Abbott Architect、Immage、BN ProspectⅠ的组合却缺乏了互换性。

3. 英国NEQAS的结果:Zegers也总结了英国室间质评结果,根据研究表明,对于新鲜样品,方法学间有系统偏倚,比如BeckmanImmage系统测的值比较高,而Roche和Olympus系统测的值低(见下图A);对于加入叠氮化钠后的EQAS样品,不同方法的结果差异显著降低,对于新鲜的EQAS样品,方法间CV值在9%到25%之间,而对于含有叠氮化钠的EQAS样品,方法间CV值在1%到6%之间(见下图B和C),似乎对于这样非新鲜的样品,不同方法的结果更靠近;添加了Bronidox的EQAS样品,显示出非常相似的方法CVs(见下图C)。在不同的存储时间后,每种方法的平均值没有显著变化(见下图D)。Zegers认为470的表现很类似Aged(非新鲜的)患者样品,在Aged 470作为新鲜EQAS样品结果的溯源性基础时,方法间的变异很高。但Aged 470为Aged的EQAS 样品提供溯源性时,方法间变异非常小。事实上,制造商已经用该值转换给自己试剂盒校准品,这样造成了新鲜样品的检测系统间变异。但对储存过的样品进行铜蓝蛋白的检测时,储存过样品内铜蓝蛋白的性质类似470,这样检测系统间变异非常低。所以,检测系统间变异在很大程度上可以用470缺乏互换性来解释。为何470的中的铜蓝蛋白表现出Aged,可能是因为作为血清中输送铜的蛋白,铜离子与蛋白结合数量不同造成CER以多种不同形式存在,其各种形式在血清中无法长期保持稳定,以及该蛋白对蛋白水解比较敏感等多种因素造成。

根据Miller的综述文章,Miller认为所有拟用作通用校准品或用于外部质量评估/能力验证一致性评价的参考物质,其提供者都应确保这些参考物质与具有代表性的临床患者样本具有互换性。从实际的角度来看,不可能对全世界使用的每一种测量程序都进行评估。一种合理的办法是评价常用程序或方法。2010年CLSI也发布了互换性评价的标准EP30-A《Characterization and qualification of commutable reference materials for laboratory medicine:approved guideline》。Miller也指出,对于那些不太常用的测量程序,或者新进入市场的产品,以及实验室自建方法,则这些方法(产品)的开发者如果想要使用该参考物质,则由他们自己来评价该参考物质的互换性和适用性。研制具有互换性的参考物质还是具有较大的技术挑战和难度,因为对于某些给定的分析物,其在人体内的分子形式不能被很好地定义,或者会随着临床状态不同而发生变化。此外,可能难以获得足够的生物材料,其中包含测量的适当分子形式,并从中制备参考材料。还有就是,在临床样品处理过程中,分子形态的改变、感兴趣的生物标记物的纯化以及在制备时添加稳定剂时,通常会改变样品基质,这些因素也对参考物质的互换性提出了挑战。纯品形式的生物标记物可能不足以制备用于常规测量程序的参考物质,例如,如果用重组蛋白替代,但可能没有适当的翻译后糖基化或分子复合体结构来充分代表被测量。尽管存在这些技术挑战,互换性仍然是用于参考物质的基本要求。

四、互换性在计量溯源性中的演进作用

W. Greg Miller教授2021年在《Clinica Chimica Acta》发表了一篇文章《The evolving role of commutability in metrological traceability(互换性对计量溯源性不断发展的作用)》。这篇文章非常重要,Miller对互换性的发展做了一个全面的分析总结,下面我将文中的主要观点列出来。

1. 背景:互换性是参考物质(RM)的一种特性,它表示RM对测量程序(MPs)的分析响应,与临床样品相同。在下图中,具有互换性的RM(绿色)与临床样本具有相同的响应,即在可接受的标准内,两种不同的MPs测量临床样品与测量RM,在偏倚上没有差异。不具有互换性的RM(红色)与临床样品观察到的反应不同,表现为偏倚有差异。当RM(蓝色)偏倚的不确定度与可接受标准重叠时,将会无法得出互换性的结论。几十年来,测量程序测量结果的标准化一直是临床实验室的重要目标,用于测量程序标准化的校准参照的参考物质应具备互换性,这一要求现在已得到一致认同。

2. 计量溯源性中的互换性:新版ISO 17511描述了临床实验室检验结果的计量溯源。如下图所示:

互换性不适用于一级纯物质的RM(m.1),但可适用于m.2位置的一级校准品,这取决于p.3位置的参考测量程序的分析选择性。在本报告中,我们关注位置m.3的二次校准品,它应是一个具有互换性的基体参考物质,用于校准制造商选定的测量程序(p.4)。p.4和p.5中使用的MPs是IVD生产制造过程的一部分,用于为位于位置m.5的终端用户校准品赋值,而该校准品又用于校准最终用户的测量程序(p.6)。p.4和p.5所使用的MPs通常与p.6所使用的最终用户MP相同,但更为严格进行校准和精密度测量,以减少结果的不确定度。RM的互换性主要取决于试剂配方以及其他测量参数。因此,m.3的基体参考物质必须与最终用户使用的测量程序(p.6)所测量的临床样本可互换。如果m.3位置的基体参考物质与临床样本不互换,那么校准等级将引入一个偏倚,导致m.6位置的临床样本结果不正确,且不能适当溯源到m.1位置的一级参考物质。m.4位置的制造商工作校准品和m.5位置的终端用户校准品在校准等级中用于特定的某个IVD制造商测量程序,即是专用的,不是共用的,因此不要求必须具备互换性,m.4和m.5的赋值可以通过一个已知的、恒定的互换性偏倚予以纠正,当然这种工作校准品或终端用户校准品不能用于校准其他IVD试剂。

3. 现有参考物质普遍缺乏充分的互换性确认:在2000年,由美国国家标准与技术研究所(NIST)举办的关于临床实验室溯源性的研讨会上,大家高度关注多个案例,这些案例各种测量的不充分直接或间接地与在校准等级中使用的参考物质不具备互换性有关。“互换性”一词在这次NIST研讨会的会议记录中出现了50多次。

在20世纪80年代和90年代初,多个报告强调了血清胆固醇的不同临床实验室MPs的标准化进展,当时的实验室受益于新开发的国家胆固醇参考系统,该系统包括高等级的RM和参考测量程序。然而,关于血清胆固醇的校准等级的现状仍然存在问题,特别是仍然缺乏能够传递正确度的、具有互换性、基体二级参考物质。下图示意了不具备互换性的RM如何将偏差引入临床实验室最终用户MP。

除了基质的影响,互换性还受到实际所测量的分子形式的影响。例如ERM-DA470k/IFCC中的C反应蛋白不具备互换性。C反应蛋白在天然样品中是五聚体,而470k在冻干过程中会引起五聚体解离成单体亚基。免疫测定针对的是五聚体,而质谱测的是五聚体或单体消化而成的肽段,这样,免疫分析方法和质谱方法中对470k就有不同的测量反应。新的参考物质ERM-DA474/IFCC为冰冻人血清,解决了上述问题,具有很好的互换性。

4. 具备互换性的CRM,超出预期用途使用或稀释使用时应重新进行互换性评估:举例,ERM-DA470k/IFCC的各种血清蛋白,如果用户决定使用这个参考物质对除血清以外的其他体液(例如尿液、脑脊液)的测量程序进行校准,例如对尿白蛋白的测量程序进行校准,则用户有义务验证该材料在新测量系统中的互换性。这一原则适用于任何偏离参考物质提供者使用说明的情况,如用户对参考物质进行进一步稀释。

5. 在多个测量程序间具备互换性是一个有用的参考物质的先决条件:IFCC最近描述了两种评估参考物质在多个测量程序间互换性的方法。对于这两种方法,MPs都必须具有足够的精密度和选择性,以能准确测量RM和CSs(clinical samples)之间的互换性偏差(commutability bias)。第一种方法见IFCC Working Group Recommendations for AssessingCommutability Part2:Using the Difference in Bias Between a Reference Material and Clinical Samples,Clin. Chem. 64(2018),这种方法对MPs进行一对一比较研究,在每对比较中,每个RM的互换性都是独立评估的。第二种方法见IFCC Working Group Recommendations for Assessing Commutability Part 3:Using the CalibrationEffectiveness of a Reference Material,Clin. Chem. 64(2018)。参考物质用于校准每一个MP,然后测试CSs(clinical samples),临床样本结果在所有MP之间进行比较。如果RM具有互换性,则所有MPs的临床样本结果将相似,若RM不互换,则某个或某些MP将产生与其他MP明显不同的临床样本结果,当然这取决于预先设定的可接受标准。这两种方法各有其优先使用范围,如果想要评价一个RM的互换性偏差(commutability bias)大小,可用第一种方法,如果想评价一个RM是否适用于溯源链,则优先选用第二种方法。

值得注意的是,可能会有不同的结果,包括RM与一个或几个mp不互换,但这也可能被认为是一个有用的RM,因为它适合于其他多个mp。还有一种情况是,有两组或更多的MPs,在一组MPs中RM显示具有互换性,但在其他MPs组中RM显示不具备互换性,这种情况可能是由于用于测量的不同技术,例如针对分析物不同表位的不同免疫分析方法。

如果RM对某个MP与其他MP存在互换性偏差,则这个MP不能在其校准等级中直接使用RM的指定值。可以这样处理,RM不互换的MP可以在其校准等级中使用该RM,使用互换性偏差的大小来调整RM的赋值,注意互换性偏差的不确定度要尽可能控制,这样才能使最终临床样本结果的合成不确定度保持在分析性能允许范围内。

6. 研制具有互换性的RM的挑战:在研制具有互换性的RM时,通常会考虑如下问题,比如:材料应该冷冻还是冻干?能否将外源性物质添加到材料中以达到通常在患病患者身上观察到的高浓度?RM可以稀释吗?如果可以,稀释到什么程度,使用什么缓冲液或基质?是否可以使用添加剂或防腐剂来提高RM的稳定性而不影响材料的互换性?

7. 实施互换性评估实验的挑战:互换性研究实验面临许多实际的挑战。首先,就是临床样本,理想的样本应该是真实的临床样本,并且最好是新鲜的,通常是25~50个样本,每一份样本来源于一个单一的donation,还要考虑足够的量,浓度应与候选RM的浓度相匹配,有可能需要的浓度很低或很高。

8. 设定互换性可接受标准:判断一个参考物质是否具有互换性,应该有一定的标准。以用作校准的校准品举例,校准品具有互换性的可接受标准,是基于校准品校准的测量程序在临床使用的可接受的分析性能而定的,互换性引入的偏差不能超过测量程序最大允许误差。

9. 后续工作:IFCC的互换性工作组正在研究制定对有证参考物质、正确度质控物以及能力验证样本进行互换性评价的更详细、更具有实操性的技术文件。

这三篇文章展示了Miller同时也是国际检验医学领域对互换性认识逐渐发展过程。人们对于一个具体事物的正确认识,一般说来经过在实践的基础上从感性认识到理性认识,再从理性认识到实践的多次反复,才能完成。实践、认识、再实践、再认识,这种形式,循环往复以至无穷,而实践和认识每一循环的内容,都比较地进到了高一级的程度