GB/T 6379.3-2012“测量方法和结果的准确度(正确度和精密度)”第3部分:“标准测量方法精密度的中间度量”读书笔记
摘 要
本部分给出如下一些认识:
1、对精密度给以全面的划分,即:重复性、复现性和期间精密度;
2、对这三类精密度用通俗语言加以说明:
“在重复性条件下,0.3中所列的因素a)-f)皆保持不变,不产生变异。而在再现性条件下, 这些条件都是变化的,能引起测试结果的变异。因此,重复性条件和再现性条件是精密度条件的两个极端情形。前者描述测试结果最小变异,后者描述测试结果最大变异。在这两种极端条件之间的中间条件也是存在的,即因素a)-f)之中的一个或多个发生变化”。
下面一句是“它们可用于某些特定的环境,精密度通常用标准差表示”。
换言之,标准编写者认为中间精密度实际只用于某些特定情况,实际用处有限。
3、期间精密度有四个主要变化因素:“时间、校准、操作员和设
备”。
指出“校准”不是指校准方法的不同,而是“在连续的几组测量之间是否经过重新校准”。
指出“设备”不是指不同种类的设备或仪器,而是“在测量中是否使用同一设备(或者同一批试剂)”。
4、对商业和医学实验室而言,评估期间精密度没有评估重复性和复
现性重要。
5、对医学实验室而言,评估期间精密度和室内质控工作相关。实际
工作中,可使用最简单的方法,即将所有质控数据按经典的不精密度公式计算即可,可以不用CLSI EP文件中复杂的套式评定方法。
6、实验室认可方以及管理者常依据医学实验室室内质控的期间精
密度数据判断实验室的质量高低。因此,医学实验室往往只选时间以及不可避免的操作员两项条件来评估期间精密度度量。
但是一个精明的检验工作者,绝不能忽视不同批号校准品、质控品和试剂对测量结果的影响。也要注意在重新进行校准后所引起的精密度变化。
引 言
“0.1 ……用两个术语‘正确度’与‘精密度’来描述一种测量方
法的准确度……”
这是ISO 5725每个部分引言中首先强调的内容。必须弃用习惯的“准确度”定义,承认ISO 5725对准确度术语的新解释,才能继续阅读和理解ISO 5725的内容。
下面再次显示准确度(正确度和精密度)与误差间关系图:
“0.2 GB/T 6379.1中对上述诸量给出了一般性考虑,在本部分中
不再重复”。
“0.3 很多不同的因素,都能引起测量方法的结果变异,这些因素
包括:
a)操作员
b)使用的设备
c)设备的校准
d)环境(温度、湿度、空气污染等)
e)试剂的批次
f)不同测量的时间间隔”
这似乎和正文中所叙述的4个主要因素有所差异,但如将因素d)并入f),e)与c)合并为设备,仍为4个因素。
“0.4 ……在重复性条件下,0.3中所列的因素a)-f)皆保持不
变,不产生变异。而在再现性条件下, 这些条件都是变化的,能引起测试结果的变异。因此,重复性条件和再现性条件是精密度条件的两个极端情形,前者描述测试结果最小变异,后者描述测试结果最大变异。在这两种极端条件之间的中间条件也是存在的,即因素a)-f)之中的一个或多个发生变化”,下面一句是“它们可用于某些特定的环境,精密度通常用标准差表示”。
换言之,标准编写者认为期间精密度实际只用于某些特定情况,医学实验室的室内质控可能就属于这些特定情况之—。
“0.5 本部分主要讨论一种测量方法的中间精密度的度量,称中间
精密度……”
“0.6 ……中间精密度度量首先应用于:为了在实验室内部,对测量
方法进行改进、标准化和控制”。对医学实验室而言主要用于室内质控。
其次“在一个特殊设计的实验室间研究中,也需要进行中间精密度的估计。但是,由于1.3和9.1所述的原因,对这些度量的解释和应用,应当谨慎”。
对医学实验室而言,评估实验室间的中间精密度的意义和价值不大。
“0.7 具有可能影响测量方法精密度的四个因素是:
a)时间:连续性测量的时间间隔是大还是小
b)校准:在连续的几组测量之间是否经过重新校准
c)操作员:连续的测量是否由同一操作员完成
d)设备:在测量中是否使用同一设备(或者同一批试剂)”
这四个因素来自ISO 3534.2-1993的注,多个标准都引用这四因素。
“0.8 下面先引进M个因素不同的中间精密度条件,以便考虑实验
室内测量条件的变化。
a)M=1:四个因素中只有一个不同
b)M=2:四个因素中有两个不同
c)M=3:四个因素中有三个不同
d)M=4:所有四个因素都不同
不同的中间精密度条件,产生不同的中间精密度标准差,记作si (。)。所对应的特定条件在圆括号里明确标出。例如si(TO)表示不同时间、不同操作员的中间精密度标准差”。
“0.9 ……在重复性条件下所得到测试结果的标准差,一般要小于
在中间精密度条件下所得结果的标准差。一般情况下,在化学分析中,中间精密度条件下的标准差会是重复性条件下标准差的2-3倍。当然,它不应大于再现性标准差……”
第一部分
1 “1 范围”
2 “3 术语和定义”
第二部分 概论
1 “4 一般要求”
2 “5 重要因素”
3 “6 统计模型”
4 “7 测量条件的选择”
第三部分 中间精密度度量的研究和分析
1 “8 中间精密度度量的实验室内研究和分析”
2 “9 中间精密度度量的实验室间研究和分析”
*以下每一章的内容都按原来编码排列。
第一部分
1 “1 范围”
2 “3 术语和定义”
1 “1 范围”
首先说明“1.1 本部分规定了由于实验室内观察条件(时间、校准、操作员和设备)变化而产生的四种中间精密度度量。这些中间精密度可以在一个确定的实验室内产生,也可以通过实验室间试验产生”。
其次“GB/T 6379本部分还有如下内容:
“a)讨论中间精密度度量定义的含义
b)为在实际工作中对中间精密度度量估计的解释和应用提供指南”;
特别指出,本部分不叙述下列问题:
“c)没有为估计中间精密度度量的误差提供任何度量
d)不涉及如何确定测量方法本身的正确度,但讨论了正确度与测量条件之间的关系”。
此段话从另一方面说明了中间精密度实用价值不大,没有必要进一步讨论这些问题。这是因为期间测量条件的变化太多,很难比较不同实验室在不同条件下期间精密度度量大小的价值和意义。所以c)提出估计中间精密度度量的误差的度量实际意义不大。
下面1.2到1.5内容是对1.1的补充和说明。
“1.2 本部分适用于所涉及的测量方法特指对连续量进行测量,并
且每次测量只取一个值作为测量结果。尽管这个值可能是一组观察值的计算结果”。
在ISO 5725每个部分都有此段叙述,因为这是ISO 5725的基本出发点。
“1.3 确定这些中间精密度度量的本质在于,用数量表示测量方法
在规定条件下,重复测试结果的能力”。
“1.4 本部分所叙述的统计方法基于如下的前提:可以联合‘相
似’的测量条件中的信息,以获得对中间精密度更为准确的信息……但通过实验室间研究来估计中间精密度度量时,这个前提很难得到满足……因此,在使用中间精密度实验室间研究所得的结果时要加以小心”。
这段话实际上是认为了通过实验室间研究来评定期间精密度度量的意义和价值不大。这也可能是ISO 5725.2在评定复现性标准差时,不使用期间精密度度量的一个原因。
“1.5 除本部分所需的技术外,还有另外一些估计和证实一个实验
室内中间精密度度量的技术,例如控制图……本部分并未声明提供了在某一特定实验室内对中间精密度度量进行估计的唯一方法”。
从另外一个角度说明了医学实验室主要是在室内质控(IQC)应用期间精密度,并有其特定的评估技术和方法。
2 “3 术语和定义”
“GB/T 6379.1和ISO 3534.1界定的以及下列术语和定义适用于本文件”。
实际上在GB/T6379.1找不到有关中间精密度条件的定义;在GB/T 3358.2-2009(ISO 3534.2-2006)找到中间精密度的术语和定义。
“3.3.16 中间精密度条件 intermediate precision conditions
在某些不同的基本观察条件下,按相同的测试方法,对同一测试/测量对象获得独立测试/测量结果的观察条件。
注1:四个基本的观察条件分别是:时间、校准、操作员和设施”。
这四个因素是本标准中讨论的基础,似乎得到计量界的公认。但是并不排除还有其他的观察条件, 例如更换校准品的种类和批号等。
在VIM-2007中,相应的 intermediate precision conditions定义为:
“5.11 期间测量精密度测量条件 intermediate precision conditions
of measurement【VIM 2.22】
简称期间精密度条件 intermediate precision conditions
除了相同测量程序、相同地点以及在一个较长时间内对同一或相类似的被测对象重复测量的一组测量条件外,还可包括涉及改变的其他条件。
注:
1. 改变可包括新的校准、测量标准器、操作者和测量系统
2. 对条件的说明应包括改变和未变的条件以及实际改变到
什么程度(引自JJF 1001-2011)”
这两个标准的定义都不太明确,可能按照本标准中引言0.4更容易理解,即“重复性条件和再现性条件是精密度条件的两个极端情形。前者描述测试结果最小变异,后者描述测试结果最大变异。在这两种极端条件之间的中间条件也是存在的,即因素a)-f)之中的一个或多个发生变化……”
第二部分 概论
包括本部分的4到7章
1 “4 一般要求”
2 “5 重要因素”
3 “6 统计模型”
4 “7 测量条件的选择”
1 “4 一般要求
为保证测量方法的一致性,应使用标准化的测量方法构成一个特定实验室内试验或实验室间实验一部分的所有测量都应按标准方法进行”。
2 “5 重要因素”
5.1实验室内测量条件的四个因素被认为是产生测量结果变异的主要原因(见表1)。
“5.2 ……‘同时间测量’是指那些在尽可能短的时间内进行的测
量……‘不同时间测量’是指那些在较长的时间间隔内进行的测量,可能由于环境条件的变化而对测量发生影响。”
医学实验室惯用的批间、日间精密度都属于此类。
“5.3 ‘校准’在此处不是指由测量方法所规定的作为获取测试结
果程序中的一个组成部分的校准。而是指在一个实验室内部不同组测量之间的每隔一定时间所进行的校准过程”。
实际上就是指进行了新的校准后所引起精密度的变化。
5.4 说明操作员不都是只指一个操作员,“对于某些操作,操作员
实际上可能指一组操作员……每一操作员执行测量程序的某一规定部分,在此情况,‘操作员’是指这一组操作员,这一组操作员中出现的任何人员和所分配任务的变更都应看作是不同的‘操作员’”。
对于第四个因素设备,本标准5.5有清楚的说明:
“5.5 ‘设备’事实上往往是指成套的设备。而成套设备中任何重
要部件的任何变化都将被视为不同的‘设备’”,绝不是使用了不同的成套设备。“至于什么是重要部件,可按常识判断。温度计的变更将被视作不同的重要部件,而用一个稍微不同的容器来代替水槽将被视为无关紧要。使用不同批次的试剂应被视作重要部件变化,这将被认为是使用了不同的‘设备’……”
这一段说明特别适合使用“测量系统”的医学实验室。“测量系统”重要组成部分的改变都可能形成期间精密测量条件的变化。
“5.6 在重复性条件下,所有的四个因素都处于表1中的状态1。对
于中间精密度条件,一个或者多个因素处于表1中的状态2……在再现性条件结果下,测量结果由不同的实验室获得……”
5.6用最简单的语言清晰说明3类不同精密度的主要差异。
“5.7 对M个因素不同的中间精密度条件,有必要指明哪些因素处
于表1中的状态2,且用相应的下标表示,例如:
—— 时间不同的中间精密度标准差,sI(T);
—— 校准不同的中间精密度标准差,sI(C);
—— 操作员不同的中间精密度标准差,sI(O);
—— 时间、操作员与设备不同的中间精密度标准差,sI(TOI);
其他情形也用类似的表示方法”。
3 “6 统计模型”
“6.1 基本模型
为估计测量方法的准确度(正确度和精密度),假定每个测试结果y是以下3个分量的和:
其中,对给定的受试物料:
m―总平均值(期望);
B―重复性条件下,偏移的实验室分量;
e―重复性条件下每次测量产生的随机误差”。
ISO 5725每个部分,几乎都对测量模型进行讨论,内容多有重复,希望今后能有同志专门对测量模型写篇文章,此处省略对下列6.3-6.5的读书报告。
“ 6.2 总平均值m
6.3 分量B
6.4 分量B0、B(1)、B(2)……等
6.5 误差项e”
4 “7 测量条件的选择”
“7.1 ……在一个实验室内,可想象有许多测量条件,例如:
a)重复性条件(四因素均为常量)
b)一个因素不同的几种中间精密度条件
c)两个因素不同的几种中间精密度条件
d) 三个因素不同的几种中间精密度条件
e)四个因素都不同的中间精密度条件
在测量方法标准中,尽管总应给出重复性标准差,但不必(尽管可行)给出所有可能精密度度量。在一般的商业实践中,对中间精密度测量,应说明通常会遇到的测量条件……同时,只明确一个适当的中间精密度度量就已足够。应该仔细地说明可能改变的测量条件因素……”
这一点的说明很重要,无论IVD厂家还是医学实验室没有必要在期间精密度上花费更多的精力去加以评估。对医学实验室,其价值可能就是评价实验室内质量控制(IQC)时有用,主要的可变因素是时间。
7.1还继续叙述“特别对于时间不同的中间精密度,应明确连续测量间的实际平均时间间隔”。
“7.2 我们假定,一个标准化测量方法的偏移已经尽可能小,且测
量方法本身固有的偏移也已通过技术手段进行过处理,因此本部分只讨论源于测量条件的偏移”。
“7.3 重复性条件中测量条件的诸因素的任何变化都会增大测试结
果的变异。然而,多个测试结果平均值的期望的偏移会比重复性条件下的偏移小,因此不用单个测试结果,而用多个测试结果的平均值作为最终报告的测试结果,即能克服中间精密度条件下标准差的增大”。
说明在中间测量条件下的多次测量的平均值“能克服中间精密度条件下标准差的增大”。
“7.4 大多数实验室的一些实际考虑:例如所要求的最终上报结果
的精密度(标准差)及进行测量的费用,将决定测量方法标准化中所考虑的测量条件改变的因素个数和因素的选择”。
实验室认可方以及管理者常依据室内质控的期间精密度数据判断实验室的质量高低。因此,医学实验室往往只选时间以及不可避免的操作员两项条件来评估期间精密度度量。
但是一个精明的检验工作者,绝不能忽视不同批号校准品、质控品和试剂对测量结果的影响。也要注意在重新进行校准后所引起的精密度变化。
第三部分 中间精密度的研究和分析
包括第八章和第九章
1 “8 中间精密度度量的实验室内研究和分析”
2 “9 中间精密度度量的实验室间研究和分析”
1 “8 中间精密度度量的实验室内研究和分析”
“8.1 最简单的方法
估计一个实验室内的中间精密度标准差的最简单的方法是:抽取一个样本,对其进行次数为n的重复测量,在不同次测量之间因素发生改变,建议测量次数n至少应为15……它的分析过程很简单,这种方法对于通过连续多日对同一样本进行连续测量来研究不同时间的中间精密度,或研究不同校准对测量的影响是有用的”。
这段叙述完全符合医学实验室的室内质控的实际工作,换言之,只要对质控品的连续多日测量,就很容易用质控数据来评定期间精密度。
“为检测数据中潜在的离群值,推荐使用yk-y对测量数k的图,其中yk是n个重复测试结果中第k个测试结果,而y是这n个重复测试结果的平均值……”
对医学实验室而言,只要除去失控数据即可,不需使用这些复杂的统计学方法。
“M个因素不同时,中间精密度标准差的估计值由下式给出:
”
这实际上就是医学实验室熟悉的计算标准差的公式,简单易行,没有必要应用CLSI EP05的复杂的套式计算方法。
“8.2 可供选择的方法
8.2.1 另一种可供选择的方法要考虑t组测量,每组测量包括
n个重复测试结果……每组中的n个测试结果,应由同一样本上测量得到……建议t(n-1)的值至少为15。
示例:一个操作员,对t组物料中的每一种进行单个测量后,由第二个操作员重复这一过程,接着可能有第三个操作员进行测量,如此继续,此后就可以计算中间精密度的估计值sI(O)。
8.2.2 为检测数据中潜在的离群值,推荐使用yk-y对物料数 j
的图……”
对医学实验室而言,计算时只要除去失控数据即可,不需使用这些复杂的统计学方法。
“M个因素不同的中间精密度标准差的估计由下式给出:
对n=2(即每种物料有2个测试结果)上述公式简化为:
”
“8.3 测量条件对最终报告结果的影响
8.3.1 对时间、校准、操作员和设备诸因素的不同组合,y 的
期望值各不相同……这限制了对平均值的使用。在化学分析或物理测试中,y被当做最终结果报告……在很大程度上影响产品的价格。
8.3.2 因此,最终报告的化学分析和物理测试的结果应当足够精确,高度可靠,尤其要是通用的和可再现的。对商业要求而言,一个只在一定的操作员、设备和时间条件下,才能得到保证的最终报告结果是不够好的”。
最后一段叙述是对―个实验室提供期间精密度的疑惑。通过上述讨论,人们知道影响期间精密度度量的因素太多。—个实验室所得到的数据并不足以说明结果的可靠性,这可能是目前流行多个实验室协作研究的―个重要原因。
2 “9 中间精密度度量的实验室间研究和分析”
“9.1 基本假定
由实验室间研究获得中间精密度估计依赖于如下假定:任何特定因素在所有实验室间的效应是相同的……如果此假定不成立,中间精密度度量的概念以及以下各节给出的中间精密度度量的估计技术就没有意义……”
通过此段叙述,可以看到导则编写者认为评估实验室间期间精密度很困难,其价值和意义价值也不清楚。
“9.2 最简单的方法,
将q个水平的物料发送到p个实验室,每个实验室对q个水平中的每个水平进行n次测量,在每个水平内的n次测量间改变中间精密度条件。用GB/T6379.2所述的同样方法进行分析,所不同的只是此时得到的是中间精密度标准差而不是重复性标准差的估计”。
在多个实验室协同研究中,有时要考虑在期间精密度测量条件下进行测量,例如,每个实验室不单单在1天而是在2日重复测量同—标本。此时如何计算精密度标准差?本标准推荐的办法是:可使用GB/T6379.2介绍的计算的单元表,不同的是填入2天中间测量条件的数据,而不是一天重复性数据。继续按ISO 5725.2介绍的程序计算到复现性精密度的结果,“所不同的只是此时得到的是中间精密度标准差而不是重复性标准差的估计”。
应该说,这是对复现性标准差估计的一个重要补充。因为在―些实验室间协同研究中有时不得不按期间精密度测量条件进行试验,按此处介绍的办法,无需进行复杂的统计学计算就可解决问题。
下面导则内容叙述使用CLSI EP-05介绍的套式方法,即:
“9.3 套设计试验
估计中间精密度的另一种方法是进行更精密复杂的试验。可能的方法有完全套设计试验和错层套设计试验。使用套设计的优点是,可以通过一次实验室间试验,在同一时间不仅获得重复性标准差和再现性标准差的估计,也同时能获得一个或者多个中间精密度标准差的估计”。
在随后的“9.4完全套设计试验”、“9.5错层套设计试验”和“9.6套设计中因数的配置”中,对这两种方法做了简单介绍,但没有详细的计算方法。
对于医学实验室而言,可以使用“9.2 最简单的方法”估计期间精密度度量。有兴趣的同志可以阅读上述内容、本部分的“附录B完全套设计试验的方差分析”和“附录C错层套设计试验的方差分析”。
“9.7 套设计与GB/T 6379.2中给出方法的比较
GB/T 6379.2中所给的方法,是对每一测试水平分别进行分析的,实际上是两因素的完全套设计,最终获得两个标准差,即重复性标准差和再现性标准差。两个因素中,因素0是实验室,因素1是重复。如果在这一设计中增加一个因素:在每一个实验室里安排两个操作员,每个操作员在重复性条件下测得两个结果,那么除了重复性标准差和再现性标准差外,还可以确定操作员不同的中间精密度。如果每个实验室,只用一个操作员,但是在不同的日子进行测试,就可以通过这三个因素完全套设计实验,得到时间不同的中间精密度标准差。如果试验加一个因素,每一个实验室安排两个操作员,每个操作员做两次测量并且试验在不同的工作日完全重复一次,这样安排的试验能确定重复性标准差、再现性标准差、操作员不同中间精密度标准差、时间不同中间精密度标准差,以及时间-操作员不同中间精密度标准差”。
说明用简单方法只能得出一个笼统的期间精密度;使用套式方法可以得到各种各样有明确条件差异的期间精密度。
“9.8 完全套设计与错层套设计的比较
一个n因素完全套设计试验对每一实验室要求有2n-1个测试结果,对实验室可能是一个过分的要求,这是要采用错层套设计的主要原因。尽管错层套设计的分析稍为复杂,且由于所需测试结果的数量少,标准差估计的不确定度较大,但它可以用较少的测试结果获得同样数量的标准差”。
———— ISO 5725.3读书报告结束 ———