GB/T 6379.2-2004 ( ISO 5725.2-1994 ) “测量方法和结果准确度(正确度和精密度)”第2部分:“确定标准测量方法重复性与再现性的基本方法”读书笔记(第二部分)
摘 要
本部分主要介绍ISO 5725.2提出的测定复现性标准(偏)差的计算过程。
简言之,计算过程大致如下:
1. 提出3个基本表格:
-图2的A表 原始数据整理的推荐格式
-图2的B表 单元平均值整理的推荐格式
-图2的C表 单元内离散度的推荐格式
2. 从上述基本表格计算出每个单元的统计学数据
-首先从A表中提出数据组成“精密度试验单元”的原始数据;
-按T1到T5公式计算出共5个结果;
-将T1到T5代入公式计算出每个单元下列统计学数据:
重复性方差;sr2
实验室间方差;sL2
复现性方差;sR2= sL2+ sr2
平均值m
3. 依次计算每个单元数据,得出一个完整数据表
ISO 5725.2读书报告(第2部分)
内 容
1 “4 基本模型中的参数估计”
2 “7 精密度试验的统计分析”
3 “8 统计数值表”
1“4 基本模型中的参数估计”
为了阅读方便,以下内容章节仍按原标准编码排列。
4.1 内容与ISO 5725.1相似
“GB/T 6379本部分给出的程序是建立在GB/T 6379.1-2004第5章的统计模型基础上的……基本模型是:
y=m+B+e
其中,对给定的受试物料:
m —— 总平均值(期望);
B —— 重复性条件下的偏倚的实验室分量;
e —— 在重复性条件下每一次测量产生的随机误差。
注意:后2项都是指重复性条件下的实验室偏移和随机误差。”
非常清楚指出为什么先要讨论基本模型,这是因为“GB/T 6379本部分给出的程序是建立在GB/T 6379.1-2004第5章的统计模型基础上的”。
4.2 “……实际情况中,这些标准差的确切值是未知的,精密度的
估计值通过从全体实验室组成的总体抽取少量的实验室来获得的。而在这些实验室内部,该估计值由所有可能测试结果的一个小样本获得。”
这是一段重要叙述,在实际工作中,人们通过―个小样本的“协同研究”不可能得到真值σ,只能得到其估计值s。在评价估计值s价值时不可避免要考虑样本量大小的影响,涉及到自由度问题。
4.3 “……可根据GB/T 6379.1-2004第5章中的式(2)到式(6)
得出。
sL2:实验室间方差的估算值;
sw2:实验室内方差的估算值;
sr2:sw2的算术平均值,并且是重复性方差的估计值,这个算术
平均值是在剔除了离群值后对所有参与准确度试验的实验室计算的。
sR2:再现性方差的估计值:
sR2 = sL2 + sr2 ………………(1)”
第4章内容体现了从基本模型到推导出基本公式的过程,统计学家应审核过程是否合适恰当。
2 “7 精密度试验的统计分析”
为了阅读方便,以下读书内容仍按原标准的章节编排。
7.1 初步考虑
7.2 结果列表和所用记号
7.3 测试结果的一致性和离群值检查
7.4 总平均值和方差的计算
7.5 精密度值和平均水平m之间的函数关系的建立
7.6 统计分析程序的步骤
7.7 给领导小组的报告和领导小组做出的决定
如同ISO 5725.1读书报告一样,省略7.3“测试结果的一致性和离群值检查”。
7.1 “初步考虑”
7.1.1 强调统计学家的作用,应该由统计学家全权负责:
“a)对数据进行检查,以判别和处理离群值或其他不规则数
据,并检验模型的合适性;
b)对每个水平分别计算精密度和平均值的初始值;
c)确定精密度和平均值的最终值,且在分析表明精密度和水
平m之间可能存在某种关系时,建立它们之间的关系。”
7.1.2 “对每个水平,首先计算以下诸量的估计值
-重复性方差;sr2
-实验室间方差;sL2
-复现性方差;sR2 = sL2 + sr2
-平均值m
应先组成精密度试验单元,计算每个单元的上述数值。”
7.1.3 提出离群值的统计方法。有关评定离群值的方法分类,将在今后详细介绍。
7.2 结果列表和所用记号
这是本部分最重要的章节,叙述了评定复现性标准偏移的详细程序。它包括如下7.2.1—7.2.11内容:
7.2.1 单元
7.2.2 多余数据
7.2.3 缺失数据
7.2.4 离群值
7.2.5 离群实验室
7.2.6 错误数据
7.2.7 平衡均匀水平测试结果
7.2.8 原始测试结果
7.2.9 单元平均值(图2的B表)
7.2.10 单元离散度(图2的C表)
7.2.11 经更正或被删除的数据
本读书报告不包括上述7.2.2至7.2.6内容,其余内容将结合附录B的实例加以介绍,希望通过阅读此节可以完整地了解和初步掌握此标准中的评定办法。
7.2.1 “单元
一个实验室和一个水平的组合称为精密度试验的一个单元。理想的情况是,一项有p个实验室和q个水平的试验,列成pq单元的表,每个单元包含n次重复测试结果,以此来计算重复性标准差和再现性标准差。然而,由于多余数据、缺失数据和离群值的发生,这种理想情况在实际中并不总是能够得到的。”
严格地说,此处介绍的是“精密度试验单元”定义。单元另有定义(见ASTM E 691)。协同试验产生大量数据,从何开始计算数据?本段叙述明确了从计算每一个“精密度试验单元”数据开始。
7.2.2至7.2.6涉及离群值和一致性检验,以后另行讨论。
7.2.7 平衡均匀水平测试结果
要得到平衡均匀水平测试结果,也就是每个参加协同研究实验室的数据完全相等,决非易事。
理想的情况是对p个实验室(编号为i=1,2,…p),q个水平(编号为j=1,2,…q),每个水平都重复n次测试的情形,总共获得pqn个测试结果。由于数据缺失(7.2.3)、离群的测试结果(7.2.4)、离群实验室(7.2.5)或错误数据(7.2.6)的存在,这种理想的情况并不总能得到。
在这些情况下如何处理?
一是保留所有数据,只要有问题实验室是少数。例如在引用的附录B实例1中,参加的8个实验室各有一个实验室n为4或5,其余n都为3;
注8称:“注8表B.1中所引用的试验,没有指明实验室应该做多少次试验,给出了应测试的最小次数……为说明计算程序也能适用于那些测试结果数可能不等的情形,本例中保留了所有的测试结果。读者可以将每个单元的测试结果用随机抽取的办法减少到3个,经过计算,可以验证对mi、Sr和SR的值影响甚微。”
另一是用随机抽取的办法强行减少到相同测量数。
从本导则引用实例来看,似乎不平衡的实验结果对计算结果实际影响不太大。
7.2.8—7.2.10是数据计算中最基本的三个表格,将结合附录B的具体数据,加以详细说明。
7.2.8 “原始测试结果
图2的A表 原始数据整理的推荐格式”
“nij是第i个实验室在水平j这个单元的测试结果数;
yijk是该单元第k个测试结果(k=1,2,……nij)
pj中j水平至少有一个测试结果的实验室数(在剔除了所有离群值和错误的测试结果后)”
附录B第1个实例
“煤中硫含量的确定(多水平,不包含缺失值和离群值数据……c)简述
8个实验室参与试验……对每个水平实验室1报告了4个测试结果,实验室5报告了4~5个测试结果,其余的实验室都报告3个测试结果。”
具体数据见下表:
7.2.9 “单元平均值”
图2的B表单元平均值整理的推荐格式
“由A表按下式计算单元平均值:
特别指出:
“单元平均值应比A表中的测试结果有效数字多一位。”
下面是图2的B表 单元平均值整理的推荐格式
将附录B第1个实例计算结果填入B表
7.2.10 单元离散度
图2的C表单元内离散度的推荐格式
“由A表(参见7.2.8)和B表(参见7.2.9)按下面的公式计算单元离散度:
一般情况,使用单元内标准差,即
上式等价于
在使用上述公式计算时,应注意在计算过程中保留足够的有效数字位数,每个中间值需要保留的位数应是原始数据的两倍。标准差应该比A表中的结果的有效数字多一位。”
将计算结果填入C表 单元内离散度的推荐格式
将附录B第1个实例计算结果填入C
7.2.11 “因为一些数据根据7.1.3、7.3.3和7.3.4中提到的检验可能
经过更正或予以剔除,因此用于最后确定精密度和平均值的yijk、nij及pj可能与在图2中记录的A表、B表和C表中的原始测试结果不同。所以在报告精密度和正确度的最终值时,如果有经过更正或剔除的数据应予指出。”
7.3 测试结果的一致性和离群值检查
此次读书报告,暂时省略。
7.4 总平均值和方差的计算
7.4.1 分析方法
“在本部分中采用的分析方法包括m的估计以及每个不同水平下精密度的估计。计算结果对每个j值列在一个表中。”
7.4.2 基本数据
“用于计算的基本数据是图2所列的三个表:
-A表为原始测试结果;
-B表为单元平均值;
-C表为单元离散度。”
7.4.3 非空白单元
此情况见于数据丢失或不完全,如何处理,此处暂不讨论。
7.4.4 总平均值的计算
“对于水平j,总平均值的估计为
7.4.5 方差的计算
对每个水平(浓度)计算三个方差,即重复性方差、实验室间方差和复现性方差。”
7.4.5.1 重复性方差
7.4.5.2 实验室间方差
其中:
上述计算将在附录B.1.5与B.3中用例子说明。
上述计算中不易理解的是公式(21),可惜的是,我所收集到的文件似都未加以说明。
7.4.5.5 复(再)现性方差
上述7.4.4、7.4.5.1、7.4.5.2和7.4.5.5计算将在下面以附录B.1.5与B.3中用例子的具体数据进行计算。
以下为附录B1.6中所介绍的mj、srj和sRj的计算。
ISO5725.2介绍的计算方法特点为不直接将数据代入前面所列的公式19到24直接计算,而是先分别以下列T1—T5公式计算出正文中公式中各个分项的数据,然后将分项T1至T5结果再代入公式19到24中计算得出结果。
我将以水平1为例,介绍对此单元总平均值和各个方差的计算。为了叙述清楚,添加我另行制作的表格和计算过程。
第一步
先从前面A表中提出单元(水平1)如下数据
上表中第1行为实验室编号,第2行为每一实验室n次测量原始数据,第3行为每一个实验室n次测量次数,第4行为测量结果的平均值,最后一行则是每一个实验室n次测量数值离散度(标准偏差)。
第二步
ISO 5725.2介绍的方法是进行间接计算。就是先用上表中3项基本数值,按下列T1—T5公式计算,得如下结果:
其中T1数值和计算见下表:
T1=2.832+2.004+2.001+1.980+3.450+2.199+2.109+2.031=18.642
其中T2数值和计算见下表:
T2=2.005+1.387+1.335+1.307+2.381+1.612+1.483+1.375=12.885
请问,为什么不是ISO 5725.2中的答案12.883 7?*
T3=4+3+3+3+5+3+3+3=27
T4=42+32+32+32+52+32+32+32=95
T5数值和计算如下:
T5=0.000075+0.000200+0.000882+0.000200+0.00144++0.000072+0.000288+0.00125=0.004 411
请问,为什么不是ISO 5725.2中的答案0.004 407?*
* 此结果是因计算者没注意到“7.2.10……在使用上述公式计算时,应注意在计算过程中保留足够的有效数字位数,每个中间值需要保留的位数应是原始数据的两倍。标准差应该比A表中的结果的有效数字多一位。”
第三步
将上列计算T1—T5值代入下式:
第四步
再对水平2、3和4进行类似的计算,结果列于表B.5
上面是附加的附录B实例1的具体计算过程,下面回到ISO 5725.2内容。
本读书报告省略下述2种特殊情况:
7.4.5.3 “对于所有的nij=n=2的特殊情况,可使用以下简单的公式……”
7.4.5.4 由于受到误差影响,当计算结果sLj2出现负值时,应将该值设置为零。
7.4.6 “方差依赖于m的情形
接下来应该考察精密度是否依赖于m,如果是,应该确定他们之间的函数关系……”
7.5 “精密度值和平均水平m之间的函数关系的建立……”
本节内容很多,7.5.1—7.5.9约占2页。由于在目前实际工作中没有此迫切要求,暂不讨论。
7.6 “统计分析程序的步骤”
此节包括了7.6.1—7.6.19诸多内容,主要为“注5:图3是在7.6中给出的统计分析程序各步骤的流程图。”见下图。其余7.6.2—7.6.19则是对此图的说明。
“图3 统计分析主要步骤流程图”
图的上半部有一定参考价值。由于“协同研究”不一定考虑建立函数关系,图的下半部只供参考。
7.7 给领导小组的报告和领导小组做出的决定
7.7.1 统计专家的报告
7.7.2 领导小组采取的决定
7.7.3 全面报告
本节内容易懂,没有需说明和讨论之处。
3 “8 统计数值表”
8.1 表4给出了柯克伦检验的临界值(见7.3.3)
8.2 表5给出了格拉布斯检验的临界值(见7.3.4)
8.3 表6和表7给出了曼德尔的h和k统计量的临界值。
此部分给出的这些表都是检查离群值所需的。
——ISO 5725.2阅读笔记第2部分结束——