GB/T 6379.2-2004 ( ISO 5725.2-1994 ) “测量方法和结果准确度(正确度和精密度)”第2部分:“确定标准测量方法重复性与再现性的基本方法”读书笔记(第二部分)

作者:杨振华
2021-12-16

摘 要

本部分主要介绍ISO 5725.2提出的测定复现性标准(偏)差的计算过程。


简言之,计算过程大致如下:


1. 提出3个基本表格:

 -图2的A表  原始数据整理的推荐格式

 -图2的B表  单元平均值整理的推荐格式

 -图2的C表  单元内离散度的推荐格式


2. 从上述基本表格计算出每个单元的统计学数据

 -首先从A表中提出数据组成“精密度试验单元”的原始数据;

 -按T1到T5公式计算出共5个结果;

 -将T1到T5代入公式计算出每个单元下列统计学数据:

  •   重复性方差;sr2

  •   实验室间方差;sL2

  •   复现性方差;sR2= sL2+ sr2

  •   平均值m


3. 依次计算每个单元数据,得出一个完整数据表


ISO 5725.2读书报告(第2部分)


内 容

1 “4 基本模型中的参数估计”

2 “7 精密度试验的统计分析”

3 “8 统计数值表”


1“4 基本模型中的参数估计”

为了阅读方便,以下内容章节仍按原标准编码排列。


4.1 内容与ISO 5725.1相似

“GB/T 6379本部分给出的程序是建立在GB/T 6379.1-2004第5章的统计模型基础上的……基本模型是: 

y=m+B+e

其中,对给定的受试物料:

m —— 总平均值(期望);

B —— 重复性条件下的偏倚的实验室分量;

e —— 在重复性条件下每一次测量产生的随机误差。

注意:后2项都是指重复性条件下的实验室偏移和随机误差。”


非常清楚指出为什么先要讨论基本模型,这是因为“GB/T 6379本部分给出的程序是建立在GB/T 6379.1-2004第5章的统计模型基础上的”。


4.2 “……实际情况中,这些标准差的确切值是未知的,精密度的

估计值通过从全体实验室组成的总体抽取少量的实验室来获得的。而在这些实验室内部,该估计值由所有可能测试结果的一个小样本获得。”


这是一段重要叙述,在实际工作中,人们通过―个小样本的“协同研究”不可能得到真值σ,只能得到其估计值s。在评价估计值s价值时不可避免要考虑样本量大小的影响,涉及到自由度问题。


4.3 “……可根据GB/T 6379.1-2004第5章中的式(2)到式(6)

得出。

sL2:实验室间方差的估算值;

sw2:实验室内方差的估算值;

sr2:sw2的算术平均值,并且是重复性方差的估计值,这个算术

平均值是在剔除了离群值后对所有参与准确度试验的实验室计算的。

sR2:再现性方差的估计值:

sR2 = sL2 + sr2 ………………(1)”


第4章内容体现了从基本模型到推导出基本公式的过程,统计学家应审核过程是否合适恰当。


2 “7 精密度试验的统计分析”

为了阅读方便,以下读书内容仍按原标准的章节编排。

7.1 初步考虑

7.2 结果列表和所用记号

7.3 测试结果的一致性和离群值检查

7.4 总平均值和方差的计算

7.5 精密度值和平均水平m之间的函数关系的建立

7.6 统计分析程序的步骤

7.7 给领导小组的报告和领导小组做出的决定


如同ISO 5725.1读书报告一样,省略7.3“测试结果的一致性和离群值检查”。


7.1 “初步考虑”


7.1.1 强调统计学家的作用,应该由统计学家全权负责:

“a)对数据进行检查,以判别和处理离群值或其他不规则数

据,并检验模型的合适性;

b)对每个水平分别计算精密度和平均值的初始值;

c)确定精密度和平均值的最终值,且在分析表明精密度和水

平m之间可能存在某种关系时,建立它们之间的关系。”


7.1.2 “对每个水平,首先计算以下诸量的估计值

-重复性方差;sr2

-实验室间方差;sL2

-复现性方差;sR2 = sL2 + sr2

-平均值m

应先组成精密度试验单元,计算每个单元的上述数值。”


7.1.3 提出离群值的统计方法。有关评定离群值的方法分类,将在今后详细介绍。


7.2 结果列表和所用记号

这是本部分最重要的章节,叙述了评定复现性标准偏移的详细程序。它包括如下7.2.1—7.2.11内容:

7.2.1 单元

7.2.2 多余数据

7.2.3 缺失数据

7.2.4 离群值

7.2.5 离群实验室

7.2.6 错误数据

7.2.7 平衡均匀水平测试结果

7.2.8 原始测试结果

7.2.9 单元平均值(图2的B表)

7.2.10 单元离散度(图2的C表)

7.2.11 经更正或被删除的数据


本读书报告不包括上述7.2.2至7.2.6内容,其余内容将结合附录B的实例加以介绍,希望通过阅读此节可以完整地了解和初步掌握此标准中的评定办法。


7.2.1 “单元

一个实验室和一个水平的组合称为精密度试验的一个单元。理想的情况是,一项有p个实验室和q个水平的试验,列成pq单元的表,每个单元包含n次重复测试结果,以此来计算重复性标准差和再现性标准差。然而,由于多余数据、缺失数据和离群值的发生,这种理想情况在实际中并不总是能够得到的。”


严格地说,此处介绍的是“精密度试验单元”定义。单元另有定义(见ASTM E 691)。协同试验产生大量数据,从何开始计算数据?本段叙述明确了从计算每一个“精密度试验单元”数据开始。


7.2.2至7.2.6涉及离群值和一致性检验,以后另行讨论。


7.2.7 平衡均匀水平测试结果

要得到平衡均匀水平测试结果,也就是每个参加协同研究实验室的数据完全相等,决非易事。


理想的情况是对p个实验室(编号为i=1,2,…p),q个水平(编号为j=1,2,…q),每个水平都重复n次测试的情形,总共获得pqn个测试结果。由于数据缺失(7.2.3)、离群的测试结果(7.2.4)、离群实验室(7.2.5)或错误数据(7.2.6)的存在,这种理想的情况并不总能得到。


在这些情况下如何处理?

 一是保留所有数据,只要有问题实验室是少数。例如在引用的附录B实例1中,参加的8个实验室各有一个实验室n为4或5,其余n都为3;

注8称:“注8表B.1中所引用的试验,没有指明实验室应该做多少次试验,给出了应测试的最小次数……为说明计算程序也能适用于那些测试结果数可能不等的情形,本例中保留了所有的测试结果。读者可以将每个单元的测试结果用随机抽取的办法减少到3个,经过计算,可以验证对mi、Sr和SR的值影响甚微。”


 另一是用随机抽取的办法强行减少到相同测量数。

从本导则引用实例来看,似乎不平衡的实验结果对计算结果实际影响不太大。


7.2.8—7.2.10是数据计算中最基本的三个表格,将结合附录B的具体数据,加以详细说明。


7.2.8 “原始测试结果

图2的A表 原始数据整理的推荐格式”

读书笔记-1.jpg

“nij是第i个实验室在水平j这个单元的测试结果数;

yijk是该单元第k个测试结果(k=1,2,……nij)

pj中j水平至少有一个测试结果的实验室数(在剔除了所有离群值和错误的测试结果后)”


附录B第1个实例

“煤中硫含量的确定(多水平,不包含缺失值和离群值数据……c)简述

8个实验室参与试验……对每个水平实验室1报告了4个测试结果,实验室5报告了4~5个测试结果,其余的实验室都报告3个测试结果。”


具体数据见下表:

读书笔记-2.jpg


7.2.9 “单元平均值”

图2的B表单元平均值整理的推荐格式

“由A表按下式计算单元平均值:

读书笔记-3.jpg

特别指出:

“单元平均值应比A表中的测试结果有效数字多一位。”


下面是图2的B表 单元平均值整理的推荐格式

 将附录B第1个实例计算结果填入B表

读书笔记-4.jpg

 读书笔记-5.jpg

7.2.10 单元离散度

图2的C表单元内离散度的推荐格式

“由A表(参见7.2.8)和B表(参见7.2.9)按下面的公式计算单元离散度:

一般情况,使用单元内标准差,即

读书笔记-6.jpg

上式等价于 

读书笔记-7.jpg

 在使用上述公式计算时,应注意在计算过程中保留足够的有效数字位数,每个中间值需要保留的位数应是原始数据的两倍。标准差应该比A表中的结果的有效数字多一位。”


将计算结果填入C表 单元内离散度的推荐格式

 将附录B第1个实例计算结果填入C

 读书笔记-8.jpg

读书笔记-9.jpg

7.2.11 “因为一些数据根据7.1.3、7.3.3和7.3.4中提到的检验可能

经过更正或予以剔除,因此用于最后确定精密度和平均值的yijk、nij及pj可能与在图2中记录的A表、B表和C表中的原始测试结果不同。所以在报告精密度和正确度的最终值时,如果有经过更正或剔除的数据应予指出。”


7.3 测试结果的一致性和离群值检查

此次读书报告,暂时省略。


7.4 总平均值和方差的计算


7.4.1 分析方法

“在本部分中采用的分析方法包括m的估计以及每个不同水平下精密度的估计。计算结果对每个j值列在一个表中。”


7.4.2 基本数据

“用于计算的基本数据是图2所列的三个表:

 -A表为原始测试结果;

 -B表为单元平均值;

 -C表为单元离散度。”


7.4.3 非空白单元

此情况见于数据丢失或不完全,如何处理,此处暂不讨论。


7.4.4 总平均值的计算

“对于水平j,总平均值的估计为

读书笔记-10.jpg

 

7.4.5 方差的计算

对每个水平(浓度)计算三个方差,即重复性方差、实验室间方差和复现性方差。”


7.4.5.1 重复性方差

读书笔记-11.jpg

7.4.5.2 实验室间方差

读书笔记-12.jpg

读书笔记-13.jpg

读书笔记-14.jpg

 其中:

上述计算将在附录B.1.5与B.3中用例子说明。


上述计算中不易理解的是公式(21),可惜的是,我所收集到的文件似都未加以说明。


7.4.5.5 复(再)现性方差

读书笔记-15.jpg

上述7.4.4、7.4.5.1、7.4.5.2和7.4.5.5计算将在下面以附录B.1.5与B.3中用例子的具体数据进行计算。


以下为附录B1.6中所介绍的mj、srj和sRj的计算。


ISO5725.2介绍的计算方法特点为不直接将数据代入前面所列的公式19到24直接计算,而是先分别以下列T1—T5公式计算出正文中公式中各个分项的数据,然后将分项T1至T5结果再代入公式19到24中计算得出结果。


我将以水平1为例,介绍对此单元总平均值和各个方差的计算。为了叙述清楚,添加我另行制作的表格和计算过程。


第一步 

 

先从前面A表中提出单元(水平1)如下数据


QQ截图20171026110144.png

上表中第1行为实验室编号,第2行为每一实验室n次测量原始数据,第3行为每一个实验室n次测量次数,第4行为测量结果的平均值,最后一行则是每一个实验室n次测量数值离散度(标准偏差)。


第二步


ISO 5725.2介绍的方法是进行间接计算。就是先用上表中3项基本数值,按下列T1—T5公式计算,得如下结果:

读书笔记-16.jpg

其中T1数值和计算见下表:

读书笔记-18.jpg

T1=2.832+2.004+2.001+1.980+3.450+2.199+2.109+2.031=18.642


 其中T2数值和计算见下表:

读书笔记-18.jpg

T2=2.005+1.387+1.335+1.307+2.381+1.612+1.483+1.375=12.885


请问,为什么不是ISO 5725.2中的答案12.883 7?*

 T3=4+3+3+3+5+3+3+3=27

 T4=42+32+32+32+52+32+32+32=95

 T5数值和计算如下:

读书笔记-20.jpg

T5=0.000075+0.000200+0.000882+0.000200+0.00144++0.000072+0.000288+0.00125=0.004 411


请问,为什么不是ISO 5725.2中的答案0.004 407?*


* 此结果是因计算者没注意到“7.2.10……在使用上述公式计算时,应注意在计算过程中保留足够的有效数字位数,每个中间值需要保留的位数应是原始数据的两倍。标准差应该比A表中的结果的有效数字多一位。”


第三步


将上列计算T1—T5值代入下式:

读书笔记-20.jpg

 

第四步


再对水平2、3和4进行类似的计算,结果列于表B.5 

上面是附加的附录B实例1的具体计算过程,下面回到ISO 5725.2内容。

读书笔记-21.jpg

本读书报告省略下述2种特殊情况:


7.4.5.3 “对于所有的nij=n=2的特殊情况,可使用以下简单的公式……”


7.4.5.4 由于受到误差影响,当计算结果sLj2出现负值时,应将该值设置为零。


7.4.6 “方差依赖于m的情形

接下来应该考察精密度是否依赖于m,如果是,应该确定他们之间的函数关系……”


7.5 “精密度值和平均水平m之间的函数关系的建立……”

本节内容很多,7.5.1—7.5.9约占2页。由于在目前实际工作中没有此迫切要求,暂不讨论。


7.6 “统计分析程序的步骤”

此节包括了7.6.1—7.6.19诸多内容,主要为“注5:图3是在7.6中给出的统计分析程序各步骤的流程图。”见下图。其余7.6.2—7.6.19则是对此图的说明。

“图3 统计分析主要步骤流程图”

图的上半部有一定参考价值。由于“协同研究”不一定考虑建立函数关系,图的下半部只供参考。

读书笔记-22.jpg


7.7 给领导小组的报告和领导小组做出的决定

7.7.1 统计专家的报告

7.7.2 领导小组采取的决定

7.7.3 全面报告

本节内容易懂,没有需说明和讨论之处。


3 “8 统计数值表”

8.1 表4给出了柯克伦检验的临界值(见7.3.3)

8.2 表5给出了格拉布斯检验的临界值(见7.3.4)

8.3 表6和表7给出了曼德尔的h和k统计量的临界值。

此部分给出的这些表都是检查离群值所需的。


——ISO 5725.2阅读笔记第2部分结束——