为了帮助参加2011年注册计量师考试的广大学员更好的复习注册计量师考试相关知识,此处特地整理编辑了2011年注册计量师考试中计量专业实务与案例分析考前串讲辅导,希望可以对大家有所帮助!
四、异常值的判别和剔除
(一)什么是异常值
异常值(ahn0rmal value)又称离群值(0utlier),指在对一个被测量重复观测所获的若干观测结果中,出现了与其他值偏离较远且不符合统计规律的个别值,他们可能属于来自不同的总体,或属于意外的、偶然的测量错误。也称为存在着“粗大误差”。
例如:
震动、冲击、电源变化、电磁干扰等意外的条件变化,人为的读数或记录错误,仪器内部的偶发故障等,可能是造成异常值的原因。
如果一系列测量值中混有异常值,必然会歪曲测量的结果。这时若能将该值剔除不用,即可使结果更符合客观情况。在有些情况下,一组正确测得值的分散性,本来是客观地反映了实际测量的随机波动特性,但若人为地去掉了一些偏离较远但不属于异常值的数据,由此得到的所谓分散性很小,实际上是虚假的。因为,以后在相同条件下再次测量时原有正常的分散性还会显现出来。
所以必须正确地判别和剔除异常值。
在测量过程中,记错、读错、仪器突然跳动、突然震动等异常情况引起的已知原因的异常值,应该随时发现,随时剔除,这就是物理判别法。有时,仅仅是怀疑某个值,对于不能确定哪个是异常值时,可采用统计判别法进行判别。
【案例】检定员在检定一台计量器具时,发现记录的数据中某个数较大,她就把它作为异常值剔除了,并再补做一个数据。
【案例分析】案例中的那位检定员的做法是不对的。
在测量过程中除了当时已知原因的明显错误或突发事件造成的数据异常可以随时剔除外,如果仅仅是看不顺眼或怀疑某个值,不能确定是否是异常值的,不能随意剔除,必须用统计判别法(如格拉布斯法等)判别,判定为异常值的才能剔除。
(二)判别异常值常用的统计方法
格拉布斯准则
设在一组重复观测结果xi中,其残差vi的绝对值最大者为可疑值xd,在给定的置信概率为p=0.99或P=0.95,也就是显着性水平为a=l-p=0.01或0.05时,如果满足下式,可以判定xd为异常值

【案例】使用格拉布斯准则检验以下n=6个重复观测值中是否存在异常值:0.82,0.78,0.80,0.91,0.79,0.76。
【案例分析】
计算步骤如下:
算术平均值: =0.81;
实验标准偏差:s=0.053;
计算各个观测值的残差vi=xi-为:0.01,一0.03,一0.01,0.10, 一0.02,一0.05;其中绝对值最大的残差为0.10,相应的观测值x4=0.91为可疑值xd,则

按p=95%一0.95,即a=1一0.95=0.05,n=6,查表3-4得:G(0.05,6)=1.82,则

可以判定xd=0.91为异常值,应予以剔除。
在剔除xd=0.91后,剩下n=5个重复观测值,重新计算算术平均值为0.79,实验标准偏差s=0.022,并在5个数据中找出残差绝对值为最大的值xd=0.76

再按格拉布斯准则进行判定:a=0.05,n=5,查表得:G(0.05,5)=1.67,则

相关文章:
编辑推荐:
(责任编辑:)