试验数据的统计处理和误差分析第三讲参数估计和假设检验_凌树森
-
Upload
jerry-zhang -
Category
Documents
-
view
242 -
download
0
description
Transcript of 试验数据的统计处理和误差分析第三讲参数估计和假设检验_凌树森
专题讲座
试验数据的统计处理和误差分析 第三讲 参数估计和假设检验
凌树森(上海材料研究所 , 上海 200437)
中图分类号: O211. 9; O241. 1 文献标识码: E 文章编号: 1001-4012( 2001) 03-0134-05
1 统计推断的两种方法
统计推断是由子样的信息来推测母体性能的一
种方法 ,它又可以分为两类问题 ,即参数估计和假设
检验。
实际生产和科学实验中 ,大量的问题是在获得
一批数据后 ,要对母体的某一参数进行估计和检验。
例如 ,我们对 45钢的断裂韧性作了测定 ,取得了一
批数据 ,然后要求 45钢断裂韧性的平均值 ,或要求
45钢断裂韧性的单侧下限值 ,或要求 45钢断裂韧
性的分散度 (即离散系数 ) ,这就是参数估计的问题。
又如 ,经过长期的积累 ,知道了某材料的断裂韧
性的平均值和标准差 ,经改进热处理后 ,又测得一批
数据 ,试问新工艺与老工艺相比是否有显著差异 ,这
就是假设检验的问题。
1. 1 关于母体平均值 (又称数学期望或真值 )的统
计推断
1. 1. 1 使用的公式及符号的意义
( 1)用于参数估计的
x - ueY
n< _ < x + u
eY
n( 3-1)
x - teY
n< _ < x + t
eY
n( 3-2)
( 2)用于假设检验的
u =x - _
eY / n( 3-3)
t =x - _
eY / n( 3-4)
e Y=n
n - 1S =
nn - 1
1n∑ (xi - x ) 2 =
1n - 1∑ (xi - x ) 2 ( 3-5)
式中 μ—— 母体平均值 ,又称数学期望或真值
x—— n个观测值的平均值 ,又称子样平均
值 ,用它来估计母体的平均值
eY—— 母体的标准差。在实际问题中 ,当母体
的标准差未知时 ,要用到子样的标准
差
e Y—— 母体标准差eY的估计值
n—— 子样的大小 ,又称子样容量
u—— 正态分布的检验统计量 ,或称正态分
布的限值 ,它是由保证概率 (即可靠度
R= 1- T)决定的 ,其值可查正态分布
表
t—— 学生氏 t分布的检验统计量 ,又称 t分
布的限值 ,它是由可靠度和子样容量 n
决定的一个限值 ,可查 t分布表
1. 1. 2 应用例题
( 1) 第一种类型— — 估计母体的真值及其范
围。
例 1 已知某材料的抗拉强度 eb ,经长期累积
知道它的均方差eY= 24. 5N /mm2。现测得 200根该
材料的eb值 ,得子样平均值 x= 794. 4N /mm2。给定
可信度T= 5% (即可靠度 R= 1- T= 95% ) ,试估计
该材料eb的上下限范围。
解: 首先判断一下 ,这个问题属于大子样 ,因为
n= 200个。 又其母体标准差eY是已知的 ,根据 R=
95%查得 u= 2. 0,只要用式 ( 3-1)求得。
估计上限:
·133·
第 37卷第 3期
2001年 3月
理化检验 -物理分册PTCA ( PART A: PHYSICAL TEST ING)
Vo l. 37 No. 3
Mar. 2001
x + 2eY / n = 794. 4+2× 24. 5
200=
797. 9N /mm2;
估计下限:
x - 2eY / n = 794. 4 -2× 24. 5
200=
790. 9N /mm2
这个范围是 790. 9~ 797. 9N /mm2,其可靠度为
95% ,即 R= P ( 790. 9N /mm2 <eb < 797. 9N /mm
2 )
= 95%
例 2 已知在某一交变应力下 ,测得 8个试样
的疲劳寿命 ,取对数后得 4. 84, 4. 93, 4. 94, 4. 95,
4. 94, 4. 98, 5. 03和 5. 08。试估计可靠度 R= 90%时
的寿命范围。
解:此例是小子样 ,eY未知的情况。假定该材料
疲劳的对数寿命符合正态分布 ,则可用式 ( 3-2)估计
之。先计算
x =1
n ∑n
i= 1
x i =1
8[4. 84+ 4. 93+ … … + 5. 08] = 4. 97
e Y=1
n - 1∑
n
i= 1( x i - x )
2=
1
8- 1[ ( 4. 84- 4. 97]
2+ … + ( 5. 08 - 4. 97)
2= 0. 0726
T= 1- R= 0. 10,自由度 O= n - 1= 7,查 t分布
表 ,得 t= 1. 895
估计上限= x+ 1. 895e Y / n = 4. 97+ 1. 895×
0. 0726
8= 5. 02
估计下限= x- 1. 895e
Y / n = 4. 97- 1. 895×
0. 0726
8= 4. 92
所以 R= P ( 4. 92< lgN < 5. 02)= 90%
( 2) 第二种类型——检验一个子样是否来自已
知的母体。
例 1 已知某材料的断裂韧性 ,经长期的积累 ,
得知 其均值 _ = 30. 16MN /m3 /2 , 标准差 eY=
5. 02MN /m3 /2。经改进热处理工艺后 ,又测得 200根
试样的 K IC值 ,其结果为 x= 30. 81MN /m3 /2,标准差
的估计值e Y= 4. 96MN /m3 /2。 试问新的热处理工艺
与原来的工艺是否有显著性差异?
解:本例中母体的标准差 eY为已知 ,故不需要
用它的估计值e Y。 我们假设新、老工艺无显著性差
异 ,按式 ( 3-3)计算 u值
u =30. 81 - 30. 16
5. 02 / 200= 1. 83 < 2
可靠度 R= 95%时的限值 uα= 2。计算的 u计 <
uα,这就是说 ,新老工艺无显著性差异 ,可以接受原
假设。现在出现的差别 ( 30. 81- 30. 16)纯属偶然因
素所引起 ,两种工艺无系统性的差异。
例 2 已知某零件运行的对数疲劳寿命的平均
值_ = 4. 4283。经改变加工工艺 ,测得六个该零件的
疲 劳 寿 命 值 lgN i = 4. 3100, 4. 3758, 4. 4077,
4. 4677, 4. 3831, 4. 4393。求:试问新老工艺有无显著
性差异? 给定可靠度 R= 1- T= 95%。
解:本例属于小子样 ,母体eY未知的情况。我们
假设新老工艺无显著性差异 ,用式 ( 3-4)作 t检验。
先计算子样的均值和标准差
x =1
n∑
6
i= 1x i =
1
6( 4. 31+ 4. 375+ … + 4. 4393) = 4. 397
e Y=1
n - 1∑
n
i= 1(x i - x )
2=
1
6 - 1[ ( 4. 31 - 4. 397)
2+ … + ( 4. 4393- 4. 397)
2] =
0. 052
然后代入 t检验式
t计 =|x - _|
e Y/ n=
|4. 397 - 4. 4283|
0. 052 / 6= 1. 47
取 T= 5% ,O= 6- 1= 5,查 t分布表得 tα=
2. 571,现因 t计 = 1. 47 < 2. 571= tα,所以新老工艺在
95%的可靠度意义下无显著性差异。
( 3)第三种类型—— 估计一个母体平均值的极
限值。
例 1 已知数据与第一种类型的例 1相同。求:
该材料抗拉强度的下限值 eb|min= ?
给定可信度 T= 5% (可靠度 R= 1- T= 0. 95)
解:这个问题与原问题要求的eb的上下限范围
稍有不同。原题要求是双向的 ,所以用双尾的 u分布
表 ,见图 3-1a,落在 u= ± 2以外的可能性相等 ,均
为T/2。 而在本题的要求中 ,问题是单向的 ,要查单
尾 u分布表 ,见图 3-1b。 落在 u= 1. 65以外的可能
性为T。 所以本题的解答为
eb|min = x - 1. 65eY
n=
794. 4 - 1. 6524. 5
200= 791. 5N /mm
2
由此不难看出本例与第一种类型的例 1是有区
别的。本例是在设计中估计材料的eb时用的 ,而前
·134·
凌树森:试验数据的统计处理和误差分析 第三讲 参数估计和假设检验
( a )
( b)
图 3-1 双尾 u ( a)与单尾 u ( b)的示意图
例是在制定材料验收规范时用的。
例 2 已知数据与第二种类型的例 1相同。求:
新的热处理工艺是否比原工艺提高了材料的断裂韧
性值?
解:把两个例子比较一下似乎无多大差别 ,但细
细推敲一下还是不一样的。 原例题不知道新的热处
理工艺比原工艺是好还是坏 ,因此要求检验一下两
者在 95%可靠度下是否有显著差异。而本例题的提
法就不一样 ,在已知新工艺比原工艺好的条件下 ,要
求在 95%的可靠度下来验证这件事。有时还可以进
一步问 ,如果新工艺提高了材料的断裂韧性 ,问提高
了多少 (例如 ,给定 R= 95%的条件下 )?
根据现在这种提法 ,我们一定会想到 ,这是单向
的问题应用单尾 u值表。 所以 ,计算的 u值为
u =30. 81 - 30. 16
5. 02 / 200= 1. 83
而按单尾 u值表 ,当 P= 95%时 , uα= 1. 65,因
为 u= 1. 83> uα= 1. 65,所以新工艺确实提高了材
料的断裂韧性。
( 4) 第四种类型——检验两个子样是否来自同
一个母体。
例 1 已知有两种材料 ,各取若干根 ,测得断裂
韧性 (裂纹尖端张开的临界位移 )Wc值如下: 第一种
材料 , x 1= 0. 081mm , S1= 0. 025mm ,n1= 200;第二
种材料 , x2= 0. 062mm, S2= 0. 062mm ,n2= 150。求:
试问两种材料母体平均数之间有无真正差异?
解:假设两种子样来自同一个母体。 令ea代表
此母体的均方差 ,同第一个子样其母体的均值 a1的
标准差为 eY / n1 ,第二个子样其母体的均值a2的
标准差为eY / n2 ,而两个平均值之差 Y= a1-a2的分
布的均方根差为
eY=e2
a
n1+
e2a
n2= ea
1n1
+1n2
现在不知道母体的eξ,要用子样的 S1和 S2来
估计
e a=n1S
21 + n2 S
22
n1 + n2
因此 , eY=n1 S
21 + n2S
22
n1 + n2
1n1
+1n2
=
S21
n2+
S22
n1
由于本例题给定的两个子样均为大子样 ,所以
a1和a2都是正态分布 ,因此 ,Y也是正态分布 ,而且
Y的母体平均值为 0,则有
u =|(x 1 - x 2 ) - 0|
eY=
|x 1 - x2|
S21
n2+
S22
n1
把本例中的数据代入上式得
u =|0. 081 - 0. 062|
0. 0252
150+ 0. 062
2
200
= 3. 90
根据T= 5% ,查双尾 u表得 uα= 2,现计算的 u
= 3. 90> uα= 2. 0,所以推翻原假设 ,认为两种材料
的断裂韧性 (Wc )存在显著性差异。
例 2 已知 ,测得两批材料的残余应力数据如
下 (单位均是 N /mm2 ):
甲零件 238. 3, 204. 0, 232. 4, 208. 9, 170. 6
乙零件 178. 5, 165. 7, 198. 1, 163. 8
求:试问两种零件的残余应力是否有显著差异?
解:这里讨论的是小子样问题。其前提是 ,假设
两个母体均为正态分布 ,而且假设两个母体的方差
相等 (一般当问题未给出此条件时 ,则要检验一下它
们是否相等 ) ,然后作出统计假设 ,两个母体的平均
值是相等的 ,即 _ 1= _ 2。
这个问题又分为两种情况: ① 两个母体的标准
差为已知 ;②标准差为未知。第一种情况用 u检验 ;
第二种情况用 t检验。本例属于第二种情况 ,经过推
·135·
凌树森:试验数据的统计处理和误差分析 第三讲 参数估计和假设检验
导 ,得下列 t检验式
t =x 1 - x 2
n1S21 + n2S
22
n1 + n2 - 2× 1
n1+ 1
n2
按给定数据计算得到
甲零件: x 1= 210. 8, n1 S21 = ∑5
i= 1( x1i - x1 ) 2 =
2887. 24,n1= 5
乙零件: x 2= 176. 6,n2S22= ∑
4
i= 1(x2i- x2 )
2=
748. 26,n2= 4
代入上式得
t =|210. 8 - 176. 6|
2887. 24+ 748. 265+ 4 - 2 ×
15 +
14
= 2. 24
按自由度 O= 5+ 4- 2= 7和可信度 5% ,查双
尾 t表得 tα= 2. 365,现在 t= 2. 24 < tα= 2. 365,所以
两种零件之残余应力在可靠度 95%的意义下无显
著差异。
例 3 已知 ,测得两种齿轮在工作状态下的运
行寿命 ,第一种齿轮的寿命 (× 103h )为 6. 2, 5. 7,
6. 5, 6. 0, 6. 3, 5. 8, 5. 7, 6. 0, 6. 0, 5. 8, 6. 0;第二种齿
轮的寿命 (× 103h )为 5. 6, 5. 9, 5. 6, 5. 7, 5. 8, 6. 0,
5. 5, 5. 7, 5. 5。求:试问两种齿轮的寿命有无显著差
异?若有 ,再对寿命的差值范围作一估计。可信度均
取T= 5%。
解:根据 F检验 (下面将介绍 )知道两个子样的
方差无显著性差异。
( 1)先检验两子样的母体均值有无显著差异。
第一种齿轮: x 1= 6. 0,n1 S21= 0. 64,n1= 11
第二种齿轮: x 2= 5. 7,n2 S22= 0. 24,n2= 9
代入 t检验式
t = |6. 0 - 5. 7|
0. 64+ 0. 2411+ 9 - 2
×111
+19
= 3. 018
根据T= 5% ,O= n1+ n2- 2= 18,查双尾 t表得
tα= 2. 101,因为 t= 3. 018> tα= 2. 101,所以两种齿
轮的寿命有显著性差异。
( 2)估计两种齿轮寿命差值的范围。
由下式
P ( - tT <|x1 - x2|
n1S21+ n2S
22
n1 + n2 - 2×
1n1
+1n2
< tT) =
1 - T= 0. 95
tα= 2. 101,则寿命差值的范围是
(x 1 - x2 ) ± 2. 101×n1S
21+ n2S
22
n1+ n2 - 2×
1
n1+
1
n2=
( 6. 0 - 5. 7) ± 2. 101×0. 64+ 0. 24
11+ 9 - 2×
1
11+
1
9=
0. 3± 0. 2087= ( 0. 0913~ 0. 5087) × 103h
所以 ,在可靠度 R= 1- T= 95%的条件下 ,这两
种齿轮的寿命差值范围是 ( 0. 0913~ 0. 5087)×
103h,即为 91. 3~ 508. 7h。
1. 2 关于母体方差 (或标准差 )的统计推断
1. 2. 1 定理和公式
定理 1: 设随机变量ai服从正态分布 N (_ ,ea) ,
ai 相 互 独 立 , 只 要 n 足 够 大 , 则 Y=
1n[∑
n
i= 1
(ai - a) 2 ]也近似符合正态分布 ,其数学期
望是 ea,标准差是ea / 2n ,即随机变量的函数Y服
从正态分布 N (ea,ea / 2n )。于是 ,用这个定理便可
运用 u估计 (或检验 )公式
e a - ue a
2n< ea < e a+ u
e a
2n( 3-6)
上面的结果只适用于大子样 ,对于小子样的情
况 ,就只能用下述i2分布了。
定理 2: 设随机变量 a服从正态分布 ,ea为未
知 ,则可用下式从小子样的 S来加以估计
nS2
i22
< e2Y <
n S2
i21
( 3-7)
其中 ,子样方差 S=1n∑
n
i= 1(xi - x )
2,而 i
21 ,i
22
是取决于可信度T的量 ,求i2分布的密度函数下 ,
以 0到i21的积分是T/2,从i
22到∞的积分也是T/2。
为了比较两个子样所代表的母体的标准差是否
有显著的差异 ,可以用 F分布。 设由两个正态母体
各抽取一个子样 ,用ea1和ea2分别代表两个母体的均
方差。 经作统计假设 ,ea1= ea2 ,则可用估计值e a1和
e a2计算 F值
F = e a1 /e a2 ( 3-8)
其中 e a1和e a2按数值大小记号 ,大的记为 1,小的
记为 2。
给定一定的可信度 ,例如 T= 0. 05,可查 F分布
表得 Fα值。如果上述计算的 F < Fα,则认为原假设
可以接受 ,e a1与e a2相同 ,即无显著性差异。反之 ,则
推翻原假设 ,e a1与e a2不相等 ,它们具有显著性差异。
2. 2. 2 应用实例
·136·
凌树森:试验数据的统计处理和误差分析 第三讲 参数估计和假设检验
例 1 已知 ,数据和条件与第一种类型的例 1
相同。求: 给定可信度为 5% (即可靠度 R= 1- T= 1
- 0. 05= 0. 95) ,试对该材料抗拉强度的标准差 eY
作区间估计。
解:可利用下式估计标准差
e Y- ue Y
2n< eY < e Y+ u
e Y
2n
估计上限= e Y+
e Y
2n= 24. 5+ 2×
24. 5
2× 200=
27. 0N /mm2
估计下限= e Y-e Y
2n= 24. 5- 2× 24. 5
2× 200=
22. 1N /mm2
所以 ,该材料的标准差有 95%的可靠度时 ,估
计落在下述区间
22. 1 < eY < 27. 0( N /mm2)
例 2 已知用两种方法加工的试样 ,其疲劳寿
命试验结果如下 ,均取对数 ( xi= lgN i )。
第一种加工方法: 4. 532, 4. 623, 4. 623, 4. 643,
4. 644, 4. 653, 4. 672, 4. 691, 4. 724;
第二种加工方法: 4. 839, 4. 924, 4. 945, 4. 973,
4. 978, 5. 033, 5. 083。
求:试问两种加工方法所得试样 ,其寿命方差是
否有显著差异?
解:计算两种方法所得的寿命均值和方差。
第一种方法: x 1= 4. 65, S21= 0. 00276,n1= 10,
O1= n1- 1= 9;
第二种方法: x 2= 4. 97, S22= 0. 00527,n2= 8,
O2= n2- 1= 7。
利用 F分布判别式
F = e 2a1 /e 2
a2 = 0. 005270. 00276
= 1. 91
自由度 O2= 7,O1= 9,取T= 5. 0%查 F分布表
得 Fα= 4. 2。因为 F= 1. 91 < Fα= 4. 2,所以两种加
工方法所得的试样 ,其疲劳对数寿命的方差无显著
性差异 ,即认为其寿命的分散度是相同的。
(待续 )
· 信息·
郑州机械研究所将举办
“盲孔法测量残余应力培训班”
为推广盲孔法测量残余应力在科学研
究和工程技术领域中的应用 ,全国残余应
力学术委员会和郑州机械研究所将于
2001年 5月中下旬在郑州举办“盲孔法测
量残余应力培训班” ,通过理论和实际操
作 ,讲授盲孔法测量残余应力的基本原理、
钻孔装置及应力测量仪的操作方法及应变
片的粘贴技术等内容。 报名截止日期为
2001年 4月 25日。
联系人:王晓洪 印兵胜
地址:河南省郑州市嵩山南路 81号
郑州机械研究所测试技术研究室
邮编: 450052 电话: ( 0371) 7435313
E-mail: zrimea@ public2. zz. ha. cn
·信息·
我国开发廉价的碳纳米管
比黄金还贵 100倍的一种碳纳米管 ,
生产成本在武汉降到了每克不足 2元。 武
汉华中师范大学经过两年多的研究 ,目前
已基本实现了碳纳米管的工业生产 ,年产
量接近 2t ,而生产成本不到 2元 /g。 据了
解 ,美国去年 6月份多层壁碳纳米管的价
格为每克 1500~ 2300美元 ,为黄金的 100
多倍。由于价格昂贵 ,相关应用研究根本无
法进行。 碳纳米管 ,被西方科学家称为“ 21
世纪科技革命的转折点” ,可应用于多个领
域。
·137·
凌树森:试验数据的统计处理和误差分析 第三讲 参数估计和假设检验