试验数据的统计处理和误差分析第三讲参数估计和假设检验_凌树森

5
专题讲座 试验数据的统计处理和误差分析 第三讲 参数估计和假设检验 凌树森 ( 上海材料研究所 , 上海 200437) 中图分类号: O 211. 9; O 241. 1 文献标识码: E 文章编号: 1001-4012( 2001) 03-0134-05 1 统计推断的两种方法 统计推断是由子样的信息来推测母体性能的一 种方法 , 它又可以分为两类问题 , 即参数估计和假设 检验实际生产和科学实验中 , 大量的问题是在获得 一批数据后 , 要对母体的某一参数进行估计和检验例如 , 我们对 45 钢的断裂韧性作了测定 , 取得了一 批数据 , 然后要求 45钢断裂韧性的平均值 , 或要求 45 钢断裂韧性的单侧下限值 , 或要求 45钢断裂韧 性的分散度 (即离散系数 ), 这就是参数估计的问题又如 , 经过长期的积累 , 知道了某材料的断裂韧 性的平均值和标准差 , 经改进热处理后 , 又测得一批 数据 , 试问新工艺与老工艺相比是否有显著差异 , 就是假设检验的问题1 . 1 关于母体平均值 (又称数学期望或真值 )的统 计推断 1. 1. 1 使用的公式及符号的意义 ( 1) 用于参数估计的 x - u e Y n < _ < x + u e Y n ( 3-1) x - t e Y n < _ < x + t e Y n ( 3-2) ( 2) 用于假设检验的 u = x - _ e Y / n ( 3-3) t = x - _ e Y / n ( 3-4) e Y = n n - 1 S = n n - 1 1 n ( xi - x ) 2 = 1 n - 1 ( xi - x ) 2 ( 3-5) 式中 μ—— 母体平均值 , 又称数学期望或真值 x —— n 个观测值的平均值 , 又称子样平均 , 用它来估计母体的平均值 e Y —— 母体的标准差在实际问题中 , 当母体 的标准差未知时 , 要用到子样的标准 e Y —— 母体标准差 e Y 的估计值 n —— 子样的大小 , 又称子样容量 u —— 正态分布的检验统计量 , 或称正态分 布的限值 , 它是由保证概率 (即可靠度 R = 1- T )决定的 , 其值可查正态分布 t —— 学生氏 t 分布的检验统计量 , 又称 t 布的限值 , 它是由可靠度和子样容量 n 决定的一个限值 , 可查 t 分布表 1. 1. 2 应用例题 ( 1) 第一种类型—— 估计母体的真值及其范 1 已知某材料的抗拉强度 e b , 经长期累积 知道它的均方差 e Y= 24. 5N /mm 2 现测得 200根该 材料的 e b , 得子样平均值 x = 794. 4N /mm 2 给定 可信度 T =5%(即可靠度 R = 1- T = 95% ), 试估计 该材料 e b 的上下限范围: 首先判断一下 , 这个问题属于大子样 , 因为 n= 200又其母体标准差 e Y 是已知的 , 根据 R = 95% 查得 u = 2. 0, 只要用式 ( 3-1)求得估计上限: · 133 · 37卷第 32001 3 理化检验 - 物理分册 PTCA ( PART A: PHYSICAL TESTING) V o l. 37 N o. 3 M ar. 2001

description

statistic lecture

Transcript of 试验数据的统计处理和误差分析第三讲参数估计和假设检验_凌树森

Page 1: 试验数据的统计处理和误差分析第三讲参数估计和假设检验_凌树森

专题讲座

试验数据的统计处理和误差分析 第三讲 参数估计和假设检验

凌树森(上海材料研究所 , 上海 200437)

中图分类号: O211. 9; O241. 1   文献标识码: E   文章编号: 1001-4012( 2001) 03-0134-05

1 统计推断的两种方法

统计推断是由子样的信息来推测母体性能的一

种方法 ,它又可以分为两类问题 ,即参数估计和假设

检验。

实际生产和科学实验中 ,大量的问题是在获得

一批数据后 ,要对母体的某一参数进行估计和检验。

例如 ,我们对 45钢的断裂韧性作了测定 ,取得了一

批数据 ,然后要求 45钢断裂韧性的平均值 ,或要求

45钢断裂韧性的单侧下限值 ,或要求 45钢断裂韧

性的分散度 (即离散系数 ) ,这就是参数估计的问题。

又如 ,经过长期的积累 ,知道了某材料的断裂韧

性的平均值和标准差 ,经改进热处理后 ,又测得一批

数据 ,试问新工艺与老工艺相比是否有显著差异 ,这

就是假设检验的问题。

1. 1 关于母体平均值 (又称数学期望或真值 )的统

计推断

1. 1. 1 使用的公式及符号的意义

( 1)用于参数估计的

x - ueY

n< _ < x + u

eY

n( 3-1)

x - teY

n< _ < x + t

eY

n( 3-2)

   ( 2)用于假设检验的

u =x - _

eY / n( 3-3)

t =x - _

eY / n( 3-4)

e Y=n

n - 1S =

nn - 1

1n∑ (xi - x ) 2 =

1n - 1∑ (xi - x ) 2 ( 3-5)

式中 μ—— 母体平均值 ,又称数学期望或真值

x—— n个观测值的平均值 ,又称子样平均

值 ,用它来估计母体的平均值

eY—— 母体的标准差。在实际问题中 ,当母体

的标准差未知时 ,要用到子样的标准

e Y—— 母体标准差eY的估计值

n—— 子样的大小 ,又称子样容量

u—— 正态分布的检验统计量 ,或称正态分

布的限值 ,它是由保证概率 (即可靠度

R= 1- T)决定的 ,其值可查正态分布

t—— 学生氏 t分布的检验统计量 ,又称 t分

布的限值 ,它是由可靠度和子样容量 n

决定的一个限值 ,可查 t分布表

1. 1. 2 应用例题

( 1) 第一种类型— — 估计母体的真值及其范

围。

例 1 已知某材料的抗拉强度 eb ,经长期累积

知道它的均方差eY= 24. 5N /mm2。现测得 200根该

材料的eb值 ,得子样平均值 x= 794. 4N /mm2。给定

可信度T= 5% (即可靠度 R= 1- T= 95% ) ,试估计

该材料eb的上下限范围。

解: 首先判断一下 ,这个问题属于大子样 ,因为

n= 200个。 又其母体标准差eY是已知的 ,根据 R=

95%查得 u= 2. 0,只要用式 ( 3-1)求得。

估计上限:

·133·

第 37卷第 3期

2001年 3月

理化检验 -物理分册PTCA ( PART A: PHYSICAL TEST ING)

Vo l. 37  No. 3

Mar. 2001

Page 2: 试验数据的统计处理和误差分析第三讲参数估计和假设检验_凌树森

x + 2eY / n = 794. 4+2× 24. 5

200=

797. 9N /mm2;

  估计下限:

x - 2eY / n = 794. 4 -2× 24. 5

200=

790. 9N /mm2

  这个范围是 790. 9~ 797. 9N /mm2,其可靠度为

95% ,即 R= P ( 790. 9N /mm2 <eb < 797. 9N /mm

2 )

= 95%

例 2 已知在某一交变应力下 ,测得 8个试样

的疲劳寿命 ,取对数后得 4. 84, 4. 93, 4. 94, 4. 95,

4. 94, 4. 98, 5. 03和 5. 08。试估计可靠度 R= 90%时

的寿命范围。

解:此例是小子样 ,eY未知的情况。假定该材料

疲劳的对数寿命符合正态分布 ,则可用式 ( 3-2)估计

之。先计算

x =1

n ∑n

i= 1

x i =1

8[4. 84+ 4. 93+ … … + 5. 08] = 4. 97

e Y=1

n - 1∑

n

i= 1( x i - x )

2=

1

8- 1[ ( 4. 84- 4. 97]

2+ … + ( 5. 08 - 4. 97)

2= 0. 0726

  T= 1- R= 0. 10,自由度 O= n - 1= 7,查 t分布

表 ,得 t= 1. 895

估计上限= x+ 1. 895e Y / n = 4. 97+ 1. 895×

0. 0726

8= 5. 02

估计下限= x- 1. 895e

Y / n = 4. 97- 1. 895×

0. 0726

8= 4. 92

所以  R= P ( 4. 92< lgN < 5. 02)= 90%

( 2) 第二种类型——检验一个子样是否来自已

知的母体。

例 1 已知某材料的断裂韧性 ,经长期的积累 ,

得知 其均值 _ = 30. 16MN /m3 /2 , 标准差 eY=

5. 02MN /m3 /2。经改进热处理工艺后 ,又测得 200根

试样的 K IC值 ,其结果为 x= 30. 81MN /m3 /2,标准差

的估计值e Y= 4. 96MN /m3 /2。 试问新的热处理工艺

与原来的工艺是否有显著性差异?

解:本例中母体的标准差 eY为已知 ,故不需要

用它的估计值e Y。 我们假设新、老工艺无显著性差

异 ,按式 ( 3-3)计算 u值

u =30. 81 - 30. 16

5. 02 / 200= 1. 83 < 2

  可靠度 R= 95%时的限值 uα= 2。计算的 u计 <

uα,这就是说 ,新老工艺无显著性差异 ,可以接受原

假设。现在出现的差别 ( 30. 81- 30. 16)纯属偶然因

素所引起 ,两种工艺无系统性的差异。

例 2 已知某零件运行的对数疲劳寿命的平均

值_ = 4. 4283。经改变加工工艺 ,测得六个该零件的

疲 劳 寿 命 值 lgN i = 4. 3100, 4. 3758, 4. 4077,

4. 4677, 4. 3831, 4. 4393。求:试问新老工艺有无显著

性差异? 给定可靠度 R= 1- T= 95%。

解:本例属于小子样 ,母体eY未知的情况。我们

假设新老工艺无显著性差异 ,用式 ( 3-4)作 t检验。

先计算子样的均值和标准差

x =1

n∑

6

i= 1x i =

1

6( 4. 31+ 4. 375+ … + 4. 4393) = 4. 397

e Y=1

n - 1∑

n

i= 1(x i - x )

2=

1

6 - 1[ ( 4. 31 - 4. 397)

2+ … + ( 4. 4393- 4. 397)

2] =

0. 052

然后代入 t检验式

t计 =|x - _|

e Y/ n=

|4. 397 - 4. 4283|

0. 052 / 6= 1. 47

  取 T= 5% ,O= 6- 1= 5,查 t分布表得 tα=

2. 571,现因 t计 = 1. 47 < 2. 571= tα,所以新老工艺在

95%的可靠度意义下无显著性差异。

( 3)第三种类型—— 估计一个母体平均值的极

限值。

例 1 已知数据与第一种类型的例 1相同。求:

该材料抗拉强度的下限值 eb|min= ?

给定可信度 T= 5% (可靠度 R= 1- T= 0. 95)

解:这个问题与原问题要求的eb的上下限范围

稍有不同。原题要求是双向的 ,所以用双尾的 u分布

表 ,见图 3-1a,落在 u= ± 2以外的可能性相等 ,均

为T/2。 而在本题的要求中 ,问题是单向的 ,要查单

尾 u分布表 ,见图 3-1b。 落在 u= 1. 65以外的可能

性为T。 所以本题的解答为

eb|min = x - 1. 65eY

n=

794. 4 - 1. 6524. 5

200= 791. 5N /mm

2

  由此不难看出本例与第一种类型的例 1是有区

别的。本例是在设计中估计材料的eb时用的 ,而前

·134·

凌树森:试验数据的统计处理和误差分析 第三讲 参数估计和假设检验

Page 3: 试验数据的统计处理和误差分析第三讲参数估计和假设检验_凌树森

( a )

( b)

图 3-1 双尾 u ( a)与单尾 u ( b)的示意图

例是在制定材料验收规范时用的。

例 2 已知数据与第二种类型的例 1相同。求:

新的热处理工艺是否比原工艺提高了材料的断裂韧

性值?

解:把两个例子比较一下似乎无多大差别 ,但细

细推敲一下还是不一样的。 原例题不知道新的热处

理工艺比原工艺是好还是坏 ,因此要求检验一下两

者在 95%可靠度下是否有显著差异。而本例题的提

法就不一样 ,在已知新工艺比原工艺好的条件下 ,要

求在 95%的可靠度下来验证这件事。有时还可以进

一步问 ,如果新工艺提高了材料的断裂韧性 ,问提高

了多少 (例如 ,给定 R= 95%的条件下 )?

根据现在这种提法 ,我们一定会想到 ,这是单向

的问题应用单尾 u值表。 所以 ,计算的 u值为

u =30. 81 - 30. 16

5. 02 / 200= 1. 83

  而按单尾 u值表 ,当 P= 95%时 , uα= 1. 65,因

为 u= 1. 83> uα= 1. 65,所以新工艺确实提高了材

料的断裂韧性。

( 4) 第四种类型——检验两个子样是否来自同

一个母体。

例 1 已知有两种材料 ,各取若干根 ,测得断裂

韧性 (裂纹尖端张开的临界位移 )Wc值如下: 第一种

材料 , x 1= 0. 081mm , S1= 0. 025mm ,n1= 200;第二

种材料 , x2= 0. 062mm, S2= 0. 062mm ,n2= 150。求:

试问两种材料母体平均数之间有无真正差异?

解:假设两种子样来自同一个母体。 令ea代表

此母体的均方差 ,同第一个子样其母体的均值 a1的

标准差为 eY / n1 ,第二个子样其母体的均值a2的

标准差为eY / n2 ,而两个平均值之差 Y= a1-a2的分

布的均方根差为

eY=e2

a

n1+

e2a

n2= ea

1n1

+1n2

  现在不知道母体的eξ,要用子样的 S1和 S2来

估计

e a=n1S

21 + n2 S

22

n1 + n2

因此 , eY=n1 S

21 + n2S

22

n1 + n2

1n1

+1n2

=

S21

n2+

S22

n1

  由于本例题给定的两个子样均为大子样 ,所以

a1和a2都是正态分布 ,因此 ,Y也是正态分布 ,而且

Y的母体平均值为 0,则有

u =|(x 1 - x 2 ) - 0|

eY=

|x 1 - x2|

S21

n2+

S22

n1

  把本例中的数据代入上式得

u =|0. 081 - 0. 062|

0. 0252

150+ 0. 062

2

200

= 3. 90

  根据T= 5% ,查双尾 u表得 uα= 2,现计算的 u

= 3. 90> uα= 2. 0,所以推翻原假设 ,认为两种材料

的断裂韧性 (Wc )存在显著性差异。

例 2 已知 ,测得两批材料的残余应力数据如

下 (单位均是 N /mm2 ):

甲零件 238. 3, 204. 0, 232. 4, 208. 9, 170. 6

乙零件 178. 5, 165. 7, 198. 1, 163. 8

求:试问两种零件的残余应力是否有显著差异?

解:这里讨论的是小子样问题。其前提是 ,假设

两个母体均为正态分布 ,而且假设两个母体的方差

相等 (一般当问题未给出此条件时 ,则要检验一下它

们是否相等 ) ,然后作出统计假设 ,两个母体的平均

值是相等的 ,即 _ 1= _ 2。

这个问题又分为两种情况: ① 两个母体的标准

差为已知 ;②标准差为未知。第一种情况用 u检验 ;

第二种情况用 t检验。本例属于第二种情况 ,经过推

·135·

凌树森:试验数据的统计处理和误差分析 第三讲 参数估计和假设检验

Page 4: 试验数据的统计处理和误差分析第三讲参数估计和假设检验_凌树森

导 ,得下列 t检验式

t =x 1 - x 2

n1S21 + n2S

22

n1 + n2 - 2× 1

n1+ 1

n2

  按给定数据计算得到

甲零件: x 1= 210. 8, n1 S21 = ∑5

i= 1( x1i - x1 ) 2 =

2887. 24,n1= 5

乙零件: x 2= 176. 6,n2S22= ∑

4

i= 1(x2i- x2 )

2=

748. 26,n2= 4

代入上式得

t =|210. 8 - 176. 6|

2887. 24+ 748. 265+ 4 - 2 ×

15 +

14

= 2. 24

  按自由度 O= 5+ 4- 2= 7和可信度 5% ,查双

尾 t表得 tα= 2. 365,现在 t= 2. 24 < tα= 2. 365,所以

两种零件之残余应力在可靠度 95%的意义下无显

著差异。

例 3 已知 ,测得两种齿轮在工作状态下的运

行寿命 ,第一种齿轮的寿命 (× 103h )为 6. 2, 5. 7,

6. 5, 6. 0, 6. 3, 5. 8, 5. 7, 6. 0, 6. 0, 5. 8, 6. 0;第二种齿

轮的寿命 (× 103h )为 5. 6, 5. 9, 5. 6, 5. 7, 5. 8, 6. 0,

5. 5, 5. 7, 5. 5。求:试问两种齿轮的寿命有无显著差

异?若有 ,再对寿命的差值范围作一估计。可信度均

取T= 5%。

解:根据 F检验 (下面将介绍 )知道两个子样的

方差无显著性差异。

( 1)先检验两子样的母体均值有无显著差异。

第一种齿轮: x 1= 6. 0,n1 S21= 0. 64,n1= 11

第二种齿轮: x 2= 5. 7,n2 S22= 0. 24,n2= 9

代入 t检验式

t = |6. 0 - 5. 7|

0. 64+ 0. 2411+ 9 - 2

×111

+19

= 3. 018

  根据T= 5% ,O= n1+ n2- 2= 18,查双尾 t表得

tα= 2. 101,因为 t= 3. 018> tα= 2. 101,所以两种齿

轮的寿命有显著性差异。

( 2)估计两种齿轮寿命差值的范围。

由下式

P ( - tT <|x1 - x2|

n1S21+ n2S

22

n1 + n2 - 2×

1n1

+1n2

< tT) =

1 - T= 0. 95      

   tα= 2. 101,则寿命差值的范围是

(x 1 - x2 ) ± 2. 101×n1S

21+ n2S

22

n1+ n2 - 2×

1

n1+

1

n2=

( 6. 0 - 5. 7) ± 2. 101×0. 64+ 0. 24

11+ 9 - 2×

1

11+

1

9=

0. 3± 0. 2087= ( 0. 0913~ 0. 5087) × 103h

  所以 ,在可靠度 R= 1- T= 95%的条件下 ,这两

种齿轮的寿命差值范围是 ( 0. 0913~ 0. 5087)×

103h,即为 91. 3~ 508. 7h。

1. 2 关于母体方差 (或标准差 )的统计推断

1. 2. 1 定理和公式

定理 1: 设随机变量ai服从正态分布 N (_ ,ea) ,

ai 相 互 独 立 , 只 要 n 足 够 大 , 则 Y=

1n[∑

n

i= 1

(ai - a) 2 ]也近似符合正态分布 ,其数学期

望是 ea,标准差是ea / 2n ,即随机变量的函数Y服

从正态分布 N (ea,ea / 2n )。于是 ,用这个定理便可

运用 u估计 (或检验 )公式

e a - ue a

2n< ea < e a+ u

e a

2n( 3-6)

  上面的结果只适用于大子样 ,对于小子样的情

况 ,就只能用下述i2分布了。

定理 2: 设随机变量 a服从正态分布 ,ea为未

知 ,则可用下式从小子样的 S来加以估计

nS2

i22

< e2Y <

n S2

i21

( 3-7)

  其中 ,子样方差 S=1n∑

n

i= 1(xi - x )

2,而 i

21 ,i

22

是取决于可信度T的量 ,求i2分布的密度函数下 ,

以 0到i21的积分是T/2,从i

22到∞的积分也是T/2。

为了比较两个子样所代表的母体的标准差是否

有显著的差异 ,可以用 F分布。 设由两个正态母体

各抽取一个子样 ,用ea1和ea2分别代表两个母体的均

方差。 经作统计假设 ,ea1= ea2 ,则可用估计值e a1和

e a2计算 F值

F = e a1 /e a2 ( 3-8)

  其中 e a1和e a2按数值大小记号 ,大的记为 1,小的

记为 2。

给定一定的可信度 ,例如 T= 0. 05,可查 F分布

表得 Fα值。如果上述计算的 F < Fα,则认为原假设

可以接受 ,e a1与e a2相同 ,即无显著性差异。反之 ,则

推翻原假设 ,e a1与e a2不相等 ,它们具有显著性差异。

2. 2. 2 应用实例

·136·

凌树森:试验数据的统计处理和误差分析 第三讲 参数估计和假设检验

Page 5: 试验数据的统计处理和误差分析第三讲参数估计和假设检验_凌树森

例 1 已知 ,数据和条件与第一种类型的例 1

相同。求: 给定可信度为 5% (即可靠度 R= 1- T= 1

- 0. 05= 0. 95) ,试对该材料抗拉强度的标准差 eY

作区间估计。

解:可利用下式估计标准差

e Y- ue Y

2n< eY < e Y+ u

e Y

2n

  估计上限= e Y+

e Y

2n= 24. 5+ 2×

24. 5

2× 200=

27. 0N /mm2

估计下限= e Y-e Y

2n= 24. 5- 2× 24. 5

2× 200=

22. 1N /mm2

所以 ,该材料的标准差有 95%的可靠度时 ,估

计落在下述区间

22. 1 < eY < 27. 0( N /mm2)

  例 2 已知用两种方法加工的试样 ,其疲劳寿

命试验结果如下 ,均取对数 ( xi= lgN i )。

第一种加工方法: 4. 532, 4. 623, 4. 623, 4. 643,

4. 644, 4. 653, 4. 672, 4. 691, 4. 724;

第二种加工方法: 4. 839, 4. 924, 4. 945, 4. 973,

4. 978, 5. 033, 5. 083。

求:试问两种加工方法所得试样 ,其寿命方差是

否有显著差异?

解:计算两种方法所得的寿命均值和方差。

第一种方法: x 1= 4. 65, S21= 0. 00276,n1= 10,

O1= n1- 1= 9;

第二种方法: x 2= 4. 97, S22= 0. 00527,n2= 8,

O2= n2- 1= 7。

利用 F分布判别式

F = e 2a1 /e 2

a2 = 0. 005270. 00276

= 1. 91

  自由度 O2= 7,O1= 9,取T= 5. 0%查 F分布表

得 Fα= 4. 2。因为 F= 1. 91 < Fα= 4. 2,所以两种加

工方法所得的试样 ,其疲劳对数寿命的方差无显著

性差异 ,即认为其寿命的分散度是相同的。

(待续 )

· 信息·

郑州机械研究所将举办

“盲孔法测量残余应力培训班”

为推广盲孔法测量残余应力在科学研

究和工程技术领域中的应用 ,全国残余应

力学术委员会和郑州机械研究所将于

2001年 5月中下旬在郑州举办“盲孔法测

量残余应力培训班” ,通过理论和实际操

作 ,讲授盲孔法测量残余应力的基本原理、

钻孔装置及应力测量仪的操作方法及应变

片的粘贴技术等内容。 报名截止日期为

2001年 4月 25日。

联系人:王晓洪 印兵胜

地址:河南省郑州市嵩山南路 81号

郑州机械研究所测试技术研究室

邮编: 450052 电话: ( 0371) 7435313

E-mail: zrimea@ public2. zz. ha. cn

·信息·

我国开发廉价的碳纳米管

比黄金还贵 100倍的一种碳纳米管 ,

生产成本在武汉降到了每克不足 2元。 武

汉华中师范大学经过两年多的研究 ,目前

已基本实现了碳纳米管的工业生产 ,年产

量接近 2t ,而生产成本不到 2元 /g。 据了

解 ,美国去年 6月份多层壁碳纳米管的价

格为每克 1500~ 2300美元 ,为黄金的 100

多倍。由于价格昂贵 ,相关应用研究根本无

法进行。 碳纳米管 ,被西方科学家称为“ 21

世纪科技革命的转折点” ,可应用于多个领

域。

·137·

凌树森:试验数据的统计处理和误差分析 第三讲 参数估计和假设检验