第八章 假设检验
description
Transcript of 第八章 假设检验
第八章 假设检验 一 . 本章提要
1. 假设检验问题 · 统计假设的基本概念· 假设检验的思想和方法· 参数假设检验与区间估计的关系· 假设检验的两类错误
2. 单个正态总体参数的检验 · 的假设检验· 的假设检验
3. 两个正态总体参数的假设检验 · 关于 的假设检验· 关于 的假设检验
0 2 2
0
1 2 2 21 2
二 . 基本要求· 理解假设检验的概念和思想方法,以及参数假设检验与
区间估计的关系;了解假设检验中的两类错误 .· 熟练掌握单个正态总体关于均值 以及方差 的
假设检验 .
· 熟练掌握关于两个正态总体均值 以及方差 的假设检验 .
· 领会大样本检验法 .
三 . 重点、难点正态总体均值与方差的假设检验 .
0 2 20
1 2 2 21 2
4. 大样本检验法 · 两总体均值差的大样本检验法· 二项分布参数的大样本检验法
8.1 假设检验问题
8.1.1 假设检验的基本概念
在实际问题中,经常需要对总体的分布形式或分布中的未知参数的某个陈述或命题进行判断,数理统计学将这些有待验证的陈述或命题称为统计假设,简称假设;利用样本对假设的真假进行判断称为假设检验;若总体的分布已知,对分布中的未知参数作假设并进行检验,称为参数假设检验;若总体的分
布未知,对总体的分布形式或参数作假设并进行检验,称为非
参数假设检验,被检验的假设称为原假设或零假设,记为 ,
其对立面称为对立假设,记为 。
0H
1H
8.1.2 假设检验的思想和方法
小概率原理 概率很小的事件在一次试验中不会发生,如
果小概率事件在一次试验中发生了,则实属反常,一定有导致
反常的特别的原因,所以有理由怀疑试验的原定条件不成立。
概率反证法 欲判断假设 的真假,先假设 真,在此前题下构造一个能说明问题的小概率事件 ,试验取样,由样本
信息确定 是否发生,若 发生,则与小概率原理相违背,说
明假设 不成立,则拒绝 ,接受 ;若小概率事件 没有发
生,没有理拒绝 ,只好接受 。
0H
1H
A
0H
0H
0H0H
0H
A
AA
小概率事件 的概率到底多小由实际问题的不同需要来定,
我们用 记小概率,一般取 等,在假设检验中
为检验水平,或显著性水平。
例 1. 已知某炼铁厂的铁水含碳量 现改变了工
艺条件测得 10 炉铁水的平均含碳量 假设方差无变化,
问:总体的均值 是否明显改变?(取 )解:由问题提出假设:
若 成立,则 与 4.55 应很接近,未知,用其无偏估计 代替,
若 较大,则可以认为 ,所以若 成立,
0.01,0.05,0.1
2(4.55,0.06 ),X N
4.57,X
0.05
0 1: 4.55 : 4.55H H
X
4.55X 4.55
0H
A
0H
事件 不太可能发生,即 很小,
由 知 因此,若 成立
统计量 显然
因此
即 则 因此确定了小概率事件
由 ,得
( )P A
( )P A d2
( , )X Nn
(0,1),X
Nn
0H
4.55(0,1),
XU N
n
4.55d
X d Un
{ 4.55 } { } 2 { }d d
P X d P U P Un n
{ } ,2
dP U
n
2
,d
un
2
:A U u
0.05 0.025
2
1.96u u
: 4.55 ( 0,A X d d 待定)
令 来确定
由于 ,说明小概率事件 发生
因此接受假设 ,即认为 。
4.55 4.57 4.551.054
0.06 10
XU
n
2
U u
4.55
A
0H
一般地,若拒绝接受 样本观察值
是 维空间 中的区域,则称 为假设 的拒绝域或否定域,
称 的补集 的接受域,检查中的所用的统计量成为检
查统计量,拒绝域分别位于同例的假设检验称为双侧假设检验。
0H 1 2( , , , ) ,nx x x D
D n nR 0H
nD R D
其中
D
D
假设检验的步骤如下:
( 1 )提出假设:根据问题的要求,提出原假设 与对立假设
确定显著水平 及样本容量 。
( 2 )确定拒绝域:用参数 的一个好的估计量 (通常取 的
无偏估计)来代替 ,分析拒绝域 的形式,构造检验统计量在 成立的前提下确定 的概率分布,通过等式
确定 。
( 3 )执行统计判决:求统计量的值,并查表求出有关数据,判
断小概率时间是否发生,由此作出判决。
1H
( )g
1 2{( , , , ) }nP x x x D
0H
n
D
D
0H ( )g
拒绝域的形式一般有原假设与对立假设共同确定,当给定
原假设 时,其对立的形式可能有多个,得到的拒绝域也可能不同。
例 2. 数据同例 1 ,问:总体的期望 是否明显大于 4.55 ?
解:此题的合理假设为
用 的无偏估计 来代替在例 1 中,拒绝 时接受的是 所以拒绝域为
而在本例中,拒绝 时接受的是
因而拒绝域为
0 14.55, 4.55H H
X
0H
4.55, 4.55X d
1 4.55,H
4.55X d
0H
0H
由 得
所以拒绝域为 由于
所以接受 。
un
U u0.05
4.55 4.57 4.551.054 1.645
0.06 10
XU u
n
{ 4.55 } { }P X d P Un
0H
若 成立,事件 发生的概率应很小
设 统计量
4.55A X d
( ) ,P A 4.55(0,1)
XU N
n
0H
8.1.3 参数假设检验与区间估计的关系
参数假设检验的关键是找一个确定性的区域(拒绝域)
使得 成立时,事件 是小概率事件,
旦抽样结果使小概率事件发生,就否定原假设 。
参数的区间估计是找一个随机区间 ,使 包含待估参数是个大概率事件。
这两类问题都是利用样本对参数作判断:一个是由小概率
事件否定参数 属于某范围,另一个则是依大概率时间确信某
区域包含参数 的真值,两者本质上殊途同归。
,nD R 1 2{( , , , ) }nx x x D0H
I
0H
I
8.1.4 假设检验的两类错误
对于小概率事件 ,无论其概率多小,还是有可能发生的,
所以利用“概率反证法”进行假设检验,可能作出错误的判断,有以下两种情形:
( 1 )原假设 实际是正确的,但却拒绝了 ,这样就犯了
“弃真”的错误,通常称为第一类错误 .仅当小概率事件 发生时
才拒绝 ,所以犯第一类错误的概率为 。
( 2 )原假设 实际是不正确的,但却接受了 ,这样就犯了
“取协”的错误,通常称为第二类错误,其概率记为 。
A
0H
0( )AP H
0H0H
0H
0H
A
习题 8-1
1. 在假设检验中,显著性水平 的意义是( )
B. 原假设 成立,经检验被不能被拒绝的概率A. 原假设 成立,经检验被拒绝的概率
C. 原假设 不成立,经检验被拒绝的概率D. 原假设 不成立,经检验被不能被拒绝的概率2. 试述检验假设的步骤 .
3. 设总体 , 为未知参数, 为其一个样本
对下述假设检验问题 , 取拒绝域为:
试求常数 ,使得该检验的显著水平为 0.05.
0H
( ,9)X N 1 2 25, , ,x x x
0 0 1 0: , :H H
1 2 25 0{( , , , ) }C x x x X C
C
0H
0H
0H
参考答案
1. A
2. 略
3. 可以
8.2 单个正态总体参数的假设检验
设总体 ,抽取容量为 的样本 ,样本均值与样本分别是 为叙述简明,我们把各个不同的假设检验中有关的原假设 ,备择假设 ,以及在显著性水平的拒绝域分别列成相应表,这些表中,当原假设 成立时,所
有统计量及其分布都可以从第 6 章中的有关定理中得到 .
8.2.1 关于正态总体均值 的假设检验
1. 若已知 ,则取统计量 ;
2. 若 未知,则取统计量 .
2( , )X N n1 2, , , nX X X
2, ,X S
0H 1H
0
0
0( )(0,1)
X nU N
( )(0,1)
X nT t
S
0H
综和上述情况得表 8-1
原假设 原假设 备择假设 备择假设 已知 已知 未知 未知 1H0H
0
0
0
0 0
0
0
2
U U
U U
U U
( 1)t t n
( 1)t t n
2
( 1)t t n
T
0
U T
在显著水平 下关于 的拒绝域0H
①
②
①若改为 ,则统计量 或 的观测值落在拒绝域内的概率不大于 。
不大于 。②若改为 ,则统计量 或 的观测值落在拒绝域内的概率
0 U
表 8-1 正态总体均值的假设检验表
例 1. 某工厂生产的某中钢索的断裂强度(单位: )服从分布
,其中 ,现从一批此种钢索的容量为 9 的一个
样本测得断裂强度平均值 ,与以往正常生产时的 相比,
设总体方差不变,则在显著性水平 下能
否认为这批钢索质量有显著提高?
解:本题是对参数 的单侧检验问题
( 1 )提出假设
( 2 )选取检验统计量
MPa
2( , )N 40MPa
X
20MPa 0.01
0 0 1 0: , :H H
0( )(0,1)
X nU N
较 大 ,
X
( 3 )拒绝域为
( 4 )取 ,查表得
由 得
( 5 )检验:由于
故接受假设 ,认为这批钢材质量没有显著提高。
0.01 2.33 1.5u u
0H
0( )X nu u
0.01 2.33u u
2 2 209, 40n 0( ) 20 9
1.540
X nu
0.01
例 2. 某产品的一项指标 服从分布 ,现从中抽取容量
为 26 的样本,样本均值 ,能否认为这种产品的期望值
X
1637X
1600 ( 0.05)
2( ,150 )N
?
解:本题双侧检验问题
( 1 )假设
( 2 )选取统计量
( 3 )拒绝域为
( 4 )取 ,查表得
由 , 得
( 5 ) ,所以接受
即认为这种产品在显著水平 下的期望值为 1600 。
0.05
0 0 1 0: 1600, : 1600H H
0XU
n
0
2
X nu u
0.025
2
1.96u u
01.258
X n
026, 150, 1637, 1600n X
2
1.258 1.96u u 0H
0.05
例 3. 一个手机生产厂家在其宣传广告中声称他们生产的某中品牌
的手机待机时间的平均值至少为 71.5 小时,一质检部门抽查了该
厂生产的此品牌的手机 6部,得到的待机时间为:
69 , 68 , 72 , 70 , 66 , 75 ,设手机的待机时间 ,由这些数据能否说明其广告有欺
骗消费者的嫌疑 ?
解:( 1 )假设
( 2 )由于方差 未知,用检验统计量
( 3 )拒绝域为
( 4 )计算得
2( , )X N
0 1 1: 71.5, : 71.5H H
( 0.05)
2 0 ( 1)X
T t nS n
0 ( 1)X
t t nS n
270, 10, 1.162X S t
8.2.2 关于正态总体方差 的假设检验
1. 若已知 ,则取检验统计量
2. 若未知 ,则取检验统计量
表 8-2列出了正态总体方差假设检验的几种情况
2 20
0
2 2 21 02
10
1( ) ( )
n
ii
X n
2
2 2 22 2 2
10 0
1 ( 1)( ) ( 1)
n
ii
n SX X n
( 5 )查 分布表得( 6 )统计判决
故接受 ,即不能认为该厂广告有欺骗消费者之嫌疑 .
0.05( 1) (5) 2.015t n t
1.162 2.015 ( 1)t t n
0H
t
原假设 原假设 备择假设 备择假设 已知 已知 未知未知
或或
或或
2 21
12
( )n
0H 1H
21
0
22
2 20 2 2
0
2 20
2 20
2 20
0H
2 21 2
在显著水平 下关于 的拒绝域
①
②
2 20
2 20
2 21
2
( )n
2 22
12
( 1)n
2 22
2
( 1)n
2 21 ( )n 2 2
2 ( 1)n
2 22 1 ( 1)n 2 2
1 1 ( )n
①若改为 ,则统计量 或 的观测值落在拒绝域内的概率不大于 。②若改为 ,则统计量 或 的观测值落在拒绝域内的概率不大于 。
21
22
表 8-2 正态总体方差的假设检验表
例 4. 某打包机包装糖出厂,已知每包糖的质量 ,按
设计要求,方差 不能超过 100 ,现从中抽取 11包,测得样本方
差 ,问:该打包机的精度是否符合要求?
解:( 1 )提出假设
( 2 )选取统计量
( 3 )拒绝域为 或
( 4 )由 ,查 分布表得
计算
因为 , 所以接受假设
即该打包机精度符合要求。
2( ) ( , )X g N
22 50S ( 0.05)
2 20 1: 100, : 100H H
22 21 2
( 1)( 1)
n Sn
2 22
12
( 1)n
2 22
2
( 1)n
11, 0.05n 2 2
0.05 (10) 18.307
221 2
0
( 1) (11 1) 505
100
n S
2 21 0.055 18.307
20 : 100H
2
例 5. 某炼铁厂铁水含碳量 ,现对设备进行了维修,
然后抽测了 5 炉炉水,测得含碳量 的样本方差 ,问:是否可以认为设备维修后的铁水含碳量的方差仍旧是 ?
解:( 1 )提出假设( 2 )选取统计量
( 3 )拒绝域
( 4 )由 ,查表得
计算
( 5 )因为 ,所以拒绝
即设备维修后铁水含碳量的方差有改变。
2( ,0.1 )X N
2 20.228S
20.1( 0.05)
2 2 2 20 1: 0.1 , : 0.1H H
22 21 2
( 1)( 1)
n Sn
2 22
2
( 1)n
0.05, 1 4n 2
2
(4) 11.1
2 22
2 2
( 1) 4 0.22820.79
0.1
n S
2 2
2
2 20 : 0.1H
X
习题 8-2 A
1. 某批矿砂的 5 个样品中镍含量为( % ): 3.25 , 3.27 , 3.24 ,
3.26 , 3.24 ,设测定值服从正态分布,问:能否认为这批矿砂的镍含量为 3.25% ?
2. 用传统工艺加工的某中水果罐头中,每瓶平均维生素 的含量为 19 ,现改进了加工工艺,抽查了 16瓶罐头,测得维生素
含量 为: 18 , 23 , 20.5 , 21 , 22 , 20 , 22.5 , 19 , 20 , 23
, 20.5 , 18.8 , 20 , 19.5 , 22 , 23 ,已知维生素 含量服从正
态分布,分别在方差 和 未知的情况下,问:新工艺下维
生素 含量是否比旧工艺下维生素 含量有显著提高?
mg
( )mg
C
2 4 2
( 0.05)
C
C
CC ( 0.01)
4. 某种导线,要求其电阻的标准差不超过 ,今在生产的
一批导线中抽取 9 根,测得样本标准差 ,设总体服从
正态分布,能认为这批导线的标准差显著偏大吗?( 0.05)
0.005
0.007S
3. 设来自正态总体 ,容量为 100 的样本,样本均值
未知,而 ,检验下列假设( 1 )
( 2 )
207,X 2, 2
1
( ) 225n
ii
X X
2( , )X N
0 1: 3, : 3H H
2 20 1: 2.5, : 2.5H H
习题 8-2 B
1. 检测站对某条河流每日的溶解氧浓度纪录了 30 个数据,并由此算得 ,已知这条河流的每日溶解氧浓度服从
,试检验2.从一批轴料中取 15 件测量其椭圆度,计算得
问:该批轴料椭圆度的总体方差与规定的 有无显著差异( ,椭圆度服从正态分布)?
2.52, 2.05x S 2( , )N 0 : 2.7H ( 0.05)
2
1
1( ) 0.023,
n
ii
S x xn
2 0.04
0.05
4.电池在货架上滞留时间不能太长,下面给出某商店随机选取的 8 只电池的货架滞留时间(以天计):
108 , 124 , 124 , 106 , 138 , 163 , 159 , 134
设数据来自总体 未知,试检验假设
取
2 2( , ), ,N
0 1: 125, : 125H H 0.05
3. 有一批枪弹,出厂时初速 经较长时间储存,取 9
发进行测试,得样本值 : 914 , 920 , 910 , 953 , 945 , 912
924 , 940 ,据检验,枪弹经储存,其初速 仍服从正态分布,
且 可认为不变,问:是否可以认为这批枪弹的 显著降底 ?
2(950,10 ),U N
U
0 10
( 0.025)
( )m s
U
参考答案A: 1. 含镍量为 3.25%
4.检验得
B: 1.
2. 有显著提高3. 显著降低4.
2. 有显著提高3. 23, 2.5
0.05
2.7
125
2 2 2 20 1 0 1: 0.05, : 0.05 : 0.05 , : 0.05H H H H
8.3 两个正态总体参数的假设检验
设总体 总体 从两个总体中分别抽取样本 及 样本均值与样本方差分别是
及 ,以下是有关参数 的某些假设。
8.3.1 关于两个正态总体均值 的假设检验1. 若已知 及 ,则取统计量
2. 若未知 及 ,假定 ,取统计量
其中
于是得到表 8-3 所列的两个正态总体均值的假设检验
21 1( , ),X N 2
2 2( , ),Y N
11 2, , , nX X X21 2, , , ,nY Y Y
21,X S 2
2,Y S2 2
1 2 1 2, , ,
1 2
21
22
2 21 2
1 2
(0,1)X Y
U N
n n
2 21 2
1 2
1 2
( 2)1 1
w
X YT t n n
Sn n
2 21 1 2 2
1 2
( 1) ( 1)
2w
n S n SS
n n
21
22
原假设 原假设 备择假设 备择假设 已知 和 已知 和 未知 和未知 和
0H
U
1H0H
21
22
21
22
在显著水平 下关于 的拒绝域
1 2
1 2
1 2
①
② 1 2
1 2
1 2
2
U U
U U
U U
1 2( 2)t t n n
1 2( 2)t t n n
1 2
2
( 2)t t n n
①若改为 ,则统计量 或 的观测值落在拒绝域内的概率不大于 。
T
U1 2
1 2
②若改为 ,则统计量 或 的观测值落在拒绝域内的概率不大于 。
T
表 8-3 两个正态总体均值的假设检验
例 1. 某香烟厂向化验室送去两批烟丝样本,要化验尼古丁的含量,各抽取重量相同的 5 例化验,得尼古丁含量分别为 A:24 , 27 , 26 ,
21 , 24 , B:27 , 28 , 23 , 31 , 26. 设化验数据服从正态分布, A批方差为 5,B批方差为 8 ,在显著性水平 下,检验两批烟丝
的尼古丁含量是否有显著差异。
解:提出假设
选取统计量 拒绝域为
由
计算 查表得
0.05
0 1 2 1 1 2: , :H H
2 21 2
1 2
1.612A BX Xu
n n
2
u u
2 21 2 1 224.4, 27, 5, 5, 0.05, 5, 8A BX X n n
2 21 2
1 2
A BX XU
n n
2
1.96u
8.3.2 关于两个正态总体方差 的假设检验
1. 已知 及 检验假设
设 则
已知,则 已知,取 作
其中 及 分别为
统计量 的分子及分母的样本容量。
2 21 2
2 2 2 20 1 2 1 1 2: , :H H 1
1 12 22 2
1 21 21 11 2
1 1( ) , ( )
n n
i ii i
X Yn n
2
1
1 22
2
( , )F F n n
2 2
1 2max( , )
2 2
1 2
1 2 2
1 2
max( , )( , )
min( , )F F n n
分子 分母
2
1 2, 2 21 2, 作分子 , 2 2
1 2min( , )
分母得统计量 n分子 n分母
1F
由于 ,所以接受
即认为两批烟丝的尼古丁含量没有显著差异。2
u u 0H
2. 若未知 及 ,则与 1 类似取统计量
关于单侧假设检验的拒绝域的讨论与双侧假设检验完全类似于是,得到两个正态总体方差的假设检验表。(表 8-4 )
2 21 2
2 2 21 2
max( , )( 1, 1)
min( , )
S SF F n n
S S 分子 分母
1u 2u
对于显著性水平 , 由 分布表查得 及
使得
若由样本观测值计算得 , 则拒绝 ,但由
于 总大于 1, 而从 分布表可知,当取较小的值 时 , 总有所以统计量 的值不可能小于 ,
因此在显著水平 下的拒绝域只能是 。
1 2 2{ } , { }
2 2P F F P F F
F2( , )F n n 分子 分母
12( , )F n n 分子 分母
1 11 2 2F F F F
或 0H
1F F 0.10
1 2 2F F
1 2 1 2(k , k ) (k , k ) 1 1F 12
F
1
2F F
原假设 原假设 备择假设 备择假设 已知 和 已知 和 未知 和未知 和
2F
1
2
(F F n n 分子 分母, )
1F
0H 1H1 2 1 2
2 21 2
1F
2 21 2
2 21 2 2 2
1 2
2 21 2 2 2
1 2
①
②
21
122
(F F n n
1 2= , )
21
122
(F F n n
2 1= , )
2
2
(F F n n 分子 分母-1, -1)
21
2 22
(S
F F n nS 1 2= -1, -1)
22
2 21
(S
F F n nS 1 2= -1, -1)
①若改为 ,则统计量 或 的观测值落在拒绝域内的概率2 21 2
2 21 2
不大于 。②若改为 ,则统计量 或 的观测值落在拒绝域内的概率2F
不大于 。
在显著水平 下关于 的拒绝域 0H
表 8-4 两个正态总体方差的假设检验表
例 2. 某中物品在处理前后分别取样分析其含脂率( % )得数据:
处理前: 0.29 , 0.18 , 0.31 , 0.30 , 0.36 , 0.32 , 0.28 , 0.12 ,0.30 , 0.27 ;
处理后: 0.15 , 0.13 , 0.09 , 0.07 , 0.24 , 0.19 , 0.04 , 0.08 ,0.20 , 0.12 , 0.24 。
假设处理前后含脂率都服从 正态分布,检验处理前后含脂率的方差是否不变。
解:提出假设
计算得
2 2 2 20 1 2 1 1 2: , :H H
( 0.05)
2 21 20.00450, 0.00477S S
由于 选取统计量
取 查表得
计算得由于 则接受
即认为处理前后方差没有显著变化。
2 21 2 ,S S
2221
SF
S
1 20.05, 11, 11,n n 2(10,9) 3.96F
2221
0.004771.06
0.00450
SF
S
21.06 (10,9),F F 0H
例 3. 测得两批电子器材的电阻(单位: )分别为:
A批: 0.140 , 0.138 , 0.134 , 0.142 , 0.144 , 0.137
B批: 0.135 , 0.140 , 0.142 , 0.132 , 0.138 , 0.140
设两批器材的电阻分别服从正态分布 且2 21 1 2 2( , ), ( , ),X N Y N
相互独立,则对于显著性水平 能否认为两器材电阻值相等?
解:本题两正态总体均值的双侧检验问题,且方差未知,所以要分两步讨论
( 1 )检验假设计算得
且
取 查 分布表得
由于 所以接受 即认为 。
2 2 2 20 1 2 1 1 2: , :H H
0.05 ,X Y
2 6 2 6 2 21 2 1 20.1407, 7.867 10 , 0.138, 7.1 10 ,x S y S S S
22 221 22
1
1.108 ( )S
S SS
0.0252( 1, 1) (5,5) 7.15F n n F 1 2
222
21
1.108 ( 1, 1) 7.15,S
F n nS 1 2 0 ,H
2 21 2
0.05 F
( 2 )检验假设
查 分布表得
所以接受 即认为这两批器材电阻均值相等。
0 1 2 1 1 2: , :H H
0.0252( 2) (10) 2.228t n n t 1 2
t
2 22 61 2( 1) ( 1)
2.7366 102w
n S n SS
n n
1 2
1 2
21.39 ( 2) 2.228
1 1w
x yt t n n
Sn n
1 2
1 2
0 ,H
习题 8-3 A
1. 设总体 ,总体 ,其中, 已知,
与 是分别来自 与 的样本,两样本相互独立,对假设检验 ,其检验统计量
,拒绝域 。
2.甲、乙两台车床加工同种产品,从这两台机床中随机抽取若干件,测得产品直径
甲: 20.5 , 19.8 , 19.7 , 20.4 , 20.1 , 20.0 , 19.0 , 19.9
乙: 19.7 , 20.8 , 20.5 , 19.8 , 19.4 , 20.6 , 19.2
假设两台机床加工的产品直径都服从正态分布且总体方差相等,问:甲、乙两台车床加工的产品直径有无显著差异?
21 1( , )X N 2
2 2( , )Y N
2 2 2 20 1 2 1 1 2: , :H H
( 0.05)
11 2, , , nX X X21 2, , , nY Y Y
1 2,
X Y
F W
( )mm
4. 改进某中金属的热处理方法,要检验抗拉强度 有无显著提高,在改进前后各取 12 个样品,测量并计算得改进前
改进后
假定热处理前后抗拉强度都服从正态分布,取 ,问:( 1 )处理前后总体方差是否相等 ?
( 2 )处理后抗拉强度有无显著提高?
0.05
2
1
28.67, ( ) 66.64,n
ii
x x x
2
1
31.75, ( ) 112.25,n
ii
y y y
( )Pa
3. 两家工厂用同样的生产过程生产塑料,假定两个工厂的塑料强度都服从正态分布,生产已定型且方差都已知,收集到的数据如下:问:两个塑料的平均强度是否相等?
2 21 1 2 29, 39, 3, 16, 35, 5n x n y
( 0.05)
习题 8-3 B
1. 设总体 ,总体 ,其中, 已知,
与 是分别来自 与 的样本,两样本
相互独立,对假设检验
统计量
21 1( , )X N 2
2 2( , )Y N
2 21 1
0 12 22 2
: ( 0 :H H
已知) ,
11 2, , , nX X X21 2, , , nY Y Y
1 2,
X Y
,拒绝域 .F W
2.针织品漂白工艺中,要考察温度对针织品断裂强度的影响,
为比较 与 的影响有无差别,在这两个温度下,分别重复做了 8 次实验,得数据
时的温度: 20.5 , 18.7 , 19.8 , 20.9 , 21.5 , 17.5 , 21.0 ,21.2
070 C 080 C
其检验
070 C
时的温度: 17.7 , 20.3 , 20.0 , 18.8 , 19.0 , 20.1 , 20.0 ,19.1
已知断裂强力服从正态分布且方差不变,问:在 时强力与在
时的强力下是否有显著差别 ?( 0.05)
070 C
080 C
080 C
3. 两台机床生产同一种滚珠(滚珠直径服从正态分布),从中
分别抽取 8 个和 9 个比较两台车床生产的滚珠直径的方差是否有
明显差异 ?甲车床: 15.0 , 14.5 , 15.2 , 15.5 , 14.8 , 15.1 , 15.2 , 14.8
乙车床: 15.2 , 15.0 , 14.8 , 15.2 , 15.0 , 15.0 , 14.8 , 15.1
14.8 。
( 0.05)
4. 设有甲、乙两种安眠药,比较它们的治疗效果,以 表示失
眠者服用甲药后睡眠延长的时数,以 表示失眠者服用乙药后
睡眠延长的时数,现独立观察 20 个失眠者,其中 10人服用甲药,
另 10人服用乙药,延时纪录如下:
假定 ,试问:这两种药的疗效有无显
Y
2 21 1 2 2( , ) ( , )X N Y N ,
著差异。( 0.05)
X
Y
1.9 0.11.10.8 0.1 4.4 5.5 1.6 4.6 3.4
0.7 -1.6 -0.2 -0.1 -1.2 3.4 3.7 0.8 0.0 2.0
X
5. 某中橡胶配方中,原用氧化锌 ,现改为 ,今分别对两
种配方各种若干试验,测得橡胶伸长率为:
原配方: 540 , 530 , 525 , 520 , 545 , 531 , 541 , 529 , 534
现配方: 565 , 577 , 580 , 575 , 556 , 542 , 560 , 532 , 575 , 561
设同一批橡胶伸长率服从正态分布,问:在两种配方下,橡胶
率是否服从同一分布 ?
5g 1g
( 0.01)
参考答案A: 1.
2. 无显著差异3. 平均强度不相等4. 方差相等,抗拉强度有显著提高
B: 1.
2. 有显著差异3. 没有显著差别4. 先检验方差得方差相等;再检验均值得没有显著差别5. ( 1 )方差相等 ( 2 )均值不同,则伸长率分布不同
212 1 2 22
( , ) ( , )n
F W F F n n F F n nn
11 2 1 2
2
或
2 21 12 2 1 2 22 2
( 1, 1) ( 1, 1)S
F W F F n n F F n nS
1 2 1 2或
8.4 大样本检验法
前面讨论的假设检验问题,都已知有关统计量的分布,并
由此确定拒绝域,但在许多问题中,很难得到检验统计量的分
布,有时即使能求出,使用上也很不方便,实际应用中往往求
助于统计量的极限分布 . 若抽取大量样本(大样本),并用检
验统计量的极限分布来近似作为其分布,由此得到的检验方法
称为大样本检验法。
8.4.1 两总体均值差的大样本检验法
设有两个独立总体 ,其均值和方差分别为 和现从每一总体中各抽取一样本,其样本容量、样本均值、样本
方差分别记为 并且 很大,给定显著水平和,检验假设
,X Y
21 1, ,n X S
1 2,
2 2 2 20 1 2 1 1 2: , :H H
1 2,n n
1 2,
22 2, ,n Y S
若两总体均为正态分布 , 当 已知时 , 可用 检验法来检验;
当 未知但 时 , 可用 检验法来检验 , 此处总体分布未
知 , 即使总体为正态分布 , 由于 未知且 不一定相等 , 因
而不能用 检验 , 下面用大样本的方法给出此假设的检验法。
t
u2 21 2,
2 21 2, 2 2
1 2
2 21 2, 2 2
1 2,
t
当 很大时 , 由中心极限定理知 :
同理 , 当 很大时 ,
独立 , 所以
分别是 的很好近似值 , 用 代替 , 用 代替 仍有 :
1
1
(0,1)X
Nn
2 21 2,S S
1n
近似 , 即21
11
( , )X Nn
近似
2n22
22
( , )Y Nn
近似
,X Y1 2
2 21 1 2 2
( ) ( )(0,1)
X YN
n n
近似
2 21 2, 2
1S21 2
2S22
由此得拒绝域为
( 很大 )1 2,n n
1 2
2 21 1 2 2
( ) ( )(0,1)
X YU N
S n S n
近似
2 221 1 2 2
x yu u
S n S n
(1)
8.4.2. 二项分布参数的大样本检验法 .
设 , 在 次独立试验中事件 发生的次数为 , 则
给定显著水平 , 检验假设
设
则 独立 ,且都服从参数为 的 0-1 分布。
0 0 1 0 0 0: , : (0 1, )H p p H p p p p 已知
X
n( )P A p A
1,
0,iX
第 i 次试验中 A 发生第 i 次试验中 A 不发生
1 2, , nX X X p
由中心极限定理 , 当 时 ,n
( )(0,1)
( ) (1 )
X E X X npN
D X np p
由此得拒绝域为0
0 0(1 )
x npu u
np p
当 为真 ,且 很大时0
0 0
(0,1)(1 )
X npU N
np p
近似
(2)
0H n
例 1. 根据以往长期统计 , 某种产品的废品率不小于 5% 。但技术革
新后 ,从此种产品中随机抽取 500 件 , 发现有 15 件废品 , 问 : 能否认
为此种产品的废品率降低了 ?
解:假设检验问题为
抽样的废品率为 值为
( 0.05)
0 1: 0.05, : 0.05H p H p
150.03,
500 u
0.03 0.052.062
0.05 0.95500
u
0.050.05 1.645u
因为
所以拒绝 ,即认为废品率已降至 5% 以下。
2.062 1.645u u
0H
习题 8-4
1. 某中产品的次品率原为 0.1 ,对这种产品进行新工艺试验,抽取 200 件发现 13 件次品,能否认为这项新工艺显著降低了产品的
次品率 ?
2. 某中产品的次品率为 0.17 ,现对此产品进行工艺试验,从中抽取 400 件检查,发现次品 56 件,能否认为这项新工艺显著地提高了产品质量 ?
3. 为了比较两种子弹 、 的速度 在相同条件下进行速度测定,算得样本平均值及标准差为子弹子弹试用大样本方法检验这两种子弹的平均速度有无显著差异
( 0.05)
( )msA B
1 1 1110 2805 120.41n x S
2 2 2110 2680 105.00n x S
( 0.05)
( 0.05)
A
B
参考答案
1. ,所以不能认为显著影响质量。
2. ,所以认为新工艺显著降低了次品率。
3. 有差异。
0.0251.579u u
0.051.65u u
小 结一 . 基本概念
1. 假设检验是统计推断的基本方法之一,它先将总体的统计特性作为假设,然后通过样本检验该假设。2. 小概率原理:小概率事件在一次试验中是不该发生的,如果在原假设下导致了小概率事件发生,就应该拒绝原假设。3. 显著性水平 就是小概率原则中的小概率,也是犯第一类(去真)错误的概率上界,它的取值反映了我们在主观上对原假设的认可程度,用同一样本检验同一假设时, 取值不同会导致不同的检验结果。4. 对假设作出合理的检验结论不可避免地会犯两类错误,第一
类是否定了正确的假设,即“去真”错误,第二类错误是接受了不正确的假设,即“取伪”错误。
二 . 基本方法
应用 检验法, 检验法, 检验法和 检验法时正态总体
均值 和方差 进行假设检验是假设检验的基本方法。其共同
思路是:根据被检验的参数对象选取该参数的优良点估计量,
构造出检验统计量,使其在原假设为真的有确定的分布,最后定出该分布的小概率区域作为原假设的拒绝域。
我们将上述方法编制成表 8-5 ,将此表与表 7-1比较,就会发现假设检验与区间估计有着密切的联系,从形式上看假设检验中原假设的接受域(拒绝域的补区域)就是相应参数的置信区间,置信度 中的 正是显著水平。
u t2 F
1
2
表 8-5 正态总体均值、方差的检验法(显著性水平为 )
自测题八 (A)
一 .填空题
1. 设 是正态总体 的一组样本。现在需
要在显著水平 下检验假设 , 如果已知常数 , 则
的拒绝域为 ;如果未知常数 , 则 的拒绝域为
2. 在一个假设检验问题中令 是原假设 , 是备择假设 , 则犯
第一类错误的概率 ,第二类错误的概率 , 要使犯
两类错误的概率 同时减小必须
0.05
2( , )X N 1 2, , , nX X X
2 20 1 2:H 0H
1W 0H 2W
0H 1H
, 。
。
3. 设总体 总体 , 其中 未知 , 设总是来自总体 的样本 , 是来自总体 的样
2 2 2 20 1 2 1 1 2: :H H
21 1( , )X N 2
2 2( , )Y N 1 2,
1 2, , , nX X X X 1 2, , , nY Y Y Y
本 , 两样本独立 , 对于假设检验。
设显著水平为 , 则检验统计量是 , 检验拒绝域为 W
4. 设总体 ,总体 , 设 是来自总体 的样本, 是来自总体 的样本,两样本独立,
对于假设检验
其检验统计量 ,其拒绝域 。
21 1( , )X N 2
2 2( , )Y N 1 2, , , nX X X
1 2, , , nY Y Y
W T
0 1 2 1 1 2: ( :H H 为已知数)
X Y
。
5. 设总体 ,总体 ,其中 已知,设
是来自总体 的样本,
两样本独立,对于假设检验
是来自总体 的样本,
使用的统计量 为 ,它服从的分布是 。
6. 设总体 ,总体 ,其中 已知,设
是来自总体 的样本,
两样本独立,对于假设检验
是来自总体 的样本,
设显著水平为 ,则检验统计量是 ,检验拒绝域 。
1 2,
2 21 2,
0 1 2 1 1 2: :H H
u
2 2 2 20 1 2 1 1 2: :H H
21 1( , )X N
21 1( , )X N 2
2 2( , )Y N
22 2( , )Y N
11 2, , , nX X X
X
X21 2, , , nY Y Y
Y
Y
11 2, , , nX X X21 2, , , nY Y Y
W
二 .选择题1. 在假设检验中,用 分别表示犯第一类和犯第二类错
误的概率,则当样本容量一定时,下列说法正确的是( )A. 增大, 也增大 B. 减小, 减小C. 和 中一个增大另一个减小 D. 和 同时成立
2. 设 是正态总体 的一组样本,在显著下,已求得假设“总体的均值等于 75” 的拒绝域为
1 2, , , nX X X 2( ,3 )X N
0.05
,
A B
则样本容量
3. 设 , 其中 未知 ,从 中抽取容量为 10 的样本 ,
对于假设检验 , 若显著水平为 0.05, 则检验的拒绝域为 ( )
1 2, , ; 74.02 75.98nW x x x x x
( )n
2( , )X N X
水平
4. 设总体 , 总体 , 其中 未知 ,
从总体 抽取容量为 13 的样本 , 两样本独立 , 对于假设检验
设显著水平为 0.05, 则检验的拒绝域为 ( )
.A 2 20.05450 (9)S
1 2,
0 1 2 1 2: 2 2H
21
0.0522
2 (10,12)S
FS
.B
.D.C 2 2 2 20.975 0.025450 (9) 450 (9)S S 或2 2
0.95450 (9)S
2 20.05500 (10)S
21 1( , )X N 2
2 2( , )Y N
X
.A .B21
0.9522
1(10,12)
4
SF
S
.C .D21
0.0522
4 (10,12)S
FS
21
0.0522
1(10,12)
2
SF
S
5. 某青工以往的记录时 : 平均每加工 100 个零件 , 有 60 件是一等
品 ,今年考核他 , 在他加工的零件中随机抽取 100 件 , 发现有 70 件是
一等品 , 这个成绩是否证明该青工的技术水平有了显著提高
? 对此问题 , 假设检验问题应该是 ( )
6. 设总体 , 其中 未知 ,从总体 抽取容量为 15
的样本 , 对于假设检验若显著水平为 0.01, 则检验的拒绝域为 ( )
0 : 0.6 0.6H p p
( 0.05)
2( , )X N
.A
.D.C
.B
0 : 0.6 0.6H p p 0 : 0.6 0.6H p p
0 : 0.6 0.6H p p
X
0.01
( 100)15 (14)
xt
S
.A .B
.C .D
0.01
( 100)14 (14)
xt
S
0.01
( 100)15 (14)
xt
S
0.01
( 100)15 (15)
xt
S
三 . 计算和证明题
1. 化肥厂用自动包装包装化肥 , 某日测得 9包化肥的质量 ( 单位 :
Kg) 如下 :
49.7 49.8 50.3 50.5 49.7 50.1 49.9 50.5 50.4
设每包化肥的质量服从正态分布 , 是否可以认为每包化肥的平均质
量是 50kg( 0.05)?
2.从某工厂生产的产品中抽取 200 件样品进行质量检查 , 发现有
9 件不合格品问是否可以认为该工厂产品的不合格品率不大于 3%
3. 某农业研究所为了研究某种化肥对农作物的效力 , 在 13 个小
区进行试验得到农作物的单位面积产量 (kg) 如下 :
未施肥小区 :29,27,32,31,28,32,31
施化肥小区 :34,35,32,33,34,30
( 0.05)?
问施用该化肥能显著提高农作物单位面积产量吗 ?
4. 某船厂根据以往的资料知道 , 本厂生产的农用船只分别以 20%,
28%,8%,12% 和 32% 的比例卖给 A,B,C,D,E五个地区 ,从今年生产的
农用船只中 , 观察到其中 500艘分别售于上述 5 个地区 120,123,43,
66,148艘 , 问今年这 5 个地区的销售比例与以往是否有显著不同
5. 设总体 , 其中 未知 ,从总体 抽取容量为
的样本 , 检验下面的假设 :
取假设统计量
拒绝域 , 则在 成立时 , 有
( 0.05)?
2 20( 1)P n H
22
20
( 1)n S
2( , )X N X
2 2 2 20 0 1 0: :H H
2 2 ( 1)W n 0H
自测题八 (A)
一 .填空题
1.
2.
3.
4.
2 2 2 21 2 0.025 0.9752 2
1 10 0
1 1, , , : ( ) ( ) ( ) ( )
n n
n i ii i
X X X X n X n
2 22 2
1 2 0.025 0.9752 20 0
( 1) ( 1){ , , , : ( 1) ( 1)}n
n S n SX X X n n
1 0 0 1{ } { }P H H P H H接受 成立 接受 成立 n
21
1 222
{ ( 1, 1)S
F F F n nS
1 21 2
1 2 2
( ), { ( 2)}
w
n nx yt t n n
S n n
增大样本容量
5.
6.
2 21 2
1 2
( ) (0,1)x y Nn n
21 1
11 2
22 2
1
( ){ ( , )}
( )
n
iin
ii
x nF W F F n n
y n
二 .选择题
1. B 2. A 3. A 4. C 5. B 6. B
三 . 计算和证明题
2.
因 ,故接受 。0.05u u
0 1
0.05
: 0.03 : 0.03
0.045 0.030.045, 200 1.244
0.03 0.970.05, 1.645
H p H p
p u
u
0H
1.
接受 。0H
0 1
0.025 0.025
: 50 : 50
(50.1 50)9 0.896
0.335(8) 2.31, (8)
H H
t
t t t
3. ( 1 )
因故接受 ,即认为 。
( 2 )
因 ,故拒绝 。
2 2 2 20 1 2 1 1 2
2 21 1 2 2
0.025
: :
4.07, 3, 40, 6, 33, 32, 1.25
3.20.05 (6,5) 6.98
H H
n x s n y s F
F
0.025 (6,5)F F
0H 2 21 2
0 1 2 1 1 2
0.05
: :
30 33 422.83
136 4 5 3.211
0.05 (11) 1.7959
H H
t
t
0.05 (11)t t 0H
4. 为
因 ,故接受 。
2 2 2 2 22
20.05
(120 100) (123 140) (43 40) (66 60) (148 160)
100 140 40 60 1604 2.064 0.225 0.6 0.9
7.789
0.05 (4) 9.488
2 20.05 (4) 9.488
0H
0H
地区 A B C D E
地区 A B C D E
P 0.2 0.28 0.08 0.12 0.32
频数分布为
频数 120 123 43 66 148理论频数 100 140 40 60 160
5. ( 1 )若 ,则
故对显著水平
( 2 )若 ,则
故对显著水平
因当 时
故
2 20
22 2
20
( 1)( 1)
n Sn
2 2 2 20{ ( 1) }P n
2 20
22 21 2
( 1)( 1)
n Sn
2 21{ ( 1)}P n
2 20
22 21 2
( 1)n S
2 2 2 21{ ( 1)} { ( 1)}P n P n
自测题八 ( B )
1. 某种产品的长度 ,从中抽取任意 9 件测得
,请检验 。
2. 某测距仅在 的范围内,测距精度 ,今时距离为
的目标测量 9 次,得到平均距离为 ,问:该测距
仪是否存在系统误差?
( ) ( , 4)X cm N
22X cm 0 : 23H cm ( 0.05)
500m 10m
510X m500m
( 0.05)
3. 某产品的质量 ,从中任意抽取 9 件,测得其质
量分别为:98 , 97 , 103 , 96 , 100 , 104 , 102 , 94 , 97
厂标规定该种产品期望为 ,方差不大于 时才能出厂,问:该批产品是否符合出厂要求。
4. 某打包机包装洗衣粉,每包洗衣粉质量 ,每包
洗衣粉的额定质量为 ,今从中抽取 9袋,测得其质量为:498 , 506 , 492 , 514 , 516 , 494 , 512 , 496 , 508
问:今日打包机工作是否正常?
2( ) ( , )X g N
100g
500g
( 0.05)
( 0.05)
4g
2( ) ( , )X g N
5. 某产品长度 ,根据过去资料知其加工精度 ,
今从中抽取 10 件,测得样本方差 ,问:是否可以认为今日该产品长度的精度没有改变。6. 为了研究一种新化肥对种植小麦的效力,小麦的产量都服从正
态分布,选用 13块条件相同面积相等的土地进行试验 。各
块土地产量(单位: )如下:
施肥的: 34 , 35 , 30 , 33 , 34 , 32
未施肥的: 29 , 27 , 32 , 28 , 32 , 31 , 31
( 1 )问:这种化肥对小麦产量是否有显著影响?
( 2 )试检验 是否成立。
2( , )X N 2 20
2 25S
2 21 2
( 0.05)
kg
( 0.05)
1. 接受自测题八参考答案 ( B )
2. 存在系统误差3. 期望符合出厂要求;方差不符合出厂要求;根据厂标不能
出厂。4. 正常5. 没有改变6. ( 1 )有 ( 2 )接受