第七章 假设检验
description
Transcript of 第七章 假设检验
7 - 7 - 11
三峡大学理学院于 林
数理统计 第七章 假设检验第七章 假设检验
统计学
7 - 7 - 22
三峡大学理学院于 林
数理统计 第七章 假设检验第七章 假设检验
第一节 假设检验的一般问题 第一节 假设检验的一般问题 第二节 一个正态总体的参数检验第二节 一个正态总体的参数检验第三节 两个正态总体的参数检验第三节 两个正态总体的参数检验第四节 假设检验中的其他问题第四节 假设检验中的其他问题
7 - 7 - 33
三峡大学理学院于 林
数理统计 假设检验在统计方法中的地位假设检验在统计方法中的地位
统计方法
描述统计 推断统计
参数估计 假设检验
7 - 7 - 44
三峡大学理学院于 林
数理统计 学习目标学习目标
1.1. 了解假设检验的基本思想 了解假设检验的基本思想 2.2. 掌握假设检验的步骤掌握假设检验的步骤3.3. 能对实际问题作假设检验能对实际问题作假设检验4.4. 利用置信区间进行假设检验利用置信区间进行假设检验5.5. 利用利用 P P - - 值进行假设检验值进行假设检验
7 - 7 - 55
三峡大学理学院于 林
数理统计 第一节 假设检验的一般问题第一节 假设检验的一般问题
.壹.壹 假设检验的概念假设检验的概念
.贰.贰 假设检验的步骤假设检验的步骤
.叁.叁 假设检验中的小概率原理假设检验中的小概率原理
.肆.肆 假设检验中的两类错误假设检验中的两类错误
.伍.伍 双侧检验和单侧检验双侧检验和单侧检验
7 - 7 - 66
三峡大学理学院于 林
数理统计
假设检验的概念与思想假设检验的概念与思想
7 - 7 - 77
三峡大学理学院于 林
数理统计 什么是假设什么是假设 ??
对总体参数的一种看法对总体参数的一种看法 总体参数包括总体参数包括总体均值总体均值
、、比例比例、、方差方差等等 分析分析之前之前必需陈述必需陈述
我认为该企业生产的零我认为该企业生产的零件的平均长度为件的平均长度为 44 厘米厘米 !!
7 - 7 - 88
三峡大学理学院于 林
数理统计 什么是假设检验?什么是假设检验?
1.1. 概念概念 事先对总体参数或分布形式作出某种假设事先对总体参数或分布形式作出某种假设 然后利用样本信息来判断原假设是否成立然后利用样本信息来判断原假设是否成立
2.2. 类型类型 参数假设检验参数假设检验 非参数假设检验非参数假设检验
3.3. 特点特点 采用逻辑上的反证法采用逻辑上的反证法 依据统计上的小概率原理依据统计上的小概率原理
7 - 7 - 99
三峡大学理学院于 林
数理统计 假设检验的基本思想假设检验的基本思想
... ... 因此我们拒因此我们拒绝假设 绝假设 = 50= 50... ... 因此我们拒因此我们拒绝假设 绝假设 = 50= 50
... ... 如果这是总如果这是总体的真实均值体的真实均值... ... 如果这是总如果这是总体的真实均值体的真实均值
样本均值样本均值样本均值样本均值 = 50 = 50
抽样分布抽样分布抽样分布抽样分布
HH00HH00
这个值不像我这个值不像我们应该得到的们应该得到的样本均值 样本均值 ......
这个值不像我这个值不像我们应该得到的们应该得到的样本均值 样本均值 ......
20202020
7 - 7 - 1010
三峡大学理学院于 林
数理统计
总体总体
假设检验的过程假设检验的过程(提出假设→抽取样本→作出决策)(提出假设→抽取样本→作出决策)
抽取随机样本抽取随机样本
均值均值 X X = 20= 20
我认为人口的平均年龄是 50岁 我认为人口的平均年龄是 50岁
提出假设提出假设
拒绝假设 !
别无选择 .
拒绝假设 !
别无选择 .
作出决策作出决策
7 - 7 - 1111
三峡大学理学院于 林
数理统计
假设检验的步骤假设检验的步骤 提出原假设和备择假设提出原假设和备择假设 确定适当的检验统计量确定适当的检验统计量
规定显著性水平规定显著性水平
计算检验统计量的值计算检验统计量的值 作出统计决策作出统计决策
7 - 7 - 1212
三峡大学理学院于 林
数理统计 提出原假设和备择假设提出原假设和备择假设
什么是原假设?什么是原假设? (Null Hypothesis)(Null Hypothesis)
1.1. 待检验的假设,又称“待检验的假设,又称“ 00 假设”假设”2.2. 如果错误地作出决策会导致一系列后果如果错误地作出决策会导致一系列后果3.3. 总是有等号 总是有等号 , , 或或4.4. 表示为 表示为 HH00
HH00 :: 某一数值 某一数值 指定为 指定为 = = 号,即 号,即 或 或 例如例如 , H, H00 :: 31903190 (克)(克)
为什么叫0假设
为什么叫0假设
7 - 7 - 1313
三峡大学理学院于 林
数理统计
什么是备择假设?什么是备择假设? (Alternative Hypothesis)(Alternative Hypothesis)
1.1. 与原假设对立的假设与原假设对立的假设2.2. 总是有不等号总是有不等号 :: ,, 或 或 3.3. 表示为 表示为 HH11
HH11 :: << 某一数值,或某一数值,或某一数值某一数值 例如例如 , H, H11 :: < 3910(< 3910( 克克 )) ,或,或克克
提出原假设和备择假设提出原假设和备择假设
7 - 7 - 1414
三峡大学理学院于 林
数理统计
什么检验统计量?什么检验统计量?1.1. 用于假设检验问题的统计量用于假设检验问题的统计量2.2. 选择统计量的方法与参数估计相同,需考虑选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本是大样本还是小样本 总体方差已知还是未知总体方差已知还是未知
3.3. 检验统计量的基本形式为检验统计量的基本形式为
确定适当的检验统计量确定适当的检验统计量
n
xz
0
n
xz
0
7 - 7 - 1515
三峡大学理学院于 林
数理统计 规定显著性水平规定显著性水平
什么显著性水平?什么显著性水平?1.1. 是一个概率值是一个概率值2.2. 原假设为真时,拒绝原假设的概率原假设为真时,拒绝原假设的概率
被称为抽样分布的拒绝域被称为抽样分布的拒绝域
3.3. 表示为 表示为 (alpha)(alpha) 常用的 常用的 克克克克 0.01, 0.05, 0.100.01, 0.05, 0.10
4.4. 由研究者事先确定由研究者事先确定
7 - 7 - 1616
三峡大学理学院于 林
数理统计 作出统计决策作出统计决策
1.1. 计算检验的统计量计算检验的统计量2.2. 根据给定的显著性水平根据给定的显著性水平克克克克克克克克克克克克克克克克克克克克克克克克
3.3. 将检验统计量的值与将检验统计量的值与克克克克克克克克克克克克克克克克克克克克4.4. 得出接受或拒绝原假设的结论得出接受或拒绝原假设的结论
7 - 7 - 1717
三峡大学理学院于 林
数理统计
假设检验中的小概率原理假设检验中的小概率原理
7 - 7 - 1818
三峡大学理学院于 林
数理统计 假设检验中的小概率原理假设检验中的小概率原理
什么小概率?什么小概率?1.1. 在一次试验中,一个几乎不可能发生的在一次试验中,一个几乎不可能发生的
事件发生的概率事件发生的概率2.2. 在一次试验中小概率事件一旦发生,我在一次试验中小概率事件一旦发生,我
们就有理由拒绝原假设们就有理由拒绝原假设3.3. 小概率由研究者事先确定小概率由研究者事先确定
什么是小概率什么是小概率
7 - 7 - 1919
三峡大学理学院于 林
数理统计 汉乐府中的小概率事件汉乐府中的小概率事件
上邪上邪 ! ! 我欲与君相知,我欲与君相知,长命无绝衰。长命无绝衰。山无陵,江水为之竭,山无陵,江水为之竭,冬雷震震,夏雨雪,冬雷震震,夏雨雪,天地合,天地合,乃敢与君绝! 乃敢与君绝!
上邪上邪 ! ! 我欲与君相知,我欲与君相知,长命无绝衰。长命无绝衰。山无陵,江水为之竭,山无陵,江水为之竭,冬雷震震,夏雨雪,冬雷震震,夏雨雪,天地合,天地合,乃敢与君绝! 乃敢与君绝!
7 - 7 - 2020
三峡大学理学院于 林
数理统计
假设检验中的两类错误假设检验中的两类错误
(决策风险)(决策风险)
7 - 7 - 2121
三峡大学理学院于 林
数理统计 假设检验中的两类错误假设检验中的两类错误
1.1. 第一类错误(弃真错误)第一类错误(弃真错误) 原假设为真时拒绝原假设原假设为真时拒绝原假设 会产生一系列后果会产生一系列后果 第一类错误的概率为第一类错误的概率为
被称为显著性水平被称为显著性水平2.2. 第二类错误(取伪错误)第二类错误(取伪错误)
原假设为假时接受原假设原假设为假时接受原假设 第二类错误的概率为第二类错误的概率为 (Beta)(Beta)
7 - 7 - 2222
三峡大学理学院于 林
数理统计
HH00: : 无罪无罪
假设检验中的两类错误假设检验中的两类错误(决策结果)(决策结果)
陪审团审判陪审团审判
裁决裁决实际情况实际情况
无罪无罪 有罪有罪
无罪无罪 正确正确 错误错误
有罪有罪 错误错误 正确正确
HH0 0 检验检验
决策决策实际情况实际情况
HH00 为真为真 HH00 为假为假
接受接受 HH00 1 - 1 - 第二类错第二类错误误 ((
拒绝拒绝 HH00第一类错第一类错
误误 ((功效功效 (1-(1-
假设检验就好像一场审判过程假设检验就好像一场审判过程假设检验就好像一场审判过程假设检验就好像一场审判过程 统计检验过程统计检验过程统计检验过程统计检验过程
7 - 7 - 2323
三峡大学理学院于 林
数理统计 错误和 错误和 错误的关系 错误的关系
你不能同时减少两类错误 !
克克克克克克克克克克克克克克克克克克克克小小克克克克克克大大克克克克
7 - 7 - 2424
三峡大学理学院于 林
数理统计 影响 影响 克克克克克克克克克克
1.1. 总体参数的真值总体参数的真值 随着假设的总体参数的减少而增大随着假设的总体参数的减少而增大
2.2. 显著性水平显著性水平 克克克克克克克克克克克克
3.3. 总体标准差 总体标准差 克克克克克克克克克克克克
4.4. 样本容量 样本容量 nn 当 当 n n 减少时增大减少时增大
7 - 7 - 2525
三峡大学理学院于 林
数理统计
双侧检验和单侧检验双侧检验和单侧检验
7 - 7 - 2626
三峡大学理学院于 林
数理统计双侧检验与单侧检验双侧检验与单侧检验
(( 克克克克克克克克克克 ))
假设研究的问题
双侧检验 左侧检验 右侧检验
H0 = =
H1 ≠≠ < < > >
7 - 7 - 2727
三峡大学理学院于 林
数理统计双侧检验双侧检验
(原假设与备择假设的确定)(原假设与备择假设的确定)
1.1. 双侧检验属于双侧检验属于决策中的假设检验决策中的假设检验。也就是说。也就是说,不论是拒绝,不论是拒绝 HH00 还是接受还是接受 HH00 ,我们都必需,我们都必需采取相应的行动措施采取相应的行动措施
2.2. 例如,某种零件的尺寸,要求其平均长度为例如,某种零件的尺寸,要求其平均长度为1010 厘米,大于或小于厘米,大于或小于 1010 厘米均属于不合格厘米均属于不合格
3.3. 建立的原假设与备择假设应为建立的原假设与备择假设应为 HH00: : 10 H 10 H11: : 10 10
7 - 7 - 2828
三峡大学理学院于 林
数理统计双侧检验双侧检验
(确定假设的步骤)(确定假设的步骤)
1. 1. 例如问题为例如问题为 : : 检验该企业生产的零件平均检验该企业生产的零件平均长度为长度为 44 厘米厘米
2.2. 步骤步骤 从统计角度陈述问题 从统计角度陈述问题 (( = 4) = 4) 从统计角度提出相反的问题 从统计角度提出相反的问题 (( 4) 4)
必需互斥和穷尽必需互斥和穷尽 提出原假设 提出原假设 (( = 4) = 4) 提出备择假设 提出备择假设 (( 4) 4)
有 有 符号符号
7 - 7 - 2929
三峡大学理学院于 林
数理统计
提出原假设提出原假设 : : HH00: : = 4 = 4
提出备择假设提出备择假设 : : HH11: : 4 4
该企业生产的零件平均长度是该企业生产的零件平均长度是 44 厘米吗厘米吗 ??
(( 属于决策中的假设属于决策中的假设 ))
双侧检验双侧检验(例子)(例子)
7 - 7 - 3030
三峡大学理学院于 林
数理统计双侧检验双侧检验
(显著性水平与拒绝域 )(显著性水平与拒绝域 )
抽样分布抽样分布抽样分布抽样分布
HH00 值值HH00 值值临界值临界值临界值临界值临界值临界值临界值临界值
/2 /2 /2/2 /2/2
样本统计量样本统计量样本统计量样本统计量
拒绝域拒绝域拒绝域拒绝域 拒绝域拒绝域拒绝域拒绝域
接受域接受域接受域接受域
1 - 1 - 1 - 1 -
置信水平置信水平置信水平置信水平
7 - 7 - 3131
三峡大学理学院于 林
数理统计双侧检验双侧检验
(显著性水平与拒绝域 )(显著性水平与拒绝域 )
HH00 值值临界值临界值临界值临界值
/2 /2/2
样本统计量样本统计量
拒绝域拒绝域 拒绝域拒绝域
接受域接受域
抽样分布抽样分布
1 - 1 -
置信水平置信水平
7 - 7 - 3232
三峡大学理学院于 林
数理统计双侧检验双侧检验
(显著性水平与拒绝域 )(显著性水平与拒绝域 )
HH00 值值临界值临界值临界值临界值
/2 /2/2
样本统计量样本统计量
拒绝域拒绝域 拒绝域拒绝域
接受域接受域
抽样分布抽样分布
1 - 1 -
置信水平置信水平
7 - 7 - 3333
三峡大学理学院于 林
数理统计双侧检验双侧检验
(显著性水平与拒绝域 )(显著性水平与拒绝域 )
HH00 值值 临界值临界值临界值临界值
/2 /2/2
样本统计量样本统计量
拒绝域拒绝域 拒绝域拒绝域
接受域接受域
抽样分布抽样分布
1 - 1 -
置信水平置信水平
7 - 7 - 3434
三峡大学理学院于 林
数理统计单侧检验单侧检验
(原假设与备择假设的确定)(原假设与备择假设的确定)
检验检验研究中的假设研究中的假设1.1. 将所研究的假设作为备择假设将所研究的假设作为备择假设 HH11
2.2. 将认为研究结果是无效的说法或理论作将认为研究结果是无效的说法或理论作为原假设为原假设 HH00 。或者说,把希望。或者说,把希望 (( 想要想要 ))
证明的假设作为备择假设证明的假设作为备择假设3.3. 先确立备择假设先确立备择假设 HH11
7 - 7 - 3535
三峡大学理学院于 林
数理统计单侧检验单侧检验
(原假设与备择假设的确定)(原假设与备择假设的确定)
例如,采用新技术生产后,将会使产品的例如,采用新技术生产后,将会使产品的使用寿命明显延长到使用寿命明显延长到 15001500 小时以上小时以上 属于研究中的假设属于研究中的假设 建立的原假设与备择假设应为建立的原假设与备择假设应为
HH00: : 1500 H 1500 H11: : 1500 1500 例如,改进生产工艺后,会使产品的废品例如,改进生产工艺后,会使产品的废品
率降低到率降低到 2%2%以下以下 属于研究中的假设属于研究中的假设 建立的原假设与备择假设应为建立的原假设与备择假设应为
HH00: : 2% H2% H11: : 2% 2%
7 - 7 - 3636
三峡大学理学院于 林
数理统计单侧检验单侧检验
(原假设与备择假设的确定)(原假设与备择假设的确定)
检验检验某项声明的有效性某项声明的有效性1.1. 将所作出的说明将所作出的说明 (( 声明声明 )) 作为原假设作为原假设2.2. 对该说明的质疑作为备择假设对该说明的质疑作为备择假设3.3. 先确立原假设先确立原假设 HH00
除非我们有证据表明“声明”无效,否则除非我们有证据表明“声明”无效,否则就应认为该“声明”是有效的就应认为该“声明”是有效的
7 - 7 - 3737
三峡大学理学院于 林
数理统计单侧检验单侧检验
(原假设与备择假设的确定)(原假设与备择假设的确定)
例如,某灯泡制造商声称,该企业所生产例如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在的灯泡的平均使用寿命在 10001000 小时以上小时以上 除非样本能提供证据表明使用寿命在除非样本能提供证据表明使用寿命在 10001000
小时以下,否则就应认为厂商的声称是正确小时以下,否则就应认为厂商的声称是正确的的
建立的原假设与备择假设应为建立的原假设与备择假设应为 HH00: : 1000 H 1000 H11: : 10001000
7 - 7 - 3838
三峡大学理学院于 林
数理统计
提出原假设提出原假设 : : HH00: : 1000 1000
选择备择假设选择备择假设 : : HH11: : 1000 1000
该批产品的平均使用寿命超过该批产品的平均使用寿命超过 10001000 小时吗小时吗??
(( 属于检验声明的有效性,先提出原假设属于检验声明的有效性,先提出原假设 ))
单侧检验单侧检验(例子)(例子)
7 - 7 - 3939
三峡大学理学院于 林
数理统计
提出原假设提出原假设 : : HH00: : 25 25
选择备择假设选择备择假设 : : HH11: : : : 25 25
学生中经常上网的人数超过学生中经常上网的人数超过 25%25% 吗吗 ??
(属于研究中的假设,先提出备择假设)(属于研究中的假设,先提出备择假设)
单侧检验单侧检验(例子)(例子)
7 - 7 - 4040
三峡大学理学院于 林
数理统计单侧检验单侧检验
(显著性水平与拒绝域 )(显著性水平与拒绝域 )
HH00 值值临界值临界值
样本统计量样本统计量
拒绝域拒绝域
接受域接受域
抽样分布抽样分布
1 - 1 -
置信水平置信水平
7 - 7 - 4141
三峡大学理学院于 林
数理统计左侧检验左侧检验
(显著性水平与拒绝域 )(显著性水平与拒绝域 )
HH00 值值HH00 值值临界值临界值临界值临界值
样本统计量样本统计量样本统计量样本统计量
拒绝域拒绝域拒绝域拒绝域
接受域接受域接受域接受域
抽样分布抽样分布抽样分布抽样分布
1 - 1 - 1 - 1 -
置信水平置信水平置信水平置信水平
观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量
7 - 7 - 4242
三峡大学理学院于 林
数理统计左侧检验左侧检验
(显著性水平与拒绝域 )(显著性水平与拒绝域 )
HH00 值值HH00 值值临界值临界值临界值临界值
样本统计量样本统计量样本统计量样本统计量
拒绝域拒绝域拒绝域拒绝域
接受域接受域接受域接受域
抽样分布抽样分布
1 - 1 - 1 - 1 -
置信水平置信水平
7 - 7 - 4343
三峡大学理学院于 林
数理统计右侧检验右侧检验
(显著性水平与拒绝域 )(显著性水平与拒绝域 )
HH00 值值HH00 值值临界值临界值临界值临界值
样本统计量样本统计量样本统计量样本统计量
拒绝域拒绝域拒绝域拒绝域
接受域接受域接受域接受域
抽样分布抽样分布抽样分布抽样分布
1 - 1 - 1 - 1 -
置信水平置信水平置信水平置信水平
观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量
7 - 7 - 4444
三峡大学理学院于 林
数理统计右侧检验右侧检验
(显著性水平与拒绝域 )(显著性水平与拒绝域 )
HH00 值值HH00 值值临界值临界值临界值临界值
样本统计量样本统计量样本统计量样本统计量
接受域接受域接受域接受域
抽样分布抽样分布
1 - 1 - 1 - 1 -
置信水平置信水平
拒绝域拒绝域拒绝域拒绝域
7 - 7 - 4545
三峡大学理学院于 林
数理统计 第二节 一个正态总体的参数检验第二节 一个正态总体的参数检验
一一 . . 总体方差已知时的均值检验总体方差已知时的均值检验二二 . . 总体方差未知时的均值检验总体方差未知时的均值检验三三 . . 总体比例的假设检验总体比例的假设检验
7 - 7 - 4646
三峡大学理学院于 林
数理统计 一个总体的检验一个总体的检验
Z 检验(单尾和双尾)
Z 检验(单尾和双尾)
t 检验(单尾和双尾)
t 检验(单尾和双尾)
Z 检验(单尾和双尾)
Z 检验(单尾和双尾)
检验(单尾和双尾)
检验(单尾和双尾)
均值均值
一个总体一个总体
比例比例 方差方差
7 - 7 - 4747
三峡大学理学院于 林
数理统计 检验的步骤检验的步骤
陈述原假设 陈述原假设 HH00
陈述备择假设 陈述备择假设 HH11
选择显著性水平 选择显著性水平 选择检验统计量选择检验统计量 选择选择 nn
给出临界值给出临界值 搜集数据搜集数据 计算检验统计量计算检验统计量 进行统计决策进行统计决策 表述决策结果表述决策结果
7 - 7 - 4848
三峡大学理学院于 林
数理统计
总体方差已知时的均值检验总体方差已知时的均值检验(( 双尾 双尾 ZZ 检验检验 ))
7 - 7 - 4949
三峡大学理学院于 林
数理统计 一个总体的检验一个总体的检验
Z 检验(单尾和双尾)
Z 检验(单尾和双尾)
t 检验(单尾和双尾)
t 检验(单尾和双尾)
Z 检验(单尾和双尾)
Z 检验(单尾和双尾)
检验(单尾和双尾)
检验(单尾和双尾)
均值均值
一个总体一个总体
比例比例 方差方差
7 - 7 - 5050
三峡大学理学院于 林
数理统计均值的双尾 均值的双尾 ZZ 检验检验
(( 已知已知 ))
1.1. 假定条件假定条件 总体服从正态分布总体服从正态分布 若不服从正态分布若不服从正态分布 , , 可用正态分布来近似可用正态分布来近似 ((nn
30)30)2.2. 原假设为原假设为 ::HH00: : ==00;;备择假设为备择假设为 ::HH11::
00
3.3. 使用使用 zz-- 统计量统计量)1,0(~0 N
n
xz
)1,0(~0 Nn
xz
7 - 7 - 5151
三峡大学理学院于 林
数理统计均值的双尾 均值的双尾 ZZ 检验检验
(( 实例实例 ))
【例】【例】 某机床厂加工一种零件,根某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值度近似服从正态分布,其总体均值为为 00=0.081mm=0.081mm ,总体标准差为,总体标准差为 ==
。今换一种新机床进行加工。今换一种新机床进行加工,抽取,抽取 nn=200=200 个零件进行检验,得个零件进行检验,得到的椭圆度为到的椭圆度为 0.0760.076mmmm 。试问新机。试问新机床加工零件的椭圆度的均值与以前床加工零件的椭圆度的均值与以前有无显著差异?(有无显著差异?(== 0.050.05 ))
属于决策中属于决策中的假设!的假设!
7 - 7 - 5252
三峡大学理学院于 林
数理统计均值的双尾 均值的双尾 Z Z 检验检验
((计算结果)计算结果)
HH00:: = 0.081 = 0.081
HH11: : 0.081 0.081
== 0.050.05
nn == 200200
临界值临界值 (s):(s):
检验统计量检验统计量 ::
ZZ00 1.961.96-1.96-1.96
.025.025
拒绝 拒绝 HH00 拒绝 拒绝 HH00
.025.025
决策决策 ::
结论结论 ::
拒绝拒绝 HH00
有证据表明新机床加工的零件有证据表明新机床加工的零件的椭圆度与以前有显著差异的椭圆度与以前有显著差异
83.2200025.0
081.0076.00
n
xz
83.2200025.0
081.0076.00
n
xz
7 - 7 - 5353
三峡大学理学院于 林
数理统计
总体方差已知时的均值检验总体方差已知时的均值检验(( 单尾 单尾 Z Z 检验检验 ))
7 - 7 - 5454
三峡大学理学院于 林
数理统计均值的单尾 均值的单尾 Z Z 检验检验
(( 已知已知 ))
1.1. 假定条件假定条件 总体服从正态分布总体服从正态分布 若不服从正态分布,可以用正态分布来若不服从正态分布,可以用正态分布来近似 近似 ((nn30)30)
2.2. 备择假设有备择假设有 << 或或 >> 符号符号3.3. 使用使用 zz-- 统计量统计量
)1,0(~0 Nn
xz
)1,0(~0 Nn
xz
7 - 7 - 5555
三峡大学理学院于 林
数理统计均值的单尾 均值的单尾 Z Z 检验检验
(提出假设)(提出假设)
左侧:左侧: HH00:: H H11::< <
必须是必须是显著地显著地 低于 低于 克克克克克克克克克克克克HH0 0 克克克克克克克克克克
ZZ00
拒绝 拒绝 HH00
右侧:右侧: HH00:: H H11: : > >
必须必须显著地显著地大于大于克克小的值小的值满足 满足 HH0 0 ,不能拒绝,不能拒绝
ZZ00
拒绝 拒绝 HH00
7 - 7 - 5656
三峡大学理学院于 林
数理统计均值的单尾均值的单尾 ZZ 检验 检验
(实例)(实例)
【例】【例】某批发商欲从生产厂家某批发商欲从生产厂家购进一批灯泡,根据合同规定购进一批灯泡,根据合同规定,灯泡的使用寿命平均不能低,灯泡的使用寿命平均不能低于于 10001000 小时。已知灯泡使用小时。已知灯泡使用寿命服从正态分布,标准差为寿命服从正态分布,标准差为2020 小时。在总体中随机抽取小时。在总体中随机抽取 110000 只灯泡,测得样本均值为只灯泡,测得样本均值为 996060 小时。批发商是否应该购买小时。批发商是否应该购买这批灯泡? 这批灯泡? ((== 0.050.05))
属于检验声明属于检验声明的有效性!的有效性!
7 - 7 - 5757
三峡大学理学院于 林
数理统计均值的单尾均值的单尾 ZZ 检验 检验
(计算结果)(计算结果)
HH00: : 1000 1000
HH11: : < 1000 < 1000
== 00.05.05
n n == 100100
临界值临界值 (s):(s):
检验统计量检验统计量 : :
在 在 = 0.05= 0.05 的水平上拒绝的水平上拒绝 HH00
有证据表明这批灯泡的使用有证据表明这批灯泡的使用寿命低于寿命低于 10001000 小时小时
决策决策::
结论结论::
210020
10009600
n
xz
210020
10009600
n
xz
-1.645-1.645 ZZ00
拒绝域拒绝域
7 - 7 - 5858
三峡大学理学院于 林
数理统计均值的单尾均值的单尾 ZZ 检验 检验
(实例)(实例)
【例】【例】 根据过去大量资料,根据过去大量资料,某厂生产的灯泡的使用寿命某厂生产的灯泡的使用寿命服从正态分布服从正态分布 N~N~((10201020 ,, 10100022)) 。现从最近生产的一批产。现从最近生产的一批产品中随机抽取品中随机抽取 1616 只只,测得样,测得样本平均寿命为本平均寿命为 10801080 小时。试小时。试在在 0.050.05 的显著性水平下判断的显著性水平下判断这批产品的使用寿命是否有这批产品的使用寿命是否有显著提高?显著提高? (( == 0.050.05))
属于研究中属于研究中的假设!的假设!
7 - 7 - 5959
三峡大学理学院于 林
数理统计均值的单尾均值的单尾 ZZ 检验 检验
(计算结果)(计算结果)
HH00:: 1020 1020
HH11: : > 1020 > 1020
== 0.050.05
nn == 1616
临界值临界值 (s):(s):
检验统计量检验统计量 : :
在 在 = 0.05= 0.05 的水平上拒绝的水平上拒绝 HH00
有证据表明这批灯泡的使用有证据表明这批灯泡的使用寿命有显著提高寿命有显著提高
决策决策::
结论结论::
4.214100
102010800
n
xz
4.214100
102010800
n
xz
ZZ00
拒绝域拒绝域
0.050.05
1.6451.645
7 - 7 - 6060
三峡大学理学院于 林
数理统计
总体方差未知时的均值检验总体方差未知时的均值检验(( 双尾 双尾 tt 检验检验 ))
7 - 7 - 6161
三峡大学理学院于 林
数理统计 一个总体的检验一个总体的检验
Z 检验(单尾和双尾)
Z 检验(单尾和双尾)
t 检验(单尾和双尾)
t 检验(单尾和双尾)
Z 检验(单尾和双尾)
Z 检验(单尾和双尾)
检验(单尾和双尾)
检验(单尾和双尾)
均值均值
一个总体一个总体
比例比例 方差方差
7 - 7 - 6262
三峡大学理学院于 林
数理统计均值的双尾 均值的双尾 t t 检验检验
(( 未知未知 ))
1.1. 假定条件假定条件 总体为正态分布总体为正态分布 如果不是正态分布如果不是正态分布 , , 只有轻微偏斜和大只有轻微偏斜和大
样本 样本 ((nn 30)30)条件下条件下
2.2. 使用使用 tt 统计量统计量
)1(~0
ntns
xt
)1(~0
nt
ns
xt
7 - 7 - 6363
三峡大学理学院于 林
数理统计均值的双尾 均值的双尾 t t 检验检验
(实例)(实例)
【例】【例】 某厂采用自动包装某厂采用自动包装机分装产品,假定每包产机分装产品,假定每包产品的重量服从正态分布,品的重量服从正态分布,每包标准重量为每包标准重量为 10001000 克。克。某日随机抽查某日随机抽查 99 包,测得包,测得样本平均重量为样本平均重量为 986986 克,克,样本标准差为样本标准差为 2424 克。试问克。试问在在 0.050.05 的显著性水平上,的显著性水平上,能否认为这天自动包装机能否认为这天自动包装机工作正常?工作正常?
属于决策中属于决策中的假设!的假设!
7 - 7 - 6464
三峡大学理学院于 林
数理统计均值的双尾 均值的双尾 t t 检验检验
(计算结果)(计算结果)
HH00: : = 1000 = 1000
HH11:: 1000 1000
= 0.05= 0.05
df df = 9= 9 - 1 = 8 - 1 = 8临界值临界值 (s):(s):
检验统计量检验统计量 : :
在 在 = 0.05= 0.05 的水平上接受的水平上接受 HH
00
有证据表明这天自动包装机有证据表明这天自动包装机工作正常工作正常
决策:决策:
结论:结论:
75.1924
10009860
ns
xt
75.1
924
10009860
ns
xt
tt00 2.3062.306-2.306-2.306
.025.025
拒绝 拒绝 HH00 拒绝 拒绝 HH00
.025.025
7 - 7 - 6565
三峡大学理学院于 林
数理统计
总体方差未知时的均值检验总体方差未知时的均值检验(( 单尾 单尾 t t 检验检验 ))
7 - 7 - 6666
三峡大学理学院于 林
数理统计均值的单尾 均值的单尾 t t 检验检验
(实例)(实例)
【例】【例】一个汽车轮胎制造商声一个汽车轮胎制造商声称,某一等级的轮胎的平均寿命称,某一等级的轮胎的平均寿命在一定的汽车重量和正常行驶条在一定的汽车重量和正常行驶条件下件下大于大于 4000040000 公里,对一个由公里,对一个由2020 个轮胎组成的随机样本作了试个轮胎组成的随机样本作了试验,测得平均值为验,测得平均值为 4100041000 公里,公里,标准差为标准差为 50005000 公里。已知轮胎公里。已知轮胎寿命的公里数服从正态分布,我寿命的公里数服从正态分布,我们能否根据这些数据作出结论,们能否根据这些数据作出结论,该制造商的产品同他所说的标准该制造商的产品同他所说的标准相符?相符? (( = 0.05= 0.05))
属于检验声明有属于检验声明有效性的假设!效性的假设!
7 - 7 - 6767
三峡大学理学院于 林
数理统计均值的单尾 均值的单尾 t t 检验 检验
(计算结果)(计算结果)
HH00: : 40000 40000
HH11:: < 40000 < 40000
= 0.= 0.0505
df df = = 20 - 1 = 1920 - 1 = 19
临界值临界值 (s):(s):
检验统计量检验统计量 ::
在在 = 0.05= 0.05 的水平上接受的水平上接受 HH00
有证据表明轮胎使用寿命显著有证据表明轮胎使用寿命显著地大于地大于 4000040000公里公里
决策决策 ::
结论结论 ::
894.0205000
4000041000
0
ns
xt
894.0205000
4000041000
0
ns
xt
-1.7291-1.7291 tt00
拒绝域拒绝域
.05.05
7 - 7 - 6868
三峡大学理学院于 林
数理统计
总体比例的假设检验总体比例的假设检验(( ZZ 检验)检验)
7 - 7 - 6969
三峡大学理学院于 林
数理统计 适用的数据类型适用的数据类型
离散数据 克克克克
数值型数据
数 据
品质数据
7 - 7 - 7070
三峡大学理学院于 林
数理统计 一个总体的检验一个总体的检验
Z 检验(单尾和双尾)
Z 检验(单尾和双尾)
t 检验(单尾和双尾)
t 检验(单尾和双尾)
Z 检验(单尾和双尾)
Z 检验(单尾和双尾)
检验(单尾和双尾)
检验(单尾和双尾)
均值均值
一个总体一个总体
比例比例 方差方差
7 - 7 - 7171
三峡大学理学院于 林
数理统计 一个总体比例的 一个总体比例的 Z Z 检验检验
1.1. 假定条件假定条件 有两类结果有两类结果 总体服从二项分布总体服从二项分布 可用正态分布来近似可用正态分布来近似
2.2. 比例检验的 比例检验的 z z 统计量统计量
PP00 为假设的总体比例为假设的总体比例
)1,0(~)1(
ˆ
00
0 N
n
pp
ppz
)1,0(~)1(
ˆ
00
0 N
n
pp
ppz
7 - 7 - 7272
三峡大学理学院于 林
数理统计一个总体比例的 一个总体比例的 Z Z 检验检验
(实例)(实例)
【例】【例】 某研究者估计本某研究者估计本市居民家庭的电脑拥有市居民家庭的电脑拥有率为率为 30%30% 。现随机抽查。现随机抽查了了 200200 的家庭,其中的家庭,其中 6868个家庭拥有电脑。试问个家庭拥有电脑。试问研究者的估计是否可信研究者的估计是否可信? ? (( = = 0.050.05))
属于决策中属于决策中的假设!的假设!
7 - 7 - 7373
三峡大学理学院于 林
数理统计一个样本比例的 一个样本比例的 Z Z 检验检验
(结果)(结果)
HH00:: pp = 0.3 = 0.3
HH11: : pp 0.3 0.3
= 0.05= 0.05
nn = = 200200
临界值临界值 (s):(s):
检验统计量检验统计量 ::
在在 = 0.05= 0.05 的水平上接受的水平上接受 HH00
有证据表明研究者的估计可信有证据表明研究者的估计可信
决策决策 ::
结论结论 ::
234.1
200
7.03.0
3.034.0
)1(
ˆ
00
0
n
pp
ppz
234.1
200
7.03.0
3.034.0
)1(
ˆ
00
0
n
pp
ppz
ZZ00 1.961.96-1.96-1.96
.025.025
拒绝 拒绝 HH00 拒绝 拒绝 HH00
.025.025
7 - 7 - 7474
三峡大学理学院于 林
数理统计
总体方差的检验总体方差的检验((2 2 检验检验 ))
7 - 7 - 7575
三峡大学理学院于 林
数理统计 一个总体的检验一个总体的检验
Z 检验(单尾和双尾)
Z 检验(单尾和双尾)
t 检验(单尾和双尾)
t 检验(单尾和双尾)
Z 检验(单尾和双尾)
Z 检验(单尾和双尾)
检验(单尾和双尾)
检验(单尾和双尾)
均值均值
一个总体一个总体
比例比例 方差方差
7 - 7 - 7676
三峡大学理学院于 林
数理统计 方差的卡方 方差的卡方 ((22) ) 检验检验
1.1. 检验一个总体的方差或标准差检验一个总体的方差或标准差2.2. 假设总体近似服从正态分布假设总体近似服从正态分布3.3. 原假设为 原假设为 HH00: : 22 = = 00
22
4.4. 检验统计量检验统计量样本方差样本方差
假设的总体方差假设的总体方差
)1(~)1( 2
20
22
n
sn
)1(~)1( 2
20
22
n
sn
7 - 7 - 7777
三峡大学理学院于 林
数理统计卡方 卡方 ((22)) 检验检验
实例实例
【例】【例】 根据长期正常生产根据长期正常生产的资料可知,某厂所产维尼的资料可知,某厂所产维尼纶的纤度服从正态分布,其纶的纤度服从正态分布,其方差为方差为 0.00250.0025 。现从某日。现从某日产品中随机抽取产品中随机抽取 2020 根,测根,测得样本方差为得样本方差为 0.00420.0042 。试。试判断该日纤度的波动与平日判断该日纤度的波动与平日有无显著差异?有无显著差异? ((0.050.05 ) )
属于决策中属于决策中的假设!的假设!
7 - 7 - 7878
三峡大学理学院于 林
数理统计卡方 卡方 ((22) ) 检验 检验
计算结果计算结果HH00:: 22 = 0.0025 = 0.0025
HH11:: 22 0.0025 0.0025
= 0.= 0.0505
df df == 20 - 1 = 1920 - 1 = 19
临界值临界值 (s):(s):
统计量统计量 ::
在 在 = 0.05= 0.05 的水平上接受的水平上接受 HH
00
有证据表明该日纤度的波动比有证据表明该日纤度的波动比平时没有显著差异平时没有显著差异22220000 32.85232.85232.85232.8528.9078.9078.9078.907
/2 =.05/2 =.05 /2 =.05/2 =.05
决策决策 ::
结论结论 ::
92.310025.0
0042.0)120(
)1(20
22
sn
92.310025.0
0042.0)120(
)1(20
22
sn
7 - 7 - 7979
三峡大学理学院于 林
数理统计 第三节 两个正态总体的参数检验第三节 两个正态总体的参数检验
一一 . . 两个总体参数之差的抽样分布两个总体参数之差的抽样分布.贰.贰 两个总体均值之差的检验两个总体均值之差的检验.叁.叁 假设检验中相关样本的利用假设检验中相关样本的利用.肆.肆 两个总体比例之差的检验两个总体比例之差的检验
7 - 7 - 8080
三峡大学理学院于 林
数理统计 两个正态总体的参数检验两个正态总体的参数检验
两个总体的检验两个总体的检验
Z 检验( 大样本
)
Z 检验( 大样本
)
t 检验( 小样本
)
t 检验( 小样本
)
t 检验( 小样本
)
t 检验( 小样本
)
Z 检验Z 检验 F 检验F 检验
独立样本独立样本独立样本独立样本 配对样本配对样本配对样本配对样本
均值均值 比例比例 方差方差
7 - 7 - 8181
三峡大学理学院于 林
数理统计
两个独立样本的均值检验两个独立样本的均值检验
7 - 7 - 8282
三峡大学理学院于 林
数理统计 两个独立样本之差的抽样分布两个独立样本之差的抽样分布
1
1总体 12
2
总体 2
抽取简单随机样样本容量 n1
计算 X1
抽取简单随机样样本容量 n2
计算 X2
计算每一对样本的 X1-X2
所有可能样本的 X1-X2
抽样分布抽样分布
7 - 7 - 8383
三峡大学理学院于 林
数理统计两个总体均值之差的两个总体均值之差的 ZZ 检验检验
(( 克克
已知 已知 ))
1.1. 假定条件假定条件 两个样本是独立的随机样本两个样本是独立的随机样本 两个总体都是正态分布两个总体都是正态分布 若不是正态分布若不是正态分布 , , 可以用正态分布来近似可以用正态分布来近似 ((nn113300和 和 nn2230)30)
2.2. 原假设:原假设: HH00: : == ;;备择假设:备择假设: HH11: :
3.3. 检验统计量为检验统计量为 )1,0(~
)()(
2
22
1
21
2121 N
nn
xxz
)1,0(~
)()(
2
22
1
21
2121 N
nn
xxz
7 - 7 - 8484
三峡大学理学院于 林
数理统计两个总体均值之差的两个总体均值之差的 ZZ 检验检验
(( 克克克克克克克克克克 ))
假设研究的问题
没有差异有差异
均值 1 均值 2
均值 1 < 均值 2
均值 1 均值 2
均值 1 > 均值 2
H0
H1 μ– μμ– μ≠0≠0
μ– μμ– μ= 0= 0 μ – μμ – μ≥0≥0
μ – μμ – μ< 0< 0 μ – μμ – μ > 0> 0
μ – μμ – μ≤0≤0
7 - 7 - 8585
三峡大学理学院于 林
数理统计两个总体均值之差的两个总体均值之差的 ZZ 检验检验
(( 克克克克 ))
属于决策中属于决策中的假设!的假设!
【例】【例】有两种方法可用于制造某种以有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为产品其抗拉强度的标准差为 88 公斤,公斤,第二种方法的标准差为第二种方法的标准差为 1010 公斤。从公斤。从两种方法生产的产品中各抽取一个随两种方法生产的产品中各抽取一个随机样本,样本容量分别为机样本,样本容量分别为 nn11=32=32 ,, nn22
=40=40 ,测得,测得 xx22= = 5050 公斤,公斤, xx11= = 4444 公公斤。问这两种方法生产的产品平均抗斤。问这两种方法生产的产品平均抗拉强度是否有显著差别? 拉强度是否有显著差别? (( = 0.05 = 0.05))
7 - 7 - 8686
三峡大学理学院于 林
数理统计两个总体均值之差的两个总体均值之差的 ZZ 检验检验
((计算结果)计算结果)
HH00:: - - = 0 = 0
HH11: : - - 0 0
== 0.050.05
nn11 == 32 32 ,, nn22 = = 4040
临界值临界值 (s):(s):
检验统计量检验统计量 ::
决策决策 ::
结论结论 ::
拒绝拒绝 HH00
有证据表明两种方法生产的产有证据表明两种方法生产的产品其抗拉强度有显著差异品其抗拉强度有显著差异
83.2
40
100
32
64
04050)()(
2
22
1
21
2121
nn
xxz
83.2
40
100
32
64
04050)()(
2
22
1
21
2121
nn
xxz
ZZ00 1.961.96-1.96-1.96
.025.025
拒绝 拒绝 HH00 拒绝 拒绝 HH00
.025.025
7 - 7 - 8787
三峡大学理学院于 林
数理统计两个总体均值之差的 两个总体均值之差的 t t 检验检验
(( 克克
未知未知 ))
1.1. 检验具有等方差的两个总体的均值检验具有等方差的两个总体的均值2.2. 假定条件假定条件
两个样本是独立的随机样本两个样本是独立的随机样本 两个总体都是正态分布两个总体都是正态分布 两个总体方差未知但相等两个总体方差未知但相等
3.3. 检验统计量检验统计量
21
2121
11
)()(
nns
xxt
p
21
2121
11
)()(
nns
xxt
p
其中:其中:其中:其中:2
)1()1(
21
222
2112
nn
snsnS p 2
)1()1(
21
222
2112
nn
snsnS p
7 - 7 - 8888
三峡大学理学院于 林
数理统计两个总体均值之差的 两个总体均值之差的 tt 检验检验
(( 克克克克 ))
属于研究中属于研究中的假设!的假设!
【例】【例】一个车间研究用两种不同的一个车间研究用两种不同的工艺组装某种产品所用的时间是否相工艺组装某种产品所用的时间是否相同。让一个组的同。让一个组的 1010 名工人用第一种名工人用第一种工艺组装该产品,平均所需时间为工艺组装该产品,平均所需时间为 226.16.1 分钟,样本标准差为分钟,样本标准差为 1212 分钟;另分钟;另一组一组 88 名工人用第二种工艺组装,平名工人用第二种工艺组装,平均所需时间为均所需时间为 17.617.6 分钟,样本标准分钟,样本标准差为差为 10.510.5 分钟。已知用两种工艺组分钟。已知用两种工艺组装产品所用时间服从正态分布,且装产品所用时间服从正态分布,且
克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克克 (( = 0.05 = 0.05
))
7 - 7 - 8989
三峡大学理学院于 林
数理统计两个总体均值之差的 两个总体均值之差的 tt 检验检验
((计算结果)计算结果)
HH00: : - - 0 0
HH11:: - - > 0 > 0
= = 0.050.05
nn11 == 10 10 ,, nn22 == 88
临界值临界值 (s):(s):
检验统计量检验统计量 ::
决策决策 ::
结论结论 ::
接受接受 HH00
没有证据表明用第二种方法组没有证据表明用第二种方法组装更好装更好
576.1
8
1
10
137.11
06.171.26
11
)()(
21
2121
nns
xxt
p
576.1
8
1
10
137.11
06.171.26
11
)()(
21
2121
nns
xxt
p
tt00
拒绝域拒绝域
0.050.05
1.74591.7459
7 - 7 - 9090
三峡大学理学院于 林
数理统计
两个相关(配对或匹配)样本两个相关(配对或匹配)样本的均值检验的均值检验
假设检验中相关样本的利用假设检验中相关样本的利用
7 - 7 - 9191
三峡大学理学院于 林
数理统计两个总体均值之差的检验两个总体均值之差的检验
(配对样本的 (配对样本的 tt 检验)检验)
1.1. 检验两个相关总体的均值检验两个相关总体的均值 配对或匹配配对或匹配 重复测量 重复测量 ((前前 // 后后 ))
2.2. 利用相关样本可消除项目间的方差利用相关样本可消除项目间的方差3.3. 假定条件假定条件
两个总体都服从正态分布两个总体都服从正态分布 如果不服从正态分布,可用正态分布来近如果不服从正态分布,可用正态分布来近似 似 ((nn11 30 , 30 , nn2 2 30 ) 30 )
7 - 7 - 9292
三峡大学理学院于 林
数理统计配对样本的 配对样本的 tt 检验检验
(( 克克克克克克克克克克 ))
假设研究的问题
没有差异有差异
总体 1 总体 2
总体 1 < 总体 2
总体 1 总体 2
总体 1 > 总体 2
H0 D D == 0 0 D D 0 0 D D 0 0
H1 D D 00 DD< 0< 0 D D > 0> 0
注:注: DDii = = XX11ii - - XX22ii ,对第 ,对第 i i 对观察值对观察值
7 - 7 - 9393
三峡大学理学院于 林
数理统计配对样本的 配对样本的 tt 检验检验
(数据形式)(数据形式)
观察序号 样本 1 样本 2 差值1 x 11 x 21 D1 = x 11 - x 21
2 x 12 x 22 D1 = x 12 - x 22
i x 1i x 2i D1 = x 1i - x 2i
n x 1n x 2n D1 = x 1n- x 2n
7 - 7 - 9494
三峡大学理学院于 林
数理统计配对样本的 配对样本的 tt 检验检验
(检验统计量)(检验统计量)
样本均值样本均值 样本标准差样本标准差
自由度自由度 df df == nnD D - 1- 1
统计量统计量
DD
D
ns
Dxt 0
DD
D
ns
Dxt 0
D
n
ii
D n
Dx
1
D
n
ii
D n
Dx
1
1
)(1
2
D
n
iDi
D n
xDs
1
)(1
2
D
n
iDi
D n
xDs
7 - 7 - 9595
三峡大学理学院于 林
数理统计
【例】【例】一个以减肥为主要目标的健美俱乐部声称,一个以减肥为主要目标的健美俱乐部声称,参加其训练班至少可以使减肥者平均体重减重参加其训练班至少可以使减肥者平均体重减重 8.58.5公斤以上。为了验证该宣称是否可信,调查人员随公斤以上。为了验证该宣称是否可信,调查人员随机抽取了机抽取了 1010 名参加者,得到他们的体重记录如下名参加者,得到他们的体重记录如下表:表:
配对样本的 配对样本的 tt 检验检验(例子)(例子)
在 在 = 0.05= 0.05 的显著性水平下,调查结果是否支持的显著性水平下,调查结果是否支持该俱乐部的声称?该俱乐部的声称?
训练前 94.5 101 110 103.5 97 88.5 96.5 101 104 116.5
训练后 85 89.5 101.5 96 86 80.5 87 93.5 93 102
属于检验某属于检验某项声明的假项声明的假
设!设!
7 - 7 - 9696
三峡大学理学院于 林
数理统计
样本差值计算表样本差值计算表训练前 训练后 差值 Di
94.5
101
110
103.5
97
88.5
96.5
101
104
116.5
85
89.5
101.5
96
86
80.5
87
93.5
93
102
9.5
11.5
8.5
7.5
11
8
9.5
7.5
11
14.5
合计 — 98.5
配对样本的 配对样本的 tt 检验检验(计算表)(计算表)
7 - 7 - 9797
三峡大学理学院于 林
数理统计配对样本的 配对样本的 tt 检验检验
(计算结果)(计算结果)
样本均值样本均值
样本标准差样本标准差
85.910
5.981
D
n
ii
D n
Dx 85.9
10
5.981
D
n
ii
D n
Dx
199.2110
525.43
1
)(1
2
D
n
iDi
D n
xDs 199.2
110
525.43
1
)(1
2
D
n
iDi
D n
xDs
7 - 7 - 9898
三峡大学理学院于 林
数理统计
HH00:: 11 – – 22 8.5 8.5
HH11: : 11 – – 22 < 8.5< 8.5
== 0.05 0.05
df df == 10 - 1 = 910 - 1 = 9
临界值临界值 (s):(s):
检验统计量检验统计量 ::
决策决策 ::
结论结论 ::
接受接受 HH00
有证据表明该俱乐部的宣称是有证据表明该俱乐部的宣称是可信的可信的
配对样本的 配对样本的 tt 检验检验(计算结果)(计算结果)
165.1410199.2
085.90
DD
D
ns
Dxt 165.14
10199.2
085.90
DD
D
ns
Dxt
-1.833-1.833 tt00
拒绝域拒绝域
.05.05
7 - 7 - 9999
三峡大学理学院于 林
数理统计
两个总体比例之差的检验两个总体比例之差的检验 (( ZZ 检验)检验)
经济、管理类经济、管理类基础课程基础课程
统计学统计学
7 - 7 - 100100
三峡大学理学院于 林
数理统计
1.1. 假定条件假定条件 两个总体是独立的两个总体是独立的 两个总体都服从二项分布两个总体都服从二项分布 可以用正态分布来近似可以用正态分布来近似
2.2. 检验统计量检验统计量
两个总体比例之差的两个总体比例之差的 ZZ 检验检验
)1,0(~)ˆ1(ˆ)ˆ1(ˆ
)()ˆˆ(
2
22
1
11
2121 N
n
PP
n
PP
PPPPz
)1,0(~
)ˆ1(ˆ)ˆ1(ˆ
)()ˆˆ(
2
22
1
11
2121 N
n
PP
n
PP
PPPPz
7 - 7 - 101101
三峡大学理学院于 林
数理统计两个总体比例之差的检验两个总体比例之差的检验
(假设的形式)(假设的形式)
假设研究的问题
没有差异有差异
比例 1 ≥比例 2
比例 1 < 比例 2
总体 1 ≤比例 2
总体 1 > 比例 2
H0 PP11––PP2 2 = 0= 0 PP11––PP2200 PP11––PP2200
H1 PP11––PP2200 PP11––PP22<0<0 PP11––PP2 2 >0>0
7 - 7 - 102102
三峡大学理学院于 林
数理统计两个总体比例之差的两个总体比例之差的 ZZ 检验检验
(( 克克克克 ))
属于研究中属于研究中的假设!的假设! 【例】【例】对两个大型企业青年对两个大型企业青年
工人参加技术培训的情况进工人参加技术培训的情况进行调查,调查结果如下:甲行调查,调查结果如下:甲厂:调查厂:调查 6060 人,人, 1818 人参加人参加技术培训。乙厂调查技术培训。乙厂调查 4040人,人,1414 人参加技术培训。能否根人参加技术培训。能否根据以上调查结果认为乙厂工据以上调查结果认为乙厂工人参加技术培训的人数比例人参加技术培训的人数比例高于甲厂?高于甲厂? (( = 0.05 = 0.05))
7 - 7 - 103103
三峡大学理学院于 林
数理统计两个总体比例之差的两个总体比例之差的 ZZ 检验检验
((计算结果)计算结果)
HH00:: PP- P- P 0 0
HH11:: PP- P- P < 0 < 0
== 0.050.05
nn11 == 60 60 ,, nn22 = = 4040
临界值临界值 (s):(s):
检验统计量检验统计量 ::
决策决策 ::
结论结论 ::
接受接受 HH00
没有证据表明乙厂工人参加技没有证据表明乙厂工人参加技术培训的人数比例高于甲厂术培训的人数比例高于甲厂
52.0
40
)35.01(35.0
60
)0301(30.0
0035.30.0
)ˆ1(ˆ)ˆ1(ˆ
)()ˆˆ(
2
22
1
11
2121
n
PP
n
PP
PPPPz 52.0
40
)35.01(35.0
60
)0301(30.0
0035.30.0
)ˆ1(ˆ)ˆ1(ˆ
)()ˆˆ(
2
22
1
11
2121
n
PP
n
PP
PPPPz
-1.645-1.645 ZZ00
拒绝域拒绝域
7 - 7 - 104104
三峡大学理学院于 林
数理统计 第四节 假设检验中的其他问题第四节 假设检验中的其他问题
一一 . . 用置信区间进行检验用置信区间进行检验.贰.贰 利用利用 P P - - 值进行检验值进行检验
7 - 7 - 105105
三峡大学理学院于 林
数理统计
利用置信区间进行假设检验利用置信区间进行假设检验
7 - 7 - 106106
三峡大学理学院于 林
数理统计利用置信区间进行假设检验利用置信区间进行假设检验
(双侧检验)(双侧检验)
1.1. 求出双侧检验均值的置信区间求出双侧检验均值的置信区间
已知时已知时:: 已知时已知时::
nzx
nzx
22 ,
nzx
nzx
22 ,
未知时未知时:: 未知时未知时::
n
stx
n
stx nn 1
21
2 ,
n
stx
n
stx nn 1
21
2 ,
2.2. 若总体的假设值若总体的假设值 00 在置信区间外,拒绝在置信区间外,拒绝 HH
0 0
7 - 7 - 107107
三峡大学理学院于 林
数理统计利用置信区间进行假设检验利用置信区间进行假设检验
(左侧检验)(左侧检验)
n
stx
nzx n 1
或
n
stx
nzx n 1
或
1.1. 求出单边置信下限求出单边置信下限
2.2. 若总体的假设值若总体的假设值 00 小于单边置信下限,拒绝小于单边置信下限,拒绝 HH00
7 - 7 - 108108
三峡大学理学院于 林
数理统计利用置信区间进行假设检验利用置信区间进行假设检验
(右侧检验)(右侧检验)
1.1. 求出单边置信上限求出单边置信上限
2.2. 若总体的假设值若总体的假设值 00 大于单边置信上限,拒绝大于单边置信上限,拒绝 HH00
n
stx
nzx n 1
或
n
stx
nzx n 1
或
7 - 7 - 109109
三峡大学理学院于 林
数理统计利用置信区间进行假设检验利用置信区间进行假设检验
(( 克克克克 ))
【例】【例】一种袋装食品每包的标一种袋装食品每包的标准重量应为准重量应为 10001000 克。现从生克。现从生产的一批产品中随机抽取产的一批产品中随机抽取 1616袋,测得其平均重量为袋,测得其平均重量为 991991 克克。已知这种产品重量服从标准。已知这种产品重量服从标准差为差为 5050 克的正态分布。试确克的正态分布。试确定这批产品的包装重量是否合定这批产品的包装重量是否合格?格? (( = 0.05 = 0.05))
属于决策属于决策的假设!的假设!
香脆香脆蛋卷蛋卷香脆香脆蛋卷蛋卷
7 - 7 - 110110
三峡大学理学院于 林
数理统计利用置信区间进行假设检验利用置信区间进行假设检验
((计算结果)计算结果)
HH00:: = 1000 = 1000
HH11: : 1000 1000
== 0.050.05
nn == 49 49
临界值临界值 (s):(s):
置信区间为置信区间为
决策决策 ::
结论结论 ::
克克克克克克 =1000=1000 在置信区间在置信区间内,接受内,接受 HH00
表明这批产品的包装重量合格表明这批产品的包装重量合格
5.1015,5.966
16
5096.1991,
16
5096.1991
, 22
nzx
nzx
5.1015,5.966
16
5096.1991,
16
5096.1991
, 22
nzx
nzx
ZZ00 1.961.96-1.96-1.96
.025.025
拒绝 拒绝 HH00 拒绝 拒绝 HH00
.025.025
7 - 7 - 111111
三峡大学理学院于 林
数理统计
利用 利用 P-P- 值进行假设检验值进行假设检验
观察到的显著性水平 观察到的显著性水平 PP-- 值值
7 - 7 - 112112
三峡大学理学院于 林
数理统计什么是 什么是 P P 值?值?
(( PP-Value-Value))
1.1. 是一个概率值是一个概率值2.2. 如果我们假设原假设为真,如果我们假设原假设为真, P-P- 值是观测到的样值是观测到的样
本均值不同于本均值不同于 (( 或 或 实测值的概率实测值的概率 左侧检验时,左侧检验时, PP-- 值为曲线上方值为曲线上方小于等于小于等于检验统计检验统计
量部分的面积量部分的面积 右侧检验时,右侧检验时, PP-- 值为曲线上方值为曲线上方大于等于大于等于检验统计检验统计
量部分的面积量部分的面积
3.3. 被称为观察到的被称为观察到的 (( 或实测的或实测的 )) 显著性水平显著性水平 HH00 能被拒绝的能被拒绝的的最小值的最小值
7 - 7 - 113113
三峡大学理学院于 林
数理统计 利用 利用 P P 值进行决策值进行决策
1.1. 单侧检验单侧检验 若若 p-p- 值 值 ,,不能拒绝 不能拒绝 HH00
若若 p-p- 值 值 < < , , 拒绝 拒绝 HH00
2.2. 双侧检验双侧检验 若若 p-p- 值 值 , , 不能拒绝 不能拒绝 HH00
若若 p-p- 值 值 < < , , 拒绝 拒绝 HH00
7 - 7 - 114114
三峡大学理学院于 林
数理统计双尾 双尾 Z Z 检验 检验
((PP-- 值计算实例值计算实例 ))
【例】【例】欣欣儿童食品厂生欣欣儿童食品厂生产的盒装儿童食品每盒的标产的盒装儿童食品每盒的标准重量为准重量为 368368 克。现从某天克。现从某天生产的一批食品中随机抽取生产的一批食品中随机抽取2525盒进行检查,测得每盒的盒进行检查,测得每盒的平均重量为平均重量为 x x = 372.5= 372.5 克。克。企业规定每盒重量的标准差企业规定每盒重量的标准差为为 1515 克。确定克。确定 P P - - 值。值。
368 368 克克
欣欣儿童食品厂欣欣儿童食品厂
7 - 7 - 115115
三峡大学理学院于 林
数理统计双尾 双尾 Z Z 检验检验
((PP-- 值计算结果值计算结果 ))
样本统计量的样本统计量的 ZZ值值
(观察到的)(观察到的)
计算的检验统计量为:计算的检验统计量为: 5.12515
3685.3720
n
xZ
5.12515
3685.3720
n
xZ
00 1.501.50-1.50-1.50 ZZ
7 - 7 - 116116
三峡大学理学院于 林
数理统计双尾 双尾 Z Z 检验检验
((PP-- 值计算结果值计算结果 ))
p-p- 值为 值为 P(Z P(Z -1.50 -1.50 或 或 Z Z 1.50) 1.50)
样本统计量的样本统计量的 ZZ值值
(观察到的)(观察到的)
00 1.501.50-1.50-1.50 ZZ
7 - 7 - 117117
三峡大学理学院于 林
数理统计双尾 双尾 Z Z 检验检验
((PP-- 值计算结果值计算结果 ))
p-p- 值为 值为 P(Z P(Z -1.50 -1.50 或 或 Z Z 1.50) 1.50)
样本统计量的样本统计量的 ZZ值值
(观察到的)(观察到的)
00 1.501.50-1.50-1.50 ZZ
1/2 p-1/2 p- 值值1/2 p-1/2 p-值值
7 - 7 - 118118
三峡大学理学院于 林
数理统计双尾 双尾 Z Z 检验检验
((PP-- 值计算结果值计算结果 ))
p-p- 值为 值为 P(Z P(Z -1.50 -1.50 或 或 Z Z 1.50) 1.50)
从从 ZZ 分布分布表查找表查找 1.501.50
样本统计量的样本统计量的 ZZ值值
(观察到的)(观察到的)
注:注: 0.9332 - 0.0.9332 - 0.55
== 0.43320.4332
00 1.501.50-1.50-1.50 ZZ
1/2 p-1/2 p- 值值1/2 p-1/2 p-值值
.4332.4332
7 - 7 - 119119
三峡大学理学院于 林
数理统计双尾 双尾 Z Z 检验检验
((PP-- 值计算结果值计算结果 ))
p-p- 值为 值为 P(Z P(Z -1.50 -1.50 或 或 Z Z 1.50) 1.50)
从从 ZZ 分布分布表查找表查找 1.501.50
样本统计量的样本统计量的 ZZ值值
(观察到的)(观察到的)
0.5000-0.43320.5000-0.4332
== 0.06680.066800 1.501.50-1.50-1.50 ZZ
1/2 p-1/2 p- 值值1/2 p-1/2 p-值值
.4332.4332
7 - 7 - 120120
三峡大学理学院于 林
数理统计双尾 双尾 Z Z 检验检验
((PP-- 值计算结果值计算结果 ))
00 1.501.50-1.50-1.50 ZZ
1/2 p-1/2 p- 值 值 = .0668= .0668
1/2 p-1/2 p- 值 值 = .0668= .0668
1/2 1/2 = .025 = .0251/2 1/2 = .025 = .025
拒绝拒绝 拒绝拒绝
7 - 7 - 121121
三峡大学理学院于 林
数理统计双尾 双尾 Z Z 检验检验
((PP-- 值计算结果值计算结果 ))
2p = 0.1336 2p = 0.1336 = 0.05 = 0.05 ,不能拒绝,不能拒绝 HH00
检验统计量未在拒绝区域检验统计量未在拒绝区域
00 1.501.50-1.50-1.50 ZZ
1/2 p-1/2 p- 值 值 = .0668= .0668
1/2 p-1/2 p- 值 值 = .0668= .0668
1/2 1/2 = .025 = .0251/2 1/2 = .025 = .025
拒绝拒绝 拒绝拒绝
7 - 7 - 122122
三峡大学理学院于 林
数理统计单尾 单尾 Z Z 检验 检验
((PP-- 值计算结果值计算结果 ))
【例】【例】欣欣儿童食品厂生产欣欣儿童食品厂生产的某种盒装儿童食品,规定的某种盒装儿童食品,规定每盒的重量每盒的重量 不低于不低于 368368 克。克。现从某天生产的一批食品中现从某天生产的一批食品中随机抽取随机抽取 2525 盒进行检查,测盒进行检查,测得每盒的平均重量为得每盒的平均重量为 xx=372.=372.55 克。企业规定每盒重量的标克。企业规定每盒重量的标准差准差为为 1515 克。确定克。确定 P-P- 值。值。
368 368 克克
欣欣儿童食品厂欣欣儿童食品厂
7 - 7 - 123123
三峡大学理学院于 林
数理统计单尾 单尾 Z Z 检验检验
((PP-- 值计算结果值计算结果 ))
样本统计量的样本统计量的 ZZ值值
计算的检验统计量为:计算的检验统计量为: 5.12515
3685.3720
n
xZ
5.12515
3685.3720
n
xZ
00 1.501.50-1.50-1.50 ZZ
7 - 7 - 124124
三峡大学理学院于 林
数理统计双尾 双尾 Z Z 检验检验
((PP-- 值计算结果值计算结果 ))
p-p- 值为 值为 P(Z P(Z -1.50 -1.50 或 或 Z Z 1.50) 1.50)
从从 ZZ 分布分布表查找表查找 1.501.50
样本统计量的样本统计量的 ZZ值值
(观察到的)(观察到的)
1.501.50-1.50-1.50
注:注: 0.9332 - 0.0.9332 - 0.55
== 0.43320.4332
00 ZZ
1/2 p-1/2 p- 值值1/2 p-1/2 p-值值
.4332.4332
7 - 7 - 125125
三峡大学理学院于 林
数理统计单尾 单尾 Z Z 检验检验
((PP-- 值计算结果值计算结果 ))
p-p- 值为 值为 P(Z P(Z 1.50) 1.50)
样本统计量的样本统计量的 ZZ值值
用备择用备择假设找出方假设找出方向向
00 1.501.50 ZZ
P-P- 值值
7 - 7 - 126126
三峡大学理学院于 林
数理统计单尾 单尾 Z Z 检验检验
((PP-- 值计算结果值计算结果 ))
p-p- 值为 值为 P(Z P(Z 1.50) 1.50)
样本统计量的样本统计量的 ZZ值值
用备择用备择假设找出方假设找出方向向
从从 ZZ 分布分布表表 ::查找查找 1.51.500
00 1.501.50 ZZ
P-P- 值值
.4332.4332
7 - 7 - 127127
三峡大学理学院于 林
数理统计单尾 单尾 Z Z 检验检验
((PP-- 值计算结果值计算结果 ))
p-p- 值为 值为 P(Z P(Z 1.50) 1.50)
样本统计量的样本统计量的 ZZ值值
用备择用备择假设找出方假设找出方向向
从从 ZZ 分布分布表表 ::查找查找 1.51.500
0.5000-0.43320.5000-0.4332
== 0.06680.0668
00 1.501.50 ZZ
P-P- 值值
.4332.4332
7 - 7 - 128128
三峡大学理学院于 林
数理统计单尾 单尾 Z Z 检验检验
((PP-- 值计算结果值计算结果 ))
p-p- 值为 值为 P(Z P(Z 1.50)=.0668 1.50)=.0668
样本统计量的样本统计量的 ZZ值值
用备择用备择假设找出方假设找出方向向
从从 ZZ 分布分布表表 ::查找查找 1.51.500
0.5000-0.43320.5000-0.4332
== 0.06680.0668
00 1.501.50 ZZ.4332.4332
P-P- 值值 .0.0668668
7 - 7 - 129129
三峡大学理学院于 林
数理统计单尾 单尾 Z Z 检验检验
((PP-- 值计算结果值计算结果 ))
00 1.501.50 ZZ
1 p-1 p- 值 值 = .0668= .0668
= .05= .05
拒绝拒绝
7 - 7 - 130130
三峡大学理学院于 林
数理统计单尾 单尾 Z Z 检验检验
((PP-- 值计算结果值计算结果 ))
检验统计量未在拒绝区域检验统计量未在拒绝区域
(p-(p- 值 值 =0 .0668) =0 .0668) ( ( = .05) = .05) ,不能拒绝,不能拒绝HH00
00 1.501.50 ZZ
1 p-1 p- 值 值 = .0668= .0668
= .05= .05
拒绝拒绝
7 - 7 - 131131
三峡大学理学院于 林
数理统计 本章小节本章小节
1.1. 假设检验的概念和类型 假设检验的概念和类型 2.2. 假设检验的过程假设检验的过程3.3. 基于一个样本的假设检验问题基于一个样本的假设检验问题4.4. 基于两个样本的假设检验问题基于两个样本的假设检验问题5.5. 利用置信区间进行假设检验利用置信区间进行假设检验6.6. 利用利用 pp - - 值进行假设检验值进行假设检验
结 束