第十二章 非参数检验 ( Nonparametric test )
description
Transcript of 第十二章 非参数检验 ( Nonparametric test )
第十二章 非参数检验( Nonparametric test )
第十二章 非参数检验( Nonparametric test )
检验方法的选择及应用条件
t 检验:u 检验:方差分析:χ2 检验:
参数:统计量:
参数检验:若样本所来自的总体分布已知(如正态分布),对其总体参数进行假设检验,则称为参数检验。
非参数检验:不考虑研究对象总体分布的具体形式,也不对总体参数进行统计推断,而是对样本所代表的总体分布进行检验。由于这类方法不受总体参数的限制,故称非参数检验,又称任意分布检验( distribution-free test )
非参数检验适用于:
非正态分布的资料方差不齐的资料等级资料一端或两端有不确定数值(如 >10.0、 <0.1等)的资料分布不明的资料
非参数检验的优缺点:优点: 适用范围广 对数据要求不严 方法简便、易于理解和掌握缺点: 损失信息、检验效能低
符合条件 首选参数检验
不符合条件 非参数检验
注 意 :
凡符合或经过变换后符合参数检验条件的资料,最好用参数检验。当资料不具备参数检验的条件时,非参数检验是一种有效的分析方法。
秩和检验 ( Rank sum test )
又称秩转换的非参数检验 将变量值从小到大或从弱到强转换成秩后再计算检验统计量,从而推断一个总体表达分布位置的中位数 M 和已知M0 、两个或多个总体的分布是否不同特点:对总体分布的形状差别不敏感,只对总体分布的位置差别敏感
第一节 配对设计差值比较的符号秩检验
由 Wilcoxon 于 1945 年提出又称 Wilcoxon 符号秩和检验
常用于检验差值的总体中位数是否等于零
P198 例 12.1 为比较定量骨超声测定仪与磁共振成象仪对原发性骨质疏松性椎体骨折诊断结果是否有差别,某医师分别对 16 例伴有脊椎压缩性骨折绝经妇女,采用两法检测硬度( Stiffness )( % ),结果见表 12-1 。问两法检测结果是否有差别?
表 12-1 两法测定硬度( Sstiffness )的结果( % )
538431615769115121325143214461337357212-20100801136003610-570659
-727208
075757
3112436
1325385
-232304
-242403
1042522
2020401
( 4 )( 3 )( 2 )( 1 )差值磁共振骨超声观察对象
3.59
7
1315
10.514
3.55
--
128
2
1
6
10.5( 6 )( 5 )
差值为负秩次差值为正秩次
( 1 )建立检验假设,确定检验水准
H0 :两种方法测得结果相同,即差值的总体中位数Md=0
H1 :两种方法测得结果不相同,即差值的总体中位数Md≠0 α= 0.05
( 2 )求差值、编秩、求秩和并确定检验统计量:编秩 : 按绝对值大小 差值为 0舍去不计 秩次相等取平均秩次
T += 98 , T -= 22任取其中之一作为检验的统计量 T本例取 T = T - = 22 。
根据 T 值( T+=98 或 T-=22 )查 T界值表( P208附表 12-1 )确定 P 值
原则:如果 T 位于检验界值区间内, P> ,不拒绝 H0 ;如果 T 位于检验界值区间外,P ,拒绝 H0 ,接受 H1
( 3 )确定 P 值并作出推断结论:
本例 : n=16-1=15 , T = 22 , T0.05 : 25-95所以 P0.05, 按 α = 0.05 的检验水准,拒绝 H0 ,接受 H1 ,可认为两种方法测定结果间差别有统计学意义,即两种方法测定伴有脊椎压缩性骨折绝经妇女病人的硬度有差别。
( 3 )确定 P 值并作出推断结论:
正态近似法
n>50 时, T 分布近似正态分布可用正态近似法作 u 检验:
| ( 1) / 4 | 0.5
( 1)(2 1) / 24T
T
T T n nu
n n n
相同秩次较多时的校正值:
3
| ( 1) / 4 | 0.5
( 1)(2 1) / 24 ( ) / 48c
i i
T n nu
n n n t t
注意:仍为非参数检验
符号秩检验的基本思想 当 H0( 差值的总体中位数 Md=0) 成立时,任一配对的差值出现正号与出现负号的机会均等,因此他们的秩和 T+ 与 T- 的理论数 (期望值 )也应相等,由 T+与 T- 之和为 n(n+1)/2 可知, T+ 与 T- 的理论数为 n(n+1)/4 。可以证明:当 H0 成立时,秩统计量 T是以 T=n(n+1)/4 为中心的对称分布,在大多数情况下 T 与n(n+1)/4 的差值较小 ( 纯属抽样误差 ) 。当 n 很大时,T 近似服从均数 T 为 n(n+1)/4 ,方差为 n(n+1)(2n+1)/24 的正态分布。 H0 不成立时,统计量 T 呈偏态分布,并且在大多数情况下 T 远离 n(n+1)/4 。因此在H0 成立的情况下 T 远离 n(n+1)/4 为小概率事件,可认为在一次抽样中是不会发生的,故当出现这种情况时推断拒绝 H0 。
第二节 完全随机设计两样本比较的秩和检验
Wilcoxon 秩和检验法
Mann-Whiter U检验法
Wilcoxon 秩和检验法
假设检验的要点:1 、混合编秩、数据相等时取平均秩
2 、分别求两组的秩和
3 、以样本量较小组样本量较小组的秩和为 T
4 、查成组设计的 T界值表、确定 P 值
如果 n1>10 或 n2>20 则可用正态近似法:
1
1 2
| ( 1) / 2 | 0.5
( 1) /12
T n Nu
n n N
相同秩次较多时的校正:
1
3
1 23
| ( 1) / 2 | 0.5
( )( 1)1
12 ( )j j
T n Nu
t tn n NN N
Mann-Whiter U检验法
P200
第三节 成组设计多样本比较的秩和检验
Kruskal-Wallis H 检验
基本步骤:
1 、建立检验假设,确定检验水准
2 、混合编秩,分组求秩和 Ti
3 、计算检验统计量 H
H 值的计算
2123( 1)
( 1)i
i
TH N
N N n
2
2
( )ii T
T
TH
3 31 ( ) /( )cj j
H HH
c t t N N
4 、确定 P 值,作出推断结论
小样本情况:当组数 k≤3 ,且 ni≤5 时,可查 H界值表 ,确定 P 值。如果 H > H ,则 P < ;反之, P > 。
大样本情况:若 k > 3 或 ni > 5 时,理论上, H近似服从自由度为 k-1 的 χ2 分布,可查 χ2界值表确定 P 值。
秩和检验的两两比较
方法有:1 、扩展的 t 检验2 、 Nemenyi 法检验3 、 q 检验
几种方法理论上仍存在争议,故 SAS 、SPSS 等软件没有提供这方面的分析
第四节 配伍组设计的秩和检验
Friedman M 检验
Friedman M 检验法:
区组处理组1 2 … k
1 n11(3) n12(1) … n1k(2)
2 n21(2) n22(4) n2k(3)
… … … … …
b nb1(1) nb2(2) … nbk(4)Ti T1 T2 … Tk
秩次
原始数据区组间分别
进行编秩
计算各组秩和
查表法:
统计量 M 的计算:
2( )iM T T 2 2 2( 1) / 4iT b k k
以配伍组数 b 和处理组数 k查M界值表,确定 P 值
χ2 分布近似法:
2 2123 ( 1)
( 1) iT b kbk k
3 21 ( ) / ( 1)j jC t t bk k
22
C
校正公式:
练习题:1 、两个独立小样本计量资料比较的假设检验,首先应考虑:A 、用 t 检验 B 、用 u 检验C 、用 Wilcoxon 秩和检验D 、用 t 检验或 Wilcoxon 秩和检验均可E 、资料符合 t 检验还是 Wilcoxon 秩和检验
2 、配对样本差值的 Wilcoxon 符号秩检验,确定 P 值的方法为:A 、 T越大, P越大 B 、 T越大, P越小 C 、 T 值在界值范围内, P 小于相应的 α
D 、 T 值在界值范围内, P 大于相应的 α
E 、 T 值即 u 值,查 u界值表
3 、等级资料比较宜用:A 、 t’ 检验B 、 t 检验C 、 u 检验D 、非参数检验E 、方差分析
4 、多样本计量资料的比较,当分布类型不清时选择:A 、 t 检验B 、 χ2 检验C 、 u 检验D 、 H 检验E 、 F 检验
5 、以下检验中不属于非参数检验的方法是:A 、 t 检验B 、 H 检验C 、 T 检验D 、 χ2 检验E 、 M 检验
6 、成组设计两样本比较的秩和检验,其检验统计量 T 是:A 、以秩和较小者为 T
B 、以秩和较大者为 T
C 、以例数较小者秩和为 T
D 、以例数较大者秩和为 T
E 、当两样本例数不等时,可任取一样本的秩和为 T
7 、满足参数统计分析方法条件的数据用非参数统计分析方法分析,则:A 、增加一类错误B 、减少一类错误C 、减少二类错误D 、增加二类错误E 、两类错误都增加