第九章 方差分析 第一节 方差分析的意义 当试验的处理数目 K≥3...
description
Transcript of 第九章 方差分析 第一节 方差分析的意义 当试验的处理数目 K≥3...
第九章 方差分析 第一节 方差分析的意义 当试验的处理数目 K≥3时,不能直接应用两两测验方法进行平均数假设测验的原因有三: 1. 当有 K个处理平均数时,将有 [k(k-1)]/2 个差数,要对这诸多差数逐一进行比较测验,程序实为繁琐。 2. 试验误差估计的精确度要受到损失。 3. 两两测验的方法会随着 K的增加而大大增加犯α错误的概率。
。
方差分析的基本特点是:
将全部变量看成一个整体,进行观察
值的变异原因分析,求出各变异原因方差
的估计值 → 进行 F测验
,以判断各处理平均数间的差异状况
→ 在此基础上,进行平均数的多重比较,
以明确两两处理之间的差异状况。
表 1 kn 个观察值的单向分组资料的模式
处理
观察值 x 总和Ti
平均
1
2
┋ ┋ k
x11 x12 x13 … … x1n
x21 x22 x 23 … … x2n
┋ ┋ xk1 xk2 xk3 … … xkn
T1
T2
┋ ┋ Tk
┋ ┋
Σxij T
ix
1x
2x
kx
x
x注: i = 1 , 2, 3, … … k ; j = 1 , 2, 3, … … n
第二节 方差分析的基本步骤
一、平方和与自由度的分解 分析目的:获得各项变异来源方差的估计值。
观察值总变异
处理间变异
处理内变异(误差)
重点呦!
SST = SSt+ SSe dfT= dft+ dfe
e
ei
e
t
tit
df
SS
nk
xxs
df
SS
k
xxns
)1(
)(1
)(
22
2
2
二、 F测验
F =
F 测验分析的目的是判断各个处理平均数
之间是否存在显著差异,即可测验 :
Ho: HA: 不相等
2
2
e
t
s
s
k 21 k 、、 21
三、多重比较 如果 F测验的结果为各处理间的差异
不显著,则分析结束,否则将进行多重
比较。多重比较分析的目的是进一步判
断两两处理平均数之间的差异显著性。
(一)保护性最小显著差数法( protected least signif
icant difference ),即 PLSD 法。
步骤: 1. 根据 dfe 查出 tα 。
2. 计算平均数差数标准误:
3. 计算显著尺度 PLSDα 值:
PLSDα = tα ×
21 xxs
=
21 xxs
n
Se22
4. 将处理平均数由大到小排序,并依次求出各处理平均数之间的差值,将各均数差值均与 PLSDα
相比较,作出平均数间差异显著性判断:
差异为显著;
差异为极显著;
差异为不显著。
05.02101.0 PLSDxxPLSD
01.021 PLSDxx
05.021 PLSDxx
(二)最小显著极差法 (least significant ranges) ,即 LSR 法。 主要介绍 SSR 法。 SSR 法即邓肯氏新复极差法。
步骤: 1. 根据平均数秩次距 k和 dfe 查出 SSRα
值。秩次距是指相比较的两个平均数之间(含这两个平均数)包含的平均数个数。 2. 计算平均数标准误:
xs = n
se2
3. 计算各秩次距下的显著尺度 LSRα 或 Rα
值: LSRα 或 Rα =
4. 将处理平均数由大到小排序,并依次
求出各处理平均数之间的差值,将各均数差
值与相应秩次距下的显著尺度进行比较,作
出差异显著性判断。同样有:
xSSSR
( 1)相应秩次距的 R0.01 > 平均数差值 ≥ 相
应秩次距的 R0.05 ,则两处理平均数间差异为显著;
( 2)平均数差值 ≥相应秩次距的 R0.01 ,则两
处理平均数间差异为极显著;
( 3)相应秩次距的 R0.05 > 平均数差值 ,则两
处理平均数间差异为不显著。
表 2 各秩次距下的 Rα
K 2 3 4 … …
SSR0.05
SSR0.01
R0.05
R0.01
多重比较结果的字母表达:
( 1 )以小写英文字母表示 α=0.05 水平下的比较结果;以大写英文字母表示 α=0.01 水平下的比较结果。
( 2 )以相同字母表示差异不显著的比较结果,不同字母表示差异显著。
若各处理的重复次数不相等,其分析过程 与上述方法仅有以下三点区别,其余步骤完全相同。 1. 矫正数 C = 2. 处理平方和
3. 以 n0 代替 n进行平均数差数标准误和平均数
标准误的计算: n0 =
in
T 2
k
i
it C
n
TSS
1
2
)(
)(1
12
i
ii n
nn
k
第三节 方差分析的数学模型 一、线性可加模型
线性可加模型是指每一个观察值可以划分成若
干个线性组成部分。它是分解平方和与自由度的理
论依据 ,不同类型资料的线性可加模型是各不相同
的。前述资料观察值的数学模型为:
= μ + τi + εij
ijx
(二)期望均方( EMS )
Se2 的 EMS 是 σe
2 ;
St2 的 EMS 是
∴ F = 2
22
2
2
e
e
e
t n
s
s
22 ne
F 测验有效性的保证条件之一是分子均方 的 EMS 仅比分母均方 的 EMS 多一个分量(线性组成部分)。
21s
22s
(三)固定模型和随机模型
固定模型是指试验的各处理都抽自其特定的处
理总体,这些总体遵循 N(μi, σe2) ,因而处理效应 τ
i =(μi - μ) 是固定的。我们分析的目的就在于研究
τi ,如果重复做试验,处理不变,而所要测验的假
设则是 :H0:τi =0 或 H0:μi=μ 对 HA: 不等。
故我们的推断也仅限于供试处理范围之内。
k ,, 21
随机模型是试验的各处理皆是随机抽自 的一组随机样本,因而处理效应 是随机的,随试验的不同而不同。若重复做试验,必然是从总体 中随机抽取一组新的样本。其分析的目的不在于研究处理效应,而是在于研究 的变异度,故推断也不是关于某些供试处理,而是关于抽出这些处理的整个总体。所以方差分析要测验的假设是 对
),0( 2N
i
),0( 2N
i
020 :H 02:AH
第四节 常用试验设计资料的方差分析一、完全随机设计资料的方差分析(见前述)
二、巢式设计资料的方差分析
观察值总变异
处理间变异(组间变异)
误差
亚组间变异
(一)平方和与自由度分解 按照上述变异原因分解进行各项平方和与自由度的计算。
(二) F 测验
巢式设计的资料属于系统分组资料,应注意在进行处理间(即组间)差异的 F 测验时,分母应为亚组间方差;而进行亚组间差异的 F测验时,分母应为误差方差。当亚组间的差异未达到显著时,则应将亚组间变异与误差进行合并,求出新的误差量,再对组间差异进行 F测验
(三)、多重比较
=)1()1()1(
mnl
SSSS
nlmml
SSSS eded
三、随机区组设计资料的方差分析(一)单因素资料的方差分析
此资料为两向分组资料(交叉分组资料),其行为处理,列为区组,为 k 行 r 列的两向表,即可看作是试验因素具有 k 个水平和区组因素具有 r 个水平的两因素试验。
注意:这样的模式要求行与列间不存在交互作用,即处理效应不因区组不同而显著不同,否则, F 测验将
观察值总变异
处理间变异
区组间变异
误 差
ε
丧失有效性,需采用二因素随机区组试验。一般的随机区组试验,往往假定处理效应是固定的,而区组效应是随机的,一般是不存在交互作用的。
1.平方和与自由度的分解
trTe
tt
rr
T
SSSSSSSS
Cr
TSS
Ck
TSS
CxSS
kr
TC
2
2
2
2
trTe
t
r
T
dfdfdfdf
kdf
rdf
krdf
1
1
1
2.F测验 一般来说,区组只是局部控制的手段,而不是研究的目的,所以通常仅需将它从误差中分离出来,并不一定要作 F 测验,更无多重比较的必要。
2
2
e
t
s
sF=
3.多重比较此资料多重比较方法见前述,此处不赘述。
(二)复因素随机区组资料的方差分析 先了解几个概念:简单效应:指在单因素试验中不同水平的差异。 主效应: 指复因素试验中不同条件下同一简单效应的平 均效应。 交互作用:指试验因素间相互促进或抑制而产生的效应。 分正交互作用、负交互作用及零交互作用。
无交互作用时,因素彼此独立,简单效应等于主效应。故各因素最佳水平就组成最佳组合。有交互作用时,因素彼此相依,简单效应不等于主效应,故由简单效应推论最佳组合一定有偏,甚至错误。
观察值总变异
处理间变异
区组间变异
误 差
A因素间变异
B因素间变异
A、B因素间互作(A×B)
+
1.平方和与自由度的分解
注意用计算器进行各项平方和计算的简便方法。
trTe
batba
bb
aa
abt
rr
T
SSSSSSSS
SSSSSSSS
Cra
TSS
Crb
TSS
Cr
TSS
Cab
TSS
CxSS
2
2
2
2
2
2. F 测验
进行 F测验时,应注意两个因素的模型。如果两个因
素均为固定模型,则测验 A因素、 B因素以及 A 、 B因素互
作的效应是否显著时,分母均以误差方差为被比量。3. 多重比较 不同类型平均数的多重比较需要注意标准误计算上的区别(见表)。若互作效应未达显著,可用相加式法选取试验优劣组合。但在互作效应显著或极显著时,采取相加式法推断结果可能有误,需对处理组合平均数进行多重比较以确定试验优劣组合。
四、拉丁方设计资料的方差分析
观察值总变异
区组间变异
处理间变异
误 差
行区组间变异
列区组间变异
ijlljiijlx
1. 平方和与自由度的分解
crtTe
crt
T
crtTe
cc
rr
tt
T
dfdfdfdfkkdf
kdfdfdf
kdfSSSSSSSSSS
Ck
TSS
Ck
TSS
Ck
TSS
CxSSk
TC
)2)(1(
1
12
2
2
2
2
2
2
2. F 测验 3. 多重比较
单个拉丁方资料的 F测验和多重比较相对简单,基本
同前述单因素随机区组资料的分析,此不再赘述。五、裂区设计资料的方差分析
观察值总变异
主区部分
副区部分
区组间变异
主处理间( A 因素)主区误差
副处理间( B 因素)
A×B 副区误差
babmT
ebabarTe
baab
ba
bb
arar
e
aa
rr
T
SSSSSSSS
SSSSSSSSSSSSSS
SSSSCr
TSS
Cra
TSS
SSSSCb
TSS
Crb
TSS
Cab
TSS
CxSSrab
TC
或12
1
2
2
2
2
2
2
2
1.平方和与自由度的分解
12
1
)1)(1(
)1)(1(1
)1)(1(1
11
etrTe
bab
ea
rT
dfdfdfdfbradf
badfbdf
ardfadf
rdfrabdf
2.F 测验
计算 F值时,主处理的 F值用主处理均方与主区误差均方比,副处理和主、副处理交互作用用各自均方与副区误差比。 F测验时误差自由度的使用是:主区部分用主区误差自由度,副处理和主、副处理交互作用,用副区误差自由度。
3. 多重比较
不同类型平均数的多重比较要注意标准误计算上的区别 。
六、正交试验结果分析
(一)直观分析
1. 计算各个处理组合的总和数;
2. 计算出各因素各水平的总和数 ;
3. 计算出各因素各水平的平均数 ;
4. 计算各因素各水平平均数的极差; 5. 根据各因素的极差值来分析其对所研究性状的影响程度。
(二)方差分析 1 、无重复试验的方差分析
此类分析是通过空列进行误差估计的,但从试验设
计来讲,应该设置重复才能正确估计误差,因此在进行
试验设计时,应尽可能地采用设置重复的正交试验。
2 、有重复的正交试验结果分析
因为正交试验中选出的部分处理组合是按照随机区组设计方法进行试验的,因此其资料的分析基本同复因素随机区组资料的分析,只是不进行互作项的分析。但根据正交试验设计的情况,虽然没有研究互作,但正交试验的一个重要目的就是要找出最优组合,因此仍需要进行处理组合平均数间的多重比较。
第五节 方差分析的基本假定和数据转换
一、方差分析的基本假定
(一)可加性:处理效应与环境效应(误差)是
可加的。是进行平方和与自由度分解的依据。
(二)正态性:试验误差是独立的随机变量,
并遵从正态分布。这是 F测验的前提条件。
(三)同质性:所有试验处理的误差方差都是
同质的。方差分析是以各个处理的合并均方值作
为测验处理间显著性共用的误差均方
为使所获得的试验资料满足方差分析的基本假定,在进行方差分析之前,可采取以下措施: 1 、“剔除”某些表现“特殊”的观察值、处理或重复。 2 、将总的试验误差的方差分 裂为几个较为同质的试验误差的方差。 3 、采用几个观察值的平均数作方差分析。 4 、采用适当的数据转换,然后用转换后的数据作方差分析。
二 、数据转换的方法
(一)、反正弦转换法
p1sin
适用于两项百分数资料,不遵从二项分布的百分数资料不能作反正弦转换。如果资料的 p值都在 0.3-0.7之间, 可省略转换,直接进行方差分析;但如果 p 只要有大于 0.7或小于 0.3 的,则宜将全部 p值都转换成尺度,再作方差分析。分解结果的表达时应将变数转换为原尺度。
(二)、平方根转换
xx '
平方根转换的主要作用是减少极端大变量对于均方的影响。适用于处理平均数 与其均方成比例的资料。 (三)、对数转换
xx lg' 若变量的均方是和处理平均数的平方成比例,或者已知处理效应是和处理水平的变化成比例而不是可加的,则宜作对数转换。一般说,对数转换对于削弱大变量的作用,要比平方根转换更强。
第六节 缺区(值)估计
一、概念
在试验中,由于某种意外或疏忽而缺失的观察值叫缺值。
二 、缺值估计的原理
缺值的最可能值仅需满足 , 即使被估计值的误差等于零。
三、估计的方法
随机区组设计的误差:
0i
)( xxxxe trijij
0' xxxx trij
拉丁方试验的误差 :
xxxxxe crtijlijl 2
02' xxxxx crtijl
裂区副区误差:
aarabjkljkl xxxxe )( 2
0' aarabjkl xxxx
缺值估计后的资料在进行方差分析时应注意:
1.一个试验若有 m个缺值,则误差项和总变异的自由度都要比常规的(未发生缺值的)少 m个。
2.由于误差项自由度减少, F测验的灵敏度降低,所以多重比较时一般用 PLSD 法。
3. 多重比较时,平均数差数标准误的计算需要进行矫正。
本章结束