生 物 统 计 学

30
生生生生 生生 :宋

description

生 物 统 计 学. 主讲教师:宋喜娥. 第八章 随机区组设计的方差分析. ☺ 试验设计 ☺ 单因素试验结果的方差分析 ☺ 二因素试验结果的方差分析 ☺ 试验结果的缺失数据问题. 第一节 试 验 设 计. ☺ 什么叫随机完全区组设计 ? ☺ 什么情况下用 ☺ 设计步骤. 一、什么叫完全随机区组设计. ( 1 ) n1=n2=n3= nk=n ( 2 )区组数重复数;非处理条件在同一区组内是平均的,不同区组间 差异大。 ( 3 )在每个区组内,每个处理必须出现一次,而且只能出现一次. 二、什 么 情 况 下 用. - PowerPoint PPT Presentation

Transcript of 生 物 统 计 学

Page 1: 生  物  统  计  学

生 物 统 计 学生 物 统 计 学

主讲教师:宋喜娥

Page 2: 生  物  统  计  学

第八章 随机区组设计的方差分析

☺ 试验设计

☺ 单因素试验结果的方差分析

☺ 二因素试验结果的方差分析

☺ 试验结果的缺失数据问题

Page 3: 生  物  统  计  学

☺ 什么叫随机完全区组设计 ?

☺ 什么情况下用

☺ 设计步骤

第一节 试 验 设 计

Page 4: 生  物  统  计  学

一、什么叫完全随机区组设计

( 1 ) n1=n2=n3=nk=n

( 2 )区组数重复数;非处理条件在同一区组内是平均的,不同区组间 差异大。

( 3 )在每个区组内,每个处理必须出现一次,而且只能出现一次

Page 5: 生  物  统  计  学

二、什 么 情 况 下 用

非处理条件不一致,而且有规律可循。

Page 6: 生  物  统  计  学

三、设 计 步 骤

( 1 )试验单元分组,一个组 = 一个区组。原则:同一组内坚持唯一差异原则。( 2 )每项个区组单独地进行处理的随机化安排

Page 7: 生  物  统  计  学

修剪方式区组

总和 平均1 2 3 4

A( 对照 ) 25 23 27 26 101 25.3

B 32 27 26 31 116 29.0

C 21 19 20 22 82 20.5

D 20 21 18 21 80 20.0

总和 Tr 98 90 91 100 T=379 23.69

第二节 单因素试验结果的分析

Page 8: 生  物  统  计  学

单因素试验结果的方差分析

( 一 ) 整理资料计算各处理总和数 (Tt) 及其平均数 (t) ,各区组总和数 (Tr) ,

资料总和数 (T) 及其总平均数 () 。例如,第一区组的总和数为:

Tr = 25 + 32 + 21 + 20 = 98

第二区组的总和数为:Tr = 23 + 27 + 19 + 21 = 90

以此类推,获得剩余两个区组的总和数,一并汇于表 9.2 。核对计算结果的公式为:

T = Tr = Tt = k n = n t

Page 9: 生  物  统  计  学

( 二 ) 分解平方和与自由度1) 分解平方和

由式 (9.3) 及其相关公式得出:C =

SST = (252 + 232 + ... + 212 - C = 263.44

SSr =

SSt =

SSe = SST - SSr - SSt = 263.44 - 18.69 - 217.69 = 27.06

将上述结果填入表 9.3 。请注意,表内实际数字为计算机计算结果,其保留的小数位数较多 ( 以后相同,不再重复 ) 。

69.184

100919098 2222

C

56.897744

3792

69.2174

8082116101 2222

C

Page 10: 生  物  统  计  学

2) 分解自由度由式 (9.5) 及相关公式得出:dfT = 4 4 - 1 = 15

dfr = 4 - 1 = 3

dft = 4 - 1 = 3

dfe = (4 - 1)(4 - 1) = 9

注意,误差自由度也可以采用减法获得,即dfe = dfT - dfr - dft = 15 - 3 - 3 = 9 。

Page 11: 生  物  统  计  学

( 三 )F 检验

先计算各变异项的均方,用平方和除以相应的自由度即可。

MSr = = 6.23

MSt = = 72.56

MSe = = 3.01

再计算区组项及处理项的 F 值。由式 (9.7) 等,有

Fr =

Ft =

3

69.18

3

69.217

9

06.27

07.201.3

23.6

13.2401.3

56.72

Page 12: 生  物  统  计  学

表 9.3 表 9.2 资料的方差分析

变异来源 df SS MS F Pr>F

区组 3 18.68750000 6.22916667 2.07 0.1744

处理 3 217.68750000

72.56250000 24.13 0.0001

误差 9 27.06250000 3.00694444

总变异 15 263.43750000

Page 13: 生  物  统  计  学

修剪方式 平均产量 5%显著水平

B 29.00 a

A 25.25 b

C 20.50 c

D 20.00 c

( 四 ) 处理平均数比较

4 种修剪方式之单株产量的 PLSD 检验结果

Page 14: 生  物  统  计  学

  综合 F检验结果以及上述多重比较与区间估计结果,可获得本实验的基本信息如下: 4种修剪方式的产量不同。除方式 C与 D之间的差异因实验提供的证据不充足,无法推断其是否真实存在以外,其它任两种方式之间都有存在真实差异。其中产量差异最明显的为 B与 D,方式 B比方式 D平均增产6.23 ~ 11.77kg/ 株。

Page 15: 生  物  统  计  学

第三节 二因素试验结果的分析

灌溉次数 氮肥用量区组

1 2

一次

N0 31.7 39.1

N6 50.0 48.6

N12 56.8 60.6

N18 57.3 59.4

N24 53.1 54.1

二次

N0 38.9 40.0

N6 61.4 53.1

N12 68.5 66.7

N18 73.5 72.9

N24 70.6 72.3

总和 561.8 566.8

Page 16: 生  物  统  计  学

灌溉次数氮肥用量

N0 N6 N12 N18 N24 总和

一次 70.8 98.6 117.4 116.7 107.2 510.7

二次 78.9 114.5 135.2 146.4 142.9 617.9

总和 149.7 213.1 252.6 263.1 250.1T=1128.

6

AB 总和数的两向表

Page 17: 生  物  统  计  学

灌溉次数氮肥用量

N0 N6 N12 N18 N24 平均

一次 35.4 49.3 58.7 58.3 53.6 51.1

二次 39.5 57.2 67.6 73.2 71.4 61.8

平均 37.4 53.3 63.2 65.8 62.5 56.43

AB 平均数的两向表

Page 18: 生  物  统  计  学

变异来源 DF SS MS F P r >F

区组 1 12500000 1.2500000 0.15 0.7081

灌溉次数 1 574.5920000574.592000

068.65* 0.0001

氮肥用量 42163.122000

0540.780500

064.61* 0.0001

AB 4 123.3680000 30.8420000 3.68* 0.0483

误差 9 75.3300000 8.3700000

总变异 192937.662000

0

二因素随机区组设计冬小麦栽培实验方差分析表

Page 19: 生  物  统  计  学

1) 区组效应的 F 检验:

  F =      = 0.15 < 1 ,故推断区组间产量差异在 5% 水平上不

显著。

2)A 主效 F 检验:

  F =      = 68.65 > F0.05(1, 9) = 5.12( 附表查表值 ) ,故推

断, A 因素主效存在,即 A 因素两个水平间产量差异在 5% 水平上显

著。

37.8

25.1

37.8

59.574

Page 20: 生  物  统  计  学

3)B 主效 F 检验:

F =      = 64.61 > F0.05(4, 9) = 3.63 ,故推断, B 因素主

效存在,即 B 因素 5 个水平间产量差异在 5% 水平上显著。

AB 互作 F 检验:

F =      = 3.68 > F0.05(4, 9) = 3.63 ,故推断, AB 互作

存在,即 A 因素对产量的作用随 B 因素水平变化而改变,反之亦然。或者

说, AB 互作效应在 5% 水平上显著。

37.8

78.540

37.8

84.60

Page 21: 生  物  统  计  学

( 四 ) 主效与互作的进一步分析根据上述 F 检验结果, A 主效、 B 主效、 AB

互作都存在。故应该对主效与互作进行深入分析,以了解产量随灌溉次数 (A) 、氮肥用量 (B) 改变而改变的具体规律。

Page 22: 生  物  统  计  学

0

10

20

30

40

50

60

70

80

0 10 20 30

氮肥用量(kg/mu)

籽粒

产量

(x10

0 公斤

/ 公顷

)

灌溉一次

灌溉二次

Page 23: 生  物  统  计  学

含有8个处理,重复3次的随机区组设计的试验,已知 M

S e=1.64 , MSt=4.87, MSr=13.73, 进行处理间多重比较时,算得最小显著差数如下表

P 2 3 4 5 6 7 8

LSR0.05 2.24 2.35 2.42 2.46 2.49 2.51 2.52

LSR0.01 3.12 3.27 3.37 3.47 3.48 3.54 3.57

Page 24: 生  物  统  计  学

第四节 试验结果的缺失数据问题

☺ 缺失数据的原因

☺ 缺失数据的估计

☺ 估计结果的分析

Page 25: 生  物  统  计  学

  在实验过程中,由于意外或偶然原因造成一个或几个实验单元无法获得有效的观察值,这些缺失的观察值叫做缺失数据。缺失数据会造成两个后果,一是实验信息损失;二是实验结果无法按常规的方法进行方差分析。为此应该了解农业实验中常见的缺失数据原因,防患于未然。还应了解一旦缺失一个或几个数据时,如何进行统计分析的方法。

Page 26: 生  物  统  计  学

一、缺失数据的原因

  在田间实验中,造成缺失数据的常见原因有以下几个方面。第一,处理不当。实验有一个或若干个实验单元 (小区 )未按计划实施处理,诸如,未实施处理、处理剂量不正确、处理实施时间有误等等。第二,实验材料遭受损坏。几乎所有的田间实验都是要求全部小区的植株完好无损,但事实并非总是如此。栽培管理中的机械损害、虫鸟兽等常造成植株生长异常甚至死亡。 第三,样品丢失。有些实验指标必须从田间取样后在室内进行测量,如蛋白质含量,百粒 (果 )重等。 第四,异常数据。与上述情形相反,异常数据不是在数据收集记录之前发生的,而是在记录和转抄之后被发现的。异常数据是指数据值超出实验材料正常反应的合理范围,只有真正由于失误造成的异常数据才可以视为缺失数据。比如,读数错误、抄写错误、抽样技术不当或者仪器仪表使用不当等。

Page 27: 生  物  统  计  学

二、缺失数据的估计

一般采用公式法进行估计

  对于一个含有 k 个处理 n 次重复的随机完全区组设计,其估计公式为 y' = ''' yyy tr

  式中, y‘ 为缺失数据的估计值, 为所在区组的实际平均数,  为  所在处理的实际平均数, 为全部实际数据中与  既不在同一区组也不在同一处理者的平均数。

'ry

'ty 'y 'y'y

Page 28: 生  物  统  计  学

三、估计结果的分析

  将缺失数据的估计值填入表内,以标准的方差分析方法分析时,必须作以下三方面的校正。

(1) 总自由度和误差自由度比标准方法少 1 。(2) 处理平方和减去偏倚校正数 C‘ ,重新作 F 检验。 (3) 处理平均数多重比较时,若两处理平均数未缺失数 据,则平均数及其差数的标准误与标准方法相同。对于含缺失数值估计的处理与其它处理的比较,则按下式计算之。这可用于 PLSD 和 DMR 法。

Page 29: 生  物  统  计  学

])1)(1(

2[

2

])1)(1(

2[

21

knn

k

n

MSs

knn

k

nMSs

ey

eyy

Page 30: 生  物  统  计  学

练 习

  有一小麦品比试验,共有 A、 B、 C、 D、 E、 F、 G、 H8个品种( k=8 ),其中 A是标准品种,采用随机区组设计,重复 3次( n=3),小区计产面积 200平方尺,其中产量(千克)结果于下表,试作分析。

品种 Ⅰ Ⅱ Ⅲ

ABCDEFGH

10.910.811.19.1

11.810.110.09.3

9.112.312.510.713.910.611.510.4

12.214.010.510.116.811.814.114.4