第十一章 多因素试验的方差分析 第一节 析因设计的方差分析 ( 纲要复习...
description
Transcript of 第十一章 多因素试验的方差分析 第一节 析因设计的方差分析 ( 纲要复习...
第十一章 多因素试验的方差分析
第一节 析因设计的方差分析( 纲要复习 )
模 式
处理组数: g=I×J ,每组 n 个试验对象试验数据 Xijk
i=1,2, … , Ij =1,2, … , Jk=1,2, … ,n
试验数据共 g×n 个
b1 b2 … bj 合计
a 1
a 2
221
222
22
( ) ij ij
n
XX
TX
X
( )i iAX
┆
a i
合计
( )j jBX X
方差分析基本思想
B AB
SS SS SS
SS SS SS SS
处理总 误差
A 误差
变异分解
* 原理:
)()()(
)()(
XXXXXXXXXX
XXXXXX
jiijjiij
ijijkijijk
两边平方后求和
B AB A总 误差
自由度分解
( 1) ( 1) ( 1) ( 1)( 1) ( 1)gn I J I J g n
变异来源 自由度 SS MS F P
总变异 1gn 2X C
A主效应 1I 21A iSS A C
nJ
AMS A
AE
MSF
MS
B主效应 1J 21B iSS B C
nI
BMS B
BE
MSF
MS
AB ( 1)( 1)I J 21AB i A BSS T C SS SS
n
ABMS AB
ABE
MSF
MS
误差 ( 1)gn 2 21E iSS X T
n
EMS
表 11-6 完全随机设计两因素析因设计方差分析表
例 12-2 观察 A,B 两种镇痛药物联合运用在产
妇分娩时的镇痛效果。A药取3个剂量:1.0mg,2.5mg,
5.0mg;B药也取 3个剂量:5 g ,15 g ,30 g 。共 9
个处理组。将 27名产妇随机等分为 9组,每组 3名
产妇,记录每名产妇分娩时的镇痛时间,结果见表
11-7。试分析 A,B两药联合运用的镇痛效果。
表 11-7 A,B 两药联合运用的镇痛时间( min )
B药物剂量 A药物
剂量 5 g 15 g 30 g
105 115 75 1.0 mg 80 105 95
65 80 85
75 125 135 2.5 mg 115 130 120
80 90 150
85 65 180 5.0 mg 120 120 190
125 100 160
变异来源 自由度 SS MS F P
总变异 26 28450.000 A药主效应 2 6572.222 3286.111 8.47 < 0.01 B药主效应 2 7022.222 3511.111 9.05 < 0.01 A ×药 B药 4 7872.222 1968.056 5.07 < 0.01
误 差 18 6983.333 387.963
表 11-9 A 、 B 两药联合运用的镇痛时间的方差分析表
( 2 )将表 11-8 计算结果代入表 11-6 ,得方差分析表 , 见表 11-9 。
重复测量设计的方差分析ANOVA of Repeated Measurement Data
第十二章
Content
• Data characteristic
• Analysis of two factors and two levels
• Analysis of two factors and several levels
• Familiar errors
第一节
重复测量资料的数据特征
目的:推断处理、时间、处理 × 时间作用于试 验对象的试验指标的作用。
资料特征:
处理因素 g (≥ 1 )个水平,每个水平有 n 个试验对象,共计 gn 个试验对象。
时间因素 同一试验对象在 m (≥ 2 )个时 点获得 m 个测量值,共计 gnm 个测量值。
方法:方差分析
一、前后测量设计
最为常见,是重复测量设计的特例,
亦称单组前后测量设计,即 g=1, m=2, 如
表 12-1 。
编 号 治疗前 治疗后 差值
1 2 3 4 5 6 7 8 9
10
130 124 136 128 122 118 116 138 126 124
114 110 126 116 102 100 98 122 108 106
16 14 10 12 20 18 18 16 18 18
X 126.2 110.2 16.0 S 7.08 9.31 3.13
表 12-1 高血压患者治疗前后的舒张压( mmHg )
编 号 哥特里-罗紫法 脂肪酸水解法 差值 d 1 0.840 0.580 0.260 2 0.591 0.509 0.082 3 0.674 0.500 0.174 4 0.632 0.316 0.316 5 0.687 0.337 0.350 6 0.978 0.517 0.461 7 0.750 0.454 0.296 8 0.730 0.512 0.218 9 1.200 0.997 0.203
10 0.870 0.506 0.364
表 3-3 两种方法对乳酸饮料中脂肪含量的测定结果 (%)
比较
1. 配对设计中同一对子的两个实验单位可以随机分配处理,两个实验单位同期观察试验结果,可以比较处理组间差别。
前后测量设计不能同期观察试验结果,虽然可以在前后测量之间安排处理,但本质上比较的是前后差别,推论处理是否有效是有条件的,即假定测量时间对观察结果没有影响。
与配对设计设计的区别
2. 配对 t 检验要求同一对子的两个实验单位的观察结果分别与差值相互独立,差值服从正态分布。
前后测量设计前后两次观察结果通常与差值不独立,大多数情况第一次观察结果与差值存在负相关的关系,如表 12-1 中,治疗前舒张压与差值的相关系数为 -0.602 。
如由表 12-1 计算,治疗前后舒张压的相关系
数为 0.963,P<0.01,用治疗前舒张压 ( )X 推论治疗
后舒张压 ( )Y 的回归方程为: ˆ 49.534 1.266Y X ,
截距检验 P=0.014,回归系数检验 0.01P 。
3. 配对设计用平均差值推论处理的作用,而前后测量设计除了分析平均差值外,还可进行相关
回归分析。
区别点 配对设计 单组前后测量设计
两实验单位 可随机分配 N
观测时间 同期 两时间点
试验数据与差值关系 独立 N
分析指标 平均差值 平均差值、相关回归
推断 组间差别 前后差别
单组前后测量设计与配对设计的区别区别
二、设立对照的前后测量设计表 1 2 - 1 中 高 血 压 患 者 治 疗 后 的 舒 张 压 平 均
下 降 了 1 6 m m H g , 虽 然 经 配 对 t 检 验 :
1 6 . 1 8 , 0 . 0 1t P , 也 未 必 能 说 明 治 疗 有 效 , 因 为
住 院 休 息 、 环 境 和 情 绪 的 改 变 同 样 可 以 使 血 压 恢
复 平 稳 。 因 此 , 确 定 疗 效 的 前 后 测 量 设 计 必 须 增
加 平 行 对 照 , 如 将 2 0 位 轻 度 高 血 压 患 者 随 机 分
配 到 处 理 组 和 对 照 组 , 试 验 结 果 见 表 1 2 - 2 。
表12-2 高血压患者治疗前后的舒张压( mmHg ) 处 理 组 对 照 组
顺序号
治疗前 治疗后 差值 ( )d 顺序号
治疗前 治疗后 差值 ( )d
1 2 3 4 5 6 7 8 9 10
130 124 136 128 122 118 116 138 126 124
114 110 126 116 102 100 98 122 108
106
11 12 13 14 15 16 17 18 19 20
118 132 134 114 118 128 118 132 120 134
124 122 132 96 124 118 116 122 124
128
合 计 1262 1102 合 计 1248 1206
均 数 126.2 110.2 16.0 均 数 124.8 120.6 4.2
标准差 7.08 9.31 3.13 标准差 7.90 9.75 8.02
经检验处理组与对照组的差值d方差不齐( 2 2
1 2/ 6.58FSS , 0.01P),不符合两均数比较t检验的前提条件。
三、重复测量设计 当前后测量设计的重复测量次数 m≥3 时,称重复测量设
计或重复测量数据。
放 置 时 间 (分) 编 号 0 45 90 135
1 5.32 5.32 4.98 4.65
2 5.32 5.26 4.93 4.70
3 5.94 5.88 5.43 5.04
4 5.49 5.43 5.32 5.04
5 5.71 5.49 5.43 4.93
6 6.27 6.27 5.66 5.26
7 5.88 5.77 5.43 4.93
8 5.32 5.15 5.04 4.48
表 12-3 受试者血糖浓度( mmol/L ) (g=1)
球对称检验 : 2 15.44, 5, 0.01P
与随机区组设计的区别:
1 .重复测量设计中“处理”是在区组(受试者)间随机分配,区组内的各时间点是固定的,不能随机分配,如表 12-5 , A 、 B 两种处理随机分配给各个患者后,每个患者测量的时间是相同的。
随机区组设计则要求每个区组内实验单位彼此独立,处理只能在区组内随机分配,每个实验单位接受的处理是不相同的,如表 4-9 。
变异来源 自由度 SS MS F P
总变异 31 5.751
区组(受试者) 7 2.828 0.361 7.77 <0.01
放置时间 3 2.959 0.986 5.85 <0.01
误差 21 0.264 0.013
表 12-4 表 12-3 数据随机区组方差分析表
重复测量数据与第四章介绍的随机区组设计数据(表 4-9 )很相似,如表 12-3 ,而且同样可以计算出随机区组设计的方差分析表(表 12-4 )。
表 12-5 患者手术前后症状评分 (g=2)
手术后 处理
分组 手术前
10天 2月 4月 6月 9月
A 0.60 0.67 2.84 2.10 2.00 1.60 A 1.42 3.40 4.10 2.92 2.65 3.40 A 0.90 2.30 2.70 1.70 1.10 1.30 A 1.10 1.40 1.00 2.60 0.90 2.10 A 2.30 2.20 3.80 3.50 2.50 1.80 A 0.81 1.20 1.12 1.61 1.49 1.61 B 1.20 1.10 1.13 3.49 1.57 1.54 B 2.71 2.04 2.61 2.17 2.15 1.81
B 1.80 1.40 1.00 1.30 2.40 2.40
区组 A药 B药 C药
1 0.82 0.65 0.51
2 0.73 0.54 0.23
3 0.43 0.34 0.28
4 0.41 0.21 0.31
5 0.68 0.43 0.24
表 4-9 不同药物作用后小白鼠肉瘤重量( g )
变异来源 自由度 SS MS F P
总变异 14 0.5328
处理间 2 0.2280 0.1140 11.88 <0.01
区组间 4 0.2284 0.0571 5.95 <0.05
误 差 8 0.0764 0.0096
表 4-10 例 4-4 的方差分析表
2.重复测量设计区组内实验单位彼此
不独立,如表 12-3,即同一受试者的血样
重复测量结果是高度相关的,其相关系数
见表 12-6。
重复测量数据若用第四章随机区组
方差分析比较处理组间差异,前提条件
“ ”是满足球对称假设(通过2检验)。
放置时间 放置时间(分)
(分) 0 45 90 135
0 1 0.978** 0.936** 0.860**
45 1 0.879** 0.876**
90 1 0.896**
135 1
表 12-6 表 12-3 各放置时间点血糖浓度的相关系数
**P<0.01
重复测量数据若满足“球对称”假
设,可用随机区组方差分析;若不满足
“球对称”假设,亦可用随机区组方差
分析,但需校正时间效应 F 界值的自
由度。
“ ”校 正 的 方 法 是 用 球 对 称 系 数 ε 分 别 乘 处 理 组 间 效 应
F 界 值 的 自 由 度 1 和 2 , 得 1 1 2 2, , 用 1 2( , )F 作 为 检
验 界 值 。
“ ”球 对 称 系 数 的 常 用 估 计 方 法 有 三 种 方 法 。 例 如 , 表
1 2 - 4 组 内 效 应 F 界 值 为 0 . 0 5 ( 3 , 2 1 ) 3 . 0 7F , G r e e n h o u s e - G e i s s e r 的
校 正 系 数 0 . 5 3 6 , 校 正 后 的 F 界 值 为 0 . 0 5 ( 1 . 6 , 1 1 . 2 5 ) F
0 . 0 5 ( 1 , 1 1 ) 4 . 8 4F , 大 于 未 校 正 的 界 值 3 . 0 7 。 也 就 是 说 , 当 重 复 测
“ ”量 数 据 不 满 足 球 对 称 假 设 时 , 采 用 随 机 区 组 设 计 方 差 分
析 , 增 大 了 I 类 错 误 ( 无 差 别 判 断 为 有 差 别 ) 的 概 率 。
表 12-7 表 12-3 数据“球对称”检验结果
2值 自由度 P Greenhouse -Geisser Huynh -Feldt
Lower -bound
15.44 5 0.010 0.536 0.671 0.333
第二节 重复测量数据的两因素两水平分析
(第三节当 时的特例)
第三节 重复测量数据的两因素多水平分析
2,2 mg
一、实验设计
试验数据 Xijk i=1,2, … ,g j=1,2, … ,m k=1,2, … ,n
试验数据共 gmn 个
处理—— A 因素: g 个水平 每个水平 n 个 试验对象 时间—— B 因素: m 个时点
gaaa ,, 21
mbbb ,, 21
二、方差分析
)( ikik XMkiX 1 kiX 2 imkX
变异及自由度分解
* 原理:
两边平方后求和
对象内对象间总 SSSSSS 1 、对象内对象间总
)1()1(1
)()(
mgngngmn
XXXXXX ikijkikijk
* 原理:
两边平方后求和
组间误对象间
组间误对象间
A
A SSSSSS2 、
)1()1(1
)()(
ngggn
XXXXXX iikiik
* 原理:
两边平方后求和
3 、
)1)(1()1)(1()1()1(
)(
)()(
mngmgmmgn
XXXX
XXXXXXXX
iikijijk
jiijjikijk
组内误对象内
组内误对象内
ABB
ABB SSSSSSSS
变异来源 自由度 SS MS F P
组间合计
(观察对象) gn-1 21
( )jSS M Cm
组间 -
干预分组(A) g-1 21A iSS A C
nm
AF
组间误差 g(n-1) ASS SS组间
表 12-14 多个干预的重复测量数据方差分析表
表 12-15 多个时间点测量前后与交互作用的方差分析表
变 异 来 源 自 由 度 S S M S F P
组 内 合 计 ( 重 复 测 量 ) ( 1 )g n m 2 21( )jS S X M
m 组 内
测 量 前 后 ( B ) 1m 21B jS S B C
g n
BF
A B ( 1 ) ( 1 )g m 21A B i j B AS S T S S S S C
n
A BF
组 内 误 差 ( 1 ) ( 1 )g n m B A BS S S S S S 组 内
2m ,且 拒 绝 “ 球 对 称 ” 假 设 时 , BF 和 A BF 的
自 由 度 必 须 用 “ 球 对 称 ” 系 数 校 正 。
如 果 不 做 “ 球 对 称 ” 检 验 , 建 议 采 用 最 保 守
的 方 法 , 直 接 将 BF 的 界 值 定 为 [ 1 , ( 1 ) ( 1 ) ] g n mF ,
A BF 的 界 值 定 为 [ 1 , ( 1 ) ( 1 ) ] g g n mF 。
注意
变异来源 自由度 SS MS F P
组间合计(观察对象) 2 1n 21
( )2 jSS M C 组间 -
干预分组(A) 1 ASS
组间误差 2( 1)n ASS SS组间
表 12-10 干预分组作用的方差分析表
当 时,可简化为以下两表2,2 mg
表 12-11 测量前后与交互作用的方差分析表 变 异 来 源 自 由 度 S S M S F P
组 内 合 计
( 重 复 测 量 ) 2 n 2 21
( )2
jS S X M 组 内
测 量 前 后 ( B ) 1 BS S
A B 1 A BS S
组 内 误 差 2 ( n - 1 ) B A BS S S S S S 组 内
注 意析因设计:一张方差分析表:分析处理主效应、交互
作用。
重复测量设计:两张方差分析表,处理效应 1 张,
时间效应、时间与处理的交互作用 1 张。
* 理论:析因设计:
重复测量设计:
误差总
误差总
ABBA
ABBA SSSSSSSSSS
组内误组间误总
组内误组间误总
ABBA
ABBA SSSSSSSSSSSS
例12-2 根据表 12-2 数据,对处理
组与对照组、治疗前后舒张压的差别进
行统计分析。
变异来源 自由度 SS MS F P
组间合计(患者间) 19 2517.90
处理 (A) 1 202.50 202.50 1.57 0.05
组间误差 18 2315.40 128.63
表 12-13 处理组与对照组比较的方差分析表
变异来源 自由度 SS MS F P
组内合计(重复测量间) 20 1702.0
测量前后(B) 1 1020.1 1020.10 55.0 <0.01
AB 1 348.1 348.10 18.8 <0.01
组内误差 18 333.8 18.54
表 12-12 测量前后比较与交互作用的方差分析表
注意:处理虽无主效应,但因其与时间有交互作用,故亦认为有辅助效应。
4. 结论 ①测量前后的舒张压有差别( P < 0.01 ) ;②测量前后与处理存在交互作用( P < 0.01 ) , 即处理组和对照组治疗前后的舒张压的变化大小不同。
由表 12-2 计算,两组治疗后的差别 110.2 - 120.6= - 10.4mmHg ,大于治疗前的差别 (126.2 - 124.8=1.4mmHg) ,说明治疗有效。
例12-3 将手术要求基本相同的15名
患者随机分3组,在手术过程中分别采用A,
B,C三种麻醉诱导方法,在0T(诱导前)、
1T、2T、3T,4T 五个时相测量患者的收缩压,
数据记录见表12-16。试进行方差分析。
麻 醉 诱 导 时 相 诱导 方法 患者
序号 0T 1T 2T 3T 4T
A 1 120 108 112 120 117 A 2 118 109 115 126 123 A 3 119 112 119 124 118 A 4 121 112 119 126 120 A 5 127 121 127 133 126
B 6 121 120 118 131 137 B 7 122 121 119 129 133 B 8 128 129 126 135 142 B 9 117 115 111 123 131 B 10 118 114 116 123 133
C 11 131 119 118 135 129 C 12 129 128 121 148 132 C 13 123 123 120 143 136 C 14 123 121 116 145 126 C 15 125 124 118 142 130
表 12-16 不同麻醉诱导时相患者的收缩压( mmHg )
1.分解 SS SS组间 组内, g=3,m =5,n=5,15 名
患者的合计分别为
1M 120+108+112+120+117=577,
1M 2M 118+109+115+126+123=591,
…,
15M 125+124+118+142+130=639,
2X = 1 1 6 0 7 2 9 , 校 正 数 1 1 5 5 4 3 3 . 0 8C , 按 表 1 2 - 1 4 、
表 1 2 - 1 5 中 的 公 式 计 算
2 2 2( 5 7 7 5 9 9 6 3 9 ) 1 1 5 5 4 3 3 . 0 8
5S S 组 间
1
1 1 5 7 2 9 1 . 8 0 - 1 1 5 5 4 3 3 . 0 8 = 1 8 5 8 . 7 2
1 1 6 0 7 2 9 1 1 5 7 2 9 1 . 8 0 3 4 3 7 . 2 0S S 组 内
麻 醉 诱 导 时 相 诱导方法
0T 1T 2T 3T 4T 合 计 (iA)
A 605 562 592 629 604 2992
B 606 599 590 641 676 3112
C 631 615 593 713 653 3205
合计(iB) 1842 1776 1775 1983 1933 9309
表 12-17 不同麻醉诱导、不同时相患者收缩压合计值 ( ) ( 5)ijT n
2.分解ASS,BSS,ABSS 分组计算不同麻醉诱导、不同时相患者的收缩压的合计值(ijT),见表12-17。
表 12-18 不同诱导方法患者收缩压比较的方差分析表
变异来源 自由度 SS MS F P
患者间合计 14 1858.72
诱导方法(A) 2 912.24 456.12 5.78 <0.05
患者间误差 12 946.48 78.87
3 .按表 12-14 、表 12-15 列出方差分析表。
表 12-19 麻醉诱导时相及其与诱导方法交互作用的方差分析表
变异来源 自由度 自由度(校正) SS MS F P(校正后)
患者内合计 60 3437.20
诱导时相(B) 4 1 2336.45 584.11 106.59 0.01
AB 8 2 837.63 104.70 19.11 0.01
患者内误差 48 48 263.12 5.48
4. F B、 F AB检验界值校正 按表 12-15 的自 由 度 校正 方 法, F B 的 校正 自 由度 1 1 、
2 ( 1)( 1)g n m 3 (5 1) (5 1) 4 8 ,查 F 界值表, F B 的校正界值为 0 .01(1,48 )F = 7.19(校正前
0 .0 1( 4 ,4 8 )F = 3.74)。F AB 的校正自由度 1 1 2g 、
2 ( 1)( 1)g n m 3 (5 1) (5 1) 4 8 ,F B 的校正界值 0 .0 1( 2 ,4 8 )F = 5.08(校正前 0 .0 1( 8 , 4 8 )F = 2.90)。校正后的自由度见表 12-19。
5. 结论 不同麻醉诱导方法存在组间差别(表 12-18 ),患者的收缩压在不同的诱导方法下不同诱导时相变化的趋势不同(表 12-19 ),其中 A 组不同诱导时相收缩压较为稳定(表 12-20 )。
表 12-20 不同麻醉诱导、不同时相患者的收缩压( mmHg )
麻 醉 诱 导 时 相 诱导方法 T0 T1 T2 T3 T4
A X 121.00 112.40 118.40 125.80 120.80
S 3.54 5.13 5.64 4.71 3.70
B X 121.20 119.80 118.00 128.20 135.20
S 4.32 5.97 5.43 5.22 4.38
C X 126.20 123.00 118.60 142.60 130.60
S 3.63 3.39 1.95 4.83 3.71
三、注意事项
1. 要求各组例数相等。各组例数
不相等时,本节介绍的重复测量数据单
变量方差分析计算方法不适用,但用 SP
SS 或 SAS 统计软件计算无此限制。
2.“ 球对称” 检验。单变量方差分析的
“球对称” 检验、用“球对称”系数对 F 值
的自由度进行精确校正,需借助 SPSS 或 SAS
统计软件。
3. 无平行对照的单组重复测量数据分析
第四节重复测量数据统计分析常见的误用情况
1 .重复进行各时间点的 t 检验。
如对表 12-20 的统计结果,每个时相
做 3 次 t 检验比较 A 、 B 、 C 三种诱
导方法的差别, 5 个时相要做 15 次 t
检验,必然增大假阳性错误。
2. 忽略个体曲线变化特征。重复
测量数据的个体差异是每个观察对象
的 m 次测量结果 ( 即横向差异 ) ,不
能用纵向均数比较差别。
信度是指在相同条件下,对同一客观事物重复测量若干次,测量结果的相互符合程度,说明数据的可靠性。
3. 差值比较缺乏效度 因为前后测量
转换为差值后,信度降低,且差值一般
不符合正态性和方差齐性的条件。 效度是指测量指标或观测结果在多大程度上反映了事物的客观真实性,说明数据的准确性。