Ковариационный анализ (ANСOVA) в системе R
-
Upload
sergey-mastitsky -
Category
Data & Analytics
-
view
507 -
download
3
description
Transcript of Ковариационный анализ (ANСOVA) в системе R
![Page 2: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/2.jpg)
Регрессионный анализ, включающий как
количественные, так и качественные
предикторы (факторы), называется
ковариционным анализом (ANCOVA) Используется все та же функция lm(), но
имеются некоторые особенности
касательно интерпретации результатов
Author: Sergey Mastitsky
![Page 3: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/3.jpg)
10.1. Графическое представление данных, подпадающих по случай
ANCOVA
![Page 4: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/4.jpg)
> library(ISwR)
> data(hellung)
> head(hellung)
> help("hellung")
Два типа культур: с глюкозой (1) и без глюкозы (2) в
питательной среде
Измерены концентрация (conc) и диаметр (diameter)
Оказывает ли наличие
глюкозы влияние на связь diameter~conc?
Author: Sergey Mastitsky
![Page 5: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/5.jpg)
> summary(hellung)
Распознана R как количественная
переменная – не хорошо
Резко асимметричное распределение
Author: Sergey Mastitsky
![Page 6: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/6.jpg)
> hellung$glucose <-
factor(hellung$glucose, labels =
c("Yes", "No"))
> summary(hellung)
Author: Sergey Mastitsky
![Page 7: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/7.jpg)
> attach(hellung)
> plot(conc, diameter,
pch = as.numeric(glucose))
0e+00 1e+05 2e+05 3e+05 4e+05 5e+05 6e+05
19
21
23
25
conc
dia
me
ter
Author: Sergey Mastitsky
![Page 8: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/8.jpg)
> legend(locator(), legend =
c("glucose","no glucose"),
pch = 1:2)
0e+00 1e+05 2e+05 3e+05 4e+05 5e+05 6e+05
19
21
23
25
conc
dia
me
ter
glucoseno glucose
Author: Sergey Mastitsky
![Page 9: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/9.jpg)
Поскольку имеется выраженная
экспоненциальная зависимость
(обратная), имеет смысл log-
трансформировать данные (также
приводит к ~нормальному
распределению): > plot(conc, diameter,
pch = as.numeric(glucose),
log = "xy")
Author: Sergey Mastitsky
![Page 10: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/10.jpg)
1e+04 2e+04 5e+04 1e+05 2e+05 5e+05
19
20
21
22
23
24
25
26
conc
dia
me
ter
Author: Sergey Mastitsky
![Page 11: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/11.jpg)
> tethym.gluc <-
hellung[glucose == "Yes", ]
> tethym.nogluc <-
hellung[glucose == "No", ]
> lm.nogluc <- lm(log10(diameter)~
log10(conc), data = tethym.nogluc)
> lm.gluc <- lm(log10(diameter)~
log10(conc), data = tethym.gluc)
Author: Sergey Mastitsky
![Page 12: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/12.jpg)
> abline(lm.nogluc)
> abline(lm.gluc)
1e+04 2e+04 5e+04 1e+05 2e+05 5e+05
19
20
21
22
23
25
conc
dia
me
ter
Author: Sergey Mastitsky
![Page 13: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/13.jpg)
Линии примерно
параллельны, но не
«идеально»
Различаются линии по
углам наклона
(=степени зависимости
размера клеток от
плотности популяции)?
Различаются ли группы
по среднему размеру
клеток?
1e+04 5e+04 2e+05
19
20
21
22
23
24
25
26
conc
dia
me
ter
Author: Sergey Mastitsky
![Page 14: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/14.jpg)
10.2. Реализация ANCOVA в R
![Page 15: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/15.jpg)
> AN1 <- lm(log10(diameter) ~
log10(conc)*glucose)
> summary(AN1)
Author: Sergey Mastitsky
![Page 16: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/16.jpg)
При концентрации C, ожидаемое среднее значение
log-диаметра клеток будет суммой:
Свободного члена уравнения (Intercept), 1.6313 -0.0532log10C 0.0034, но только в культуре без глюкозы
-0.0065log10C, но только в культуре без глюкозы
Author: Sergey Mastitsky
![Page 17: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/17.jpg)
Свободный член и регрессионный
коэффициент для культуры с глюкозой
Разница между группами по
свободному члену и регрессионому коэффициенту
Author: Sergey Mastitsky
![Page 18: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/18.jpg)
Так, для культуры с глюкозой:
log10D = 1.6313 – 0.0532log10C
Для культуры без глюкозы:
log10D = (1.6313+0.0034) – (0.0532+0.0064)log10C
Author: Sergey Mastitsky
![Page 19: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/19.jpg)
Регрессионный коэффициент в культуре без глюкозы статистически не отличается от коэффициента в культуре с глюкозой => линии параллельны
Author: Sergey Mastitsky
![Page 20: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/20.jpg)
> AN2 <- lm(log10(diameter) ~
log10(conc) + glucose)
> summary(AN2)
Author: Sergey Mastitsky
![Page 21: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/21.jpg)
Культура с глюкозой:
log10D = 1.6421 – 0.0554log10C
Культура без глюкозы:
log10D = (1.6421-0.0282) – 0.0554log10C,
Таким образом, клетки в культуре без глюкозы в
среднем на 6.3% мельче (10-0.0282 = 0.937) Author: Sergey Mastitsky
![Page 22: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/22.jpg)
ANCOVA предполагает одинаковые групповые
дисперсии
Это условие можно проверить так:
> var.test(lm.gluc, lm.nogluc)
Author: Sergey Mastitsky
![Page 23: Ковариационный анализ (ANСOVA) в системе R](https://reader034.fdocument.pub/reader034/viewer/2022052508/5598cac81a28ab36568b484b/html5/thumbnails/23.jpg)
> anova(AN2)
Author: Sergey Mastitsky