Ковариационный анализ (ANСOVA) в системе R

23
Тема 10 Сергей Мастицкий БГУ, Минск, май 2014

description

Приведен пример выполнения ковариационного анализа (ANCOVA) в среде статистических вычислений R.

Transcript of Ковариационный анализ (ANСOVA) в системе R

Page 1: Ковариационный анализ (ANСOVA) в системе R

Тема 10

Сергей Мастицкий БГУ, Минск, май 2014

Page 2: Ковариационный анализ (ANСOVA) в системе R

Регрессионный анализ, включающий как

количественные, так и качественные

предикторы (факторы), называется

ковариционным анализом (ANCOVA) Используется все та же функция lm(), но

имеются некоторые особенности

касательно интерпретации результатов

Author: Sergey Mastitsky

Page 3: Ковариационный анализ (ANСOVA) в системе R

10.1. Графическое представление данных, подпадающих по случай

ANCOVA

Page 4: Ковариационный анализ (ANСOVA) в системе R

> library(ISwR)

> data(hellung)

> head(hellung)

> help("hellung")

Два типа культур: с глюкозой (1) и без глюкозы (2) в

питательной среде

Измерены концентрация (conc) и диаметр (diameter)

Оказывает ли наличие

глюкозы влияние на связь diameter~conc?

Author: Sergey Mastitsky

Page 5: Ковариационный анализ (ANСOVA) в системе R

> summary(hellung)

Распознана R как количественная

переменная – не хорошо

Резко асимметричное распределение

Author: Sergey Mastitsky

Page 6: Ковариационный анализ (ANСOVA) в системе R

> hellung$glucose <-

factor(hellung$glucose, labels =

c("Yes", "No"))

> summary(hellung)

Author: Sergey Mastitsky

Page 7: Ковариационный анализ (ANСOVA) в системе R

> attach(hellung)

> plot(conc, diameter,

pch = as.numeric(glucose))

0e+00 1e+05 2e+05 3e+05 4e+05 5e+05 6e+05

19

21

23

25

conc

dia

me

ter

Author: Sergey Mastitsky

Page 8: Ковариационный анализ (ANСOVA) в системе R

> legend(locator(), legend =

c("glucose","no glucose"),

pch = 1:2)

0e+00 1e+05 2e+05 3e+05 4e+05 5e+05 6e+05

19

21

23

25

conc

dia

me

ter

glucoseno glucose

Author: Sergey Mastitsky

Page 9: Ковариационный анализ (ANСOVA) в системе R

Поскольку имеется выраженная

экспоненциальная зависимость

(обратная), имеет смысл log-

трансформировать данные (также

приводит к ~нормальному

распределению): > plot(conc, diameter,

pch = as.numeric(glucose),

log = "xy")

Author: Sergey Mastitsky

Page 10: Ковариационный анализ (ANСOVA) в системе R

1e+04 2e+04 5e+04 1e+05 2e+05 5e+05

19

20

21

22

23

24

25

26

conc

dia

me

ter

Author: Sergey Mastitsky

Page 11: Ковариационный анализ (ANСOVA) в системе R

> tethym.gluc <-

hellung[glucose == "Yes", ]

> tethym.nogluc <-

hellung[glucose == "No", ]

> lm.nogluc <- lm(log10(diameter)~

log10(conc), data = tethym.nogluc)

> lm.gluc <- lm(log10(diameter)~

log10(conc), data = tethym.gluc)

Author: Sergey Mastitsky

Page 12: Ковариационный анализ (ANСOVA) в системе R

> abline(lm.nogluc)

> abline(lm.gluc)

1e+04 2e+04 5e+04 1e+05 2e+05 5e+05

19

20

21

22

23

25

conc

dia

me

ter

Author: Sergey Mastitsky

Page 13: Ковариационный анализ (ANСOVA) в системе R

Линии примерно

параллельны, но не

«идеально»

Различаются линии по

углам наклона

(=степени зависимости

размера клеток от

плотности популяции)?

Различаются ли группы

по среднему размеру

клеток?

1e+04 5e+04 2e+05

19

20

21

22

23

24

25

26

conc

dia

me

ter

Author: Sergey Mastitsky

Page 14: Ковариационный анализ (ANСOVA) в системе R

10.2. Реализация ANCOVA в R

Page 15: Ковариационный анализ (ANСOVA) в системе R

> AN1 <- lm(log10(diameter) ~

log10(conc)*glucose)

> summary(AN1)

Author: Sergey Mastitsky

Page 16: Ковариационный анализ (ANСOVA) в системе R

При концентрации C, ожидаемое среднее значение

log-диаметра клеток будет суммой:

Свободного члена уравнения (Intercept), 1.6313 -0.0532log10C 0.0034, но только в культуре без глюкозы

-0.0065log10C, но только в культуре без глюкозы

Author: Sergey Mastitsky

Page 17: Ковариационный анализ (ANСOVA) в системе R

Свободный член и регрессионный

коэффициент для культуры с глюкозой

Разница между группами по

свободному члену и регрессионому коэффициенту

Author: Sergey Mastitsky

Page 18: Ковариационный анализ (ANСOVA) в системе R

Так, для культуры с глюкозой:

log10D = 1.6313 – 0.0532log10C

Для культуры без глюкозы:

log10D = (1.6313+0.0034) – (0.0532+0.0064)log10C

Author: Sergey Mastitsky

Page 19: Ковариационный анализ (ANСOVA) в системе R

Регрессионный коэффициент в культуре без глюкозы статистически не отличается от коэффициента в культуре с глюкозой => линии параллельны

Author: Sergey Mastitsky

Page 20: Ковариационный анализ (ANСOVA) в системе R

> AN2 <- lm(log10(diameter) ~

log10(conc) + glucose)

> summary(AN2)

Author: Sergey Mastitsky

Page 21: Ковариационный анализ (ANСOVA) в системе R

Культура с глюкозой:

log10D = 1.6421 – 0.0554log10C

Культура без глюкозы:

log10D = (1.6421-0.0282) – 0.0554log10C,

Таким образом, клетки в культуре без глюкозы в

среднем на 6.3% мельче (10-0.0282 = 0.937) Author: Sergey Mastitsky

Page 22: Ковариационный анализ (ANСOVA) в системе R

ANCOVA предполагает одинаковые групповые

дисперсии

Это условие можно проверить так:

> var.test(lm.gluc, lm.nogluc)

Author: Sergey Mastitsky

Page 23: Ковариационный анализ (ANСOVA) в системе R

> anova(AN2)

Author: Sergey Mastitsky