ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2...

23
1 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija

Transcript of ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2...

Page 1: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

1

ANALIZA

VARIANCE

1.del

Doc.dr. Tadeja Kraner Šumenjak

Delovna verzija

Page 2: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

2

PREDPOSTAVKE:

•Y naj bo slučajna spremenljivka, ki meri izid poskusa.

•Yi naj opisuje izid pri i-tem obravnavanju (obravnavanja so

lahko različne sorte, gostote setve)

•Yi so normalno porazdeljene

•Variance po obravnavanjih so homogene (enake).

•Zagotovljena mora biti medsebojna neodvisnost obravnavanj.

ENOSMERNA ANALIZA VARIANCE

(slučajne skupine)

Page 3: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

3

Vzorec velikosti n enot razdelimo na p razredov,

ki se ločijo po enem faktorju.

Torej imamo p neodvisnih spremenljivk:

Njihova matematična upanja naj bodo (so

neznana):

1 2, ,..., pY Y Y

1 2, ,..., p

Page 4: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

4

Izmerjeni podatki za slučajne

spremenljivke:

1

2

1 11 12 1

2 21 22 2

1 2

: , ,...,

: , ,...,

: , ,...,p

n

n

P p p pn

Y Y Y Y

Y Y Y Y

Y Y Y Y

Model lahko zapišemo, če

Naključne

spremenljivke so

neodvisne.

Page 5: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

5

Ničelna hipoteza:

Proti hipotezi H1, ki pravimo, da je vsaj eno povprečje

različno od nič.

Page 6: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

6

2 2 2

1 1 1 1 1

( ) ( ) ( )i i

i

n nk k k

iij ij i

i j i i j

x x n x x x x

Skupna vsota kvadratov

Merjena z vsoto kvadratov

odklonov opazovanih

vrednosti od aritmetične

sredine

Vsota kvadratov

pojasnjena z

obravnavanji

(Zaradi razlik med

obravnavanji)

Nepojasnjena

variabilnost,

znotraj skupine

Ostanek,

napaka

je število ponovitev

je število ponovitev v skupinii

k

n

Različni viri variiranja

Q = Qn+Qg

Page 7: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

7

Vir variabilnosti

Vsota

kvadrato

v

Število

prostostnih

stopenj

Srednji

kvadriran

odklon

F

Fkritični

OBRAVNAVANJE

(med obravnavanji)

Qg

k - 1

2

gs 2

2

n

g

s

s

tabelirana

vrednost

NAPAKA

(znotraj

obravnavanj)

Qn

n - k

2

ns

Skupaj

Q

n - 1

Povprečje vsote kvadratov dobimo:

kn

Qs

k

Qs

nn

g

g

2

2

1

Page 8: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

8

V primeru, ko je ničelna hipoteza pravilna, je

kvocient (statistika)

2

2

n

g

s

sF

porazdeljen(a) po Fisherjevi F(k1, Nk) porazdelitvi.

Ničelno hipotezo, ki pravi, da so aritmetične sredine

posameznih skupin enake zavrnemo takrat, ko pri

dani stopnji značilnosti

velja F F , kjer je F kritična vrednost F statistike.

Page 9: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

9

Page 10: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

10

Primer1

Page 11: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

11

Primer 2

Page 12: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

12

R.MEAD-NASVET

Potrebno število enot n v poskusu:

10 20df

df za ostanek

Več kot 20 ni potrebno,

10 je premalo.

Page 13: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

13

Primer

Na polju je bi izveden poskus z namenom, da

bi primerjali povprečne pridelke 4 novih

kultivarjev koruze. Za poskus so imeli na voljo

homogeno polje. Poskus so izvedli v 6

ponovitvah.

Page 14: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

14

Načrt poskusa

D D C B

C A D A

C A B A

D B A D

D C B B

A C B C

Page 15: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

15

Pridelki koruze na parcelo

Parcela/

Obr

A B C D

1 25,12 40,25 18,30 28,05

2 17,25 35,25 22,60 28,55

3 26,42 31,98 25,90 23,20

4 16,08 36,52 15,05 31,68

5 22,15 43,32 11,42 30,32

6 15,92 37,10 23,68 37,58

Page 16: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

16

Levene's Test of Equality of Error

Variancesa

Dependent Variable:pridelek

F df1 df2 Sig.

,583 3 20 ,633

Tests the null hypothesis that the error

variance of the dependent variable is equal

across groups.

a. Design: Intercept + sorta

SKLEP: ne moremo trditi, da so variance po obravnavanjih različne.

Page 17: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

Kontrola ustreznosti modela-grafični

prikazi

Ostanki so

normalno

porazdeljeni,če

ležijo ob premici.

Page 18: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

Normalna

porazdelitev

ostankov.

Page 19: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

Ostanki so neodvisni. Iz

razporeditve točk v obliki

horizontalnega linearnega pasu

sklepamo, da vrednosti ostankov

niso odvisne od vrednosti ocen

odvisne spremenljivke.

Ni nobenega vzorca.

.

Page 20: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

20

SKLEP: s tveganjem manjšim od 0.05 trdimo, da povprečni pridelki

na parcelo niso enaki.

Page 21: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

21

4. Z dejavnikom, za katerega se izkaže da statistično značilno vpliva na izid (hibrid), gremo v nadaljnjo

analizo: srednje vrednosti nivojev dejavnika med sabo primerjamo s testi mnogoterih primerjav:

Post-hoc testiranje:

Če je splošni F test značilen, to še ne pomeni, da obstajajo razlike med vsemi pari obravnavanj.

Ali obstajajo razlike med pari, bi lahko testirali s t-testi, toda pri tem bi dobili preveliko alfa napako. To pomeni,

da bi ničelno hipotezo prehitro zavrnili.

Izbira testa je odvisna tudi od normalnosti porazdelitve odvisne spremenljivke in homogenosti varianc. Saj so

nekateri testi bolj in drugi manj občutljivi na kršitve. Pred odločitvijo o izbiri testa je dobro preveriti podatke in

poiskati ustrezen test.

Včasih se zgodi, da rezultati ANOVE in HSD niso skladni (F statistično značilen, HSD ne najde razlik).

Klasični testi (zahtevajo homogenost varianc): HSD (Tukeyev test), LSD, S-N-K (Student-Newman-Keuls),

Duncanov test, Scheffejev test, …

Dunettov test: kadar nas zanimajo samo primerjave s kontrolno skupino.

Testi, ki ne zahtevajo enakih varianc: Tamhanejev T2, Dunnettov T3 in C, Games-Howellov test.

Page 22: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

22

HOMOGENOST VARIANC:

Če ni izpolnjena predpostavka ANOVE o homogenosti varianc po obravnavanjih, tedaj podatke transformiramo (npr.

korenimo, logaritmiramo). S tem se lahko odpravi morebitna asimetričnost, hkrati pa zmanjša morebitna nehomogenost

varianc. SPSS uporablja za test homogenosti varianc Levenovo testno statistiko (z gumbom Options zahtevamo test

homogenosti varianc). Ta test je man občutljiv na morebitno

odstopanje podatkov od normalne porazdelitve.

Obstajajo še drugi testi: Cochran’s C test, Bartlett’s test, Hartley’s test (SPSS jih nima).

Ho: σ12= σ2

2 =…= σk2

H1: σi2≠ σj

2 za vsaj en par varianc.

NORMALNA PORAZDELITEV:

Za testiranje ali je porazdelitev normalna (ni tako pomembno, razen če pričakujemo velika odstopanja) lahko

uporabimo Kolmogorov Smirnov test. Uporaben je pri zveznih porazdelitvah in to najbolj zanesljivo v primeru velikih

vzorcev. Ta test ima vgrajen tudi program SPSS pod imenom One-Sample Kolmogorov-Smirnov Test (SPSS:

Analyze/Nonparametric Test/One-Sample Kolmogorov Smirnov Test).

Page 23: ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2 PREDPOSTAVKE: •Y naj bo slučajna spremenljivka, ki meri izid poskusa. •Yi naj opisuje

23

Testi se ločijo po

tem, kako

izračunajo kritično

razliko.

Zelo

strog.

Ni statistično

značilne razlike

med povprečnima

pridelkoma koruze

hibridov A in C in B

in D