ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2...

Post on 03-Jan-2020

6 views 0 download

Transcript of ANALIZA VARIANCE 11 ANALIZA VARIANCE 1.del Doc.dr. Tadeja Kraner Šumenjak Delovna verzija 2...

1

ANALIZA

VARIANCE

1.del

Doc.dr. Tadeja Kraner Šumenjak

Delovna verzija

2

PREDPOSTAVKE:

•Y naj bo slučajna spremenljivka, ki meri izid poskusa.

•Yi naj opisuje izid pri i-tem obravnavanju (obravnavanja so

lahko različne sorte, gostote setve)

•Yi so normalno porazdeljene

•Variance po obravnavanjih so homogene (enake).

•Zagotovljena mora biti medsebojna neodvisnost obravnavanj.

ENOSMERNA ANALIZA VARIANCE

(slučajne skupine)

3

Vzorec velikosti n enot razdelimo na p razredov,

ki se ločijo po enem faktorju.

Torej imamo p neodvisnih spremenljivk:

Njihova matematična upanja naj bodo (so

neznana):

1 2, ,..., pY Y Y

1 2, ,..., p

4

Izmerjeni podatki za slučajne

spremenljivke:

1

2

1 11 12 1

2 21 22 2

1 2

: , ,...,

: , ,...,

: , ,...,p

n

n

P p p pn

Y Y Y Y

Y Y Y Y

Y Y Y Y

Model lahko zapišemo, če

Naključne

spremenljivke so

neodvisne.

5

Ničelna hipoteza:

Proti hipotezi H1, ki pravimo, da je vsaj eno povprečje

različno od nič.

6

2 2 2

1 1 1 1 1

( ) ( ) ( )i i

i

n nk k k

iij ij i

i j i i j

x x n x x x x

Skupna vsota kvadratov

Merjena z vsoto kvadratov

odklonov opazovanih

vrednosti od aritmetične

sredine

Vsota kvadratov

pojasnjena z

obravnavanji

(Zaradi razlik med

obravnavanji)

Nepojasnjena

variabilnost,

znotraj skupine

Ostanek,

napaka

je število ponovitev

je število ponovitev v skupinii

k

n

Različni viri variiranja

Q = Qn+Qg

7

Vir variabilnosti

Vsota

kvadrato

v

Število

prostostnih

stopenj

Srednji

kvadriran

odklon

F

Fkritični

OBRAVNAVANJE

(med obravnavanji)

Qg

k - 1

2

gs 2

2

n

g

s

s

tabelirana

vrednost

NAPAKA

(znotraj

obravnavanj)

Qn

n - k

2

ns

Skupaj

Q

n - 1

Povprečje vsote kvadratov dobimo:

kn

Qs

k

Qs

nn

g

g

2

2

1

8

V primeru, ko je ničelna hipoteza pravilna, je

kvocient (statistika)

2

2

n

g

s

sF

porazdeljen(a) po Fisherjevi F(k1, Nk) porazdelitvi.

Ničelno hipotezo, ki pravi, da so aritmetične sredine

posameznih skupin enake zavrnemo takrat, ko pri

dani stopnji značilnosti

velja F F , kjer je F kritična vrednost F statistike.

9

10

Primer1

11

Primer 2

12

R.MEAD-NASVET

Potrebno število enot n v poskusu:

10 20df

df za ostanek

Več kot 20 ni potrebno,

10 je premalo.

13

Primer

Na polju je bi izveden poskus z namenom, da

bi primerjali povprečne pridelke 4 novih

kultivarjev koruze. Za poskus so imeli na voljo

homogeno polje. Poskus so izvedli v 6

ponovitvah.

14

Načrt poskusa

D D C B

C A D A

C A B A

D B A D

D C B B

A C B C

15

Pridelki koruze na parcelo

Parcela/

Obr

A B C D

1 25,12 40,25 18,30 28,05

2 17,25 35,25 22,60 28,55

3 26,42 31,98 25,90 23,20

4 16,08 36,52 15,05 31,68

5 22,15 43,32 11,42 30,32

6 15,92 37,10 23,68 37,58

16

Levene's Test of Equality of Error

Variancesa

Dependent Variable:pridelek

F df1 df2 Sig.

,583 3 20 ,633

Tests the null hypothesis that the error

variance of the dependent variable is equal

across groups.

a. Design: Intercept + sorta

SKLEP: ne moremo trditi, da so variance po obravnavanjih različne.

Kontrola ustreznosti modela-grafični

prikazi

Ostanki so

normalno

porazdeljeni,če

ležijo ob premici.

Normalna

porazdelitev

ostankov.

Ostanki so neodvisni. Iz

razporeditve točk v obliki

horizontalnega linearnega pasu

sklepamo, da vrednosti ostankov

niso odvisne od vrednosti ocen

odvisne spremenljivke.

Ni nobenega vzorca.

.

20

SKLEP: s tveganjem manjšim od 0.05 trdimo, da povprečni pridelki

na parcelo niso enaki.

21

4. Z dejavnikom, za katerega se izkaže da statistično značilno vpliva na izid (hibrid), gremo v nadaljnjo

analizo: srednje vrednosti nivojev dejavnika med sabo primerjamo s testi mnogoterih primerjav:

Post-hoc testiranje:

Če je splošni F test značilen, to še ne pomeni, da obstajajo razlike med vsemi pari obravnavanj.

Ali obstajajo razlike med pari, bi lahko testirali s t-testi, toda pri tem bi dobili preveliko alfa napako. To pomeni,

da bi ničelno hipotezo prehitro zavrnili.

Izbira testa je odvisna tudi od normalnosti porazdelitve odvisne spremenljivke in homogenosti varianc. Saj so

nekateri testi bolj in drugi manj občutljivi na kršitve. Pred odločitvijo o izbiri testa je dobro preveriti podatke in

poiskati ustrezen test.

Včasih se zgodi, da rezultati ANOVE in HSD niso skladni (F statistično značilen, HSD ne najde razlik).

Klasični testi (zahtevajo homogenost varianc): HSD (Tukeyev test), LSD, S-N-K (Student-Newman-Keuls),

Duncanov test, Scheffejev test, …

Dunettov test: kadar nas zanimajo samo primerjave s kontrolno skupino.

Testi, ki ne zahtevajo enakih varianc: Tamhanejev T2, Dunnettov T3 in C, Games-Howellov test.

22

HOMOGENOST VARIANC:

Če ni izpolnjena predpostavka ANOVE o homogenosti varianc po obravnavanjih, tedaj podatke transformiramo (npr.

korenimo, logaritmiramo). S tem se lahko odpravi morebitna asimetričnost, hkrati pa zmanjša morebitna nehomogenost

varianc. SPSS uporablja za test homogenosti varianc Levenovo testno statistiko (z gumbom Options zahtevamo test

homogenosti varianc). Ta test je man občutljiv na morebitno

odstopanje podatkov od normalne porazdelitve.

Obstajajo še drugi testi: Cochran’s C test, Bartlett’s test, Hartley’s test (SPSS jih nima).

Ho: σ12= σ2

2 =…= σk2

H1: σi2≠ σj

2 za vsaj en par varianc.

NORMALNA PORAZDELITEV:

Za testiranje ali je porazdelitev normalna (ni tako pomembno, razen če pričakujemo velika odstopanja) lahko

uporabimo Kolmogorov Smirnov test. Uporaben je pri zveznih porazdelitvah in to najbolj zanesljivo v primeru velikih

vzorcev. Ta test ima vgrajen tudi program SPSS pod imenom One-Sample Kolmogorov-Smirnov Test (SPSS:

Analyze/Nonparametric Test/One-Sample Kolmogorov Smirnov Test).

23

Testi se ločijo po

tem, kako

izračunajo kritično

razliko.

Zelo

strog.

Ni statistično

značilne razlike

med povprečnima

pridelkoma koruze

hibridov A in C in B

in D