Zadatak. 2 X ;X ;:::;Xn 1 2 X4.5. Testovi o parametru o•cekivanja na osnovi velikih uzoraka Ovdje...

63
Zadatak. (χ 2 -test) Neka je X 1 ,X 2 ,...,X n sluˇ cajni uzorak za X s normalnom populacijskom distribuci- jom N (μ, σ 2 ) (oba parametra su nepoznata). Pokaˇ zite da je test omjera vjerodostojnosti za testi- ranje nul-hipoteze H 0 : σ 2 = σ 2 0 u odnosu na (a) jednostranu alternativu H 1 : σ 2 2 0 ; (b) jednostranu alternativu H 1 : σ 2 2 0 ; (c) dvostranu alternativu H 1 : σ 2 6= σ 2 0 , dan testnom statistikom V = (n - 1)S 2 n σ 2 0 . 1

Transcript of Zadatak. 2 X ;X ;:::;Xn 1 2 X4.5. Testovi o parametru o•cekivanja na osnovi velikih uzoraka Ovdje...

  • Zadatak. (χ2-test) Neka je X1, X2, . . . , Xn slučajniuzorak za X s normalnom populacijskom distribuci-jom N(µ, σ2) (oba parametra su nepoznata).Pokažite da je test omjera vjerodostojnosti za testi-ranje nul-hipoteze H0: σ

    2 = σ20 u odnosu na

    (a) jednostranu alternativu H1: σ2 < σ20;

    (b) jednostranu alternativu H1: σ2 > σ20;

    (c) dvostranu alternativu H1: σ2 6= σ20,

    dan testnom statistikom

    V =(n− 1)S2n

    σ20.

    1

  • Za sva tri navedena slučajeva odredite kritična po-

    dručja u odnosu na testnu statistiku.

    (σ20 > 0 je zadani broj)

    2

  • 4.5. Testovi o parametru očekivanja na osnovi

    velikih uzoraka

    Ovdje ne pretpostavljamo da X ima normalnu dis-

    tribuciju (u populaciji), ali pretpostavljamo da je va-

    rijanca σ2 = Var[X] konačna.

    Konstrukcija testa se bazira na asimptotskoj nor-

    malnosti od X za uzorke velike duljine (posljedica

    CGT-a).

    3

  • Primjer 4.5. (primjer 3.15)

    Zanima nas postotak p · 100% pušača u populaciji18-godǐsnjih Britanaca. Na slučajan način odabran

    je uzorak duljine n = 7383 iz te populacije. U uzorku

    je bilo p̂ · 100% = 32.8% pušača.

    Uz razinu značajnosti od 5% testirajte

    H0 : p = 0.30H1 : p 6= 0.30.

    4

  • X = Bernoullijeva varijabla koja indicira pušača

    E[X] = p, Var[X] = p(1− p)Procjenitelj za p: relativna frekvencija pušača u uzorku,

    p̂ = X

    ⇒ Testna statistika:

    Z =p̂− 0.30√0.30 · 0.70 ·

    √7383

    5

  • Kritično područje (dvostrani test!):

    ZH0≈ N(0,1) ⇒ P(|Z| ≥ z0.025) ≈ 0.05

    z0.025 = (tablice) = 1.96 pa je kritično područje

    〈−∞,−1.96] ∪ [1.96,+∞〉Vrijednost testne statistike Z:

    z =0.328− 0.30√

    0.21·√

    7383 = 5.25 > 1.96.

    Dakle, na razini značajnosti od 5% odbacujemo pret-

    postavku da u populaciji 18-godǐsnjih Britanaca ima

    30% pušača.

    6

  • 4.6 Usporedba očekivanja dviju normalno dis-

    tribuiranih populacija (t-test)

    Pretpostavimo da mjerimo (opažamo) isto stat. o-

    bilježje X, ali u dvije različite populacije.

    Nadalje, pretpostavljamo da

    • u obje populacije X je normalno distribuiranavarijabla

    • s jednakim (populacijskim) varijancama.

    7

  • Neka su:

    X1 = vrijednost varijable X na slučajno odabranoj

    jedinki iz populacije 1

    X2 = vrijednost varijable X na slučajno odabranoj

    jedinki iz populacije 2.

    Pretpostavke na X ⇒

    X1 ∼ N(µ1, σ2), X2 ∼ N(µ2, σ2)

    8

  • Neka su:

    X11, X12, . . . , X1n1 sl. uzorak za X1 duljine n1X21, X22, . . . , X2n2 sl. uzorak za X2 duljine n2

    i ta dva uzorka su (medusobno)nezavisna.

    Označimo sa:

    X1, S21 i X2, S

    22

    arit. sredine i uzoračke varijance uzoraka za X1 i X2(redom).

    9

  • Želimo testirati (3 slučaja!):

    (1) : (2) : (3) :

    H0 : µ1 = µ2 H0 : µ1 = µ2 H0 : µ1 = µ2H1 : µ1 > µ2 H1 : µ1 < µ2 H1 : µ1 6= µ2

    10

  • U sva tri slučaja, testna statistika je jednaka:

    T =X1 −X2

    Sd· 1√

    1n1

    + 1n2

    H0∼ t(n1 + n2 − 2),

    gdje je Sd procjenitelj (zajedničke) standardne devi-

    jacije σ na osnovi oba uzorka:

    Sd =

    √√√√(n1 − 1)S21 + (n2 − 1)S22n1 + n2 − 2

    (S2d je nepristrani procjenitelj varijance σ2)

    Neka je α zadana razina značajnosti.

    11

  • (1): (jednostrani test)

    H0 : µ1 = µ2H1 : µ1 > µ2

    P(T ≥ tα(n1 + n2 − 2) |H0) = α⇒ kritično područje:

    [tα(n1 + n2 − 2),+∞〉

    12

  • (2): (jednostrani test)

    H0 : µ1 = µ2H1 : µ1 < µ2

    P(T ≤ −tα(n1 + n2 − 2) |H0) = α⇒ kritično područje:

    〈−∞,−tα(n1 + n2 − 2)]

    13

  • (3): (dvostrani test)

    H0 : µ1 = µ2H1 : µ1 6= µ2

    P(|T | ≥ tα/2(n1 + n2 − 2) |H0) = α⇒ kritično područje:

    〈−∞,−tα/2(n1 + n2 − 2)] ∪ [tα/2(n1 + n2 − 2),+∞〉

    14

  • Zadatak. Pokažite da je navedeni t-test test omjera

    vjerodostojnosti.

    15

  • Primjer 4.6. Zanima nas da li nova vrsta prehranestoke značajno utječe na količinu proizvedenog mli-jeka. U tu svrhu na sl. način odabrano je 25 krava,a od njih 25, opet na sl. način odabrano je 13 kravakoje će biti podvrgnute novom režimu prehrane. Os-talih 12 krava hranit će se na uobičajeni (stari) način.Tijekom tri tjedna za svaku kravu mjeri se dnevniprinos mlijeka.

    U tablici se za svaku kravu nalaze prosječni dnevniprinosi mlijeka za razdoblje od 3 tjedna.

    tretman 44,44,56,46,47,38,58,53,49,35,46,30,41kontrola 35,47,55,29,40,39,32,41,42,57,51,39

    16

  • Označimo:X1 = prosječni dnevni prinos mlijeka krave hranjenena novi načinX2 = prosječni dnevni prinos mlijeka krave hranjenena stari način.

    Razumno je pretpostaviti da su X1 i X2 normalnodistribuirane s.v. Dodatno pretpostavljamo da su imvarijance jednake.

    Želimo uz razinu značajnosti od 5% testirati je linovi način prehrane stoke s aspekta prinosa mlijekabolji od starog načina.

    17

  • Neka su µ1 = E[X1] i µ2 = E[X2]. Želimo testirati:

    H0 : µ1 ≤ µ2H1 : µ1 > µ2

    H0 mijenjamo s jednostavnom hipotezom i testi-

    ramo:

    H0 : µ1 = µ2H1 : µ1 > µ2

    Obzirom na pretpostavke, koristimo jednostrani t-

    test.

    18

  • Testna statistika:

    T =X1 −X2

    Sd· 1√

    113 +

    112

    H0∼ t(23)

    Kritično područje:

    P(T ≥ t0.05(23) |H0) = 0.05 ⇒ [1.714,+∞〉

    19

  • x̄1 = 45.15, s21 = 64.0, x̄2 = 42.25, s

    22 = 76.4

    ⇒ sd =√√√√(n1 − 1)s21 + (n2 − 1)s22

    n1 + n2 − 2=

    =

    √12 · 64.0 + 11 · 76.4

    23=√

    69.9 = 8.63

    ⇒ t = x̄1 − x̄2sd

    1√113 +

    112

    =

    =45.15− 42.25

    8.63

    √12 · 13

    25= 0.84

    20

  • Budući da se t = 0.84 ne nalazi u kritičnom po-

    dručju, na osnovi opaženog uzorka i razine značajnosti

    od 5% ne možemo zaključiti da nova metoda daje u

    srednjem veći dnevni prinos milijeka od stare metode

    prehrane stoke.

    21

  • Primjer 4.8. (Spareni podaci)

    Istražuje se da li odredena vrsta lijeka izaziva sma-

    njenje krvnog tlaka. Uzorak se sastoji od 15 na

    slučajan način odabranih studentica. U trenutku 0

    izmjeren im je krvni tlak (X). Zatim su uzimale

    redovnu dozu lijeka tijekom 6 mjeseci. Nakon 6

    mjeseci ponovo im je izmjeren krvni tlak (Y ).

    Da li lijek značajno (uz razinu značajnosti od 5%)

    utječe na smanjenje krvnoga tlaka?

    22

  • Podaci:

    i 1 2 3 4 5 6 7 8xi 70 80 72 76 76 76 72 78yi 68 72 62 70 58 66 68 52

    i 9 10 11 12 13 14 15xi 82 64 74 92 74 68 84yi 64 72 74 60 74 72 74

    23

  • Pretpostavimo:

    X = krvni tlak studentice u t = 0 ∼ N(µ0, σ20)Y = krvni tlak studentice u t = 6 ∼ N(µ6, σ26)

    Testiramo:

    H0 : µ0 ≤ µ6H1 : µ0 > µ6

    H0 mijenjamo s jednostavnom hipotezom i testi-

    ramo:

    H0 : µ0 = µ6H1 : µ0 > µ6

    24

  • Jesu li X i Y nezavisne s.v?

    25

  • D := X − Y ∼ N(µ0 − µ6, σ2)Želimo testirati:

    H0 : µ0 − µ6 = 0H1 : µ0 − µ6 > 0

    što se svodi na t-test za jedan uzorak (poglavlje 4.4).

    26

  • Izvedeni podaci:

    i 1 2 3 4 5 6 7 8xi 70 80 72 76 76 76 72 78yi 68 72 62 70 58 66 68 52di 2 8 10 6 18 10 4 26

    i 9 10 11 12 13 14 15xi 82 64 74 92 74 68 84yi 64 72 74 60 74 72 74di 18 -8 0 32 0 -4 10

    27

  • d̄ = 8.8, s = 10.98 ⇒ t = d̄s·√

    15 = 3.11

    Kritično područje (α = 5%):

    [t0.05(14),+∞〉 = [1.761,+∞〉Dakle, odbacujemo H0 u korist H1, tj. istraživani li-

    jek značajno smanjuje krvni tlak na razini značajnosti

    od 5%.

    28

  • 4.7 Usporedba varijanci normalno distribuiranih

    populacija (F -test)

    Ovdje opisujemo test hipoteze o jednakosti popu-

    lacijskih varijanci dviju normalno distribuiranih vari-

    jabli X1 i X2.

    Koristimo iste oznake kao u 4.6 samo što sada pret-

    postavljamo da je moguće da su populacijske vari-

    jance različite:

    σ21 = Var[X1], σ22 = Var[X2].

    29

  • Želimo testirati osnovnu hipotezu

    H0 : σ21 = σ

    22

    u odnosu na jednostrane alternative

    H1 : σ21 > σ

    22 ili H1 : σ

    21 < σ

    22

    ili dvostranu alternativu

    H1 : σ21 6= σ22.

    30

  • Zadatak. Pokažite da je testna statistika testa om-

    jera vjerodostojnosti za navedene hipoteze:

    F =S21S22

    .

    Tada je

    FH0∼ F (n1 − 1, n2 − 1).

    31

  • Neka je α zadana razina značajnosti.

    (1): (jednostrani test)

    H0 : σ21 = σ

    22

    H1 : σ21 > σ

    22

    P(F ≥ fα(n1 − 1, n2 − 1) |H0) = α⇒ kritično područje:

    [fα(n1 − 1, n2 − 1),+∞〉

    32

  • (2): (jednostrani test)

    H0 : σ21 = σ

    22

    H1 : σ21 < σ

    22

    P(F ≤ f1−α(n1 − 1, n2 − 1) |H0) = α⇒ kritično područje:

    〈0, f1−α(n1 − 1, n2 − 1)]

    33

  • (3): (dvostrani test)

    H0 : σ21 = σ

    22

    H1 : σ21 6= σ22

    P(F ≤ f1−α2(n1 − 1, n2 − 1) iliF ≥ fα

    2(n1 − 1, n2 − 1) |H0) = α

    ⇒ kritično područje:

    〈0, f1−α2(n1 − 1, n2 − 1)] ∪ [fα2(n1 − 1, n2 − 1),+∞〉

    34

  • Vrijednosti fα(m1, m2) su tabelirane.

    Vrijedi:

    f1−α(m1, m2) =1

    fα(m2, m1)

    35

  • Primjer 4.8. (nastavak primjera 4.6)

    Uz razinu značajnosti od 10% želimo testirati

    H0 : σ21 = σ

    22

    H1 : σ21 6= σ22.

    Iz zadanih uzoraka imamo

    s21 = 64.0, s22 = 76.4

    36

  • Vrijednost testne statistike F = S21/S22 je

    f =s21s22

    =64.0

    76.4= 0.84.

    Kritično područje:

    〈0, f0.95(12,11)] ∪ [f0.05(12,11),+∞〉

    f0.05(12,11) = (tablice) = 2.69

    f0.95(12,11) =1

    f0.05(11,12)= (tablice) =

    1

    2.72= 0.37

    dakle, kritično područje je:

    〈0,0.37] ∪ [2.69,+∞〉.37

  • Budući da f = 0.84 ne pripada kritičnom području,

    ne odbacujemo hipotezu da su populacijske varijance

    jednake na razini značajnosti od 10%.

    38

  • 4.8 Usporedba očekivanja na osnovi velikih uzo-

    raka. Usporedba proporcija.

    Promatramo dvije populacije.

    Neka su:X1 s.v., model za prvu populacijuX2 s.v., model za drugu populaciju.

    Pretpostavljamo da su populacijske varijance σ21 iσ22 konačne i općenito nepoznate. Želimo testiratihipoteze o nepoznatim parametrima populacijskihsrednjih vrijednosti µ1 i µ2.

    39

  • Neka su:

    X11, X12, . . . , X1n1 sl. uzorak za X1 duljine n1X21, X22, . . . , X2n2 sl. uzorak za X2 duljine n2

    i ta dva uzorka su (medusobno)nezavisna.

    Označimo sa:

    X1, σ̂21 i X2, σ̂

    22

    arit. sredine i konzistentne procjenitelje populacijskihvarijanci na osnovi svakog uzorka posebno, za X1 iX2 (redom).

    40

  • Želimo testirati (3 slučaja!):

    (1) : (2) : (3) :

    H0 : µ1 = µ2 H0 : µ1 = µ2 H0 : µ1 = µ2H1 : µ1 > µ2 H1 : µ1 < µ2 H1 : µ1 6= µ2

    41

  • Ako je H0 točna, prema CGT-u vrijedi

    Z :=X1 −X2√

    σ̂21n1

    +σ̂22n2

    D−→ N(0,1), min{n1, n2} → +∞.

    Z je testna statistika. Kritično područje konstruira

    se kao u t-testu, samo što su odgovarajuće kritične

    vrijednosti jedinični normalni kvantili.

    42

  • Važan primjer je usporedba proporcija.

    Promatramo dvije populacije i neko bernoullijevsko

    obilježje X.

    Označimo sa:

    X1 Bernoullijevu s.v. koja reprezentira X u pop.1,

    X2 Bernoullijevu s.v. koja reprezentira X u pop.2,

    a sa p1, p2 njihove parametre (vjerojatnosti uspjeha).

    43

  • Želimo testirati osnovnu hipotezu

    H0 : p1 = p2

    u odnosu na (uobičajene) jednostrane alternative:

    H1 : p1 > p2 ili H1 : p1 < p2

    ili dvostranu alternativu

    H1 : p1 6= p2.

    44

  • Označimo sa p̂1, p̂2 procjenitelje od p1, p2 na os-

    novi svakog uzorka posebno (uzorci su medusobno

    nezavisni duljina n1 i n2), te sa

    p̂ :=n1p̂1 + n2p̂2

    n1 + n2

    procjenitelj zajedničke vjerojatnosti uspjeha (na bazi

    oba uzorka zajedno).

    45

  • Testna statistika:

    Z =p̂1 − p̂2√p̂(1− p̂)

    · 1√1n1

    + 1n2

    H0∼ asimptotskiN(0,1)

    za velike n1 i n2 (tj., kada min{n1, n2} → ∞)

    Kritična područja se odrede kao u slučaju t-testa,

    jedino se umjesto tα(m) očitavaju zα vrijednosti iz

    tablica za standardnu normalnu razdiobu.

    46

  • Primjer 4.9. Želimo usporediti tradicionalnu (T) s

    audio-vizualnom (AV) metodom učenja nekog stra-

    nog jezika. U tu svrhu na sl. način odabrano je 250

    učenika. 100 od njih je na sl. način odredeno da uče

    jezik T-metodom, a preostalih 150 AV-metodom.

    Na kraju tečaja svih 250 učenika pristupilo je istom

    pismenom ispitu.

    47

  • Podaci o broju prošlih i palih na ispitu nalazi se u

    tablici:

    T AV ukupnoprošli 63 107 170pali 37 43 80ukupno 100 150 250

    Želimo uz razinu značajnosti od 5% testirati je li

    AV-metoda uspješnija od T-metode.

    48

  • Neka su:

    p1 = omjer učenika koji prolaze ispit u populaciji

    učenika koji su učili metodom T

    p2 = omjer učenika koji prolaze ispit u populaciji

    učenika koji su učili metodom AV.

    Testiramo:

    H0 : p1 ≥ p2H1 : p1 < p2

    , odn.H0 : p1 = p2H1 : p1 < p2

    49

  • Testna statistika:

    Z =p̂1 − p̂2√p̂(1− p̂)

    · 1√1

    100 +1

    150

    Kritično područje: (zbog ZH0≈ N(0,1))

    P(Z ≤ −z0.05 |H0) ≈ 0.05 ⇒ 〈−∞,−1.64]

    50

  • Procjene:

    p̂1 =63

    100= 0.63, p̂2 =

    107

    150= 0.71, p̂ =

    170

    250= 0.68

    Vrijednost testne statistike Z:

    z =p̂1 − p̂2√p̂(1− p̂)

    · 1√1

    100 +1

    150

    =

    =0.63− 0.71√0.68 · 0.32 ·

    √150 · 100

    250= −1.33

    51

  • Budući da se z = −1.33 ne nalazi u kritičnom po-dručju, ne možemo na razini značajnosti od 5% i

    opaženog uzorka tvrditi da je AV-metoda uspješnija

    od tradicionalne.

    52

  • 4.9 Jednofaktorska analiza varijance (ANOVA)

    Kada želimo usporediti (normalne) razdiobe neke

    varijable u vǐse od dvije populacije, tada koristimo

    ANOVA-u.

    (ANOVA = Analysis of Variance)

    (Za usporedbu dviju normalnih populacija koristimo

    t-test iz 5.5)

    53

  • Neka su

    X11, X12, . . . , X1n1 s.u. za X1 ∼ N(µ1, σ2)X21, X22, . . . , X2n2 s.u. za X2 ∼ N(µ2, σ2)... ...Xk1, Xk2, . . . , Xknk s.u. za Xk ∼ N(µk, σ2)

    k nezavisnih slučajnih uzoraka, svaki za normalno

    distribuirano obilježje X reprezentirano sa X1 u po-

    pulaciji 1, sa X2 u populaciji 2, itd., sa Xk u popu-

    laciji k.

    Uz normalnost svake populacije još pretpostavljamo

    da su im populacijske varijance jednake.

    54

  • Želimo testirati osnovnu hipotezu

    H0 : µ1 = µ2 = . . . = µk

    u odnosu na alternativu

    H1 : postoje i, j ∈ {1,2, . . . , k} t.d. je µi 6= µj.

    55

  • Testnu statistiku izračunamo postupno:

    1. Za svaki uzorak posebno izračunamo arit. sredinu

    i uzoračku varijancu:

    Xi·, S2i·, i = 1,2, . . . , k.

    2. Izračuna se n = n1 + · · · + nk i ukupna arit.sredina:

    X =1

    n

    k∑

    i=1

    ni∑

    j=1

    Xij =1

    n

    k∑

    i=1

    niXi·

    56

  • 3. Zbroj kvadrata odstupanja srednjih vrijednosti

    od ukupne arit. sredine (suma kvadrata zbog tret-

    mana):

    SST =k∑

    i=1

    ni(Xi· −X)2

    4. Suma kvadrata pogrešaka:

    SSE =k∑

    i=1

    ni∑

    j=1

    (Xij −Xi·)2 =k∑

    i=1

    (ni − 1)S2i·

    57

  • 5. Srednjekvadratno odstupanje medu uzorcima (zbogtretmana):

    MST =SST

    k − 1

    6. Srednjekvadratna pogreška:

    MSE =SSE

    n− k

    7. Testna statistika:

    F =MST

    MSE

    H0∼ F (k − 1, n− k)

    58

  • Dakle, ako je H0 istinita testna statistika F ima

    Fisherovu F -distribuciju s parom stupnjeva slobode

    (k − 1, n− k).

    Ako H0 nije istinita hipoteza, onda očekujemo da

    opažena vrijednost f statistike F bude velika.

    ⇒ Kritično područje (uz razinu značajnosti α):

    [fα(k − 1, n− k),+∞〉

    59

  • Cjelokupni račun se prikazuje u ANOVA-tablici:

    broj zbroj srednjeizvor stupnjeva kvadrata kvadratno

    varijabilnosti slobode odstupanja odstupanje F -stat.

    zbog tretmana k − 1 SST MST Fsl. pogreška n− k SSE MSE —

    ukupno n− 1 SS — —

    SS :=k∑

    i=1

    ni∑

    j=1

    (Xij −X)2

    Vrijedi sljedeći rastav varijance:

    SS = SST + SSE

    60

  • Primjer 4.10. U svrhu pobolǰsanja kvalitete AVmagnetskih vrpci, mjeri se efekt vrste premaza vrp-ce na kvalitetu reprodukcije zvuka. Promatrane sučetiri vrste premaza: A, B, C i D. Dobiveni su sljedećipodaci:

    premaz podaciA 10, 15, 8, 12, 15B 14, 18, 21, 15C 17, 16, 14, 15, 17, 15, 18D 12, 15, 17, 15, 16, 15

    Utječe li značajno (uz α = 5%) vrsta premaza vrpcena kvalitetu reprodukcije zvuka?

    61

  • i ni x̄i· nix̄i· ni(x̄i· − x̄)2 (ni − 1)s2i·A 5 12 60 45 38B 4 17 68 16 30C 7 16 112 7 12D 6 15 80 0 15∑

    22 − 330 68 94

    n = 22, x̄ =330

    22= 15, SST = 68, SSE = 94, k = 4

    MST =68

    4− 1 = 22.67, MSE =94

    22− 4 = 5.22

    f =22.67

    5.22= 4.34

    62

  • ANOVA-tablica:

    broj zbroj srednjeizvor stupnjeva kvadrata kvadratno

    varijabilnosti slobode odstupanja odstupanje F -stat.

    zbog premaza 3 68 22.67 4.34sl. pogreška 18 94 5.22 —

    ukupno 21 162 — —

    f0.05(3,18) = (tablice) = 3.16

    Budući da je f = 4.34 ≥ 3.16 uz razinu značajnostiod 5% odbacujemo pretpostavku da vrsta premaza

    ne utječe na kvalitetu reprodukcije zvuka.

    63