STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą...
Transcript of STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą...
STATYSTYKA I DOŚWIADCZALNICTWO Wykład 3
Estymacja przedziałowa – przedziały ufności
Przedział ufności jest przedziałem liczbowym zawierającym z
określonym prawdopodobieństwem (zazwyczaj bliskim 1) nieznaną
wartość szacowanego parametru np. średnią dla populacji
1–α współczynnik ufności (lub poziom ufności) – prawdopodobieństwo
tego, że przedział ufności pokrywa nieznaną wartość szacowanego
parametru
Im wyższa jest wartość współczynnika ufności, tym większa jest długość przedziału.
Wartość α nazywamy poziomem istotności
Przedział ufności dla średniej w populacji o rozkładzie normalnym
α−=+<<−−α−α
1}tXmtX{Pn
S1n,n
S1n,
)tX;tX(n
S1n,n
S1n, −α−α
+−
1, −ntα - wartość odczytana z tablic rozkładu Studenta dla poziomu
istotności α oraz n–1 stopni swobody
Przybliżony przedział ufności dla frakcji (parametru p) w rozkładzie
dwupunktowym (zero-jedynkowym)
u1-α/2 – kwantyl rzędu 1-α/2; wartość z tablicy dystrybuanty rozkładu X~N(0,1)
dla α=0,05 u1-α/2 =1,96
Weryfikacja (testowanie) hipotez statystycznych
sprawdzenie określonych przypuszczeń (założeń) wysuniętych w stosunku do parametrów lub rozkładu populacji generalnej na podstawie próby.
Hipotezy możemy podzielić na
– dotyczące typu rozkładu populacji
– dotyczące parametrów rozkładu (który jest znany)
Test statystyczny – reguła postępowania, która pozwala na przyjęcie (nieodrzucenie) bądź odrzucenie sprawdzanej hipotezy
Procedura testowania hipotez polega na tym, że zakładamy pewną
hipotezę zerową (H0), którą uznajemy za możliwą. Następnie
sprawdzamy, czy ona może być prawdziwa przy pomocy testu
statystycznego. Jeśli podczas weryfikacji hipotezy odrzucimy hipotezę
zerową to przyjmujemy przeciwną do niej hipotezę alternatywną (H1).
Możliwe do popełnienia błędy przy testowaniu hipotez:
Błąd I rodzaju– błąd odrzucenia, występuje, gdy odrzucamy hipotezę,
natomiast jest ona prawdziwa
Błąd II rodzaju – błąd przyjęcia, występuje gdy przyjmujemy hipotezę,
natomiast jest ona fałszywa
Prawdopodobieństwo popełnienia błędu I rodzaju nazywamy
poziomem istotności (α) (przyjmujemy najczęściej α=0,05)
Test t do porównania średniej z normą (rozkład normalny)
Hipoteza zerowa H0: m = m0 Hipoteza alternatywna H1: m ≠ m0
(uwaga: zamiast symbolu m oznaczającego średnią dla populacji używamy również zamiennie symbolu µ)
założenie:
zmienna ma rozkład normalny
Przykłady zastosowań:
Sprawdzenie, czy urządzenie pakujące pewien produkt w opakowania po 1 kg
średnio pakuje dokładnie 1 kg
(badana zmienna: waga netto produktu)
Funkcja testowa:
x
0emp
S
mxt
−=
Sx – błąd standardowy
x Średnia dla próby
m0 - zakładana wartość („norma”)
n
sSx =
Wartość temp. porównujemy z wartością tkryt. i na tej podstawie stwierdzamy,
czy średnia może być równa „normie” (zakładanej wartości), czy też nie.
Wartość krytyczna tα,ν, dla rozkładu t-studenta, gdzie α jest przyjętym
poziomem istotności (najczęściej 0,05), a ν liczbą stopni swobody, czyli
liczebność próby pomniejszona o 1 (n - 1)
Jeżeli |temp|> tα,ν to hipotezę H0 odrzucamy i przyjmujemy hipotezę
alternatywną H1: m ≠ m0 a więc stwierdzamy że średnia różni się istotnie od
„normy” (zakładanej wartości)
W programach statystycznych zamiast wartości krytycznej podawana jest wartość p (p-value). Decyzję o tym, czy hipotezę zerową odrzucamy, czy też nie podejmujemy na podstawie wartości p. Jeżeli p<α to hipotezę zerową odrzucamy i przyjmujemy hipotezę alternatywną, a jeśli p>α to hipotezy zerowej nie odrzucamy. Przyjęło się, że wartość α ustalamy równą 0,05.
Test t do porównania średnich dwóch populacji (niezależnych)
Hipoteza zerowa H0: m1= m2 Hipoteza alternatywna H1: m1 ≠ m2
założenia:
zmienne mają rozkład normalny
wariancje dla porównywanych populacji są sobie równe: σ12= σ2
2
(jeśli to założenie nie jest spełnione stosujemy zmodyfikowaną wersję testu t uwzględniającą nierówność wariancji)
Przykłady zastosowań:
Porównanie wysokości plonów dwóch odmian roślin uprawnych
(badana zmienna: plon)
Porównanie skuteczności dwóch leków obniżających ciśnienie krwi
(zmienna: ciśnienie krwi)
Funkcja testowa:
r
21emp
S
xxt
−=
Sr – błąd różnicy średnich
1x
2x
Średnia dla pierwszej populacji na podstawie próby
Średnia dla drugiej populacji na podstawie próby
+=
21
2 11
nnSS er
gdzie wspólna wariancja:
)1n()1n(
XvarXvarS
21
212e
−+−
+=
∑=
−=
n
i
i )xx(Xvar1
2jest sumą kwadratów odchyleń od średniej
Wartość temp. porównujemy z wartością tkryt. i na tej podstawie stwierdzamy,
czy średnie mogą być równie, czy też nie.
Wartość krytyczna tα,ν, dla rozkładu t-studenta, gdzie α jest przyjętym
poziomem istotności (najczęściej 0,05), a ν liczbą stopni swobody, czyli
liczebność 2 prób pomniejszona o 2 (n1 +n2 -2)
Jeżeli |temp|> tα,ν to hipotezę H0 odrzucamy i przyjmujemy hipotezę
alternatywną H1: m1 ≠ m2 a więc stwierdzamy że średnie różnią się istotnie
W programach statystycznych zamiast wartości krytycznej podawana jest wartość p (p-value). Decyzję o tym, czy hipotezę zerową odrzucamy, czy też nie podejmujemy na podstawie wartości p. Jeżeli p<α to hipotezę zerową odrzucamy i przyjmujemy hipotezę alternatywną, a jeśli p>α to hipotezy zerowej nie odrzucamy. Przyjęło się, że wartość α ustalamy równą 0,05.
test F - porównanie wariancji 2 populacji pod względem zmienności (wartości wariancji)
Hipoteza zerowa H0: σ12= σ2
2 Hipoteza alternatywna H1: σ12 ≠ σ2
2
Założenie: zmienne mają rozkład normalny
Funkcja testowa 22
21
emps
sF =
Wartość krytyczna Fα,ν,u dla rozkładu F-Fishera, gdzie α jest przyjętym
poziomem istotności (najczęściej 0,05), a ν i u liczbami stopni
swobody, czyli liczebnością próby pierwszej (n1-1) i drugiej (n2 -1)
Gdzie wartość s12>s2
2
Test t do porównania dwóch frakcji (parametrów p) w rozkładzie dwupunktowym (zerojedynkowym)
Hipoteza zerowa H0: p1= p2 Hipoteza alternatywna H1: p1 ≠ p2
Przykłady zastosowań:
Porównanie dwóch odmian pod względem udziału roślin porażonych przez pewną
chorobę
Porównanie udziału osób kupujących pewien produkt w dwóch regionach
Funkcja testowa:
n
)p1(p
n
m
n
m
u 2
2
1
1
emp−
−
=
21
21
21
21 ,nn
nnn
nn
mmp
+
⋅=
+
+=
Gdzie:
n1 i n2 – liczebność elementów w populacji
pierwszej i drugiej poddanych ocenie
m1 i m2 – liczebność elementów w populacji
pierwszej i drugiej spełniających określone
kryteria
Wartość uemp. porównujemy z wartością ukryt. i na tej podstawie
stwierdzamy, czy średnie mogą być równie, czy też nie.
Wartość krytyczna u1-α/2, dla rozkładu normalnego standardowego, gdzie α
jest przyjętym poziomem istotności (najczęściej 0,05)
Jeżeli |uemp|> ukryt. to hipotezę H0 odrzucamy i przyjmujemy hipotezę
alternatywną H1: p1 ≠ p2 a więc stwierdzamy że parametry p (frakcje) różnią
się statystycznie istotnie
W programach statystycznych zamiast wartości krytycznej podawana jest wartość p (p-value). Decyzję o tym, czy hipotezę zerową odrzucamy, czy też nie podejmujemy na podstawie wartości p. Jeżeli p<α to hipotezę zerową odrzucamy i przyjmujemy hipotezę alternatywną, a jeśli p>α to hipotezy zerowej nie odrzucamy. Przyjęło się, że wartość α ustalamy równą 0,05.
u1-α/2 dla α=0,05 u1-α/2 =1,96
test U Manna-Whitneya - porównanie średnich 2 populacji o dowolnychrozkładach
Test U Manna-Whitneya (nazywany również testem rang Wilcoxona) służy
do porównania zgodności dwóch rozkładów. Wykorzystywany jest natomiast
najczęściej do porównania median. Jeśli rozkłady są symetryczne i ich
wariancje są równe lub bliskie to uzasadnione jest stosowanie tego testu
jako alternatywy dla testu t przy braku założenia normalności rozkładów.
Dlatego też ten test stosuje się często do porównania średnich dla dwóch
populacji o innych rozkładach niż normalne. Statystyka testową jest wartość U.
Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w hipotezie
zerowej przyjmujemy, że średnie nie różnią się. Jeśli ją odrzucimy to
przyjmujemy hipotezę alternatywną, czyli stwierdzamy, że występuje różnica
między średnimi.
Przykład zastosowania:
Porównanie wyników z odpowiedzi z ankiety między kobietami a
mężczyznami
Zmienna: odpowiedź w skali od 1-5