STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą...

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 3

Estymacja przedziałowa – przedziały ufności

Przedział ufności jest przedziałem liczbowym zawierającym z

określonym prawdopodobieństwem (zazwyczaj bliskim 1) nieznaną

wartość szacowanego parametru np. średnią dla populacji

1–α współczynnik ufności (lub poziom ufności) – prawdopodobieństwo

tego, że przedział ufności pokrywa nieznaną wartość szacowanego

parametru

Im wyższa jest wartość współczynnika ufności, tym większa jest długość przedziału.

Wartość α nazywamy poziomem istotności

Przedział ufności dla średniej w populacji o rozkładzie normalnym

α−=+<<−−α−α

1}tXmtX{Pn

S1n,n

S1n,

)tX;tX(n

S1n,n

S1n, −α−α

+−

1, −ntα - wartość odczytana z tablic rozkładu Studenta dla poziomu

istotności α oraz n–1 stopni swobody

Przybliżony przedział ufności dla frakcji (parametru p) w rozkładzie

dwupunktowym (zero-jedynkowym)

u1-α/2 – kwantyl rzędu 1-α/2; wartość z tablicy dystrybuanty rozkładu X~N(0,1)

dla α=0,05 u1-α/2 =1,96

Weryfikacja (testowanie) hipotez statystycznych

sprawdzenie określonych przypuszczeń (założeń) wysuniętych w stosunku do parametrów lub rozkładu populacji generalnej na podstawie próby.

Hipotezy możemy podzielić na

– dotyczące typu rozkładu populacji

– dotyczące parametrów rozkładu (który jest znany)

Test statystyczny – reguła postępowania, która pozwala na przyjęcie (nieodrzucenie) bądź odrzucenie sprawdzanej hipotezy

Procedura testowania hipotez polega na tym, że zakładamy pewną

hipotezę zerową (H0), którą uznajemy za możliwą. Następnie

sprawdzamy, czy ona może być prawdziwa przy pomocy testu

statystycznego. Jeśli podczas weryfikacji hipotezy odrzucimy hipotezę

zerową to przyjmujemy przeciwną do niej hipotezę alternatywną (H1).

Możliwe do popełnienia błędy przy testowaniu hipotez:

Błąd I rodzaju– błąd odrzucenia, występuje, gdy odrzucamy hipotezę,

natomiast jest ona prawdziwa

Błąd II rodzaju – błąd przyjęcia, występuje gdy przyjmujemy hipotezę,

natomiast jest ona fałszywa

Prawdopodobieństwo popełnienia błędu I rodzaju nazywamy

poziomem istotności (α) (przyjmujemy najczęściej α=0,05)

Test t do porównania średniej z normą (rozkład normalny)

Hipoteza zerowa H0: m = m0 Hipoteza alternatywna H1: m ≠ m0

(uwaga: zamiast symbolu m oznaczającego średnią dla populacji używamy również zamiennie symbolu µ)

założenie:

zmienna ma rozkład normalny

Przykłady zastosowań:

Sprawdzenie, czy urządzenie pakujące pewien produkt w opakowania po 1 kg

średnio pakuje dokładnie 1 kg

(badana zmienna: waga netto produktu)

Funkcja testowa:

x

0emp

S

mxt

−=

Sx – błąd standardowy

x Średnia dla próby

m0 - zakładana wartość („norma”)

n

sSx =

Wartość temp. porównujemy z wartością tkryt. i na tej podstawie stwierdzamy,

czy średnia może być równa „normie” (zakładanej wartości), czy też nie.

Wartość krytyczna tα,ν, dla rozkładu t-studenta, gdzie α jest przyjętym

poziomem istotności (najczęściej 0,05), a ν liczbą stopni swobody, czyli

liczebność próby pomniejszona o 1 (n - 1)

Jeżeli |temp|> tα,ν to hipotezę H0 odrzucamy i przyjmujemy hipotezę

alternatywną H1: m ≠ m0 a więc stwierdzamy że średnia różni się istotnie od

„normy” (zakładanej wartości)

W programach statystycznych zamiast wartości krytycznej podawana jest wartość p (p-value). Decyzję o tym, czy hipotezę zerową odrzucamy, czy też nie podejmujemy na podstawie wartości p. Jeżeli p<α to hipotezę zerową odrzucamy i przyjmujemy hipotezę alternatywną, a jeśli p>α to hipotezy zerowej nie odrzucamy. Przyjęło się, że wartość α ustalamy równą 0,05.

Test t do porównania średnich dwóch populacji (niezależnych)

Hipoteza zerowa H0: m1= m2 Hipoteza alternatywna H1: m1 ≠ m2

założenia:

zmienne mają rozkład normalny

wariancje dla porównywanych populacji są sobie równe: σ12= σ2

2

(jeśli to założenie nie jest spełnione stosujemy zmodyfikowaną wersję testu t uwzględniającą nierówność wariancji)


Porównanie wysokości plonów dwóch odmian roślin uprawnych

(badana zmienna: plon)

Porównanie skuteczności dwóch leków obniżających ciśnienie krwi

(zmienna: ciśnienie krwi)

Funkcja testowa:

r

21emp

S

xxt

−=

Sr – błąd różnicy średnich

1x

2x

Średnia dla pierwszej populacji na podstawie próby

Średnia dla drugiej populacji na podstawie próby

+=

21

2 11

nnSS er

gdzie wspólna wariancja:

)1n()1n(

XvarXvarS

21

212e

−+−

+=

∑=

−=

n

i

i )xx(Xvar1

2jest sumą kwadratów odchyleń od średniej

Wartość temp. porównujemy z wartością tkryt. i na tej podstawie stwierdzamy,

czy średnie mogą być równie, czy też nie.

Wartość krytyczna tα,ν, dla rozkładu t-studenta, gdzie α jest przyjętym

poziomem istotności (najczęściej 0,05), a ν liczbą stopni swobody, czyli

liczebność 2 prób pomniejszona o 2 (n1 +n2 -2)

Jeżeli |temp|> tα,ν to hipotezę H0 odrzucamy i przyjmujemy hipotezę

alternatywną H1: m1 ≠ m2 a więc stwierdzamy że średnie różnią się istotnie


test F - porównanie wariancji 2 populacji pod względem zmienności (wartości wariancji)

Hipoteza zerowa H0: σ12= σ2

2 Hipoteza alternatywna H1: σ12 ≠ σ2

2

Założenie: zmienne mają rozkład normalny

Funkcja testowa 22

21

emps

sF =

Wartość krytyczna Fα,ν,u dla rozkładu F-Fishera, gdzie α jest przyjętym

poziomem istotności (najczęściej 0,05), a ν i u liczbami stopni

swobody, czyli liczebnością próby pierwszej (n1-1) i drugiej (n2 -1)

Gdzie wartość s12>s2

2

Test t do porównania dwóch frakcji (parametrów p) w rozkładzie dwupunktowym (zerojedynkowym)

Hipoteza zerowa H0: p1= p2 Hipoteza alternatywna H1: p1 ≠ p2


Porównanie dwóch odmian pod względem udziału roślin porażonych przez pewną

chorobę

Porównanie udziału osób kupujących pewien produkt w dwóch regionach

Funkcja testowa:

n

)p1(p

n

m

n

m

u 2

2

1

1

emp−

−

=

21

21

21

21 ,nn

nnn

nn

mmp

+

⋅=

+

+=

Gdzie:

n1 i n2 – liczebność elementów w populacji

pierwszej i drugiej poddanych ocenie

m1 i m2 – liczebność elementów w populacji

pierwszej i drugiej spełniających określone

kryteria

Wartość uemp. porównujemy z wartością ukryt. i na tej podstawie

stwierdzamy, czy średnie mogą być równie, czy też nie.

Wartość krytyczna u1-α/2, dla rozkładu normalnego standardowego, gdzie α

jest przyjętym poziomem istotności (najczęściej 0,05)

Jeżeli |uemp|> ukryt. to hipotezę H0 odrzucamy i przyjmujemy hipotezę

alternatywną H1: p1 ≠ p2 a więc stwierdzamy że parametry p (frakcje) różnią

się statystycznie istotnie


u1-α/2 dla α=0,05 u1-α/2 =1,96

test U Manna-Whitneya - porównanie średnich 2 populacji o dowolnychrozkładach

Test U Manna-Whitneya (nazywany również testem rang Wilcoxona) służy

do porównania zgodności dwóch rozkładów. Wykorzystywany jest natomiast

najczęściej do porównania median. Jeśli rozkłady są symetryczne i ich

wariancje są równe lub bliskie to uzasadnione jest stosowanie tego testu

jako alternatywy dla testu t przy braku założenia normalności rozkładów.

Dlatego też ten test stosuje się często do porównania średnich dla dwóch

populacji o innych rozkładach niż normalne. Statystyka testową jest wartość U.

Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w hipotezie

zerowej przyjmujemy, że średnie nie różnią się. Jeśli ją odrzucimy to

przyjmujemy hipotezę alternatywną, czyli stwierdzamy, że występuje różnica

między średnimi.

Przykład zastosowania:

Porównanie wyników z odpowiedzi z ankiety między kobietami a

mężczyznami

Zmienna: odpowiedź w skali od 1-5

STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą...

Documents

Transcript of STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą...