Критерии за различие

Post on 01-Jan-2016

49 views 0 download

description

Критерии за различие. Department of zoology and anthropology Elena Tasheva. Достоверност – основно свойство на добре организираната извадка да отразява правилно генералните параметри. Достоверна разлика – такава разлика по знак ще има и между генералните параметри - PowerPoint PPT Presentation

Transcript of Критерии за различие

ДостоверностДостоверност – основно свойство на – основно свойство на добре организираната извадка да добре организираната извадка да отразява правилно генералните отразява правилно генералните

параметрипараметри

Достоверна разликаДостоверна разлика – – такава такава разлика по знак ще има и между разлика по знак ще има и между генералните параметригенералните параметри

Недостоверна разликаНедостоверна разлика – – различията различията между генералните параметри между генералните параметри остават недоказаниостават недоказани

Въвежда сеВъвежда се нулева хипотеза –нулева хипотеза – HHoo

предположение, че разликата между предположение, че разликата между генералните параметри е нула, а различието генералните параметри е нула, а различието между извадъчните показатели е случайномежду извадъчните показатели е случайно

Ако: І извадка от нормална съвкупност с Ако: І извадка от нормална съвкупност с параметри параметри 11 и и 11

ІІ извадка от нормална съвкупност с ІІ извадка от нормална съвкупност с параметри параметри 22 и и 22

То:То: HHoo : : 11 - - 22 = 0 = 0

1 1 - - 2 2 = 0= 0

Биологични въпросиБиологични въпроси versusversus статистически нулеви хипотези статистически нулеви хипотези

Различават ли се женските и мъжките Различават ли се женските и мъжките по размерипо размери??

Средните размери на женските и Средните размери на женските и мъжките са еднакви.мъжките са еднакви.

Дали възрастовата структура на даден Дали възрастовата структура на даден вид риби в две популации се вид риби в две популации се различаватразличават??

Възрастовата структура е Възрастовата структура е независима от популацията.независима от популацията.

Индивидуални наблюденияИндивидуални наблюдения((данниданни) - ) - допусканиядопускания

Допускане – данните са събрани по Допускане – данните са събрани по подходящ начин подходящ начин

Всички данни са обект на еднакво голяма Всички данни са обект на еднакво голяма грешка в измерваниятагрешка в измерванията

Какво представляваКакво представлява вероятността вероятността pp??

Вероятността нулевата хипотеза да е Вероятността нулевата хипотеза да е вярнавярна

Ако нулевата хипотеза е вярна, р е Ако нулевата хипотеза е вярна, р е вероятността да получим резултати, които вероятността да получим резултати, които да се отличават от очакванитеда се отличават от очакваните, , при при условие, че данните са събрани правилно условие, че данните са събрани правилно и всички статистически допускания са и всички статистически допускания са налиценалице

Вероятността да не бъдем прави, когато Вероятността да не бъдем прави, когато отхвърляме нулевата хипотезаотхвърляме нулевата хипотеза

Да отхвърлим или не нулевата Да отхвърлим или не нулевата хипотезахипотеза??

Решението да приемем или отхвърлим Решението да приемем или отхвърлим нулевата хипотеза зависи отнулевата хипотеза зависи от pp..

Това изисква съгласие относно Това изисква съгласие относно големината на големината на pp, , която да се приеме за която да се приеме за гранична. гранична. Тази стойност е условна.Тази стойност е условна.

Оценка на рОценка на р

В статистическия анализ В статистическия анализ pp се оценява се оценява въз основа на разпределението на въз основа на разпределението на някаква тест - статистика. някаква тест - статистика.

Ако знаем разпределението на Ако знаем разпределението на стойностите на тест - статистиката, стойностите на тест - статистиката, можем да изчислим вероятността да можем да изчислим вероятността да получим конкретна стойност или по-получим конкретна стойност или по-голяма голяма ((по-малкапо-малка)), ако , ако HH00 е вярна – т.е. е вярна – т.е. pp

За проверка на нулевата хипотеза се използват За проверка на нулевата хипотеза се използват показатели, наречени показатели, наречени тестове за различие.тестове за различие.

Това са величини, функцията на разпреде-Това са величини, функцията на разпреде-лението на които са известни и дадени в таблици, лението на които са известни и дадени в таблици, които съдържат стойностите на функциите:които съдържат стойностите на функциите: - за различни степени на свобода /обем на - за различни степени на свобода /обем на извадката/ извадката/

- за различно ниво на значимост.- за различно ниво на значимост.

Ниво на значимостНиво на значимост – допустимата – допустимата вероятност за получаване на случайни вероятност за получаване на случайни

отклонения от установените с определена отклонения от установените с определена вероятност резултати вероятност резултати ((допустимата допустимата

вероятност за некоректно заключение, че вероятност за некоректно заключение, че съществуват различиясъществуват различия))

АкоАко Р Р ≤≤ различията са достоверниразличията са достоверни

0.05 0.01 0.0010.05 0.01 0.001

Две извадкиДве извадки (1, 2) (1, 2) се различават по се различават по средните си средните си аритметични саритметични с ..

Каква е вероят-Каква е вероят-носттаността pp да да наблюдаваме тези наблюдаваме тези различия акоразличия ако HH00 ( (че че няма различияняма различия)) е е вярнавярна??

чес

тота

X1 X2

| |X X1 2

Sample 2Sample 1

АкоАко HH00 е вярнае вярна, , то то

очакваното очакваното разпределение наразпределение на статистикатастатистиката t t ще бъдеще бъде::

s XX

XXt21

21

-3 -2 -1 0 1 2 3

ве

ро

ятн

ос

т (p

)

t

чес

тота

X1 X2

| |X X1 2

Sample 2Sample 1

Нека предположим, че Нека предположим, че tt = 2.01 = 2.01

Каква е вероятността Каква е вероятността да получим стойност да получим стойност поне толкова голяма поне толкова голяма при условие, че при условие, че HH00 е е вярна? вярна?

Тъй катоТъй като pp е малкае малка, , то то изглежда малко изглежда малко вероятно вероятно HH00 да е да е вярнавярна..

Следователно Следователно отхвърлямеотхвърляме HH0.0.

-3 -2 -1 0 1 2 3

Pro

bab

ility t = 2.01

Fre

qu

en

cy

X1 X2

| |X X1 2

Sample 2Sample 1

Какво в превод означава Какво в превод означава конкретна стойност на конкретна стойност на pp??

АкоАко pp < 0.05, < 0.05, отхвърляме нулевата отхвърляме нулевата хипотеза, но хипотеза, но ...... не забравяме не забравяме pp

СъобщавамеСъобщаваме pp, , без “достоверни” или без “достоверни” или “недостоверни”“недостоверни”

ПомнимПомним, , че съгласието “че съгласието “pp < 0.05 < 0.05”” е е изцяло условноизцяло условно!!

ДопусканияДопускания

pp се изчислява при допускането, че се изчислява при допускането, че tt разпределението разпределението == на известното в на известното в статистиката разпределение на статистиката разпределение на StudentStudent ttss,,

Това допускане е вярно само когато Това допускане е вярно само когато данните са нормално разпределениданните са нормално разпределени..

Разпределение наРазпределение на Student Student

Рапределението Рапределението зависи от зависи от d.f.d.f.

Една и съща Една и съща разлика ще даде разлика ще даде различна различна вероятноствероятност

При При d.f.d.f.=30 =30 разпределението е разпределението е почти нормалнопочти нормално

-5 -4 -3 -2 -1 0 1 2 3 4 50.0

0.1

0.2

0.3

0.4

-5 -4 -3 -2 -1 0 1 2 3 4 5

t

0.0

0.1

0.2

0.3

0.4

ве

ро

ятн

ос

т

df=2df=1000

tt versusversus Student Student t tss

Изчисляването наИзчисляването на pp допускадопуска pp((tt) = ) = pp((ttss).).

Колкото данните се Колкото данните се отклоняват повече от отклоняват повече от нормалнотонормалното,, толкова толкова разликата между разликата между вероятностите се вероятностите се увеличаваувеличава

СледователноСледователно, , изчислената стойност изчислената стойност нана pp не е вярнане е вярна

t, по-силно отклонение от нормалнотоtпо-слабо отклонение от нормалното

ts разпределение на Student

-3 -2 -1 0 1 2 3

ве

ро

ятн

ос

т (p

)

Увеличаваме обема на извадкатаУвеличаваме обема на извадката..

Трансформираме даннитеТрансформираме данните..

Използваме друг непараметричен Използваме друг непараметричен тест, който да не изисква тест, който да не изисква нормалност на разпределениетонормалност на разпределението..

Какво да правим, ако Какво да правим, ако разпределението не е разпределението не е

нормално инормално и pp е близка дое близка до ??

Транформация на даннитеТранформация на данните Като математически функции:Като математически функции: log( log(XX), sqrt(), sqrt(XX), ),

arcsin(arcsin(XX)) На базата на опита и грешкатаНа базата на опита и грешката.. Съществуват алгоритми, за опростяване на Съществуват алгоритми, за опростяване на

задачата.задачата. проблемпроблем 1 1: : търсенето на подходяща търсенето на подходяща

трансформация често е много труднотрансформация често е много трудно проблемпроблем 2 2: : някои данни не могат да бъдат някои данни не могат да бъдат

нормализиранинормализирани

Едно- и дву-странна Едно- и дву-странна нулева хипотезанулева хипотеза

((One- and two-tailed)One- and two-tailed)

При При 2-tailed 2-tailed HH00

има 2 области има 2 области на отхвърляне на отхвърляне с големинас големина /2./2.

ПриПри 1-tailed 1-tailed HH00

има 1 област има 1 област на отхвърляне на отхвърляне с големинас големина ..

-3 -2 -1 0 1 2 3

ве

ро

ятн

ос

т-3 -2 -1 0 1 2 3

ве

ро

ятн

ос

т

-3 -2 -1 0 1 2 3

t

1-

1- 1-

2-tailed 2-tailed HH00

Няма различия между Няма различия между генералните генералните съвкупностисъвкупности

HH00: : 11 = = 22

Ще отхвърлимЩе отхвърлим HH00 ако: ако:

11 - - 22 > > 0 0 илиили 11 - - 22 < < 0. 0.

HH11: : 11 22

чес

тота

X1 X2

| |X X1 2

Sample 2Sample 1

-3 -2 -1 0 1 2 3

ве

ро

ятн

ос

т

- Алтернативна хипотеза- Алтернативна хипотеза

1-tailed 1-tailed HH00

Средно индивидите от Средно индивидите от едната съвкупностедната съвкупност са по-са по-големи от другата големи от другата съвкупностсъвкупност

HH00: : 11 - - 22 0 0

Ще отхвърлимЩе отхвърлим HH00 само само

ако ако 11 - - 22 > 0 > 0

HH11: : 11 - - 22 0 0

Fre

qu

en

cy

X1 X2

| |X X1 2

Sample 2Sample 1

-3 -2 -1 0 1 2 3P

rob

abili

ty

- Алтернативна хипотеза- Алтернативна хипотеза

ЕдностраннаЕдностранна versusversus двустранна нулева хипотезадвустранна нулева хипотеза

2-tailed 2-tailed хипотезахипотеза: : отхвърля се отхвърля се независимо от независимо от наблюдавания моделнаблюдавания модел..

1-tailed 1-tailed хипотезахипотеза: : отхвърля се само при отхвърля се само при определен моделопределен модел

чес

тота

X1 X2

| |X X1 2

Sample 2Sample 1

ВажноВажно!! Тестът при Тестът при

едностранна едностранна HH00 е е

по-мощен, отколкото по-мощен, отколкото при двустраннапри двустранна

ЗатоваЗатова HH00 трябва да трябва да

се формулира преди се формулира преди да се извършат да се извършат изчислениятаизчисленията

2 3

ве

ро

ятн

ос

т

-3 -2 -1 0 1 2 3

ве

ро

ятн

ос

т

Видове грешкиВидове грешки

Има 2 типа грешки при приемане или Има 2 типа грешки при приемане или отхвърляне на нулевата хипотеза:отхвърляне на нулевата хипотеза:

I I тип грешкатип грешка ((): ): вероятността да вероятността да отхвърлим правилна нулева хипотезаотхвърлим правилна нулева хипотеза

II II тип грешкатип грешка ((): ): вероятността да вероятността да приемем невярна нулева хипотезаприемем невярна нулева хипотеза

Грешки при тестовете за Грешки при тестовете за различияразличия

реалност

решение H0 е вярна H0 е грешна

приемаме H0

отхвърляме H0

правилно

правилно

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

f

0.00

0.05

0.10

0.15

0.20

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

f

0.00

0.05

0.10

0.15

0.20

α/2 α/2

ß 1-ß

H0 ♀:♂=1:1

H1 ♀:♂=2:1

1-α

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

f

0.00

0.05

0.10

0.15

0.20

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

f

0.00

0.05

0.10

0.15

0.20

ß 1-ß

H0 ♀:♂=1:1

H1 ♀:♂=2:1

α/21-α

Когато α намалява

1 - α се увеличава ß нараства

- І тип грешка

- област на приемане

- ІІ тип грешка

Сила на тестаСила на теста

Вероятността тестът да открие различия, Вероятността тестът да открие различия, когато те наистина съществуват.когато те наистина съществуват.

Силата на теста Силата на теста ≥ 0.8≥ 0.8

Сила на тестаСила на теста Силата на теста е вероятността да Силата на теста е вероятността да

отхвърлим нулевата хипотеза, когато тя е отхвърлим нулевата хипотеза, когато тя е грешна, а алтернативната хипотеза е вярна грешна, а алтернативната хипотеза е вярна т.е.т.е. 1- 1- ..

Силата на теста се изчислява само при Силата на теста се изчислява само при конкретна алтернативна хипотеза и зависи конкретна алтернативна хипотеза и зависи от нея. от нея.

Тестове с по-голяма сила могат да открият Тестове с по-голяма сила могат да открият по-малки различия, тестове с по-малка сила по-малки различия, тестове с по-малка сила могат да докажат само по-големи различия. могат да докажат само по-големи различия.

Сила на теста Сила на теста зависи от:зависи от: Конкретния тестКонкретния тест Нивото на значимост Нивото на значимост Обема на извадкатаОбема на извадката Алтернативната хипотезаАлтернативната хипотеза Минималната разлика,Минималната разлика, която може да регистриракоято може да регистрира Вариацията в извадкитеВариацията в извадките

ІІ тип грешка и сила на тестаІІ тип грешка и сила на теста

40 45 50 55 60

H0: = 0 H1: = 1

1=54

1=53

1=50

1=48.5

=0.0096

=0.0018

0=45.5

=0.2676

=0.5948

Нарастването на ІІ Нарастването на ІІ тип грешкатип грешка , , води води до намаляване на до намаляване на силата на тестасилата на теста

Приближаването Приближаването на алтернативната на алтернативната хипотеза до хипотеза до нулевата води до нулевата води до увеличаване на ІІ увеличаване на ІІ тип грешка и тип грешка и намаляване на намаляване на силата на тестасилата на теста

Зависимост на силата на Зависимост на силата на теста от обема на извадкататеста от обема на извадката

Крива на силата на Крива на силата на теста когатотеста когато H H00: : = 45.5 = 45.5

HH11: : 45.5 45.5 заза

n = 5 n = 5 ии n = 35. n = 35. За дадена стойност За дадена стойност

вероятността да вероятността да отхвърлим грешната отхвърлим грешната HH00 намалява с намалява с намаляване на обема намаляване на обема на извадкатана извадката

35 40 45 50 55

1.0

0.5

0

дължина (x 0.1 mm)

Сил

а на

тес

та (

1-)

n = 5

n = 35

Защо трябва наблюденията да Защо трябва наблюденията да са независимиса независими??

Ако наблюденията не Ако наблюденията не са независими, тогава са независими, тогава истинските истинските d.f. d.f. ще са ще са по-малко, отколкото по-малко, отколкото изчисленитеизчислените… …

Разпределението, въз Разпределението, въз основа на което основа на което изчисляваме изчисляваме pp ще ще бъде грешнобъде грешно … …

… … pp ще бъде по-ще бъде по-малко, отколкото би малко, отколкото би трябвалотрябвало

-3 -2 -1 0 1 2 3

ве

ро

ятн

ос

тt

изчислениdf

истинскиdf

изчисленаt

t-тест на Student

William Sealey Gosset (Student)(1876 - 1937)

21

2121

xxs

xxt

Оценка на разликата междусредните аритметични

t-тест на Student

210 : H

d.f. = (n1-1) + (n2-1) = n1 + n2 -2

0 210 Hсъгласно

dxx s

d

s

xxt

21

21

d - разликата между средните Sd - грешка на извадъчната разлика

22

21

22

21

1

обема от независимо

n

21ss

nsss

nnпри

xxd

Стандартна грешка на разликатамежду средните аритметични

21

21

21

22

21

21

2

30n

nn

nn

nn

xxxxs

nпри

iid

Стандартна грешка на разликатамежду средните аритметични

1

22

2

21

21 30n

n

s

n

ss

nпри

d

Стандартна грешка на разликатамежду средните аритметични

t t stАко

Нулевата хипотеза се ОТХВЪРЛЯ.Разликата между средните аритметични

е ДОСТОВЕРНА

Такава разлика по знак ще има и междусредните аритметични на генералнитесъвкупности.

t t stАко

Нулевата хипотеза ОСТАВА.Разликата между средните аритметични

е НЕДОСТОВЕРНА

1. По извадъчната разлика не може да се направи оценка на генералната разлика2. Остава недоказано както наличието, така и отсъствието на разлика 3. Остава неизяснено коя от генералните средни е по-голяма

Сте

пен

и н

а св

обод

аНиво на значимост

Правилното използване на теста на Student

ИЗИСКВА

1. Нормално разпределение 2. Равенство на дисперсиите

След пречиствателните станции се създават изкуственивлажни зони от тръстикови масиви за допълнително пречистване на биогенните елементи, разтворени във водата. Важен показател за ефективността на пречист-ването е химичното потребление на кислорода ХПК, представляващ мярка за количеството кислород, необходимо за окисление на наличната органика в отпадъчните води.

ХПК1 [mg l-1] над тръстиковия масив

3.53 3.81 2.88 3.32 4.14 3.04 3.45 3.75

4.29 3.14 3.22 2.61 3.1 3.68 4.52

ХПК2 [mg l-1] под тръстиковия масив

2.98 3.42 3.18 2.80 2.60 3.61 3.09 3.27

2.36 3.82 2.88 3.17

Normality Test: Passed (P = 0.8733)

Equal Variance Test: Passed (P = 0.1998)

Group N Missing ХПК1 15 0 ХПК2 12 0

Group Mean Std Dev SEM ХПК1 3.4987 0.53832 0.13899 ХПК2 3.0983 0.41248 0.11907

Difference 0.40033

t = 2.1226 with 25.000 degrees of freedom. (P = 0.0439)

95 percent confidence interval for difference of means: 0.011897 to 0.78877

?

Доверителен интервална разликата между

средните аритметични

dstxx значимост

на ниво2121 : -

F-тест на Fisher

Проверка за равенство на дисперсиите

212

0

2

: H

22

212

2

21 при sss

sF

F1 (при равни дисперсии F=1)

d.f.1 = n1-1 d.f.2 = n2-1

При FFst Нулевата хипотеза се отхвърля Дисперсиите са различни

При F<Fst Нулевата хипотеза за равенство на дисперсиите остава.

d.f.1

d.f.2

50.40073.0

0331.0F

84.1stFпри α = 0.05 n1 = 30, n2 = 30

FFst Нулевата хипотеза се отхвърля Дисперсиите са различни

Сравнени са лабораторнаи изходна популация на Aphis gossypii по отношениена изменчивостта на белега дължина на сифоните.

Чифтен критерий на Student

Параметричен критерий за различиемежду средните аритметични на извадки

с по двойки свързани варианти.

0 : 210 H

ds

dt

11

22

2

nn

n

dd

nn

dds

ii

id

d.f. = n - 1

Чифтен критерий на Student

t t stАко

Нулевата хипотеза се ОТХВЪРЛЯ.Разликата между средните аритметични

е ДОСТОВЕРНА

t t stАко

Нулевата хипотеза ОСТАВА.Разликата между средните аритметични

е НЕДОСТОВЕРНА

Изследване на нервни клетки от гръбначния мозък на Rhesus maccacus. Нервите, от лявата страна са прерязвани, докато тези от дясната страна са запазвани цялостни. През време на регенерационния процес е измервано съдържанието на креатин фосфат CP на двойките неврони. Мерната единица е mg CP за 100 g тъкан.

D 16.3 4.8 10.9 14.2 16.3 9.9 29.2 22.4

L 11.5 3.6 12.5 6.3 15.2 8.1 16.6 13.1

Съдържание на креатин фосфат[mg CP / 100g]

n = 8

T-test for Dependent Samples

Std.Dv.Diff.Mean Std.Dv. N Diff.

D 15.5 7.609017

L 10.8625 4.488378 8 4.6375 4.885821

t df p

2.684673 7 0.031326

T-test for Independent Samples

Note: Variables were treated as independent samples

Mean Mean

D L t-value df p

15.5 10.8625 1.484782 14 0.159767

ГрешноГрешно!!

Стандартната грешка е по-голяма стойността на t-теста е по-малка

d.f. са по-големи

Стойността на Стойността на рр ще е по-голяма ще е по-голяма

Реално съществуващи различия могат да Реално съществуващи различия могат да не бъдат доказани!не бъдат доказани!

НЕПАРАМЕТРИЧНИКРИТЕРИИ ЗА

РАЗЛИЧИЕ

U - тест на Mann-Whitney

Ho - Извадките принадлежат към генерални съвкупности с еднакви медиани

Непараметричен тест за сравняване на медиани

приложениеприложение

Количествени белезиКоличествени белези, при които едно , при които едно или двете условия за използване на или двете условия за използване на t-t-тестатеста не са спазенине са спазени

Качествени белези Качествени белези (ordinal scale)(ordinal scale)

Алгоритъм

1. Вариантите в двете извадки се подреждат по големина - от най-малката стойност до най-голямата

2. За всеки вариант от едната извадка се преброяват вариантите от другата извадка с по-малка стойност.

При еднакви стойности, се отчита При еднакви стойности, се отчита 0.50.5

3. За стойност на U-test се приема по-малката от двете суми на тези стойности

4. Сравнява се стойността на U-testс критичната стойност при приетото ниво на значимост и обемите на двете извадки

Критични стойности на теста наMann-Whitney при ниво на значимост

и обем на извадките

U U stАко

Нулевата хипотеза се ОТХВЪРЛЯ.Разликата между медианите

е ДОСТОВЕРНА

Такава разлика по знак ще има и междумедианите на генералните съвкупности.

Ако

Нулевата хипотеза ОСТАВА.Разликата между медианите

е НЕДОСТОВЕРНА

По извадъчната разлика не може да се направи оценка на генералната разлика

U U st

ІІ извадка 2 4 5 9 12 17 19 0 0 0 1 1.5 3 3

8 12 15 21 25 44 44 60

2 4 5 9 12 17 19

І извадка

ІІ извадка

І извадка 8 12 15 21 25 44 44 60 3 4.5 5 7 7 7 7 7

5.8

5.47

UU

108.5

st

При ниво на значимост 5%,

критичната стойност на теста е 10

Нулевата хипотеза се ОТХВЪРЛЯ.Разликата между медианите

е ДОСТОВЕРНА

Измерена е дължината на основата на хелицеритена извадки от две популации на Trombicula lipovskyi

104 109 112 114 116 118 118 119

121 123 125 126 126 128 128 128

100 105 107 107 108 111 116 120

121 123            

Group N Median 25% 75% 1 16 120 115 126

2 10 109 107 120

T = 91,500 n (small)= 10 n (big)= 16 (P = 0,023)

Различие между две популации на Trombicula lipovskyi по

дължината на основата на хелицерите

Тест на Wilcoxon за свързани по двойки наблюдения

Wilcoxon’s signed-ranks test

Ho - Извадките принадлежат към генерални съвкупности с еднакви медиани

Непараметричен тест за сравняване на медиани

Алгоритъм

1. За всяка двойка наблюдения, се изчислява разликата - d

2. Поставят се поредни номера - РАНГОВЕ на тези разлики, според абсолютната им стойност

Не се взимат под внимание двойките Не се взимат под внимание двойките наблюдения, чиято разлика е нула ! ! !наблюдения, чиято разлика е нула ! ! !

3. Изчисляват се сумите от ранговете на отрицателните и положителните разлики

4.4. Взима се по-малката от двете суми стойност и се сравнява с критичната стойност на теста при избраното ниво на значимост.

Критични стойности на теста наWilcoxon при избрано ниво на значимост

и дадения обем на извадките

TT stАко

Нулевата хипотеза се ОТХВЪРЛЯ.Разликата между медианите

е ДОСТОВЕРНА

Такава разлика по знак ще има и междумедианите на генералните съвкупности.

Ако

Нулевата хипотеза ОСТАВА.Разликата между медианите

е НЕДОСТОВЕРНА

По извадъчната разлика не може да се направи оценка на генералната разлика

TT st

Изследване върху телесната маса [g] на eдин вид коприварче, преди периода на

миграция през август и септември

10.311.410.912.010.011.912.212.311.712.0

+1.9+0.7+2.2-0.1+2.0+1.0-0.8-0.2+1.8+0.3

8 410 1 9 6 5 2 7 3

+++-++--++

8

47

12.212.113.111.912.012.911.412.113.512.3

stTT

88

При ниво на значимост 5%,

критичната стойност на теста е 88

Нулевата хипотеза се ОТХВЪРЛЯ.Разликата между медианите

е ДОСТОВЕРНА

Group N Median 25% 75% 1 10 11,80 10,90 12,00 2 10 12,15 12,00 12,90

W= 39,000 T+ = 47,000 T- = -8,000 P (est.)= 0,053 P (exact)= 0,049

Сравнение на телесната маса [g] на eдин вид коприварче, преди периода на миграция

през август и септември

статистическа достоверност

не е равна нане е равна на биологическа значимост

Тест на Колмогоров-Смирнов

сравняване на емпирични и теоретични натрупани честоти тест за нормалност на разпределението

сравняване на емпирични натрупани честоти

Приложение

Тест на Колмогоров-Смирнов

Ho – Няма разлика между теоретичните и емпиричните натрупани честоти т.е. Разпределението се счита за

нормално

Тест за нормалностна разпределението

Колмогоров-СмирновКолмогоров-Смирнов Сравнява Сравнява

наблюдавани наблюдавани натрупани честоти и натрупани честоти и очаквани натрупани очаквани натрупани честоти според честоти според Ho Ho

pp се основава на се основава на максималната максималната абсолютна разлика абсолютна разлика между тяхмежду тях

Dmax

X

0.2

0.4

0.6

0.8

1.0

На

тру

па

ни

че

сто

ти

di+ = │Fi –F’│

di- = │Fi-1 –F’│

D = най-голямата разлика

F’ - теоретична натрупана честота в дадена стъпкаFi - емпирична натрупана честота в тази стъпкаFi-1 - емпирична натрупана честота преди тази стъпка

Ако

Нулевата хипотеза се ОТХВЪРЛЯ.Разликата между натрупаните честоти

е ДОСТОВЕРНА

Разпределението не е нормално

stDD

Ако

Нулевата хипотеза ОСТАВА.Разликата между натрупаните честоти

носи случаен характер

Разпределението се счита за нормално

stDD

Ако Р Ако Р ≤≤ различията са достоверни различията са достоверни

Разпределението не е нормалноРазпределението не е нормално

Ако Р Ако Р >> различията са недостоверни различията са недостоверни

Разпределението се счита нормалноРазпределението се счита нормално

xx tt F’F’ FF d+d+ d-d-

1.411.41 -1.64-1.64 0.050.05 0.080.08 0.030.03 0.050.05

2.502.50 -1.47-1.47 0.070.07 0.160.16 0.090.09 0.010.01

4.194.19 -1.21-1.21 0.110.11 0.250.25 0.140.14 0.040.04

9.529.52 -0.39-0.39 0.350.35 0.330.33 0.020.02 0.100.10

11.3011.30 -0.12-0.12 0.450.45 0.420.42 0.030.03 0.120.12

14.4014.40 0.360.36 0.640.64 0.500.50 0.140.14 0.220.22

14.9014.90 0.440.44 0.670.67 0.580.58 0.090.09 0.170.17

15.2015.20 0.490.49 0.680.68 0.670.67 0.010.01 0.100.10

15.3915.39 0.520.52 0.700.70 0.750.75 0.050.05 0.030.03

15.8115.81 0.580.58 0.710.71 0.830.83 0.120.12 0.040.04

17.2517.25 0.800.80 0.790.79 0.920.92 0.130.13 0.040.04

22.7022.70 1.641.64 0.950.95 1.001.00 0.050.05 0.030.03

Ðàçï ðåäåëåí èå í à í àòðóï àí èòå÷åñòî òè

ì àñà [gr]

0 5 10 15 20 25

íàò

ðóï

àíà

÷åñ

òîòà

0

1

òåî ðåòè÷í à ÷åñòî òàåì ï èðè÷í à ÷åñòî òà

D = 0.22Dst = 0.37, α=0,01

stDD

Normality Test (Kolmogorov-Smirnov)

K-S Distance = 0.2250 P = 0.0949

Разпределението може да се считаРазпределението може да се счита

за нормалноза нормално

праг на праг на вероятноствероятност

Об. биоста-Об. биоста-

тистическитистически

методиметоди

Различия в Различия в разпределенияразпределения

0.95 0.95 ((αα = 0.05) = 0.05) обикновенаобикновена повишенаповишена

0.90.999 ((αα = 0.01) = 0.01) повишенаповишена обикновенаобикновена

0.90.99999 ((αα = = 0.001)0.001)

високависока пониженапонижена

Отговорност на изследванетоОтговорност на изследването

Eucera M.leporina

Изследвана е разликата в сезонната динамика на двавида Eucera clypeata и Melitta leporina - опрашители на люцерната. Направен е количествен сбор на двата вида в активния период от края на май до началото на август. Материалът е събиран през 10 дена (декада).

Сравнение на сезонната динамиката на видоветеСравнение на сезонната динамиката на видоветеEucera clypeataEucera clypeata ии Melitta leporinaMelitta leporina

ІвидІвид ІІвидІІвид

11 V3V3 6464 00

22 VI1VI1 7474 22

33 VI2VI2 1515 1616

44 VI3VI3 2929 66

55 VII1VII1 22 3434

66 VII2VII2 44 174174

77 VII3VII3 11 144144

88 VIII1VIII1 00 77

Case Number

87654321

Va

lue

200

100

0

E. clypeata

M. leporina

Сравнение на сезонната динамиката на видоветеСравнение на сезонната динамиката на видоветеEucera clypeataEucera clypeata ии Melitta leporinaMelitta leporina

Критерий на Колмогоров- Смирнов

J

j

jJ

j

j

n

n

n

n

1 2

2

1 1

1 и

21

21

1 2

2

1 1

1 - maxnn

nn

n

n

n

n J

j

jJ

j

j

n1j и n2j - броя на индивидите на двата вида през jтия период от време

Натрупаните честоти на индиви- дите на двата вида през jтия период от време

Eucera clypeataEucera clypeata ии Melitta leporinaMelitta leporina

ІвидІвид ІІвидІІвид ІвидІвид ІІвидІІвид ІвидІвид ІІвидІІвид

11 V3V3 6464 00 6464 00 .338.338 00 .338.338

22 VI1VI1 7474 22 138138 22 .729.729 .005.005 .724.724

33 VI2VI2 1515 1616 153153 1818 .809.809 .047.047 .762.762

44 VI3VI3 2929 66 182182 2424 .962.962 .063.063 .899.899

55 VII1VII1 22 3434 184184 5858 .972.972 .152.152 .820.820

66 VII2VII2 44 174174 188188 232232 .995.995 .606.606 .389.389

77 VII3VII3 11 144144 189189 376376 11 .981.981 .019.019

88 VIII1VIII1 00 77 189189 383383 11 11 00

Бройиндивиди

Натрупаначестота

Дяловенатрупана

честота разл

ика

01.001.0 63.1 Различията са достоверни

99.9383189

383189899,0

Критерий на Пирсон χ2

сравняване на емпирични и теоретични разпределения сравняване на две емпирични разпределения разпадане на хибриди таблици 2х2

Приложение

Различия между разпределенияРазличия между разпределения

20 30 40 50 60 дължина

0

10

20

30

чес

тоти

Наблюдавани честоти

Очаквани честоти

Fork length

очакванинаблюдавани

0

20

30

чес

тоти

20 30 40 50 600

10

20

30

отхвърлянена H0

приеманена H0

22

1

i i

ii

n f f

f

( )

чес

тоти

клас/категория

наблюдаваниочаквани

Критерий на Пирсон χ2

i

i

f

f

ˆемпирична честота

теоретична честота

Buteo buteo (обикновен мишелов)

Изследвано е пространственото разпределение на гнездата на обикновения мишелов Buteo buteo. На даденатеритория са обособени 60 квадрата с по 4 km2 площи са преброени гнездата на този вид за всички квадрати.

брой гнезда 0 1 2 3 4 5+

честота 4 22 15 10 7 2

теор.

честота 8.1 16.2 16.2 10.8 5.4 3.2

0 1 2 3 4 5

֌

ñòî

òà

0

5

10

15

20

25

åì ï èðè÷í è ÷åñòî òèòåî ðåòè÷í è ÷åñòî òè

Χ2 = 5.1815

Χ2st = 9,49

при α = 0,05и d. f. = 4

Заключение: Пространственото разпределение на гнездата на Buteo buteo е случайно.

Χ2 < Χ2st

H0 остава

Степени на свобода при сравняване на Степени на свобода при сравняване на емпирични с теоретични честотиемпирични с теоретични честоти

Нормално разпределениеНормално разпределение

d.f. = k – 3, d.f. = k – 3, k – k – броя класовеброя класове Биномно разпределениеБиномно разпределение

d.f. = k – d.f. = k – 22, , k – k – броя класовеброя класове Поасоново разпределениеПоасоново разпределение

d.f. = k – d.f. = k – 22, , k – k – броя класовеброя класове

Изследване на унаследяването на цвета Изследване на унаследяването на цвета ((червен, розов и бялчервен, розов и бял)) на цветовете на на цветовете на

AntirrhinumAntirrhinum majusmajus ((лъвска муцункалъвска муцунка))

При кръстосване на хетерозиготни индивиди При кръстосване на хетерозиготни индивиди са се получили 10 червени, 21 розови и 9 бели.са се получили 10 червени, 21 розови и 9 бели.

Тези резултати съответстват ли на Тези резултати съответстват ли на теоретичното разпадане - 1:2:1 ?теоретичното разпадане - 1:2:1 ?

Унаследяването на цвета Унаследяването на цвета на на AntirrhinumAntirrhinum majusmajus

ЧервениЧервени РозовиРозови белибели

бройброй

цветовецветове1010 2121 99

очакваночакван

бройброй

¼ х 40 =¼ х 40 =

1010

½ х 40 =½ х 40 =

2020

¼ х 40 =¼ х 40 =

1010

22

1

i i

ii

n f f

f

( )

d.f. = (r - 1)(c - 1)

Observed vs. Expected Frequencies Chi-Square = 0,15 df = 2 p < 0,927

observed expected (O – E) (O-E)**2 / EC: 1 10 10 0 0,00C: 2 21 20 1 0,05C: 3 9 10 -1 0,10Sum 40 40 0 0,150,15

Разпадането по този белег е 1:2:1 Разпадането по този белег е 1:2:1

Таблици 2х2Таблици 2х2

ff1111 ff1212 RR11

ff2121 ff2222 RR22

CC11 CC22 nn

Критерий на Пирсон χ2с поправка на Yates

(за изясняване на степента на достоверност на връзката между два белега)

2121

2

211222112 2

CCRR

nffffn

X

d.f. = (r - 1)(c - 1) 2x2 d.f. = 1

sp1sp1 sp2sp2 общообщо

без без паразитипаразити 1818 1010 2828

с с паразитипаразити 66 1515 2121

общообщо 2424 2525 4949

Изследвани извадки от 2 вида мишки заналичие на чревни паразити.Ho: р1 = p2 H1: р1 p2

779,421.28.25.24

549

6.1015.18492

2

X

Χ2st = 3,841

при α = 0,05и d. f. = 1

Χ2 > Χ2st

H0 се отхвърля

Заключение: Честотата на инфектираните с чревни паразити популации не е една и съща при двата вида.

Row

Column 1 Column 2 Totals

Frequencies, row 1 18 10 28

Percent of total 36.735% 20.408% 57.143%

Frequencies, row 2 6 15 21

Percent of total 12.245% 30.612% 42.857%

Column totals 24 25 49

Percent of total 48.980% 51.020%

Yates corrected Chi-square 4.78 p= .0288

Морската звезда Pisaster ochraceus се среща в 3 цветовиморфи – кафява, оранжева и лилава. Изследвани са 2 локални популации в Орегон - Seal rock и Yaquina Head. От тях, по време на отлива са събрани случайни извадки с големина съответно 143 и 149. Отчитан е броя на морските звезди от всяка морфа.

лилави кафявиоранжев

иобщо

Seal rock 38 72 33 143

очакванаочаквана 28,89 86,19 27,91

Yaquina Head

21 104 24 149

очакванаочаквана 30,11 89,81 29,09

общо 59 176 57 292

Примерно изчисление:Лилави: 38 + 21 = 59 общо.

Относителна честота: 59 / 292 = 0,20Очакван брой 0,20 х 143 = 28,89

Χ2 = 2.870 + 2.337 + 0.927 + 2.754 + 2.243 + 0.889

Χ2 = 12.019 при df = 2, p = 0.003

Критична стойност - 5.991 при = 0.05 и df = 2.

22

1

i i

ii

n f f

f

( )

12.019 5.991 - нулевата хипотеза се отхвърля

Заключение: Съотношението между цветовите форми на Pisaster ochraceus се различават достоверно между двете популации.

d.f. = (r - 1)(c - 1)

Fisher exact testFisher exact testако честотите < 5

McNemar testMcNemar testако данните са свързани по двойки