Hodnocení závislosti kvantitativních znaků
description
Transcript of Hodnocení závislosti kvantitativních znaků
Hodnocení závislostiHodnocení závislosti
kvantitativních znakůkvantitativních znaků
– hodnocení 1 znaku (proměnné) v různých souborech (ZS, VS); vzájemné porovnání souborů
Vícerozměrná statistikaVícerozměrná statistika
Jednorozměrná Jednorozměrná statisstatistikatika
– závislost mezi 2 a více znaky v jednom souboru; vyjádření a popis vzájemného vztahu mezi proměnnými
Vztahy mezi 2 proměnnými (obecně):
1.Funkční závislost (matematika, fyzika)
- každé číselné hodnotě jednoho znaku (proměnné xi) odpovídá 1 přesná hodnota znaku druhého (proměnná yi)
Přesný popis rovnicí (vzorcem) – např. vztah mezi poloměrem kruhu a jeho obvodem, plochou.
xi (r)
yi
(2r)
(nezávislá p.- příčina)
(závislá p.-následek)
Pevný příčinný vztah, neovlivněný náhodou
2.Korelační (statistická) závislost (biologie, medicína)
- jedné číselné hodnotě prvního znaku (proměnné xi) odpovídá celá řada náhodných hodnot znaku druhého (proměnná yi)
Volná závislost – změna 1.znaku vyvolá změnu 2.znaku jen s určitou pravděpodobností (znaky spolu korelují).
(spojení celého komplexu různých příčin a následků, včetně náhodných vlivů.)
xi (výška)
yi
(hmotnost)
(bodový diagram)
Popis a charakteristika korelační závislosti v biologii:
Funkční závislost vyjádříme rovnicí.
Odhadování nejbližší funkční závislosti (ke které se korelační závislost blíží) - aproximace
Typy funkčních závislostí:
1.Lineární závislost: y = kx +q
k – směrnice přímky
(=tg ; sklon přímky)
q – posun přímky na ose y
+k
-k
+q
-q
2.Kvadratická (parabolická) závislost:y = ax2+bx +c
3.Hyperbolická závislost:
cxb
y
Odhadování nejvýstižnější funkční závislosti pro korelační vztah:
Bodový diagram - podle charakteru rozložení bodů:
a) lineární závislost
b) nelineární závislost
A) Lineární korelaceA) Lineární korelace
1.Empirická křivka:
- pro opakované měření v bodě xi získáme několik hodnot
yi (zjistíme jejich průměr)
yi
xi
(empirická křivka - - VSVS)
Empirická křivka – popisuje závislost na – popisuje závislost na
úrovni úrovni VSVS (odhad skutečné (odhad skutečné závislosti)závislosti)
2.Aproximace – zjištění teoretické přímky:
(výpočet koeficientů přímky y=kx + q: regresní analýza)
VS: n- počet členůkorelační dvojice (xi ;
yi)
22ix
ix
iy
ix
iyixn
n
kn
kyq i
xi
(kvalitativní stránka závislosti: vlastnosti přímky – sklon,
posun)
Výpočet 2 bodů pro sestrojení přímky:
- zvolíme x1 y1 = kx1 + q
- zvolíme x2 y2 = kx2 + q
yi
xi
x1 x2
y2
y1
(teoretická přímka - - ZSZS)
22 yyxx
xxr
ii
i yiy
3.Korelační analýza – zjištění těsnosti vztahu:
(výpočet korelačního koeficientu: r)
r – kvantitativně vyjadřuje sílu závislosti (rozptýlení bodů v bodovém diagramu)
r = -1; +1
(„parametrická
korelace“ )
r = 0 r >0 r <0
r =+1
závislost úplná(funkční)
r = -1
závislost úplná(funkční)
Přímá závislost nepřímá závislost
Významnost korelačního koeficientu
Testujeme hypotézu nezávislosti pomocí t-testu:
Střední chyba korelačního koeficientu: 2
1 2
n
rsr
rs
rt
= n-2
Test.kritérium:
Porovnáme s tab.krit. hodnotou Studentova rozdělení t1-
/2() :
Významnost korel.koeficientu souvisí s rozsahem VS:
- čím větší je n souboru, tím větší je významnost r (při stejné velikosti).
Pokud t t1-/2() zamítáme hypotézu nezávislosti X a Y
(r je statisticky významný)
Pokud t t1-/2() platí hypotéza nezávislosti X a Y
(r je statisticky nevýznamný)
B) Nelineární korelaceB) Nelineární korelace
Bodový diagram:
Stat. SW – polynomiální regrese (křivky různého tvaru) Např. polynom 4.řádu: y=ax4 +bx3 +cx2 +dx +e
Namáhavost výpočtů nelineárních regresních rovnic
řešení pomocí počítače
– Spearmanův koeficient pořadové korelace (neparametrický – nevyžaduje normalitu dat)
ne – empirická (pozorovaná) četnost znaku ve VS
no – očekávaná (teoretická) četnost znaku v ZS
Kvalitativní znakyKvalitativní znakybarva, tvar, výskyt anomálie, onemocnění, úhyn
apod.
(charakterizované četnostmi výskytu v souboru)
Výpočty: testování rozdílu četností mezi souboryzjišťování závislosti kvalitativních
znaků
2 2 – test– test (test shody četností)
m – počet kvalitativních tříd ve VS (varianty znaku)
Je-li 2 > 2krit. významný rozdíl mezi ne a no (při
zvolené )Je-li 2 2
krit. nevýznamný rozdíl mezi ne a no
PoužitíPoužití::
• porovnání četnosti onemocnění ve VS se statistickou nemocností
• porovnání výskytu onemocnění ve 2 a více VS
• zjišťování závislosti kvalitativních znaků
m
i oi
oiei
n
nn
1
22
Test rozdílu empirické a teoretické četnosti (VS x (VS x ZS)ZS)
VS: n=146 ZS: p=4,5% (0,045)
enteritis: 13
ne: 13 (N)
133 (Z)
no : p. n= 0,045.146= 6,57 (N)
(1- p). n= 0,955.146= 139,43 (Z)
5895,643,139
)43,139133(
57,6
)57,613(222
2 krit.0,05 = 3,841
2 krit.0,01 = 6,635
Významnost: p<0,05
Test rozdílu 2(a více) empirických četností (VSxVS)
Porovnání několika skupin empirických četností mezi sebou Každá skupina: několik kvalitativních tříd
Př.: při vyšetření masa srnčí zvěře na parazitární napadení byl sledován počet pozitivních a negativních vzorků ze 3 lokalit (A,B,C) v republice. Liší se lokality?
mk
Negativní Pozitivní
A 96 25
B 121 22
C 89 16
Skup (si)
121
143
105
Tř. (tj) 306 63
369(n)
ne – empirické četn.
no – teoretické četn. noij
n
t.s ji
(100,34) (20,66)
(118,59) (24,41)
(87,07) (17,93)
3 skupiny– k (i) 2 třídy– m (j)
Závěr.: výskyt parazitárního napadení srnčí zvěře se v lokalitách A, B a C významně neliší.
Vypočteme testovací kritérium:
637,1
93,1793,1716
........59,11859,118121
66,2066,2025
34,10034,10096 2222
2
Počet stupňů volnosti: = (k-1).(m-1)=2
Tabulková kritická hodnota: 20,05(2)=5,99
2 2krit. rozdíl mezi pozorovanými četnostmi je stat. nevýznamný
(p>0,05)
ji oij
oijeij
n
nn
,
2
2