Vlastnosti kvantitatívnych dát Ukazovatele (miery)
-
Upload
uriah-wright -
Category
Documents
-
view
38 -
download
2
description
Transcript of Vlastnosti kvantitatívnych dát Ukazovatele (miery)
Štatistika UVM 1
Vlastnosti kvantitatívnych dátUkazovatele (miery)
PolohaPoloha
Central Central Tendency Tendency (Location)(Location)
MenlivosťMenlivosť
Variation Variation (Dispersion)(Dispersion)
TvarTvar
ShapeShape
Štatistika UVM 2
Kvantitatívne dátaVlastnosti a ukazovatele
Priem erModusMedián
Miery polohy(Centrálna tendencia)
Variačné rozpätieKvartilové rozpätieŠtand. odchýlkaRozptylVariačný koeficientŠtandardná chyba
Miery variability(Menlivosť)
Š ikm osťŠpicatosť
Miery tvaru
Ukazovatele(Miery)
Štatistika UVM 3
Vlastnosti kvantitatívnych dátPoužívané symboly
Ukazovateľ
Measure
Populácia
Population
Výber
Sample
Rozsah (Size) N n
Priemer (Mean) µ x
Rozptyl (Variance)
2 s2
Štand.oddchýlka
(Stand.Deviation) s
Štatistika UVM 4
mm2211
m
1iii
n21
n
1ii
nx...nxnxn
1nx
n
1x
x...xxn
1x
n
1x
Aritmetický priemer(Mean)
• Miera polohy (často používaná)
• Bod „rovnováhy“• Citlivý na extrémne hodnoty
(„Outliers“)
• Vzorec (pre výber):– Jednoduchý:
– Vážený (z frekv. tabuľky):
Štatistika UVM 5
• Miera polohy (centrálnej tendencie)
• Najčastejšie sa vyskytujúca hodnota
• Nie je citlivý na extrémne hodnoty
• Súbor môže mať aj viac modusov, alebo aj žiadny
• Používa sa u číselných ale aj kategoriálnych dát
• Príklady:
1. Dáta: 10, 10, 11, 13, 9, 10, 10, 8 xMo=10 (1 modus)
2. Dáta: 10, 10, 11, 12, 12, 8, 9, 10, 12 xMo=10 a 12 (2 modusy)
3. Dáta: 10, 12, 8, 9, 11, 13, 7 - dáta bez modusu
Modus (Mode)
Štatistika UVM 6
• Miera polohy (centrál. tendencie)
• Necitlivý na extrémne hodnoty
• Stredná hodnota v usporiadanom súbore:– ak n = nepárne, tak je to hodnota v
strede usporiadaného súboru– ak n = párne, tak je to priemer 2-och
prostredných hodnôt usporiadaného súboru
• Pozícia mediánu v súbore:
Medián (Median)
2
1nr
Štatistika UVM 7
Dáta: 24.1 22.6 21.5 23.722.6
Usporiadané: 21.5 22.6 22.6 23.724.1
Pozícia: 1 2 3 45
Medián - príklad n = 5 (nepárne)
22,6x
32
15
2
1nr
Me
Štatistika UVM 8
Medián - príklad n = 6 (párne)
Dáta: 10.3 4.9 8.9 11.7 6.3 7.7
Uspor.:4.9 6.3 7.7 8.9 10.3 11.7
Pozícia:1 2 3 4 5 6
8,32
8,97,7x
3,52
16
2
1nr
Me
Štatistika UVM 9
Variačné rozpätie (Range)
• Miera variability (menlivosti, dispersie)
• Vzorec: R = xmax - xmin
• Ignoruje rozdelenie dát (ich výskyt)
Príklad:
1. Dáta: 7, 7, 8, 8, 9, 9, 10, 10 R = 10-7 = 3
2. Dáta: 7, 8, 8, 9, 9, 9, 10, 10, 10, 10 R = 10-7 = 3
77 88 99 1010 77 88 99 1010
Štatistika UVM 10
Rozptyl & štandardná odchýlka
Variance & Standard Deviation
• Miery variability najviac používané (menlivosti, disperzie)
• Posudzujú rozdelenie dát
• Ukazujú variabilitu okolo priemeru ( x alebo )
• Vzorec (výberový rozptyl):
– Jednoduchý:
– Vážený ( z frekv. tabuľky):
1-n
nxx...nxxnx-x
1-n
1s
1-n
xx...xxxxx-x
1-n
1s
m
2
m1
2
1i
2m
1ii
2
2
n
2
2
2
1
2n
1ii
2
Štatistika UVM 11
nn - 1 - 1 v menovateli!v menovateli!
PoužiPouži NN ak počítaš rozptyl ak počítaš rozptyl ppopulopulácie ácie namiestonamiesto n-1! n-1!
Štandardná odchýlkaSmerodajná odchýlka (Standard Deviation)
1-n
nxx...nxxnx-x
1-n
1s
vážený
1-n
xx...xxxxx-x
1-n
1s
jednoduchý
ss
m
2
m1
2
1i
2m
1ii
2
n
2
2
2
1
2n
1ii
2
Štatistika UVM 12
Rozptyl & štandardná odchýlkaPríklad
DDááta:17ta:17, , 1616, , 2121, , 1818, , 1313, , 1616, , 1212, , 1111
n = 8n = 8
3,343,33811,14 s
11,14s
1-8
15,511...15,51615,517s
x-x1-n
1s
15,511...16178
1x
n
1x
2
2222
2n
1ii
2
n
1ii
Štatistika UVM 13
Relatívne miery variability
• Variačný koeficient (Coefficient of Variation):
– vyjadruje sa v percentách
– porovnanie variability 2-och rôznorodých súborov
• Štandardná chyba (Standard Error):
n
sSE
100x
sVk
Štatistika UVM 14
Miery tvaruShape
• Popisujú ako sú dáta rozložené
• Miery tvaru sú:– Šikmosť (Skew = Skewness)– Špicatosť (Kurtosis)
Šikmosť:
MeanMean
Left-SkewedLeft-Skewed SymmetricSymmetricMeanMean = = MedianMedian = = ModeMode MedianMedian ModeMode
Right-SkewedRight-Skewed MedianMedian MeanMeanModeMode
Štatistika UVM 15
Miery tvaruShape
Špicatosť (Kurtosis):
NormálneNormálnerozdelenie rozdelenie
N(0,1)N(0,1)
ŠpicatejšieŠpicatejšieako N(0,1)ako N(0,1)
++
Plochejšie Plochejšie
ako N(0,1)ako N(0,1)
--
Štatistika UVM 16
Kvartily (Quartile)
• Miery alokácie (Measure of Noncentral Tendency)
• Rozdeľujú usporiadané dáta na 4 rovnako početné časti:
QQ11 QQ2 2 QQ33
• Pozícia i-ho kvartilu:
25% 25% 25% 25%
4
1nikQi
Štatistika UVM 17
Kvartily (Quartile)Príklad
Dáta: 10.3 4.9 8.9 11.7 6.37.7
Uspor.:4.9 6.3 7.7 8.9 10.311.7
Pozícia: 1 2 3 4 5 6
10,3Q55,25
4
163k
6,32
8,97,7Q3,5
4
162k
6,3Q21,754
161k
3Q3
2Q2
1Q1
Štatistika UVM 18
Kvartilové rozpätie Interquartile Range
• miera variability
• výskyt (rozšírenie, Midspread) javu u 50% jednotiek súboru
• necitlivá na extrémne hodnoty
• Vzorec: RQ = Q3 – Q1
DDááta:ta: 1717,,1616, , 2121,1,188, , 1313, , 1616,,11 22, , 1111Uspor.Uspor.::1111,,1212,,1313, , 1616, , 1616, , 1717, , 1818, , 2121PoPozíciazícia:: 11, , 22, , 33, , 44, , 55, , 66, , 77, , 88
n = 8
kQ3 = 6,75 kQ1 = 2,25
RQ = 18 – 12 = 6
Štatistika UVM 19
Krabicový grafBox Plot
• Grafické zobrazenie dát pomocou 5-tich popisných štatistík (ukazovateľov)
MedianMedian
44 66 88 1010 1212
QQ33
QQ11
XXlargestlargest
XXsmallestsmallest
Štatistika UVM 20
Right-SkewedRight-SkewedLeft-SkewedLeft-Skewed SymmetricSymmetric
QQ11 MedianMedian QQ
33
QQ11 MedianMedian QQ
33QQ
11 MedianMedian QQ
33
Tvar (Shape) & Box Plot
Štatistika UVM 21
Miery tvaruShape
• Koeficient šikmosti (Skew = Skewness), označenie 1
– zošikmenie doľava kladný– zošikmenie doprava záporný– symetria 0
• Koeficient špicatosti (Kurtosis) označenie 2
– normálne rozdelenie 0– špicatejšie kladný– plochejšie záporný
3
n
1i
3
i
1 s
xxn1
γ
3
s
xxn1
γ4
n
1i
4
i
2