Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)
description
Transcript of Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)
Analýza kvantitativních dat I.
Popisné statistiky v grafech 1.(třídění 1. stupně)
Jiří Šafr jiri.safr(zavináč)seznam.cz
poslední aktualizace 28. 3. 2014
UK FHSHistorická sociologie, Řízení a supervize
(LS 2011-2014)
2
Lodyhový (cifrový) graf (Stem-and-Leaf Plot )
vek Stem-and-Leaf Plot
Frequency Stem & Leaf
3,00 0 . 668 3,00 1 . 122 1,00 1 . 5
Stem width: 10,00 Each leaf: 1 case(s)
Ukazuje distribuci dat: hustotu a rozložení; identifikace outlierů (extrémů),
Vhodný pouze pro data s menším počtem případů → histogram nebo boxplot
Postup: hodnoty znaku vzestupně uspořádáme; určíme úroveň dle číslice: lodyha (stem) = např. desítky a listy (leafs) = např. jednotky;
3
Histogramsloupcový graf, v němž každé kategorii přiřadíme její četnost (nejde procenta!). Zobrazuje distribuci kategorií numerického- kardinálního (nebo ordinálního) znaku (proto ho někdy doplňujeme o distribuční křivku normálního rozdělení).Osa Y znázorňuje počet případů (četnost) v dané kategorii. Osa X – intervaly, ty jsou stejné šířky. Pozor nesprávná šířka intervalu může zkreslovat.
4
Sloupcový graf – Barchart, v %Pokud je zadán v % znázorňuje relativní podíly kategorií (ty lze dále je porovnávat pro určité podskupiny).
5
Sloupcový graf – Barchart, absolutní četnostiPokud ho zadáme v absolutních četnostech, dostaneme vlastně histogram (ale viz rozdíl).
6
Histogram a Sloupcový graf (Barchart) v SPSS
Histogram není příliš vhodný pro malý počet případů.
7
Barchart → četnosti kategorií kategorizovaného znaku (zde nominální znak Kraj)
Zdroj: ISSP2007, ČR
8
Barchart → četnosti kategorií kategoriálního znaku
(zde ordinální kategorie věku)
Zdroj: ISSP2007, ČR
9
Histogram → četnosti/ hustota kardinálního (numerického – spojitého) znaku
(věk u dospělé populace ČR)
Zdroj: ISSP2007, ČR
10
Stem and Leaf → četnosti/ hustota kardinálního (numerického – spojitého) znaku
(věk u dospělé populace ČR)vek Stem-and-Leaf Plot
Frequency Stem & Leaf
53,00 1 . 88888888888899999999999999 104,00 2 . 00000000000000011111111111122222222333333333344444 62,00 2 . 555555666667777778888888899999 89,00 3 . 0000000000111111222222222233333333334444444 76,00 3 . 5555555566666667777788888888889999999 95,00 4 . 0000000011112222222222233333333333444444444444 107,00 4 . 5555555555666666666666677777788888888888899999999999 112,00 5 . 0000000000000011111111122222222222233333333334444444444 135,00 5 . 555555555555666666666666777777777778888888888888888999999999999999 112,00 6 . 0000000000000001111111111222222222223333333333333444444 118,00 6 . 5555555555555555666666666677777777777777788888888889999999 75,00 7 . 000000000000011111122222233333444444 84,00 7 . 55555555555666666677777888888888999999999
Stem width: 10 Each leaf: 2 case(s)
11
Koláčový graf (Pie chart), v %
Zdroj: ISSP2007, ČR
12
Koláčový graf (Pie chart), v %
Zdroj: TV&knihy 2013, studenti FHS
13
Boxplot – vousaté krabičky, graf rozptýlení
KVARTILY dělí statistický soubor na desetiny: dolní Q0,25 (Q1) a horní Q0,denní5 (Q3) medián, kvartily (II. a III.), přilehlá (outliers) a vzdálená (extremes) pozorování
Interkvartilové rozpětí (vnitřní hradby):
HH = horní kvartil + 1,5 násobku interkvartilového rozpětí
DH = dolní kvartil + 1,5 násobku interkvartilového rozpětí
14
Syntax pro základní grafy v SPSSJednoduše v rámci příkazu FREQUENCIES:
FREQ vek / HISTO.FREQ vek / BARCHART PERCENT.FREQ vek / BARCHART FREQ.FREQ vek /PIECHART PERCENT.
Samostatný příkaz GRAPH (jde o původní zadávání v SPSS, které je přehledné a lze jednoduše zadávat
ze syntaxu. Novější verze SPSS mají rozhraní Chart Builder a Interactive, které je v podstatě nutné zadávat klikáním přes okna)
GRAPH /HISTOGRAM=vek.GRAPH /BAR(SIMPLE)=PCT BY vekkat.GRAPH /BAR(SIMPLE)=PCT BY q14b BY s30. /*2. stupeň: AxB.
GRAPH /PIE=PCT BY vekkat.
Parametr COUNT → absolutní četnosti, PCT → procenta
Další grafy pro třídění 2. a 3. stupně viz prezentaci 7. Grafy třídění 2.&3.st. http://metodykv.wz.cz/AKD1_Grafy2.ppt
.
15
Stem-and-LeafV rámci příkazu EXPLORE resp. EXAMINE:
EXAMINE VARIABLES=vek /PLOT BOXPLOT HISTOGRAM STEMLEAF /COMPARE GROUPS /STATISTICS NONE /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL.*specifikace STATISTICS=NONE vypíná zobrazení výpočtů statistik – tabulek příkazu Explore
/STATISTICS=ALL naopak zobrazí všechny.
16
BOXPLOT (fousaté krabičky)
EXAMINE VARIABLES= vek BY vzd4 /PLOT=BOXPLOT /STATISTICS=NONE /NOTOTAL.
*pro třídění 2. stupně (věk podle vzdělání).
EXAMINE VARIABLES= vek BY vzd4 /PLOT=BOXPLOT /STATISTICS=NONE /NOTOTAL.
Třídění 2. stupně pro kategoriální proměnné
Podrobně viz
7. Grafy třídění 2. a 3. stupně
http://metodykv.wz.cz/AKD1_Grafy2.ppt
18
Barchart: často pro třídění 2.stupněPříklad: Zájem o politiku podle pohlaví