Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

18
Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně) Jiří Šafr jiri.safr(zavináč)seznam.cz poslední aktualizace 28. 3. 2014 UK FHS Historická sociologie, Řízení a supervize (LS 2011-2014)

description

UK FHS Historická sociologie, Řízení a supervize (LS 2011 -2014 ). Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně). Jiří Šafr jiri.safr(zavináč)seznam.cz. poslední aktualizace 28. 3. 2014. Lodyhový (cifrový) graf ( Stem-and-Leaf Plot ). - PowerPoint PPT Presentation

Transcript of Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

Page 1: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

Analýza kvantitativních dat I.

Popisné statistiky v grafech 1.(třídění 1. stupně)

Jiří Šafr jiri.safr(zavináč)seznam.cz

poslední aktualizace 28. 3. 2014

UK FHSHistorická sociologie, Řízení a supervize

(LS 2011-2014)

Page 2: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

2

Lodyhový (cifrový) graf (Stem-and-Leaf Plot )

vek Stem-and-Leaf Plot

Frequency Stem & Leaf

3,00 0 . 668 3,00 1 . 122 1,00 1 . 5

Stem width: 10,00 Each leaf: 1 case(s)

Ukazuje distribuci dat: hustotu a rozložení; identifikace outlierů (extrémů),

Vhodný pouze pro data s menším počtem případů → histogram nebo boxplot

Postup: hodnoty znaku vzestupně uspořádáme; určíme úroveň dle číslice: lodyha (stem) = např. desítky a listy (leafs) = např. jednotky;

Page 3: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

3

Histogramsloupcový graf, v němž každé kategorii přiřadíme její četnost (nejde procenta!). Zobrazuje distribuci kategorií numerického- kardinálního (nebo ordinálního) znaku (proto ho někdy doplňujeme o distribuční křivku normálního rozdělení).Osa Y znázorňuje počet případů (četnost) v dané kategorii. Osa X – intervaly, ty jsou stejné šířky. Pozor nesprávná šířka intervalu může zkreslovat.

Page 4: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

4

Sloupcový graf – Barchart, v %Pokud je zadán v % znázorňuje relativní podíly kategorií (ty lze dále je porovnávat pro určité podskupiny).

Page 5: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

5

Sloupcový graf – Barchart, absolutní četnostiPokud ho zadáme v absolutních četnostech, dostaneme vlastně histogram (ale viz rozdíl).

Page 6: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

6

Histogram a Sloupcový graf (Barchart) v SPSS

Histogram není příliš vhodný pro malý počet případů.

Page 7: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

7

Barchart → četnosti kategorií kategorizovaného znaku (zde nominální znak Kraj)

Zdroj: ISSP2007, ČR

Page 8: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

8

Barchart → četnosti kategorií kategoriálního znaku

(zde ordinální kategorie věku)

Zdroj: ISSP2007, ČR

Page 9: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

9

Histogram → četnosti/ hustota kardinálního (numerického – spojitého) znaku

(věk u dospělé populace ČR)

Zdroj: ISSP2007, ČR

Page 10: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

10

Stem and Leaf → četnosti/ hustota kardinálního (numerického – spojitého) znaku

(věk u dospělé populace ČR)vek Stem-and-Leaf Plot

Frequency Stem & Leaf

53,00 1 . 88888888888899999999999999 104,00 2 . 00000000000000011111111111122222222333333333344444 62,00 2 . 555555666667777778888888899999 89,00 3 . 0000000000111111222222222233333333334444444 76,00 3 . 5555555566666667777788888888889999999 95,00 4 . 0000000011112222222222233333333333444444444444 107,00 4 . 5555555555666666666666677777788888888888899999999999 112,00 5 . 0000000000000011111111122222222222233333333334444444444 135,00 5 . 555555555555666666666666777777777778888888888888888999999999999999 112,00 6 . 0000000000000001111111111222222222223333333333333444444 118,00 6 . 5555555555555555666666666677777777777777788888888889999999 75,00 7 . 000000000000011111122222233333444444 84,00 7 . 55555555555666666677777888888888999999999

Stem width: 10 Each leaf: 2 case(s)

Page 11: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

11

Koláčový graf (Pie chart), v %

Zdroj: ISSP2007, ČR

Page 12: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

12

Koláčový graf (Pie chart), v %

Zdroj: TV&knihy 2013, studenti FHS

Page 13: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

13

Boxplot – vousaté krabičky, graf rozptýlení

KVARTILY dělí statistický soubor na desetiny: dolní Q0,25 (Q1) a horní Q0,denní5 (Q3) medián, kvartily (II. a III.), přilehlá (outliers) a vzdálená (extremes) pozorování

Interkvartilové rozpětí (vnitřní hradby):

HH = horní kvartil + 1,5 násobku interkvartilového rozpětí

DH = dolní kvartil + 1,5 násobku interkvartilového rozpětí

Page 14: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

14

Syntax pro základní grafy v SPSSJednoduše v rámci příkazu FREQUENCIES:

FREQ vek / HISTO.FREQ vek / BARCHART PERCENT.FREQ vek / BARCHART FREQ.FREQ vek /PIECHART PERCENT.

Samostatný příkaz GRAPH (jde o původní zadávání v SPSS, které je přehledné a lze jednoduše zadávat

ze syntaxu. Novější verze SPSS mají rozhraní Chart Builder a Interactive, které je v podstatě nutné zadávat klikáním přes okna)

GRAPH /HISTOGRAM=vek.GRAPH /BAR(SIMPLE)=PCT BY vekkat.GRAPH /BAR(SIMPLE)=PCT BY q14b BY s30. /*2. stupeň: AxB.

GRAPH /PIE=PCT BY vekkat.

Parametr COUNT → absolutní četnosti, PCT → procenta

Další grafy pro třídění 2. a 3. stupně viz prezentaci 7. Grafy třídění 2.&3.st. http://metodykv.wz.cz/AKD1_Grafy2.ppt

.

Page 15: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

15

Stem-and-LeafV rámci příkazu EXPLORE resp. EXAMINE:

EXAMINE VARIABLES=vek /PLOT BOXPLOT HISTOGRAM STEMLEAF /COMPARE GROUPS /STATISTICS NONE /CINTERVAL 95 /MISSING LISTWISE /NOTOTAL.*specifikace STATISTICS=NONE vypíná zobrazení výpočtů statistik – tabulek příkazu Explore

/STATISTICS=ALL naopak zobrazí všechny.

Page 16: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

16

BOXPLOT (fousaté krabičky)

EXAMINE VARIABLES= vek BY vzd4 /PLOT=BOXPLOT /STATISTICS=NONE /NOTOTAL.

*pro třídění 2. stupně (věk podle vzdělání).

EXAMINE VARIABLES= vek BY vzd4 /PLOT=BOXPLOT /STATISTICS=NONE /NOTOTAL.

Page 17: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

Třídění 2. stupně pro kategoriální proměnné

Podrobně viz

7. Grafy třídění 2. a 3. stupně

http://metodykv.wz.cz/AKD1_Grafy2.ppt

Page 18: Analýza kvantitativních dat I. Popisné statistiky v grafech 1. (třídění 1. stupně)

18

Barchart: často pro třídění 2.stupněPříklad: Zájem o politiku podle pohlaví