SPSS alapismeretek - OKTokt.ektf.hu/data/lenke/file/SPSS_OKT_17abra.pdf2010.10.26. 2 Statistical...
Transcript of SPSS alapismeretek - OKTokt.ektf.hu/data/lenke/file/SPSS_OKT_17abra.pdf2010.10.26. 2 Statistical...
SPSS ALAPISMERETEK
T. Parázsó Lenke
2010.10.26.
2
Statistical Package for Social Scienses
Statisztikai programcsomag a szociológiai tudományok számára
1968-ban Norman H. Nie, C.Handlai Hull és Dale H. Bent alkották meg az SPSS alapjait,
70-es években továbbfejlesztették a Chicagói Egyetemen.
1992-ben megjelent a Windows alatt futó változata, ez averzió vált elterjedtebbé a felhasználók körében.
1997 – 2003 vállalati alkalmazások elterjedése
2004 Predectiv elemzések ideje
2007 Java alkalmazások
2009 SPSS PASW
Médiainformatikai Intézet
SPSS munkaterületei
2010.10.26.
MS Windows család tagja, minták statisztikai elemzését végezhetjük el segítségével.
A programot kizárólag a megnevezett intézmények oktatói és tanulói használhatják: kutatás, egyetemi oktatás és fejlesztés céljára.
Munkaterületei:
Data – adatmátrix
Output – eredmények
Chart – diagram ablak
3
Médiainformatikai Intézet
Változók
2010.10.26.
4
Médiainformatikai Intézet
Az SPSS beköszöntő oldala
2010.10.26.
Tárgyszavas és címszavas megnyitás, kereséseÚj adat beírása
Meglévő könyvtárak és fájlok megnyitása
Adatbázis konvertáló megnyitása
Már mentett adatbázis megnyitása
5
Médiainformatikai Intézet
Az SPSS beköszöntő oldala
2010.10.26.
6
Médiainformatikai Intézet
Különböző kiterjesztésű adatok konvertálása
2010.10.26.
7
Médiainformatikai Intézet
Az adatbázis
2010.10.26.
Az oszlopok, más szóval mezők vagy változók, a kérdőív kérdéseinek,
a sorok, vagy rekordokilletve elemek, a válaszadóknak felelnek meg.
8
Médiainformatikai Intézet
Az adatbázis definiálása
2010.10.26.
9
Médiainformatikai Intézet
Adat
2010.10.26.
Az oszlopok, más szóval mezők vagy változók, a kérdőív kérdéseinek,
a sorok, vagy rekordokilletve elemek, a válaszadóknak felelnek meg.
10
Médiainformatikai Intézet
Az adat jellemzői_1
2010.10.26.
VARIABLE NAME a kijelölt oszlopba feltüntetett változókmegnevezését határozzuk meg.
TYPE a változó típusát jelöljük meg
LABELS a változó címkéjét definiáljuk
MISSING VALUES az adathiány kódja, ahol a hiányzó adatokatkódolhatjuk
COLUMN FORMAT a cella formázása
11
Médiainformatikai Intézet
Adat típusa
2010.10.26.
12
Médiainformatikai Intézet
13
A File menű
2010.10.26.Médiainformatikai Intézet
Define Labels – a változók definiálása
2010.10.26.
A változók neveit – Value - cimkékkel látjuk elValue label – a változók magyarázatai
14
Médiainformatikai Intézet
Define Missing Values- az adathiány ellenőrzése
2010.10.26.
Ha a feldolgozás során nem kell számolni adathiánnyal, akkor a legfelső, No missing valuespontot jelöljük meg.
Abban az esetben, ha hibás értékekkel is számolni kell, az alábbi 3 beállítási lehetőségünk van:
15
Médiainformatikai Intézet
Define Missing Values- Hiba
2010.10.26.
16
Médiainformatikai Intézet
Hibás értékek – adathiány ellenőrzése
2010.10.26.
17
Médiainformatikai Intézet
Hibás értékek – adathiány ellenőrzése_2
File
Display Data Info
2010.10.26.
18
Médiainformatikai Intézet
Keretrendszer kialakítása
2010.10.26.
19
Médiainformatikai Intézet
Oszlop formázás
2010.10.26.A lehulló ablak az oszlop szélességének és a beleírt szöveg igazítására ad lehetőséget.
20
Médiainformatikai Intézet
SPSS adatfelvitel
2010.10.26.
21
Médiainformatikai Intézet
Sor és oszlop beszúrás
2010.10.26.
22
Médiainformatikai Intézet
23
Az adatbázis
• az oszlopok, más szóval mezők vagy változók, a kérdőív kérdéseinek,
• a sorok, vagy rekordok illetve elemek, a válaszadóknak felelnek meg. 2010.10.26.Médiainformatikai Intézet
24
Adatfelvitel
2010.10.26.Médiainformatikai Intézet
Grafikai ábrázolás
kördiagram
2010.10.26.
25
Médiainformatikai Intézet
Hisztogram
2010.10.26.
26
Médiainformatikai Intézet
Halmozott oszlopdiagram
2010.10.26.
27
Médiainformatikai Intézet
Tő és levél (Steam snd leaf plot)
2010.10.26.
28
Médiainformatikai Intézet
Boksz-Plot ábra
2010.10.26.
29
Médiainformatikai Intézet
Pókháló, sugár
2010.10.26.
30
Médiainformatikai Intézet
31
Adatfájlok statisztikai elemzése
OLAP
2010.10.26.Médiainformatikai Intézet
32
A középérték mérőszámai
2010.10.26.Médiainformatikai Intézet
33
Statisztikai jellemzők
2010.10.26.Médiainformatikai Intézet
34
Gyakoriság
2010.10.26.Médiainformatikai Intézet
35
Gyakoriság_2
2010.10.26.Médiainformatikai Intézet
36
Eredmény
2010.10.26.Médiainformatikai Intézet
37
Kovarancia
Két adathalmaz adatpárjai közötti eltérések szorzatának átlagát számolja
megadja két egymástól különböző változó együttmozgását.
n számú x, y értékpár esetében a minta kovarianciája az alábbi képlettel
határozható meg:
37
n
yyxx i
n
i i )()(
2010.10.26.Médiainformatikai Intézet
38
Korrelációs együttható
A korrelációszámítást többdimenziós mintákvizsgálatakor, a minta elemeihez rendelt adatokközötti összefüggés feltárását szolgálja.
A korrelációs együttes szignifikancia vizsgálatamegmutatja, hogy egy adott, többdimenziósminta esetén a változók között talált összefüggésmekkora valószínűséggel valódi és nem a véletlenműve.
táblázatxy rr
táblázatxy rr
a két minta korrelációs összefüggése az oszlopnak megfelelő
valószínűséggel nem a véletlen műv, vagyis általánosítható
a korrelációs összefüggés mértékét nem lehet áltatlánosítani, vagyis a mintában észlelt kapcsolat a véletlen műve 2010.10.26.Médiainformatikai Intézet
39
A korrelációs együttható szignifikanciája
A korrelációs együttes szignifikancia vizsgálata megmutatja, hogy egy adott, többdimenziós minta esetén a változók között talált összefüggés mekkora valószínűséggel valódi és nem a véletlen műve.
A mintához tartozó elemek szabadságfoka: szf=n-2
2010.10.26.Médiainformatikai Intézet
40
Az eredmény általánosíthatósága a populációra
A feltételezett összefüggés általánosításához azszükséges, hogy a korrelációs együtthatóabszolút értéke nagyobb legyen, mint a 95%-osvalószínűségi szinthez (adott szabadságfokon)tartozó érték.
Abban az estben, ha 99% vagy 99,9%-os értékenvégezzük az összevetést, a felfedett kapcsolatmég nagyobb valószínűséggel általánosítható.
2010.10.26.Médiainformatikai Intézet
2010.10.26.
41
Kereszttáblák
Az ilyen csoportosítások megjelenítésére és a szempontok közötti összefüggések vizsgálatára alkalmasak a kontingenciatáblák vagy kereszttáblák.
A kereszttáblákat két változó összefüggésének vizsgálatához használjuk.
Médiainformatikai Intézet
2010.10.26.
42
Chi-négyzet (Kereszttáblák)
Ezt a statisztikát arra használjuk, hogy azt a hipotézist, miszerint a sor és oszlopváltozók függetlenek, ellenôrizhessük.
Nem jól használható, ha bármelyik cellában a peremeloszlások alapján várható érték (expected value) kisebb 1-nél, vagy a cellák több mint 20%-ban ez az érték kisebb mint 5.
Médiainformatikai Intézet
2010.10.26.
43
Chi-négyzet(Kereszttáblák)
A Pearson chi-négyzet a legelterjedtebb forma, a likelihood-ratio chi-négyzet a max. likelihood elméleten alapszik.
Médiainformatikai Intézet
2010.10.26.
44
Kereszttáblák alkalmazása
Médiainformatikai Intézet
2010.10.26.
45
Kereszttáblák alkalmazása
Display clustered bar charts: olyan oszlopdiagramot közöl, amely a kereszttábla egyes celláihoz tartozók elemszámát mutatja
Suppress tables: a kereszttáblát nem, csak a statisztikákat közli
A Format gomb lenyomása után megjelenô dialógus dobozban a táblázat formátumát adhatjuk meg.
A Crosstabs ablakon belül lehetőségünk van arra, hogy beállítsuk, milyen adatokat akarunk a cellákban megjeleníteni: Cells …
Médiainformatikai Intézet
2010.10.26.
46
Kereszttáblák alkalmazása
Médiainformatikai Intézet
2010.10.26.
47
Kereszttáblák alkalmazása
Counts …
Observed: a megfigyelt gyakoriságok
Expected: a várt gyakoriságok, az adott cellába eső megfigyelések száma a sor- és az oszlopváltozó függetlensége esetén
Percentages …
Row (sor): sorszázalék
Column (oszlop): oszlopszázalék
Total (teljes): totálszázalék. Az adott cellába eső esetek aránya az összes megfigyelthez képest.
Médiainformatikai Intézet
2010.10.26.
48
Beállítás: Statistics …
Chi-square: azt a nullhipotézist teszteli, anélkül, hogy számot
adna kapcsolatuk irányáról és erősségéről.
Correlation: Pearson's R: két, legalább intervallum szintű,
változó lineáris összefüggésének mérésére alkalmas mérőszám. Értéke a -1; 1 zárt intervallumba esik.
A negatív értékek negatív (az egyik változó értékének emelkedésével a másik értéke csökken), a pozitívak pozitív összefüggést jelentenek (az egyik változó értékének emelkedésével a másik értéke is nő), ahol a –1 és 1 a teljes lineáris meghatározottságot a 0 pedig azt jelenti, hogy a két változó között nincs lineáris összefüggés vagy más szavakkal a két változó korrelálatlan.
Médiainformatikai Intézet
2010.10.26.
49
Beállítás: Statistics …
Nominal Data: (nominális adatok)
Phi and Cramer’s V: 2 alapú asszociációs mérőszám. Értéke 0; 1 között mozoghat, ahol a 0 érték azt jelenti, hogy egyáltalán nincs kapcsolat a két változó között, míg az 1 érték tökéletes statisztikai együttjárást jelez. 2 2-s táblánál Phi-t használunk, nagyobbra Cramer’s V-t.
Médiainformatikai Intézet
2010.10.26.
50
Beállítás: Statistics …
Lambda: asszociációs mérőszám, amelynek segítségével azt
vizsgáljuk, hogy az egyik változó értékeinek megtippelésekor mekkora aránylagos hibacsökkenést okoz a másik változó ismerete. Értéke 0; 1 között mozoghat, ahol 1 jelzi a tökéletes statisztikai együttjárást.
Gamma: asszociációs mérőszám. A lambdához hasonlóan ez
is azon alapul, hogy mennyire segíti az egyik változó ismerete a másik értékének előrejelzését. De a gammánál nem a pontos értékére tippelünk, hanem az értékek ordinális elrendezésére, nagyságviszonyára. Értéke -1; 1 közé eshet és így a kapcsolat nagyságán kívül annak irányára is utal.
Médiainformatikai Intézet
2010.10.26.
51
Beállítás: Cell Display
Médiainformatikai Intézet
2010.10.26.
52
Eredmények_1
Médiainformatikai Intézet
2010.10.26.
53
Eredmények_2
Médiainformatikai Intézet
2010.10.26.
54
Eredmények_3
Médiainformatikai Intézet
2010.10.26.
55
Eredmények_4
Médiainformatikai Intézet
56
Parancsbeállító menűsor -OLAP
OLAP - az adatok középérték mérőszámait állítja elő
2010.10.26.Médiainformatikai Intézet
57
Statisztikai jellemző beállítás -OLAP
2010.10.26.Médiainformatikai Intézet
58
OLAP eredményeket bemutató tábla
OLAP Cubes
sorszám: Total
Sum N Mean Std. Deviation % of Total N
feladat_1 39 17 2,29 1,312 100,0%
feladat_2 27 17 1,59 1,543 100,0%
feladat_3 18 17 1,06 1,478 100,0%
feladat_4 33 17 1,94 1,478 100,0%
feladat_5 45 17 2,65 ,996 100,0%
feladat_6 30 17 1,76 1,522 100,0%
feladat_7 24 17 1,41 1,543 100,0%
feladat_8 45 17 2,65 ,996 100,0%
2010.10.26.Médiainformatikai Intézet