SPSS alapismeretek - OKTokt.ektf.hu/data/lenke/file/SPSS_OKT_17abra.pdf2010.10.26. 2 Statistical...

SPSS ALAPISMERETEK

T. Parázsó Lenke

2010.10.26.

2

Statistical Package for Social Scienses

Statisztikai programcsomag a szociológiai tudományok számára

1968-ban Norman H. Nie, C.Handlai Hull és Dale H. Bent alkották meg az SPSS alapjait,

70-es években továbbfejlesztették a Chicagói Egyetemen.

1992-ben megjelent a Windows alatt futó változata, ez averzió vált elterjedtebbé a felhasználók körében.

1997 – 2003 vállalati alkalmazások elterjedése

2004 Predectiv elemzések ideje

2007 Java alkalmazások

2009 SPSS PASW

Médiainformatikai Intézet

SPSS munkaterületei

2010.10.26.

MS Windows család tagja, minták statisztikai elemzését végezhetjük el segítségével.

A programot kizárólag a megnevezett intézmények oktatói és tanulói használhatják: kutatás, egyetemi oktatás és fejlesztés céljára.

Munkaterületei:

Data – adatmátrix

Output – eredmények

Chart – diagram ablak

3


Változók

2010.10.26.

4


Az SPSS beköszöntő oldala

2010.10.26.

Tárgyszavas és címszavas megnyitás, kereséseÚj adat beírása

Meglévő könyvtárak és fájlok megnyitása

Adatbázis konvertáló megnyitása

Már mentett adatbázis megnyitása

5


Az SPSS beköszöntő oldala

2010.10.26.

6


Különböző kiterjesztésű adatok konvertálása

2010.10.26.

7


Az adatbázis

2010.10.26.

Az oszlopok, más szóval mezők vagy változók, a kérdőív kérdéseinek,

a sorok, vagy rekordokilletve elemek, a válaszadóknak felelnek meg.

8


Az adatbázis definiálása

2010.10.26.

9


Adat

2010.10.26.

Az oszlopok, más szóval mezők vagy változók, a kérdőív kérdéseinek,

a sorok, vagy rekordokilletve elemek, a válaszadóknak felelnek meg.

10


Az adat jellemzői_1

2010.10.26.

VARIABLE NAME a kijelölt oszlopba feltüntetett változókmegnevezését határozzuk meg.

TYPE a változó típusát jelöljük meg

LABELS a változó címkéjét definiáljuk

MISSING VALUES az adathiány kódja, ahol a hiányzó adatokatkódolhatjuk

COLUMN FORMAT a cella formázása

11


Adat típusa

2010.10.26.

12


13

A File menű

2010.10.26.Médiainformatikai Intézet

Define Labels – a változók definiálása

2010.10.26.

A változók neveit – Value - cimkékkel látjuk elValue label – a változók magyarázatai

14


Define Missing Values- az adathiány ellenőrzése

2010.10.26.

Ha a feldolgozás során nem kell számolni adathiánnyal, akkor a legfelső, No missing valuespontot jelöljük meg.

Abban az esetben, ha hibás értékekkel is számolni kell, az alábbi 3 beállítási lehetőségünk van:

15


Define Missing Values- Hiba

2010.10.26.

16


Hibás értékek – adathiány ellenőrzése

2010.10.26.

17


Hibás értékek – adathiány ellenőrzése_2

File

Display Data Info

2010.10.26.

18


Keretrendszer kialakítása

2010.10.26.

19


Oszlop formázás

2010.10.26.A lehulló ablak az oszlop szélességének és a beleírt szöveg igazítására ad lehetőséget.

20


SPSS adatfelvitel

2010.10.26.

21


Sor és oszlop beszúrás

2010.10.26.

22


23

Az adatbázis

• az oszlopok, más szóval mezők vagy változók, a kérdőív kérdéseinek,

• a sorok, vagy rekordok illetve elemek, a válaszadóknak felelnek meg. 2010.10.26.Médiainformatikai Intézet

24

Adatfelvitel


Grafikai ábrázolás

kördiagram

2010.10.26.

25


Hisztogram

2010.10.26.

26


Halmozott oszlopdiagram

2010.10.26.

27


Tő és levél (Steam snd leaf plot)

2010.10.26.

28


Boksz-Plot ábra

2010.10.26.

29


Pókháló, sugár

2010.10.26.

30


31

Adatfájlok statisztikai elemzése

OLAP


32

A középérték mérőszámai


33

Statisztikai jellemzők


34

Gyakoriság


35

Gyakoriság_2


36

Eredmény


37

Kovarancia

Két adathalmaz adatpárjai közötti eltérések szorzatának átlagát számolja

megadja két egymástól különböző változó együttmozgását.

n számú x, y értékpár esetében a minta kovarianciája az alábbi képlettel

határozható meg:

37

n

yyxx i

n

i i )()(


38

Korrelációs együttható

A korrelációszámítást többdimenziós mintákvizsgálatakor, a minta elemeihez rendelt adatokközötti összefüggés feltárását szolgálja.

A korrelációs együttes szignifikancia vizsgálatamegmutatja, hogy egy adott, többdimenziósminta esetén a változók között talált összefüggésmekkora valószínűséggel valódi és nem a véletlenműve.

táblázatxy rr

táblázatxy rr

a két minta korrelációs összefüggése az oszlopnak megfelelő

valószínűséggel nem a véletlen műv, vagyis általánosítható

a korrelációs összefüggés mértékét nem lehet áltatlánosítani, vagyis a mintában észlelt kapcsolat a véletlen műve 2010.10.26.Médiainformatikai Intézet

39

A korrelációs együttható szignifikanciája

A korrelációs együttes szignifikancia vizsgálata megmutatja, hogy egy adott, többdimenziós minta esetén a változók között talált összefüggés mekkora valószínűséggel valódi és nem a véletlen műve.

A mintához tartozó elemek szabadságfoka: szf=n-2


40

Az eredmény általánosíthatósága a populációra

A feltételezett összefüggés általánosításához azszükséges, hogy a korrelációs együtthatóabszolút értéke nagyobb legyen, mint a 95%-osvalószínűségi szinthez (adott szabadságfokon)tartozó érték.

Abban az estben, ha 99% vagy 99,9%-os értékenvégezzük az összevetést, a felfedett kapcsolatmég nagyobb valószínűséggel általánosítható.


2010.10.26.

41

Kereszttáblák

Az ilyen csoportosítások megjelenítésére és a szempontok közötti összefüggések vizsgálatára alkalmasak a kontingenciatáblák vagy kereszttáblák.

A kereszttáblákat két változó összefüggésének vizsgálatához használjuk.


2010.10.26.

42

Chi-négyzet (Kereszttáblák)

Ezt a statisztikát arra használjuk, hogy azt a hipotézist, miszerint a sor és oszlopváltozók függetlenek, ellenôrizhessük.

Nem jól használható, ha bármelyik cellában a peremeloszlások alapján várható érték (expected value) kisebb 1-nél, vagy a cellák több mint 20%-ban ez az érték kisebb mint 5.


2010.10.26.

43

Chi-négyzet(Kereszttáblák)

A Pearson chi-négyzet a legelterjedtebb forma, a likelihood-ratio chi-négyzet a max. likelihood elméleten alapszik.


2010.10.26.

44

Kereszttáblák alkalmazása


2010.10.26.

45


Display clustered bar charts: olyan oszlopdiagramot közöl, amely a kereszttábla egyes celláihoz tartozók elemszámát mutatja

Suppress tables: a kereszttáblát nem, csak a statisztikákat közli

A Format gomb lenyomása után megjelenô dialógus dobozban a táblázat formátumát adhatjuk meg.

A Crosstabs ablakon belül lehetőségünk van arra, hogy beállítsuk, milyen adatokat akarunk a cellákban megjeleníteni: Cells …


2010.10.26.

46



2010.10.26.

47


Counts …

Observed: a megfigyelt gyakoriságok

Expected: a várt gyakoriságok, az adott cellába eső megfigyelések száma a sor- és az oszlopváltozó függetlensége esetén

Percentages …

Row (sor): sorszázalék

Column (oszlop): oszlopszázalék

Total (teljes): totálszázalék. Az adott cellába eső esetek aránya az összes megfigyelthez képest.


2010.10.26.

48

Beállítás: Statistics …

Chi-square: azt a nullhipotézist teszteli, anélkül, hogy számot

adna kapcsolatuk irányáról és erősségéről.

Correlation: Pearson's R: két, legalább intervallum szintű,

változó lineáris összefüggésének mérésére alkalmas mérőszám. Értéke a -1; 1 zárt intervallumba esik.

A negatív értékek negatív (az egyik változó értékének emelkedésével a másik értéke csökken), a pozitívak pozitív összefüggést jelentenek (az egyik változó értékének emelkedésével a másik értéke is nő), ahol a –1 és 1 a teljes lineáris meghatározottságot a 0 pedig azt jelenti, hogy a két változó között nincs lineáris összefüggés vagy más szavakkal a két változó korrelálatlan.


2010.10.26.

49


Nominal Data: (nominális adatok)

Phi and Cramer’s V: 2 alapú asszociációs mérőszám. Értéke 0; 1 között mozoghat, ahol a 0 érték azt jelenti, hogy egyáltalán nincs kapcsolat a két változó között, míg az 1 érték tökéletes statisztikai együttjárást jelez. 2 2-s táblánál Phi-t használunk, nagyobbra Cramer’s V-t.


2010.10.26.

50


Lambda: asszociációs mérőszám, amelynek segítségével azt

vizsgáljuk, hogy az egyik változó értékeinek megtippelésekor mekkora aránylagos hibacsökkenést okoz a másik változó ismerete. Értéke 0; 1 között mozoghat, ahol 1 jelzi a tökéletes statisztikai együttjárást.

Gamma: asszociációs mérőszám. A lambdához hasonlóan ez

is azon alapul, hogy mennyire segíti az egyik változó ismerete a másik értékének előrejelzését. De a gammánál nem a pontos értékére tippelünk, hanem az értékek ordinális elrendezésére, nagyságviszonyára. Értéke -1; 1 közé eshet és így a kapcsolat nagyságán kívül annak irányára is utal.


2010.10.26.

51

Beállítás: Cell Display


2010.10.26.

52

Eredmények_1


2010.10.26.

53

Eredmények_2


2010.10.26.

54

Eredmények_3


2010.10.26.

55

Eredmények_4


56

Parancsbeállító menűsor -OLAP

OLAP - az adatok középérték mérőszámait állítja elő


57

Statisztikai jellemző beállítás -OLAP


58

OLAP eredményeket bemutató tábla

OLAP Cubes

sorszám: Total

Sum N Mean Std. Deviation % of Total N

feladat_1 39 17 2,29 1,312 100,0%

feladat_2 27 17 1,59 1,543 100,0%

feladat_3 18 17 1,06 1,478 100,0%

feladat_4 33 17 1,94 1,478 100,0%

feladat_5 45 17 2,65 ,996 100,0%

feladat_6 30 17 1,76 1,522 100,0%

feladat_7 24 17 1,41 1,543 100,0%

feladat_8 45 17 2,65 ,996 100,0%


SPSS alapismeretek - OKTokt.ektf.hu/data/lenke/file/SPSS_OKT_17abra.pdf2010.10.26. 2 Statistical...

Documents

Transcript of SPSS alapismeretek - OKTokt.ektf.hu/data/lenke/file/SPSS_OKT_17abra.pdf2010.10.26. 2 Statistical...