Statisztikai alapfogalmak

15
Statisztikai alapfogalmak

description

Statisztikai alapfogalmak. Fogalomlista. Hisztogram Átlag Szórás Konfidencia-intervallum ( megbízhatósági tartomány) Szignifikancia Percentilis CSH-index (családiháttér-index). 1. Hisztogram. Egy változó lehetséges értékeinek megoszlását bemutató oszlopdiagram . - PowerPoint PPT Presentation

Transcript of Statisztikai alapfogalmak

Page 1: Statisztikai alapfogalmak

Statisztikai alapfogalmak

Page 2: Statisztikai alapfogalmak

Fogalomlista

1. Hisztogram

2. Átlag

3. Szórás

4. Konfidencia-intervallum

(megbízhatósági tartomány)

5. Szignifikancia

6. Percentilis

7. CSH-index (családiháttér-index)

Page 3: Statisztikai alapfogalmak

1. Hisztogram

• Egy változó lehetséges értékeinek megoszlását bemutató oszlopdiagram.

• A grafikon vízszintes tengelyén a változó lehetséges értékeivagy azok valamilyen csoportosítása szerepel, függőleges tengelyről pedig az adott kategóriában található értékek száma vagy aránya olvasható le.

Matematika képességpont50 pontnyi széles intervallumokra osztva

Városi ált. iskolába járó gyerekek körében az adott intervallumba eső gyerekek száma(ezer fő)

Page 4: Statisztikai alapfogalmak

2. Átlag

• Leggyakrabban a számtani átlagot használjuk:Jelölés: x1, x2,…, xn az n db érték

• Jelentősége abban rejlik, hogy egyetlen számadattal jól jellemzi az adathalmazt, mert az adatok az átlag környezetébe esnek.

• Óvatosan kell használni, mert a „környezet” nagy is lehet!Kell egy másik mutató mellé (pl. szórás, konfidencia-intervallum, szignifikancia).

Page 5: Statisztikai alapfogalmak

3. Szórás

• Azt mutatja meg, hogy

az egyes értékek átlagosan mennyivel térnek el az átlagtól.

• Minél kisebb a szórás, az átlag annál pontosabban jellemzi az adatokat.

• Az átlagtól vett eltérések négyzetes átlaga:

Jelölések:

x1, x2,…, xn: n db érték

A: számtani közép (átlag)

kicsi szórás:

nagy szórás:

Page 6: Statisztikai alapfogalmak

4. Konfidencia-intervallum (megbízhatósági tartomány)

• 95%-os konfidencia-intervallum jelentése: a becsült adat 95%-os valószínűséggel a megadott intervallumba esik.

• A becsült adat most: a tanulók átlagos képességpontja.

249 pontnyi széles tartomány!

2 pontnyi széles tartomány

Page 7: Statisztikai alapfogalmak

4. Konfidencia-intervallum (megbízhatósági tartomány)

• FONTOS: Nem az egyes értékek esnek 95%-os eséllyel az intervallumba, hanem az átlaguk!

• Az országos átlagban a telephely tanulói is benne vannak!

• Azért nagy a telephelyi átlag konfidencia-intervalluma,mert kevés elemű és nagy szórású adathalmazból becsüljüka tanulók átlagos teljesítményét.

• Az országos szórás is nagy, viszont nagyon sok értékből számolunk, ami megbízhatóbb becslésre vezet.

Page 8: Statisztikai alapfogalmak

5. Szignifikancia

• A statisztikai összehasonlításban gyakran használatos fogalom(szignifikáns=jelentős).

• Például két telephelyet össze akarunk hasonlítani a tanulók kompetenciamérés eredménye alapján.

1. Megnézzük az átlagokat (nem elég!)

2. Megnézzük a konfidencia intervallumokat

3. Ez itt most nem elég a döntéshez, ezért statisztikai módszerrel (hipotézisvizsgálat –> 2 mintás t-próba)megállapítjuk, hogy van-e jelentős különbség, ekkor:

ki tudunk mutatni szignifikáns különbséget a két telephely közt(akkor egyértelmű, hogy melyik a jobb)

nem tudunk kimutatni lényeges különbséget(a hipotézisvizsgálat nem tudta megerősíteni, hogy különböznek,ezért lényegében egyformának tekintjük őket)

Page 9: Statisztikai alapfogalmak

Konfidencia-intervallum,szignifikáns különbség

1408 16571542

NINCS

VAN

1.

2.

4.

Bp. NAGY Ált. Iskola

Országos átlag 1611 1612 1613

1655 166216583. Bp-i iskolák átlaga

További statisztikai

vizsgálat szükséges

1675 16821679Bp-i NAGYiskolák átlaga

Egy konkréttelephely

Egy példa:

Page 10: Statisztikai alapfogalmak

6. Percentilis

• A változó eloszlásának jellemzésére szolgáló mutató.

• A k. percentilis az az érték, amelynél a változó által felvett értékek k%-a kisebb, (100-k)%-a pedig nagyobb

(k: 0 és 100 közötti egész szám).

• Például az 5-ös percentilisnél az értékek 5%-a kisebb, 95%-a pedig nagyobb.

• A 0-s percentilis a minimum, a 100-as percentilis a maximum, az 50-es percentilis pedig a medián.

Page 11: Statisztikai alapfogalmak

6. Percentilis

190318871856

1815

1774

17461730

16821675

16311624161715881559

1527

1503

14711463

14251407

Szövegértés képességpont20 db érték100%

5 dblegkisebb érték25%

15 dblegnagyobb érték75%

25-ös percentilis: az értékek25%-a alatta, 75%-a fölötte van

1509

Page 12: Statisztikai alapfogalmak

6. Percentilis

190318871856

1815

1774

17461730

16821675

16311624161715881559

1527

1503

14711463

14251407

Szövegértés képességpont20 db érték100%

10 db legkisebb érték 50%

10 db legnagyobb érték 50%

25-ös percentilis: az értékek 25%-a alatta, 75%-a fölötte van

1509

162750-es percentilis (medián): az értékek 50%-a alatta, 50%-a fölötte van

Page 13: Statisztikai alapfogalmak

6. Percentilis

190318871856

1815

1774

17461730

16821675

16311624161715881559

1527

1503

14711463

14251407

Szövegértés képességpont20 db érték100%

15 db legkisebb érték 75%

5 db legnagyobb érték 25%

25-ös percentilis: az értékek 25%-a alatta, 75%-a fölötte van

1509

162750-es percentilis (medián): az értékek 50%-a alatta, 50%-a fölötte van

75-ös percentilis: az értékek 75%-a alatta, 25%-a fölötte van

1767

Page 14: Statisztikai alapfogalmak

7. CSH-index (családiháttér-index)

• Egyetlen számadattal szeretnénk jellemezni a tanuló családi környezetének azon tényezőit, melyek a legnagyobb befolyással vannak az iskolai teljesítményére.

• A családiháttér-index értéke a tanulói kérdőív néhány kérdésére adott válasz alapján kerül kiszámításra, amelyek az index 2006-os kialakításakor a legnagyobb magyarázóerővel bírtaka lineáris modellben:

– az otthon található könyvek száma

– a szülők iskolai végzettsége külön-külön

– van-e otthon számítógép

– tanulónak vannak-e saját könyvei

2013-tól a HHH státusz is része

Page 15: Statisztikai alapfogalmak

7. CSH-index (családiháttér-index)

• A telephelyi jelentésekben külön ábracsoport mutatja be, hogy a

telephely tanulóinak átlagos CSH-indexe alapján milyen eredményre

számítanánk a kompetenciamérésen, és ehhez képest a telephely hogyan

szerepelt (hátránykompenzáló hatás).