Statisztika -...
Transcript of Statisztika -...
Statisztika I. GZM, EE, TV, GI szakok (BA és FOSZ)
(levelező tagozat)
2017-2018-as tanév I. félév
Oktató: Dr. Csáfor Hajnalka
intézetigazgató egyetemi docens, dékán
Gazdaságtudományi Intézet
E-mail: [email protected];
Témakörök
Statisztikai alapfogalmak
Statisztikai elemzések viszonyszámokkal
Statisztikai adatok és információk grafikus megjelenítése
Mennyiségi ismérv szerinti elemzés (számított és helyzeti középértékek, szóródás mutatói, aszimmetria, koncentráció)
Indexszámítás (érték-, ár- és volumenindexek, területi indexek és indexsorok)
Sztochasztikus kapcsolatok vizsgálata (asszociáció és vegyes kapcsolat)
(Részletesen a tantárgyi programban, ami a GTI honlapján érhető el:
(gti.uni-eger.hu – Vállalkozásgazdaságtan Tanszék, Csáfor Hajnalka)
Kötelező és ajánlott irodalmak
Kötelező irodalom:
Dr. Illyésné dr. Molnár Emese: Statisztikai feladatgyűjtemény
I. Perfekt Kiadó 2009.
Továbbá a zárthelyi dolgozatok anyagát képezik az
előadásokon és szemináriumokon elhangzottak.
Ajánlott irodalom:
Korpás Attiláné dr.: Általános statisztika I. Nemzeti
Tankönyvkiadó 2005.
Hunyadi László – Vita László: Statisztika I. BA tankönyv AULA
Kiadó Bp. 2009.
Molnár Máténé dr. – Tóth Mártonné dr.: Általános statisztika
példatár I. Nemzeti Tankönyvkiadó 2005.
Számonkérés és értékelés
A gyakorlatokon való részvétel kötelező.
A félév folyamán egy 100 pontos dolgozat megírására kerül sor. A gyakorlati jegy
pótló dolgozat egy szintén 100 pontos – az egész félév anyagát felölelő – dolgozat.
A zárthelyi dolgozat – vagy annak sikertelensége esetén a pótló dolgozat – alapján a
féléves teljesítményértékelés a következőképpen történik:
88-100 pont 5 (jeles)
75-87 pont 4 (jó)
63-74 pont 3 (közepes)
51-62 pont 2 (elégséges)
50 pont alatt 1 (elégtelen)
ZH: december 9. 9.00 óra
Pót ZH: december 15. 9.00 óra
Bevezetés a statisztikába
Statisztikai alapfogalmak
Statisztikai alapfogalmak
Statisztika fogalma, tárgya és szerepe
Statisztikai sokaság és ismérv
Mérési szintek
Statisztikai adat és mutatószám
Statisztikai sorok
Statisztikai táblák
Adatfelvétel, adatszerzési módok
Kérdőívszerkesztés
A statisztikai adatok pontossága
Statisztika fogalma
Tömegesen előforduló jelenségek egyedeire
vonatkozó (elméleti és gyakorlati) tevékenység:
adatgyűjtés – gyakorlati tevékenység
adatfeldolgozás
adatok elemzése
a vizsgált jelenség számszerű, tömör jellemzése.
Pl. népszámlálás, földtulajdon-összeírás (gyak.),
vizsgálati módszerek kiválasztása (elm.)
tudományos módszertan
Statisztika fogalma
A statisztika tárgyát képező tömeges jelenségek között
találunk a hétköznapi életben előforduló és a társadalmi-
gazdasági jelenségeket is, ami alapján megkülönböztetünk:
Általános statisztikát és
Szakstatisztikákat (gazdaság-, népesség-, ágazati-,
társadalomstatisztika, stb.
A jelenségeket le lehet írni egyszerűbb eszközökkel és
bonyolultabb matematikai-statisztikai módszerekkel. Ennek
megfelelően megkülönböztetünk:
Leíró statisztikát és
Statisztikai következtetést
Statisztika fogalma
Egyidős az állammal…
Mo-on a XVIII.sz. az „első összeírás”
XIX.sz. a statisztika komoly fejlődésnek indul: kialakul az intézményrendszer, központi adatszolgáltatás (Fényes Elek, Kőrösi József)
Központi Statisztikai Hivatal (KSH,1867)
1993-as XLVI-os törvény a statisztikáról
223/2009/EK rendelet az európai statisztikáról
Regionális adatszolgáltatás prioritása (NUTS-1. ország, NUTS-2: régió, NUTS-3: megye)
Statisztikai sokaság és ismérv
Statisztikai sokaság:
A megfigyelés tárgyát képező egyedek összessége. (élőlény, tárgy, intézmény, stb.)
Egyedek, egységek: a sokaság legkisebb részei
Sokaság fajtái: diszkrét – folytonos (elkülönült egységek – önkényes elkülönítés)
álló – mozgó (időpont – időtartam)
véges – végtelen (véges sok elem – végtelen sok elem)
Statisztikai sokaság és ismérv
Statisztikai ismérvek:
Olyan vizsgálati szempontok, amelyek
alapján a sokaság egységei jellemezhetők
és – megkülönböztető ismérvek esetén –
egymást nem fedő részekre bontható. Egy
adott ismérv szerinti lehetséges
tulajdonságokat (előfordulási lehetőségeit)
az ismérv változatainak nevezzük.
Statisztikai sokaság és ismérv
Ismérvek fajtái (tulajdonság fajtája):
1) Időbeli ismérvek
2) Területi ismérvek
3) Mennyiségi ismérvek
4) Minőségi ismérvek
- Alternatív ismérvek
- több változattal rendelkező ismérvek
- Közös ismérvek
- Megkülönböztető ismérvek
Tárgyi ismérvek
Feladat:
Adottak az alábbi sokaságok:
Magyarország népessége 2015. jan.1-jén 9 855 000 fő.
A budapesti férfiak sörfogyasztása a 2016-os EB idején.
BCE oktatói 2015. szept. 4-én.
Jótékonysági koncertek 2016-ban a Zeneakadémián.
Feladat:
Állapítsa meg a sokaságok típusát és egységeit!
Feladat:
Döntse el az alábbi ismérvekről, hogy mennyiségi vagy minőségi ismérvek-e!
Nem (férfi, nő)
Életkor
Magasság
Testsúly
Családi állapot
Iskolai végzettség
Foglalkozás
Bruttó havi fizetés
Mérési szintek
Csak a mennyiségi ismérvek adatai számadatok, de bizonyos szabályok mellett minden ismérv lehetséges változatai számértékké alakíthatók.
Mérés:
számok meghatározott szabályok szerinti hozzárendelése jelenségekhez (dolgok, tárgyak, események), illetve azok bizonyos tulajdonságaihoz.
Mérési szintek
4 féle mérési szintet (skálát) különböztetünk
meg:
Névleges/nominális mérési szint
Sorrendi/ordinális mérési szint
Különbségi/intervallum mérési szint
Arányskálán történő mérés
Mérési szintek
Névleges/nominális mérési szint:
Számok közvetlen hozzárendelését jelenti az
egységekhez.
Ezek ún. kódszámok, amelyek csak a sokaság
egyedeinek azonosítását szolgálják.
(azonosság és különbözőség)
Közük semmilyen reláció nem áll fenn, és velük
számtani művelet nem végezhető.
Pl: rendszám, irányítószám, megyék száma
Mérési szintek
Sorrendi/ordinális mérési szint:
A sokaság egyedeihez – bizonyos közös tulajdonság alapján – rendelt skálaérték sorrendisége írja le azok viszonyát.
Az egységhez rendelt számérték sorrendje pontosan tükrözi az adott egység valamilyen szempontból vett sorrendjét.
A számértékek magukban nem hordoznak információt (különbségeik nem értelmezhetők), csak azoknak a rendje.
Pl: hallgatók osztályzatai, áruk minőség szerinti osztályozása, katonai rendfokozat, stb.
Mérési szintek
Különbségi/intervallum mérési szint:
Kezdőpontja önkényesen választott.
A skálaértékek sorrendje és különbségei is információt hordoznak a sokaság egyes egyedeiről.
A skálán az értékek aránya és összege nem értelmezhető.
Pl: a +10 és a +20 C fokok közötti különbség ugyanannyi, mint a -5 és a +5 C fokok közötti különbség.
Mérési szintek
Arányskálán történő mérés:
A legtöbb információt nyújtó mérés. A kezdőpont egyértelműen rögzített, ennek köszönhetően két skálaérték egymáshoz viszonyított aránya is meghatározhatóvá válik. Adatain minden matematikai művelet végezhető.
Az értékek különbségei bizonyos esetekben csak arányskálával egyetemben értelmezhetők:
800 1.000 (200 emelkedés) 10.000 10.200
Pl: életkor, termelési érték, jövedelem nagysága (amelyeket mind 0 értékről kiindulva mérik)
Feladat:
Sokaság Egy
konkrét
egység
Ismérv Ismérv-
változat
Ismérvfajta/
Mérési
skála
A magyar
népesség
2015.
január
elsején
Kiss Réka Születési
idő
1998 Időbeli/
intervallum
Lakóhely Budapest Területi/
nominális
Nem Nő Minőségi/
nominális
Életkor 18 Mennyiségi/
arány
Statisztikai adat és mutatószám Statisztikai adat:
Az egyedekről
szerezhető információ.
(szám, vagy
számszerű jellemző)
fogalmi jegy
időbeli azonosító
térbeli azonosító
számérték
mértékegység (mérés vagy számlálás) Például:
247.800 (Havi) Átlagbér Magyarországon 2015-ben bruttó Ft/fő/hó
Statisztikai mutatószám:
Valamilyen statisztikai
módszerrel a
rendelkezésre álló
adatokból számított
származtatott statisztikai
mérőszám.
Statisztikai sorok A sokaság egy ismérv szerinti tömör jellemzése.
Sorkészítés célja szerint:
Csoportosító sor
Összehasonlító sor
Leíró sor
Ismérvfajtáknak megfelelően:
Időbeli (tartam-állapot), területi, minőségi, mennyiségi
+ leíró sorok
Sorok készítése: ismérvváltozatok számszerű értékek
Valódi statisztikai sorok
(azonos fajtájú adatokból)
Nem valódi statisztikai sor
(különböző fajtájú adatokból)
Statisztikai sorok
Csoportosító
statisztikai sor:
A sokaság belső
összefüggéseit fejezi
ki, csoportosítás
céljából készül, adatai
összegezhetők.
(időbeli, területi,
minőségi, mennyiségi)
Ismérv-
változatok
Egységek
száma
C1
C2
.
.
Ci
.
Ck
f1
f2
.
.
fi
.
fk
Összesen: N
Statisztikai sorok
Például:
A teremben ülő hallgatók
hajszín szerint.
minőségi csoportosító
statisztikai sor
Hajszín Hallgatók
száma/fő
barna
szőke
fekete
vörös
ősz
egyéb
23
12
4
2
2
1
Összesen: 44
Statisztikai sorok
Összehasonlító statisztikai sor:
Összehasonlító adatok statisztikai sorba rendezve, összehasonlítási céllal, adataik nem összegezhetők.
(idősor, területi)
Ismérv-
változat
Számérték/ mértékegység
C1
C2
.
.
Ci
.
Ck
adat
adat
.
.
adat
.
adat
Statisztikai sorok
Például: egy felsőoktatási intézmény nappali tagozatos hallgatóinak átlagos havi ösztöndíja 2004 és 2010 között
Összehasonlító időbeli sor
Év
Havi átlagos
ösztöndíj
(Ft/hallgató)
2004
2005
2006
2007
2008
2009
2010
12.600 Ft
13.200 Ft
13.800 Ft
14.100 Ft
14.000 Ft
14.200 Ft
15.000 Ft
Statisztikai sorok
Statisztika sorok kellékei:
Cím (sokaság pontos megnevezése, a közös
ismérvek felsorolása)
Tulajdonságok, ismérvváltozatok felsorolása
Ismérvváltozatoknak megfelelő gyakoriságok
felsorolása
Összesen rovat (csak a csoportosító sor
estében)
A forrás megnevezése
Statisztikai táblák Statisztikai sorok összefüggő rendszere.
Egyszerű tábla (összehasonlító és/vagy leíró sorok)
Nincs csoportosító sora, egy adata, egy statisztikai sor tagja.
Csoportosító tábla (csoportosító és/vagy összehasonlító vagy leíró sorok)
Egyirányú csoportosítást tartalmaz.
Kombinációs tábla (csoportosító sorok)
Csak csoportosító sorokat tartalmaz, egy adata egyidejűleg több statisztikai sor tagja.
Statisztikai táblák
Egyszerű statisztikai tábla
Év Orvosok száma
(fő)
Lakosok száma
(fő)
Egy orvosra jutó
lakosok száma
1990 240 80 000 333,3
1999 360 100 000 277,8
Egy városban az orvosellátottság alakulása:
Statisztikai táblák
Csoportosító statisztikai tábla
Körzet Termés
(ezer tonna)
Termésátlag
(t/ha)
Dunántúl 2000 5,2
Alföld 3000 5,31
Észak 705 4,71
Összesen 5705 …
Búzatermelés adatai 1991-ben:
Statisztikai táblák
Kombinációs statisztikai tábla
Osztályzat A B C Összesen
kar hallgatóinak megoszlása
5 19 23 19 61
4 32 49 40 121
3 24 36 56 116
2 20 36 82 138
1 1 2 18 21
Összesen 96 146 215 457
Egy felsőfokú intézmény nappali tagozatos hallgatónak jegyei statisztikából
1991/1992 II. félév:
Statisztikai táblák
A statisztikai táblák részei: Oszlop (a táblázat egy oszlopa)
Sor (a táblázat egy sora)
Rovat (sor és oszlop találkozása)
Fejrovat (a táblázat első sora, mely szövegesen
tartalmazza az egyik ismérv változatait)
Oszloprovat (a táblázat első oszlopa, mely szövegesen
tartalmazza a másik szerinti ismérvváltozatokat)
Összegrovat (a sorok és oszlopok összességét
tartalmazza)
Statisztikai táblák
Dimenziószám:
Azt mutatja, hogy a tábla egy statisztikai adata egyidejűleg hány statisztikai sor tagja.
Táblakészítés szabályai: Cím (azonosítókkal!, idő, hely, stb.)
Oldalrovatok (fejrovat és oszloprovat) megnevezése
Egy rovat sem üres (--, ●(●); … , 0,0)
Megjegyzés (ha valamely rovatában lévő adat eltérő mértékegységű)
Forrásmegjelölés (!)
Adatszerzési módok
Teljes körű
felvétel
Részleges felvétel
Monográfia Reprezentatív
megfigyelések
Egyéb részleges
adatfelvétel
Véletlenen
alapuló
Nem véletlen (kontrolált)
Kérdőívszerkesztés
Alapos szakmai hozzáértés
Tömör, egyértelmű, könnyen megválaszolható kérdések
Főleg feleletválasztós (karikázós, x-elős és kevés kifejtendő választ igénylő)
Ne legyen túl hosszú
Ajánlott az anonim adatfelvétel
Kompromisszum: csak a legfontosabb dolgokat kérdezzük
Véglegesítés előtt: próbalekérdezés
Ha nyereményhez kötjük, növelhető a válaszadási arány
Adatok pontossága
Szignifikáns számjegyek: a pontosnak tekinthető számjegyek
: a legutolsó kiírt szignifikáns számjegy helyértéke
aA
Mért adat Abszolút hibakorlát
A
a
Relatív hibakorlát
ahol ,2
10ˆ
k
a
k10
Például Mo. népessége (90-ben):
10.277 ezer ± 500 fő
Feladatok (stat. alapfogalmak)
Perfekt Statisztika I. példatár:
57/4, 58/7, 59/9, 60/11, 60/13, 61/14,
61/15, 61/16, 63/20, 63/21, 64/23, 64/26
További gyakorló feladatok az általános
statisztika I. (zöld) példatárból:
11/2, 12/3 (sokaság fajtája)
12/4, 13/5, 13/6,13/7, 14/8, 14/9, 14/10,
15/11 (sokaság és ismérvfajták)
15/13 (százalék és százalékpont)
Statisztikai
elemzések
viszonyszámokkal
Viszonyszámok
Viszonyszám fogalma
Viszonyszámok fajtái
Megoszlási és koordinációs
viszonyszámok
Dinamikus viszonyszámok
Viszonyszámok közötti összefüggések
Intenzitási viszonyszámok
Viszonyszámok
Viszonyszám: két, egymással kapcsolatban álló
statisztikai adat hányadosa (V)
, ahol A: a viszonyítás tárgya
(viszonyítandó adat)
B: a viszonyítás alapja
Azonos adatokból (% v. együtthatós) – Különböző fajta adatokból (int.)
B
AV
Viszonyszámok fajtái
Csoportosító sorokból: Megoszlási viszonyszámok (Vm)
Koordinációs viszonyszámok (Vk)
Összehasonlító sorokból: Dinamikus viszonyszámok (Vd: Vdl és Vdb)
Feladat- és teljesítménymutató (Vf és Vt)
Területi összehasonlító (Vö)
Leíró sorokból: Intenzitási viszonyszámok (Vi)
Viszonyszámok fajtái
Megoszlási viszonyszám: rész és egész egymáshoz
viszonyított arányát fejezi ki
Koordinációs viszonyszám: a sokaság két részadatát
viszonyítja
Dinamikus viszonyszám: idősor adataiból számított
hányados
Intenzitási viszonyszám: különböző fajta, különböző
mértékegységű- de egymással kapcsolatban lévő-
sokaság adataiból számított viszonyszám
adata)időszakbázis(aB
adata)aktárgyidősz(aAV
Viszonyszámok fajtái
Megoszlási viszonyszám:
Pl. 26 fiú és 32 lány jár a csoportba, összesen 58 hallgató (100%).
adat) vonatkozóegészére sokaság(aB
részadata)egy sokaság(aAVm
45,058
26Vm
55,058
32Vm
45 % a fiúk aránya
55% a lányok arány
Összesen: 100%
Viszonyszámok fajtái
Koordinációs viszonyszám:
részadat) szolg. alapjául sviszonyítá(aB
részadat)ott (viszonyítAVk
Pl. mozilátogató nők: 1942 fő, mozilátogató férfiak: 1876
035,11876
1942Vk
966,01942
1876Vk
1000 mozilátogató ffi-ra 1035 mozilátogató nő jut
1000 mozilátogató nőre 966 mozilátogató ffi jut
Viszonyszámok fajtái
Koordinációs viszonyszámokból az eredeti
adatok ismerete nélkül is számíthatók
megoszlási viszonyszámok.
14,4910351000
1000Vm
85,5010351000
1035Vm
14,499661000
966Vm
86,509661000
1000Vm
A nők aránya:
A férfiak aránya:
Dinamikus viszonyszámok
Bázisviszonyszám:
Láncviszonyszám:
b
t
y
ybVdb /
1
/
i
i
y
ylVdl
Feladat/1.
Év
Magyarországra
érkező külföldiek
Külföldre utazó
magyarok
ezer fő ezer fő
2000 31 141 11 065
2001 30 679 11 167
2002 31 739 12 966
2003 31 412 14 283
2004 36 635 17 558
2005 38 555 18 622
Elemezze bázis- és
láncviszonyszámokkal a
Magyarországra érkező
külföldiek és a külföldre
utazó magyarok számának
alakulását!
Az alábbi táblázatban 2000-2005 közötti
idegenforgalommal kapcsolatos adatok láthatók:
Megoldás
Megoldás
Dinamikus viszonyszámok
i
i
i lb
b
1
ii
k
i
kk blbl...ll 2
32
Viszonyszámok közötti összefüggések:
1. Az első (azaz nulladik) időszakra nem tudunk láncviszonyszámot
számolni
2. Az állandó bázisul választott időszakban a bázisviszonyszám értéke 1,
azaz 100%
3. Az állandó és a bázisul választott időszak után következő időszakban
a bázis és a láncviszonyszám megegyezik
4. Láncból bázis: adott időszak bázisviszonyszáma kiszámolható az
adott időszak és az azt megelőző időszakok láncviszonyszámainak
szorzataként:
5. Bázisból lánc: adott időszak láncviszonyszáma kiszámítható az adott
időszak és az azt megelőző időszak bázisviszonyszámának
hányadosaként:
Viszonyszámok közötti összefüggések
20022002
2001
b 1,0192l 1,0345
b 0,9852
Magyarországra érkező külföldiek esetén:
2003 2001 2002 2003b l l l 1,0092 1,1611 1,1016 1,2908
Külföldre utazó magyarok esetén:
Pl.:
Pl.:
Viszonyszámok fajtái
Feladatmutató viszonyszám:
Teljesítménymutató viszonyszám:
adata Bázisid.
adata tervezettTárgyid.Vf
énye teljesítm tervezettTárgyid.
adata ténylegesTárgyid.Vt
Pl. bázisévben (tavaly) 100 autót szereltem össze, erre az évre 120-at
terveztem, de csak 110 lett belőle
2,1100
120Vf
66,91120
110Vt
Viszonyszámok fajtái
Területi összehasonlító viszonyszám:
Pl. Heves megye és BAZ megye népességének
összehasonlítása:
adata terület szolg. alapjául sViszonyítá
adata terület ndóViszonyítaVö
4437,0739143
328000
népessége megye BAZ
népessége megye HevesVö
Intenzitási viszonyszám
Vi = A/B, megmutatja, hogy a vizsgált jelenség milyen
intenzitással fordul elő valamely más jelenség
környezetében.
Sűrűségmutatók:
Pl: népsűrűség, 1 négyzetkilométerre jutó lakos szám
Ellátottságot kifejező mutatók: Pl: orvossal való ellátottság
Színvonalmutatók: Pl: 1 főre jutó átlagkereset, 1 dolgozóra jutó
termelési érték, 1 főre jutó GDP
Arányszámok: Pl: 100 főre jutó születések száma, halálozási arányszám
Intenzitási viszonyszám
Egyenes intenzitási viszonyszám:
A mutató színvonalának alakulása egybeesik az int.
viszonyszám növekedésével.
Pl: orvosok száma / lakosok száma (ezer fő)
(1000 lakosra jutó orvosok száma)
Fordított intenzitási viszonyszám:
Amikor a jelenség színvonala javul, akkor a fordított int.
viszonyszám értéke csökken.
Pl: lakosok száma (e fő) / orvosok száma
(1 orvosra jutó lakosok száma)
Intenzitási viszonyszám
Nyers intenzitási viszonyszám: (a teljes sokasághoz viszonyítunk)
Pl: tejhozam / tehenek száma
hallgatók / dolgozók
Tisztított intenzitási viszonyszám: (csak a jelenséggel szorosan kapcsolatban álló részhez
viszonyítunk)
Pl: tejhozam / tejelő tehenek száma
hallgatók / oktatók
Viszonyszámok gyakorlása A következő adatok az 1998. évi statisztikai évkönyvből származnak:
Az egy főre jutó GDP 1998-ban 4694 USD volt, ami az előző évinél
5,1%-kal volt több.
Az építőiparban a 100 fizikaira jutó szellemi foglalkozásúak száma
29 fő, a fizikaiak aránya pedig 77, 4% volt 1998-ban.
1998-ban az 1000 lakosra jutó születések száma 9,6 volt.
A felsőoktatásban egy oktatóra 12,1 hallgató jutott 1998-ban.
A PSZF-en 1998-ban oklevelet szerzett hallgatók 61,9%-a nő volt.
Budapest népessége 1990-ről 1999-re (január 1-jei adatok alapján)
8,8%-kal csökkent.
1998-ban az egy főre jutó évi átlagos gyümölcsfogyasztás 62,6 kg
volt.
Feladat: Nevezze meg a felsorolt viszonyszámok fajtáit és jelölje meg
kiszámításuk módját! (Zöld példatár 19/22)
Feladatok (viszonyszámok)
Perfekt Statisztika I. példatár:
72/39, 73/41, 73/43, 76/48
66/28, 67/30, 68/32, 69/33, 75/47, 78/52,
78/53 , 79/54, 80/56
További gyakorló feladatok az általános
statisztika (zöld) példatárból:
16/15, 17/18, 18/20, 19/23
15/13 (százalék és százalékpont),
43/81, 43/82, 41/77, 41/78, 42/79, 42/80
(viszonyszámok és összefüggéseik)
Népességstatisztikai
definíciók
Definíciók
Lakónépesség: az adott területen lakóhellyel rendelkező, és másutt tartózkodási hellyel nem rendelkező személyek, valamint az ugyanezen területen tartózkodási hellyel rendelkező személyek együttes száma.
Természetes szaporodás (fogyás): az élveszületések és a halálozások különbözete.
Definíciók
Tényleges szaporodás (fogyás): a természetes szaporodás (fogyás) és a vándorlási (belföldi és nemzetközi) különbözet (+,–) összege.
Gyermeknépesség eltartottsági rátája: a gyermeknépesség (0–14 éves) a 15–64 éves népesség százalékában.
Idős népesség eltartottsági rátája: az idős népesség (65–X éves) a 15–64 éves népesség százalékában.
Eltartott népesség rátája: a gyermeknépesség (0–14 éves) és az idős népesség (65–X éves) a 15–64 éves népesség százalékában.
Definíciók
Öregedési index: az idős népesség (65–X éves) a gyermeknépesség (0–14 éves) százalékában.
Házasságkötés: a hivatalosan eljáró anyakönyvvezető előtt – két tanú jelenlétében – kötött házasság.
Válás: a jogerőre emelkedett bírói ítélettel felbontott vagy érvénytelenített házasság. Jogerőre az a házasságot felbontó vagy érvénytelenítő ítélet emelkedett, amely ellen további jogorvoslatnak helye nincs.
Definíciók
Élveszületés: (az ENSZ ajánlása szerint) olyan magzat világrajövetele, aki az életnek valamilyen jelét (mint légzés vagy szívműködés, illetőleg köldökzsinór-pulzáció) adja, tekintet nélkül arra, hogy mennyi ideig volt az anya méhében és mennyi ideig élt.
Teljes termékenységi arányszám: azt fejezi ki, hogy az adott év kor szerinti születési gyakorisága mellett egy nő élete folyamán hány gyermeknek adna életet.
Definíciók
Halálozás: az élet minden jelének végleges elmúlása az élveszületés megtörténte után bármikor, azaz az életműködésnek a születés utáni megszűnése, a feléledés képessége nélkül.
Halálok: mindazon betegség, kóros állapot vagy sérülés, amely vagy eredményezte, vagy hozzájárult a halálhoz (halálozáshoz), valamint olyan baleset vagy erőszak körülménye, amely halálos sérülést okozott.
Definíciók
Várható átlagos élettartam: azt fejezi ki, hogy
a különböző életkorúak az adott év halandósági
viszonyai mellett még hány évi élettartamra
számíthatnak.
Csecsemőhalálozás: az élveszületést követően
az egyéves kor betöltése előtt bekövetkezett
halálozás. A halvaszülött és a születésének
évfordulóján meghalt gyermek nem
csecsemőhalott.
Csecsemőhalálozási arányszám: ezer élveszülöttre jutó egy éven aluli meghalt.
Grafikus ábrázolás
Grafikus ábrázolás
Az adatok megjelenítésének, szemléltetésének fontos eszköze. Információ megjelenítése képi formában. (megérteni és készíteni is fontos)
Alapelvei:
Áttekinthetőség (csak azt mutassa, amire szolgál)
Célorientáltság és homogenitás
Egyszerűség
Rekonstruálhatóság
Optikailag semleges méretezés
Cím, egyértelmű jelmagyarázatok, mértékegységek, forrásra való hivatkozás szüks.
Grafikus ábrázolás
Bizonyos elemzési eszközökhöz bizonyos ábrázolási módok tartoznak.
Általában szoftverekkel (speciális rajzoló szoftverekkel) készülnek.
A grafikus ábrák fajtái:
1. Koordináta-rendszeren alapuló ábrák
2. Nem koordináta-rendszeren alapuló
ábrák
Grafikus ábrázolás
Koordináta-rendszeren alapuló ábrák:
Pontdiagram
Bot-ábra
Vonaldiagram
Oszlopdiagram (hisztogram)
Szalagdiagram
Sugárdiagram
Grafikus ábrázolás
Pontdiagram: két egymással összefüggésben lévő
mennyiségi ismérv értékeinek ábrázolása
koordinátarendszerben. (idő és menny. sorok)
Grafikus ábrázolás
Bot ábra: gyakorisági soroknál, ha kevés
és diszkrét a mennyiségi ismérv
Grafikus ábrázolás
Vonaldiagram: idősorok adatainak
koordinátarendszerben való ábrázolása.
Gyakorisági soroknál poligonnak nevezzük.
Grafikus ábrázolás
Oszlopdiagram: összehasonlítás az oszlopok
magasságával. (összehasonlítás)
Grafikus ábrázolás Osztott oszlopdiagram: a csoportosító sorok
ábrázolásának eszköze, az összehasonlítandó
oszlopon belül a megoszlás területarányos
ábrázolása.
Grafikus ábrázolás
Hisztogram:
Mennyiségi sor
esetén az
oszlopok között
nincs hézag
Grafikus ábrázolás
Szalagdiagram:
Az
oszlopdiagram
az X és Y
tengelyeinek
felcserélésével
kapjuk.
Grafikus ábrázolás
Korfa:
A szalagdiagram
speciális
alkalmazása a korfa,
amely egy összetett
szalagdiagram.
Grafikus ábrázolás
Sugárdiagram: poláris
koordináta rendszeren
alapul, önmagában
visszatérő ciklikus
folyamatok esetében
célszerű alkalmazni,
vagy ha szerkezeti
változásokat
szeretnénk kiemelni.
A magyar népesség
korösszetételének változása
Grafikus ábrázolás
Néhány nem koordináta-rendszeren
alapuló ábra:
Kördiagram
Kartogram
Kartodiagram
Ponttérkép
Piktogram (figurális ábrázolás)
Box & whiskers ábra (kvartilis eloszlás)
Grafikus ábrázolás Kördiagram: megoszlás ábrázolása körcikkek
segítségével. Mind szerkezetet, mind pedig abszolút nagyságot tud jellemezni (megoszlások, összehasonlítás)
Grafikus ábrázolás
Kartogram: területi sorok ábrázolása térképen,
az egyes régiók eltérő színeivel érzékelteti a
köztük lévő különbséget.
Grafikus ábrázolás
Kartodiagram:
területi sorok
esetén
alkalmazható, az
egyes földrajzi
egységek adatait a
térképen
elhelyezett
diagrammal
ábrázolja.
Grafikus ábrázolás
Ponttérkép: a
területi sorok
szemléltetésére
használható, a
pontok
sűrűsége az
adott területhez
tartozó adat
nagyságára
utal.
Grafikus ábrázolás
Piktogram:
figurális
ábrázolás, mely
a jelenséget
megtestesítő
különböző
nagyságú
figurák alapján
fejezi ki a
nagyságrendi
relációt.
Grafikus ábrázolás
max31min Me xQQx
Box & whiskers ábra: a kvartilis eloszlás (az
adatok nevezetes osztópontjainak, jelen
esetben negyedelő pontjainak a helyzetét)
szemlélteti.
Mennyiségi ismérv
szerinti elemzés
LEÍRÓ statisztika A leíró statisztika: olyan módszerek és mutatószámok,
amelyek segítségével akár egy nagyobb sokaságot, akár
egy mintát viszonylag könnyen és jól lehet valamilyen
mennyiségi ismérv szerint tömören, egy mutatószámmal
jellemezni.
A sokaság (vagy minta) tömör jellemzése alapvetően 3
szempont szerint történhet:
1. Középértékek: a sokaság/minta jellemző értékének és
értékeinek meghatározása
2. Szóródás: adatok különbözőségének vizsgálata
3. Alakmutatók: a gyakorisági görbe alakjának a vizsgálata
4. További elemzési módszerek: koncentráció, idősorok
elemzése átlagokkal
Mennyiségi ismérv
szerinti elemzés
Gyakorisági sorok
Gyakorisági sorok
A mennyiségi ismérv szerint csoportosító sorokat
gyakorisági soroknak nevezzük.
A gyakorisági sorok fajtái:
Rangsor: ha kevés számú diszkrét mennyiségi
ismérv szerint csoportosítjuk a sokaságot.
(amikor az összes ismérvváltozat felsorolható a
gyakoriságokkal.)
Osztályközös gyakorisági sor: folytonos,
illetve sok változattal rendelkező diszkrét ismérv
szerinti csoportosításkor, a csoportokat
osztályközökkel (intervallumokkal) adjuk meg.
Gyakorisági sorok
Érdemjegy
(x)
Hallgatók száma/fő
(f)
5 3
4 8
3 6
2 2
1 1
Összesen 20
Példa rangsorra:
Egy 20 fős szemináriumi csoport érdemjegyei statisztikából
x: átlagolandó
érték
f: gyakoriság
Ha egyedi értékek
vannak, pl. 3 barátnő
statisztika dolgozatának
átlaga:
Eredményeik: 1, 5, 3
Átlag=9:3= 3
Gyakorisági sorok
Példa osztályközös gyakorisági sorra:
Egy Heves megyei település lakásállományának vizsgálata a lakások
értéke szerint millió Ft-ban (1998-ban):
Lakások értéke (millió Ft)
(x)
Lakások száma (db)
(f)
3,0 – 4, 5 12
4,5 – 6,0 20
6,0 – 7,5 30
7,5 – 10,0 27
10, 0 – 13,0 11
Összesen 100
Gyakorisági sorok
Példa osztályközös gyakorisági sorra:
Egy Heves megyei település lakásállományának vizsgálata a lakások
értéke szerint millió Ft-ban (1998-ban):
Osztályközepek
(x)!
Lakások értéke (millió Ft)
(x)
Lakások száma (db)
(f)
3,75 3,0 – 4, 5 12
5,25 4,5 – 6,0 20
6,75 6,0 – 7,5 30
8,75 7,5 – 10,0 27
11,50 10, 0 – 13,0 11
Összesen 100
Gyakorisági sorok
Oszt.
közép
(x)!
Lakásár
(m Ft)
(x)
Lakások
száma
(db)
(f)
f’ f” g (f%)
g’ g” s
(fx)
s’ s’’ z (s%)
z’ z”
3,75 3,0 – 4,5 12 12 120 10,0 10,0 100,0 45,00 45,00 945,25 4,8 4,8 100.0
5,25 4,5 – 6,0 20 32 108 16,5 26,5 90,0 105,00 150,00 900,25 11,1 15,9 95,2
6,75 6,0 – 7,5 30 62 88 25,0 51,5 73,5 202,50 352,5 795,25 21,4 37,3 84,1
8,75 7,5 – 10,0 27 89 58 22,5 74,0 48,5 236,25 588,75 592,75 25,0 62,3 62,7
11,50 10,0 – 13,0 31 120 31 26,0 100,0 26,0 356,50 945,25 356,50 37,7 100,0 37,7
Összesen 120 - - 100,0 - - 945,25 - - 100,0 - -
Mennyiségi ismérv
szerinti elemzés
Középértékek
Középértékek
Számított
középértékek
(átlagok)
számtani átlag
harmonikus átlag
mértani átlag
négyzetes átlag
Helyzeti
középértékek:
módusz
medián
kvartilisek
Középértékekkel szembeni
követelmények
maxmin xKx
1. közepes helyet foglaljon el az értékek között
2. tipikus érték legyen: álljon közel az előforduló
értékek zöméhez
3. legyen pontosan definiálva
4. könnyen értelmezhető legyen
5. számítása egyszerűen elvégezhető legyen
Számított középértékek:
Átlagok
Súlyozatlan/egyszerű átlagot számítunk:
ha az értékek csak egyszer fordulnak elő
(egyedi értékek) vagy ugyanannyiszor
Súlyozott átlagot számítunk:
ha az értékek többször fordulnak elő és
nem ugyanannyiszor
Egyszerű átlag
Érdemjegy
(x)
Hallgatók
száma/fő
(f)
5 1
4 1
3 1
2 1
1 1
Összesen 5
Érdemjegy
(x)
Hallgatók
száma/fő
(f)
5 2
4 2
3 2
2 2
1 2
Összesen 10
Az értékek egyszer fordulnak elő: Az értékek többször, de
ugyanannyiszor fordulnak elő:
Súlyozott átlag
Érdemjegy
(x)
Hallgatók száma/fő
(f)
5 3
4 8
3 6
2 2
1 1
Összesen 20
Az értékek többször, de nem
ugyanannyiszor fordulnak elő:
Átlagok
Súlyozatlan Súlyozott
Számtani
Harmonikus
Mértani
Négyzetes
ix
nx
1
n
xx
i
n
xfx
ii
i
i
i
x
f
fx
nixx n f
iixx
n
xx
i
2
i
ii
f
xfx
2
hx
gx
x
qx
Ugyanazon pozitív értékekből számított
átlagok nagyságrendje
hx gxés érzékeny a kiugróan alacsony értékekre
x qx és érzékeny a kiugróan magas értékekre
maxmin xxxxxx qgh
Példa/1: (egyszerű/súlyozatlan átlagok – az értékek
csak egyszer fordulnak elő (egyedi értékek) vagy
ugyanannyiszor)
Az átlagolandó értékek: 3, 4, 5, 8 – az értékek egyszer fordulnak elő
(vagy: 3, 3, 4 ,4, 5, 5, 8, 8 – az értékek többször, de ugyanannyiszor fordulnak elő)
Feladat a) Számítsa ki a számtani, a harmonikus, a mértani és a
négyzetes átlagot!
b) Hasonlítsa össze a kapott eredményeket!
c) Állapítsa meg ugyanazon pozitív számokból számolt átlagok sorrendjét!
d) Amennyiben az átlagolandó értékek között szerepelne még egy kiugróan alacsony érték (pl. 1), akkor mely átlagok reagálnának rá érzékenyen?
e) Mely átlagok értékét befolyásolja jobban, ha az átlagolandó értékek között még egy kiugróan magas érték (pl. 32) is található?
Megoldás
54
8543
x
404.4
8
1
5
1
4
1
3
1
4
hx
681.485434 gx
2 2 2 2
q
3 4 5 8 114x 28,5 5.339
4 4
Számtani átlag:
Harmonikus átlag:
Mértani átlag:
Négyzetes átlag:
Példa/2: (súlyozott átlag – az értékek többször
fordulnak elő és nem ugyanannyiszor)
Az átlagolandó értékek és a hozzájuk tartozó
súlyok:
( ) adatok: 3, 4, 5, 8
( ) gyakoriság: 4, 4, 1, 1
Feladat:
a) Számítsa ki a számtani, a harmonikus, a
mértani és a négyzetes átlagot!
ix
if
Megoldás
1.410
81514434
x
762.3658.2
10
8
1
5
1
4
4
3
4
10
hx
907.3854310 1144 gx
347.410
81514434 2222
qx
Harmonikus átlag:
Mértani átlag:
Négyzetes átlag:
Számtani átlag
A számtani átlag néhány tulajdonsága
1. az átlagtól vett eltérések
(előjeles hibák) összege nulla
2. négyzetes minimum tulajdonság:
minimum , ha A=
3. az átlagolandó értékek additív transzformációjával (ha
minden átlagolandó értékhez hozzáadunk egy konstans
értéket) az átlag is a transzformációnak megfelelően nő
vagy csökken
4. az átlagolandó értékek multiplikatív transzformációjával
(ha minden átlagolandó értéket megszorzunk egy
konstans elemmel) az átlag is a transzformációnak
megfelelően változik
0 xxi
2
Axi x
Számtani átlag előnyei
Számítása egyszerű, tömör, világos
Minden adathalmazból kiszámítható, és csak
egy van belőle
Ugyanazon típusú számszerű jellemzők
összehasonlítását teszi lehetővé sokaság vagy
minta esetén
Kiszámításához nem szükséges az egyedi
értékek számszerű ismerete, elegendő azok
összegét tudni.
Számtani átlag hátrányai Kiugróan magas, vagy kiugróan alacsony egyedi
értékek (outlier-ek) esetén az átlag „torz” lehet, és
nem jellemzi jól a sokaságot , ugyanis az adatok
többségétől eltér
Osztályközös gyakori sornál nem tudunk pontos
átlagot számolni, az így kiszámított (osztályközepek
felhasználásával) érték csak becslés/közelítés.
Nyitott osztályközök esetén (amikor az osztályköz
hosszúságát akkorának tekintjük, mint az alsó vagy
a felső szomszédos osztályköz) az általunk
meghatározott alsó vagy felső határnál kisebb vagy
nagyobb értékeket figyelmen kívül hagyjuk.
Helyzeti középértékek:
Módusz
Medián
Kvartilisek
Medián az az ismérvérték, amelyiknél az összes előforduló ismérvérték fele kisebb, fele nagyobb. (rangsorba rendezett adatok közül a középső elemhez tartozó ismérvérték)
a) meghatározása egyedi értékekből (amiket először rangsorolni kell): páratlan tagszám esetén az -edik érték, páros tagszám esetén (amikor a sorszám két érték közé esik), akkor az érintett 2 érték ( -dik és az -dik tagok) számtani átlaga.
b) Meghatározása diszkrét mennyiségi ismérvek gyakorisági rangsorából: a medián értéke megegyezik azzal az értékkel, amelyhez tartozó kumulált gyakoriság tartalmazza a medián sorszámát.
c) becslése osztályközös gyakorisági sorból:
osztópont:
, ahol : a medián osztályközének a gyakorisága,
me
me
me
me hf
fn
xMe
'
1
02
mef
2
1n
2
n
1' mef: a medián osztályközét megelőző osztályköz kumulált gyakorisága
2
n
2
1n
Medián előnyei
Egyértelműen meghatározható, minden
adathalmaznak létezik mediánja, és csak egy
van belőle.
A medián rangsorba rendezett minőségi
ismérvekből is megállapítható
A medián értéke független a szélső értékektől.
Kiugróan magas vagy alacsony értékek esetén
(amelyekre nem érzékeny) jobban jellemzi a
sokaságot mint a számtani átlag.
Medián hátrányai
Csak rangsorba rendezett értékekből állapítható
meg
Ha egy minta alapján akarunk következtetni a
teljes sokaságra, akkor a számtani átlag
matematikai-statisztikai szempontból
alkalmasabb mutatószám.
Módusz
rangsor (diszkrét ismérv) esetén:
a leggyakrabban előforduló érték
folytonos ismérv esetén:
a gyakorisági görbe maximumához tartozó
érték
A módusz
a kiugró, extrém értékekre érzéketlen
nem mindig létezik (például, ha minden érték
egyforma valószínűséggel fordul elő)
Ha több különböző érték azonos gyakorisággal
fordul elő, akkor több módusz is lehet.
Módusz becslése
osztályközös gyakorisági sorból
0mox
12 momo ffk
moh
11 momo ffk
momo hkk
kxMo
21
10
: a móduszt tartalmazó osztályköz alsó határa
: a móduszt tartalmazó osztályköz hossza
Nem egyenlő osztályközök esetén a módusz becslése f* átszámított
gyakoriságok alapján történik.
, ahol
Módusz előnyei és hátrányai
Előnyök:
Nem mennyiségi jellemzők esetén is használható
Hasonlóan a mediánhoz, nem érzékeny a szélső,
kiugró értékekre
Hátrányok:
Sok esetben nem alkalmas a sokaság
jellemzésére, mert nem minden esetben létezik,
és van hogy több is van belőle.
Példa/1. (egyedi értékek)
Egy bp.-i lakóparkban télen megkérdezték a 3 szobás
lakások tulajdonosait, hogy mennyi volt az előző havi
rezsiköltségük. Az alábbi adatokat kapták ezer Ft-ban:
75, 64, 69, 80, 76, 77, 86, 79, 65, 72, 73, 75, 75, 70
Feladat:
Jellemezzük a 3 szobás lakástulajdonosok előző havi
rezsiköltségét az adott esetben felhasználható
középértékekkel! (átlag, módusz, medián)
Megoldás
75 ... 70X 74
14
5,72
15
2
1
n
Medián: Me=75 ezer Ft A lakástulajdonosok
felének 75 ezer Ft-nál kevesebb (a
lakástulajdonosok másik felének pedig
75 ezer Ft-nál nagyobb) volt az előző
havi rezsiköltsége.
Rangsor készítése:
64, 65, 69, 70, 72, 73, 75, 75, 75, 76, 77, 79, 80, 86
Számtani átlag: A lakástulajdonosok előző havi
átlagos rezsiköltsége 74 ezer Ft.
Módusz:
Mo=75 ezer Ft A legtöbb lakástulajdonos előző havi
rezsije 75 ezer Ft.
Példa/2. (egyenlő osztályközök)
Egy benzinkútnál a napi eladott mennyiség szerint
a személygépkocsik megoszlása a következő volt:
Értékesített benzin mennyisége (liter) Gépkocsik száma
10 – 19 10
20 – 29 28
30 – 39 42
40 – 49 15
50 – 59 5
Összesen 100
Feladat:
Számítsa ki és értelmezze az átlagot!
Becsülje meg a mediánt és a móduszt, és írja le jelentésüket!
Megoldás
Értékesített benzin
mennyisége (liter)
Gépkocsik
száma (f)
Osztály-
közép (x)
Kumulált
gyakoriság (f’)
10 – 19 10 15 10
20 – 29 28 25 38
30 – 39 42 35 80
40 – 49 15 45 95
50 –59 5 55 100
Összesen 100 --- ---
100
555...25281510
i
ii
f
xfx
A gépkocsik átlagosan 32,7 litert tankoltak a benzinkútnál
az adott napon.
32,7
liter
Megoldás
502
100
2
nMef 50'
me
me
me
me hf
fn
xMe
1'
0,2
1042
385030
Medián:
sme= és a 3. osztályközben van
A gépkocsik fele 32,86 liter benzinnél kevesebbet tankolt,
a gépkocsik másik fele pedig ennél többet az adott napon.
32,86 liter
momo hkk
kxMo
21
10,
10
)1542()2842(
)2842(30
A legtöbb kocsi 33,41 liter benzin körüli mennyiséget
tankolt az adott napon.
33,41 liter
Módusz: 3. osztályközben van
Példa/3. (nem egyenlő osztályközök)
1999-ben az átlagkeresetek alakulása egy vállalatnál
Keresetek (ezer Ft) Létszám
40 – 50 12
50 – 60 20
60 – 80 34
80 – 100 32
100 – 150 14
150 – 200 3
Összesen 115
Feladat:
Számítsa ki és értelmezze az átlagot!
Becsülje meg a mediánt, a móduszt és a kvartiliseket és írja le jelentésüket!
Megoldás
Keresetek
(ezer Ft)
(x)
Létszám
(f)
Osztály-
közép
(x)
Kumulált
gyakoriság
(f’)
f* (új oszt.köz=
20e Ft)
40 – 50 12 45 12 24
50 – 60 (Q1),(Mo) 20 55 32 40
60 – 80 (Me) 34 70 66 34
80 – 100 (Q3) 32 90 98 32
100 – 150 14 125 112 5,6
150 – 200 3 175 115 1,2
Összesen 115 --- --- ---
eFtf
xfx
i
ii1,75
115
3175...20551245
A vállalatnál a dolgozók átlagosan 75,1 ezer Ft-ot keresnek.
....det
* hközosztújhközosztiere
gyakoriságf
Csak a
MÓDUSZHOZ!
Megoldás
5,572
115
2
n
me
me
me
me hf
fn
xMe
1'
0,2
2034
325,5760
Medián:
sme= (A Me 3. osztályközben van.)
A dolgozók fele 75 ezer Ft-nál kevesebbet keresett,
(a másik fele pedig ennél többet) az adott évben.
75 ezer Ft
1
1
11
0,11
'4
q
q
q
q hf
fn
xQ
10
20
1275,2850 58,375 ezer Ft
Alsó kvartilis: 75,284
115
4
n
A dolgozók negyede 58,4 ezer Ft-nál kevesebbet keresett,
(három negyede pedig ennél többet) az adott évben.
(A Q1 a 2. osztályközben van.)
Megoldás
25,864
1153
4
3
n
3
3
13'
0,334
3
q
q
q
q hf
fn
xQ
eFt65,922032
6625,8680
Felső kvartilis:
sq3= (A Q3 4. osztályközben van.)
A dolgozók negyede 92,65 ezer Ft-nál többet keresett,
(a három negyede pedig ennél kevesebbet) az adott évben.
momo hkk
kxMo
21
10,
eFt27,5710)3440()2440(
)2440(50
Módusz:
A dolgozók legtöbbje 57,27 ezer Ft-ot keresett az adott évben.
(A Mo a 2. osztályközben van.)
Mennyiségi ismérv
szerinti elemzés
Szóródási mérőszámok
Szóródás Az értékek különbözőségét, változékonyságát nevezzük
szóródásnak.
Az értékek különbözősége egyrészt az értékek egymástól való
különbözőségén, másrészt valamely középértéktől való
eltérésében fejezhető ki.
A legfontosabb szóródási mérőszámok:
1. Terjedelem, R (vagy IQR)
2. Átlagos eltérés, δ
3. Szórás, б (vagy s – minta esetén)
4. Relatív szórás, V
5. (Átlagos különbség, G)
Szóródási mérőszámok
Szóródási mérőszámok
1) Terjedelem:
annak az intervallumnak a hossza, amelyen belül
az ismérvértékek elhelyezkednek.
minmax xxR
Interkvartilis terjedelem: annak az intervallumnak a hosszát fejez ki, amelyben az
ismérvértékek középső 50%-át találjuk.
13 QQIQR
Szóródási mérőszámok
2) Átlagos eltérés: az átlagtól vett eltérések számtani átlaga.
Azt mutatja, hogy az ismérvértékek átlagosan mennyivel térnek el a számtani átlagtól.
Mértékegysége megegyezik az alapadatok mértékegységével, számítása:
Egyszerű: Súlyozott:
n
dn
i
i 1
k
i
i
i
k
i
i
f
df
1
1
xxd ii
Szóródási mérőszámok
3) Szórás: az átlagtól vett eltérések négyzetes átlaga
Azt mutatja, hogy az ismérvértékek átlagosan mennyivel térnek el a számtani átlagtól.
Mértékegysége megegyezik az alapadatok mértékegységével.
Egyszerű: Súlyozott:
n
xxi
2)(
i
ii
f
xxf 2)(
xxd ii
Szóródási mérőszámok
Szórás minta esetén (s): jelentése szintén az átlagtól vett eltérések négyzetes átlaga, de ezt a formulát a mintából történő – az egész sokaságra vonatkozó – következtetés esetén használjuk. (Bővebben a mintából történő következtetések témakörben kerül rá sor a Statisztika II. kurzus során.)
Egyszerű: Súlyozott:
1
)( 2
n
xxs
i
1
)( 2
i
ii
f
xxfs
xxd ii
A szórás néhány tulajdonsága
A szórás akkor és csak akkor nulla, ha minden ismérvérték egyenlő.
Az xi ismérvértékek additív transzformációja után a szórás nem változik.
Az xi ismérvértékek multiplikatív transzformációja után a szórás a transzformációnak megfelelően változik.
Szóródási mérőszámok
4) Relatív szórás
különböző alapadatok vagy ismérvértékek
szóródásának összehasonlítására szolgál.
Mértékegység nélküli szám, általában
százalékos formában adják meg.
10 nVx
V
Szóródási mérőszámok
5) Átlagos különbség, G (Gini-féle mutató)
az ismérvértékek egymástól mért abszolút
eltéréseinek a számtani átlaga. (Leginkább a
koncentráció vizsgálatánál alkalmazható.)
n
j
n
i
ji xxn
G1 1
2.
1
jij
k
j
k
i
i xxffn
G 1 1
2.
1
Mennyiségi ismérv
szerinti elemzés Alakmutatók
Empirikus
eloszlások típusai
Egy móduszú
eloszlás
Több módoszú
eloszlás
Szimmetrikus Aszimmetrikus
Mérsékelten Erősen
Bal oldali Jobb oldali J alakú Fordított J alakú
Szimmetrikus eloszlás
Aszimmetrikus eloszlások
Bal oldali aszimmetria Jobb oldali aszimmetria
xMeMo x Me Mo
Erősen aszimmetrikus eloszlások
J alakú Fordított J alakú
Aszimmetrikus eloszlások
3) Alakmutatók
arra szolgálnak, hogy tömör számszerű
formában jellemezzék, hogy milyen tekintetben
és milyen mértékben tér el az adott eloszlás a
normális eloszlás gyakorisági görbéjéből.
Mértékegység nélküli mutatók.
Aszimmetria mutatók
A-mutató
Pearson-féle
mutatószám:
Ha +, bal oldali aszimmetria
- , jobb oldali aszimmetria
0 , szimmetrikus az eloszlás
MoxA
)()(
)()(
13
13
25,0QMeMeQ
QMeMeQF
F- mutató (kvartiliseken alapul)
-1≤ F ≤1 A abszolút értékének nincs
korlátja, de ritkán vesz fel 1-nél
nagyobb értéket.
4) További elemzési módszerek
Koncentráció
Idősorok elemzése átlagokkal
Mennyiségi ismérv
szerinti elemzés Koncentráció
Koncentráció
Gazdasági életben: erőforrások tömörülése, összpontosulása
Statisztikailag: egy sokaság mennyiségi ismérv szerinti vizsgálata
Koncentráció: az értékösszeg jelentős része a sokaság kevés egységére összpontosul
Koncentráció
A koncentráció a relatív gyakoriságok ( )
és a relatív értékösszegek ( )
összehasonlításával elemezhető. Ha az
egyes osztályközökhöz tartozó és
értékek azonosak, az a koncentráció
hiányaként értelmezhető, eltérésük viszont
a koncentrációt jelzi.
ig
iz
ig iz
Lorenz-görbe
Egységoldalú
négyzetben
elhelyezett ábra,
amely a kumulált
relatív
értékösszegeket
értékeket
a kumulált relatív
gyakoriságok
értékeinek
függvényében
ábrázolja.
Lorenz-görbe
Felhasználása:
relatív koncentráció szemléltetése
interpoláció
több ismérv koncentrációjának egybevetése
adott ismérv koncentrációjának időbeli vagy térbeli
egybevetése
Koncentráció hiánya esetén a görbe egybeesik az
átlóval.
Minél távolabb esik a görbe az átlótól, annál
nagyobb fokú a koncentráció.
Koncentrációs együttható
A Lorenz-görbe és az átló által bezárt területet
koncentrációs területnek nevezzük.
Ha koncentrációs területet a háromszög területéhez
viszonyítjuk, akkor e hányados alapján következtetni
tudunk a koncentráció mértékére. A koncentrációs
terület arányát a koncentrációs együtthatóval mérjük.
x
GK
2
(ahol G: az átlagos különbség (Gini-féle mérőszám))
K értéke [0,1] intervallumban mozoghat, koncentráció
hiány esetén K=0, és a K minél közelebb van 1-hez,
annál erősebb a koncentráció.
Koncentráció
Abszolút koncentráció: az értékösszeg kevés
egységére összpontosul (pl.: energiaiparban,
gépkocsigyártásban)
Relatív koncentráció: az értékösszeg relatív
értelemben kevés egységnél összpontosul
(pl.: személyi jövedelemben)
Mennyiségi ismérv
szerinti elemzés Idősorok elemzése átlagokkal
Tapasztalati idősor:
időtényező:
megfigyelt érték:
ni tttt ,... , ,... , , 21
y y y yi n1 2, , ... , ... , ,
Idősorok elemzése átlagokkal
Idősorok elemzése átlagokkal
Idősorelemzés egyszerű eszközei:
dinamikus viszonyszámok
(bázis-, és láncviszonyszámok):
idősor adataiból számított hányadosok
grafikus ábrázolás
átlagok
Időegységre számított
átlagok
Stock típusú idősor esetén:
(számtani átlag)
Flow típusú idősor esetén:
(kronologikus átlag)
Idősorok elemzése átlagokkal
n
yy
i
1
2...
2 12
1
n
yyy
y
y
nn
(állapot idősor) (tartam idősor)
Idősorok elemzése átlagokkal
Változások átlaga
Átlagos abszolút változás
Átlagos relatív változás
aholn
yy
n
dd ni
,11
1
d y yi i i 1
aholy
yll n
nni ,1
1
1 ly
yi
i
i
1
Feladatok (mennyiségi ismérv szerinti elemzés)
Perfekt Statisztika I. példatár:
128/1, 128/2, 130/5, 131/8, 134/12, 134/13, 137/17,
138/19, 138/20, 139/23, 141/25, 145/32,
148/36,149/38
További gyakorló feladatok az általános statisztika
I. (zöld) példatár:
24/38, 24/39 (egyedi értékekből – súlyozatlan)
25/42 (rangsorból – súlyozott)
26/45, 27/46, 29/51 (osztályközös gyakorisági sorok –
egyenlő osztályköz esetén)
26/44, 27/47, 28/48, 28/49, 29/50, 29/52, 32/56 (nem
egyenlő osztályközök)
35/65 (koncentráció)
Komplex gyakorló feladatok megoldása
Középértékek, szóródási mutatók és
alakmutatók számítása:
Egyedi értékekből ( rangsor)
Gyakorisági rangsorból
Osztályközös gyakorisági sorból (egyenlő
osztályközök esetén)
Osztályközös gyakorisági sorból (nem egyenlő
osztályközök esetén)
Koncentráció mértékének meghatározása
(grafikusan)
Indexszámítás
Időbeli összehasonlítás
viszonyszámokkal
Bauxittermelés adatai (ezer tonna)
Hónap
Bauxittermelés (ezer tonna)
Vd 1991 1992
Január 150 100 66,7
Február 200 150 75,0
Március 250 230 92,0
Összesen 600 480 80,0
Indexszámítás Az indexszámok valamilyen szempontból összetartozó, de
különnemű (különböző mértékegységű), közvetlenül nem
összesíthető javak összességére (aggregált sokaság)
vonatkozóan a mennyiségek (q - quantity), az árak (p - price) és
az értékadatok (v - value) időbeli vagy térbeli összehasonlítására
szolgálnak.
Egy jószág(csoport) értékét a mennyisége és az egységára
határozza meg:
A nem összegezhető (különböző mértékegységű) termékek az
értékösszegük alapján elemezhetők. Az összetartozó de
különnemű termékekből álló (heterogén) termékcsoport
összértékét aggregátumnak (A) nevezzük:
Indexek: termékek azonos körére vonatkozó két időben (vagy
térben területi indexek) különböző aggregátum hányadosai.
pqv
n
i
iii
n
i
vpqA11
Aggregát értékadatok
Az indexszámításban négyféle aggregátumot*
használunk fel:
00 pq
01pq
10 pq
11 pq
1.
2.
3. valós
aggregátum
valós
aggregátum
fiktív
aggregátum
fiktív
aggregátum
*Aggregálás: egy heterogén jószágcsoport értékben való összegzése.
A tárgyidőszaki aggregát értéket (aggregátumot) folyóáras értékadatnak nevezzük.
Indexszámítás Egyedi és aggregát indexek
Indexszámítás
Háztartások egy főre jutó élelmiszerfogyasztása
Megnev.
Mérték-
egység
Fogy. menny. Egységár/Ft
1980 1988 1980 1988
Sertéshús kg 20 21 75,50 144,40
Tojás db 230 234 2,20 3,30
Tej l 89 105 6,00 10,50
Étolaj l 3 5 28,50 38,40
.
.
Egyedi indexek (egy jószágcsoportra – egyfajta
termékre – vonatkozó indexek, tkp. viszonyszámok)
Egyedi árindex:
Egyedi volumenindex:
Egyedi értékindex:
ahol:
p1: tárgyidőszak egységára
p0: bázisidőszak egységára
ahol:
q1: tárgyidőszaki mennyiség
q0: bázisidőszak mennyiség
ahol:
v1: tárgyidőszaki termékérték
v0: bázisidőszaki termékérték
0
1
p
pi p
0
1
q
qiq
00
11
0
1
pq
pq
v
viv
pqv iii
pi
Indexszámítás
Megnev.
Mért.
egys.
Fogy. menny. Egységár Egyedi indexek
1980 1988 1980 1988
Sertéshús kg 20 21 75,50 144,40 105,0 191,3 200,86
Tojás db 230 234 2,20 3,30 101,7 150,0 152,55
Tej l 89 105 6,00 10,50 118,0 175,0 206,50
Étolaj l 3 5 28,50 38,40 166,7 134,7 224,54
.
.
piqi vi
Többféle termékre – heterogén
jószágcsoportra – vonatkozó indexek
- együttes indexek aggregát formái
00
11
0
1
pq
pq
v
vIv
00
100
pq
pqI p
01
111
pq
pqI p
00
010
pq
pqIq
10
111
pq
pqIq
0
1
pq
pqI
s
sp
s
sq
pq
pqI
0
1
Értékindex:
Árindex: (a mennyiségek
q adatok állandók)
Volumenindex: (az árak, p adatok
állandók)
10
pqv III
01
pqv III
Indexszámítás
Megnev.
Mért.
egys.
Fogy. menny. Egységár Egyedi indexek
1980 1988 1980 1988
Sertéshús kg 20 21 75,50 144,40 105,0 191,3 200,86
Tojás db 230 234 2,20 3,30 101,7 150,0 152,55
Tej l 89 105 6,00 10,50 118,0 175,0 206,50
Étolaj l 3 5 28,50 38,40 166,7 134,7 224,54
.
.
piqi vi
00
11
pq
pqIv
00
100
pq
pqI p
01
111
pq
pqI p
00
010
pq
pqIq
10
111
pq
pqIq
10
pp
F
p III 10
F
q III
Értékindex-számítás
00
11
0
1
pq
pq
v
vIv
Az értékindex a termékek bizonyos körére nézve
az érték változását mutatja meg. (pl. árbevétel
változás)
Árindex-számítás
0
1
pq
pqI
s
sp
Súlyozott, alapformulájú
árindexek:
00
100
pq
pqI p
01
111
pq
pqI p
Laspeyres árindex
(bázisidőszaki súlyozású) :
Paashe árindex
(tárgyidőszaki súlyozású) :
10
pp
F
p III Fisher árindex:
Az árindex az árszínvonal változásának mértékét mutatja
a vizsgált termékek összességére vonatkozóan.
Volumenindex-számítás
10
111
pq
pqIq
s
sq
pq
pqI
0
1
Súlyozott alapformájú
volumenindex:
Laspeyres volumenindex
(bázisidőszaki súlyozású) :
Paashe volumenindex
(tárgyidőszaki súlyozású) :
Fisher volumenindex:
A volumenindex a termékek bizonyos körére vonatkozóan
a mennyiségek változását méri.
10
F
q III
00
010
pq
pqIq
Az érték-, volumen- és árindex
közötti összefüggés
pqv iii
10
pqv III
01
pqv III
F
p
F
qv III
Különbségfelbontás
0011 pqpqKv
0001
0 pqpqKq
0111
1 pqpqK p
0011 pqpqKv
1
qK 1011 pqpq
0
pK 0010 pqpq
vK 0110
pqpq KKKK
Összefüggések:
Feladat:
Egy bolt három termékének forgalmára vonatkozó adatok
láthatók az alábbi táblázatban:
Termék Mértékegység
Értékesítés
mennyisége Egységár (Ft)
2004 2005 2004 2005
I. vaj db 4500 5400 220 235
II. kenyér kg 2875 3335 90 90
III. tej l 2125 1870 140 175
Feladat:
Számítsa ki az egyedi volumen-, ár-, és
értékindexeket!
Hogyan változott a bolt összbevétele? (Iv)
Hogyan változott az értékesített termékek
árszínvonala? (Ip)
Számítsa ki az együttes volumenváltozást!
(Iq)
Egyedi indexek
Aggregátumok
Értékindex
%6,122226,11546250
1896400
00
11
pq
pqI v
a megfelelő aggregátumok hányadosaként
Árindexek
%7,109097,11546250
1688125
00
100
pq
pqI p
%3,108083,11749950
1896400
01
111
pq
pqI p
%04,1090904,10837,109715,110 pp
F
p III
Volumenindexek
%2,113132,11546250
1749950
00
010
pq
pqIq
%3,112123,11688125
1896400
10
111
pq
pqIq
%74,1121274,11234,11317,110 qq
F
q III
Indexszámítás Indexek átlagformái
Értékindex-számítás
00
11
0
1
pq
pq
v
vIv
Az értékindex a termékek bizonyos körére nézve
az érték változását mutatja meg. (pl. árbevétel
változás)
Az értékindex átlagformái:
ahol a súlyok a valós értékadatok és az
egyedi értékindexek az átlagolandó
értékek:
0
0
00
00
v
iv
pq
ipqI vv
v
vv
v
i
v
v
i
pq
pqI
1
1
11
11
Árindex-számítás
0
1
pq
pqI
s
sp
Súlyozott, alapformulájú
árindexek:
00
100
pq
pqI p
01
111
pq
pqI p
Laspeyres árindex
(bázisidőszaki súlyozású) :
Paashe árindex
(tárgyidőszaki súlyozású) :
10
pp
F
p III Fisher árindex:
Az árindex az árszínvonal változásának mértékét mutatja
a vizsgált termékek összességére vonatkozóan.
Az árindex átlagformái (árindex-
számítás egyedi árindexekből) ahol a súlyok az értékadatok, az átlagolandó értékek az
egyedi árindexek:
pp
p
i
v
v
i
pq
pqI
1
1
11
111
01
011.
pq
ipqI
p
p
0
0
00
000
v
iv
pq
ipqI
pp
p
p
p
i
pq
pqI
10
100
00
100
pq
pqI p
01
111
pq
pqI p
Volumenindex-számítás
10
111
pq
pqIq
s
sq
pq
pqI
0
1
Súlyozott alapformájú
volumenindex:
Laspeyres volumenindex
(bázisidőszaki súlyozású) :
Paashe volumenindex
(tárgyidőszaki súlyozású) :
Fisher volumenindex:
A volumenindex a termékek bizonyos körére vonatkozóan
a mennyiségek változását méri.
10
F
q III
00
010
pq
pqIq
A volumenindex átlagformái (volumenindex-
számítás egyedi volumenindexekből)
0
0
00
000
v
iv
pq
ipqI
q
ahol a súlyok az értékadatok, az átlagolandó értékek az
egyedi volumenindexek:
q
i
v
v
i
pq
pqI
1
1
11
111
q
q
i
pq
pqI
01
010
10
101
pq
ipqI
q
q
00
010
pq
pqIq
10
111
pq
pqIq
Feladat:
Egy bolt három termékének forgalmára vonatkozó adatok
láthatók az alábbi táblázatban:
Termék Mértékegység
Értékesítés
mennyisége Egységár (Ft)
2004 2005 2004 2005
I. vaj db 4500 5400 220 235
II. kenyér kg 2875 3335 90 90
III. tej l 2125 1870 140 175
Feladat:
Számítsa ki az egyedi volumen-, ár-, és
értékindexeket!
Hogyan változott a bolt összbevétele? (Iv)
Hogyan változott az értékesített termékek
árszínvonala? (Ip)
Számítsa ki az együttes volumenváltozást!
(Iq)
Egyedi indexek
Aggregátumok
Értékindex
%6,122226,11546250
1896400
00
11
pq
pqI v
%6,122226,11546250
1,129750016,1258750282,1990000
0
0
v
ivI v
v
%6,122226,1
1,1
327250
16,1
300150
282,1
1269000
1896400
1
1
v
v
i
v
vI
a megfelelő aggregátumok hányadosaként
az egyedi értékindexek súlyozott számtani átlagaként:
az egyedi értékindexek súlyozott harmonikus átlagaként:
Laspeyres-féle árindex
%7,109097,11546250
1688125
00
100
pq
pqI p
%7,109097,11546250
25,129750012587500682,1990000
0
00
v
ivI
p
p
Paashe-féle árindex
%3,108083,11749950
1896400
01
111
pq
pqI p
%3,108083,1
25,1
327250
1
300150
0682,1
1269000
1896400
11
111
p
p
i
pq
pqI
Fisher-féle árindex
A Laspeyres-és a Paashe index súlyozatlan mértani
átlaga
%04,1090904,10837,109715,110 pp
F
p III
Volumenindexek
%2,113132,11546250
1749950
00
010
pq
pqIq
%3,112123,11688125
1896400
10
111
pq
pqIq
%74,1121274,11234,11317,110 qq
F
q III
Feladatok (indexszámítás)
Perfekt Statisztika I. példatár:
207/1(x), 217/1, 218/3, 219/5, 219/6, 220/7,
220/8, 221/10, 222/12, 223/14, 224/17
További gyakorló feladatok az általános
statisztika (zöld) példatárból:
88/201, 88/202, 89/203, 89/204, 89/205,
90/207, 91/210, 91/211, 92/213
Indexszámítás Indexek gyakorlati alkalmazása
Indexszámok gyakorlati alkalmazása
Cserearány-mutatók:
a gazdálkodó szervezetek által eladott termékek árindexét viszonyítjuk a vásárolt termékek árindexéhez.
Cserearány-index (terms of trade):
az adott ország által exportált és az általa importált termékek árindexeinek a hányadosa. Egységnyi exportért, hányszor többet, vagy kevesebbet tudunk importálni a tárgyidőszakban a bázisidőszakhoz képest.
Indexszámok gyakorlati alkalmazása
Árolló:
azt mutatja meg, hogy valamilyen bevételt biztosító termékek bázisidőszakival azonos volumenéért a tárgyidőszakban mennyivel nagyobb vagy kisebb volumenű másféle termék kapható cserébe.
Agrárolló:
a mezőgazdasági termelőiár-indexet osztjuk a mezőgazdasági ráfordítások árindexével.
A fogyasztói árindex (CPI)
A fogyasztói árszínvonal változását méri.
Azt mutatja meg, hogy a lakosság által
fogyasztási célra vásárolt termékek és
szolgáltatások árai átlagosan hogyan változtak
az egyik időszakról a másikra.
Az infláció mérőeszközeként is használják, de
ez nem jelent fogalmi azonosítást.
A hazai fogyasztói árindex-számítás fő
jellemzői (Consumer Price Index – CPI)
a teljes lakosságra vonatkozik
a vásárolt fogyasztás (fogyasztói kosár) árváltozását tükrözi
mintavételes módszerrel készül
kínálati árakra épül (reprezentáns árak)
havonta készül
Laspeyres-típusú (bázisidőszaki súlyozású)
a globális árindex mellett különböző termék-
csoportokra és lakossági rétegekre is készül index
a közzététel meghatározott szabályozás szerint történik
Az indexszámítás adatforrásai
Két alappillér:
1. 900 reprezentánsra vonatkozó ármegfigyelés
2. az indexszámításhoz tartozó súlyok meghatározása A 160 árucsoporthoz, az ún. alapsorokhoz tartozó súlyarányok a fogyasztás szerkezetét képviselik.
A fogyasztói árindex-számítás
harmonizációja az EU országokban
A harmonizálás célja:
Az egyes országok fogyasztói árindexeinek összehasonlítása
A térségekre, országcsoportokra számított globális indexhez olyan alapadatok biztosítása, melyek egységesen kezelhetők
Az egyes országok fogyasztói árindex-számításának módszertani javítása
A CPI gyakorlatias és alacsony költségigényű meghatározása
HICP:Harmonizált Fogyasztói Árindex
Indexszámítás Indexsorok
Indexsorok
Kettőnél több időszakra vonatkozó indexek sorozata
Indexsorok fajtái: a) Tartalma szerint
- értékindexsor - árindexsor - volumenindexsor
b) Viszonyítás rendje szerint - bázisindexsor - láncindexsor
c) Súlyozás módja szerint - állandó súlyozású indexsor - változó súlyozású indexsor (B,T)
Indexsorok
Volumenindexsorok:
Bázis
Állandó súlyozású
Változó súlyozású (B,T)
Lánc
Állandó súlyozású
Változó súlyozású (B,T)
Árindexsorok:
Bázis
Állandó súlyozású
Változó súlyozású (B,T)
Lánc
Állandó súlyozású
Változó súlyozású (B,T)
Értékindexsorok:
Bázis
Lánc
Indexsorok
Bázis-értékindexsor (0. év a bázis)
Lánc-értékindexsor
pq
pq , ... ,
pq
pq ,
pq
pq ,
00
nn
00
22
00
11
00
00
pq
pq
pq
pq , ... ,
pq
pq , ,
1-n1-n
nn
11
22
00
11
pq
pq
(100%)
Értékindexsorok:
Indexsorok
Állandó súlyozású bázis-volumenindexsor:
(bázis: a 0. időszak mennyisége, állandó súly: a 0. időszak ára)
Változó súlyozású bázis-volumenindexsor (bázis: 0. év) - (B)
Változó súlyozású bázis-volumenindexsor (bázis: 0. év) - (T)
pq
pq , ... ,
pq
pq ,
pq
pq %,100
00
0n
00
02
00
01
pq
pq , ... ,
pq
pq , %,100
1-n0
1-nn
10
12
00
01
pq
pq
Bázis volumenindexsorok:
pq
pq , ... ,
pq
pq , %,100
n0
nn
20
22
10
11
pq
pq
Indexsorok
Állandó súlyozású lánc-volumenindexsor:
(állandó súly: a 0. időszak ára)
Változó súlyozású lánc-volumenindexsor - (B)
Változó súlyozású lánc-volumenindexsor - (T)
pq
pq , ... ,
pq
pq ,
pq
pq ,
01-n
0n
01
02
00
01
pq
pq , ... ,
pq
pq , ,
1-n1-n
1-nn
11
12
00
01
pq
pq
Lánc volumenindexsorok:
pq
pq , ... ,
pq
pq , ,
n1-n
nn
21
22
10
11
pq
pq
Indexsorok
Állandó súlyozású bázis-árindexsor:
(bázis: a 0. időszak mennyisége, állandó súly: a 0. időszak menny.)
Változó súlyozású bázis-árindexsor (bázis: 0. év) - (B)
Változó súlyozású bázis-árindexsor (bázis: 0. év) - (T)
pq
pq , ... ,
pq
pq ,
pq
pq %,100
00
n0
00
20
00
10
pq
pq , ... ,
pq
pq , %,100
01-n
n1-n
01
21
00
10
pq
pq
Bázis árindexsorok:
pq
pq , ... ,
pq
pq , %,100
0n
nn
02
22
01
11
pq
pq
Indexsorok
Állandó súlyozású lánc-árindexsor:
(állandó súly: a 0. időszak ára)
Változó súlyozású lánc-árindexsor - (B)
Változó súlyozású lánc-árindexsor - (T)
pq
pq , ... ,
pq
pq ,
pq
pq ,
1-n0
n0
10
20
00
10
pq
pq , ... ,
pq
pq , ,
1-n1-n
n1-n
11
21
00
10
pq
pq
Lánc árindexindexsorok:
pq
pq , ... ,
pq
pq , ,
1-nn
nn
12
22
01
11
pq
pq
Indexszámítás Területi indexek
Területi indexek Forgalom-, vagy termelésadatok térbeli összehasonlításának
eredményeként jönnek létre
Az eddig alkalmazott 0 (bázisidőszak) és 1 (tárgyidőszak) jelölések A-ra és
B-re módosulnak (A és B a két terület jelölik)
Az értékindexet területi összehasonlítás esetén nem értelmezzük!
Az összehasonlításnak nincs egyértelmű sorrendje: felcserélhető a
viszonyítandó és a viszonyítás alapjául szolgáló terület: A/B és B/A
relációjú (területi) ár- és volumenindexeket is számolhatunk
Eltérő valutájú országok esetén az árindex számlálója és a nevezője
nem azonos mértékegységű, ezért nem %-os értékként értelmezzük
A/B relációjú index esetén jelentése: B ország 1 valutaegysége A ország
hány valutaegységével egyenértékű. B/A relációjú index esetén A ország
egy valutaegysége B ország hány valutaegységével egyenértékű.
A területi összehasonlításnál (eltérő valuták) a különböző súlyozású
indexek közötti eltérés jóval nagyobb lehet, mint az időbeli
összehasonlításnál, ezért a Fisher-formula használata kötelező.
Területi volumenindex
AA
AB
BA
BBAB
pq
pq
pq
pqIq
Fisher
/
Területi volumenindex azt fejezi ki, hogy az összehasonlítandó
területen a termelés (értékesítés) mennyisége hányszorosa az
összehasonlítás alapjául szolgáló terület termelésének
(értékesítésének).
Legfontosabb alkalmazási területe a nemzetközi
összehasonlítás
AB
AA
BB
BABA
pq
pq
pq
pqIq
Fisher
/ AB
AABA
pq
pqIq
A
/
BB
BABA
pq
pqIq
B
/
BA
BBAB
pq
pqIq
B
/
AA
ABAB
pq
pqIq
A
/
Területi árindex
Azonos valutájú országok esetén a területi árindex
árszínvonal összehasonlítást jelent.
Eltérő valutájú országok esetén a területi árindex a vásárlóerő
paritást fejezi ki.
Vásárlóerő paritás (PPP): azt mutatja meg, hogy egy adott ország
egységnyi valutája a másik ország hány egységnyi valutájával
egyenértékű a vizsgált termékek körében.
AA
BA
AB
BBAB
pq
pq
pq
pqIp
Fisher
/
BA
AA
BB
ABBA
pq
pq
pq
pqIp
Fisher
/
B ország egységnyi valutája A ország
ennyi egységnyi valutájával egyenértékű.
A ország egységnyi valutája B ország
ennyi egységnyi valutájával egyenértékű.
Feladatok (területi indexek,
indexsorok)
Perfekt Statisztika I. példatár:
212/2, 217/2 (területi indexek)
230/28, 230/29 (indexsorok)
További gyakorló feladatok az általános
statisztika (zöld) példatárból:
101/239, 102/240 (területi indexek)
97/230, 98/231, 98/232, 99/234 (indexsorok)
Sztochasztikus
kapcsolatok Asszociáció
Ismérvek közötti kapcsolatok
Statisztikai ismérvek: Minőségi ismérvek
Mennyiségi ismérvek
Időbeli ismérvek
Területi ismérvek
Eddig a sokaságokat egy ismérv szerint elemeztük, most a
sokaságokat egyszerre két – egymással valamilyen
kapcsolatban álló – megkülönböztető ismérv szerinti
csoportosításban, azaz kombinációs táblába rendezve
vizsgáljuk. A vizsgálat célja pedig az, hogy van-e és ha van,
akkor milyen erősségű/jellegű a kapcsolat a vizsgált két
ismérv között.
Ismérvek közötti kapcsolatok
a két ismérv (x és y) független egymástól, ha x ismérv
szerinti hovatartozás nem ad semmiféle többletinformációt az
y szerinti hovatartozásról. (ezekkel nem kell foglalkoznunk)
a két ismérv között sztochasztikus összefüggés van, ha
az egyik ismérvváltozathoz való tartozásból tendenciaszerűen,
valószínűségi jelleggel következtethetünk a másik ismérv
szerinti hovatartozásra. Statisztika
a két ismérv függvényszerű kapcsolatban áll egymással,
ha a vizsgált egységek x szerinti hovatartozásának
ismeretében teljesen egyértelműen megmondható azok y
szerinti hovatartozása is. (ezt a matematika vizsgálja)
Sztochasztikus kapcsolatok
Különböző okozati jellege lehet az egyes
ismérveknek:
x ismérv: ok (magyarázó változó)
y ismérv: okozat (eredményváltozó)
(pl. jövedelemnagyság és húsfogyasztás)
Vannak olyan esetek, amikor az ismérvek
kölcsönösen hatnak egymásra, vagyis az ok-
okozati viszony nem egyértelmű, az okság
kölcsönös. (pl. ár és kereslet)
Ismérvek közötti kapcsolatok
A két ismérv jellege szerint a következő sztochasztikus kapcsolatokat különböztethetjük meg:
asszociációs kapcsolat: az egymással kapcsolatban álló ismérvek minőségi vagy területi ismérvek (pl.: nem (férfi,nő) – dohányzás)
vegyes kapcsolat: az egyik vizsgált ismérv területi vagy minőségi ismérv, a másik mennyiségi (pl.: iskolai végzettség -1 főre jutó bruttó havi jövedelem)
korrelációs kapcsolat: mindkét vizsgált ismérv mennyiségi ismérv (pl.: 1 főre jutó bruttó havi jövedelem-1 főre jutó élelmiszerfogyasztás) egyszerre több ismérv között vizsgálható a sztochasztikus kapcsolat (II. félév anyaga)
rangkorreláció: mindkét ismérv ordinális mérési szintű, vagyis sorrendi skálán mérhető.
Ismérvek közötti kapcsolatok
Az asszociáció és a vegyes kapcsolat esetén egyszerre csak két ismérv közötti kapcsolatot vizsgálhatjuk.
Arra keressük a választ, hogy a két ismérv között:
van-e kapcsolat?
ha van kapcsolat, akkor az milyen erős?
A korrelációs kapcsolat (mennyiségi ismérvek kapcsolatának a vizsgálata) több elemzési lehetőséget biztosít, hiszen itt azt is meg tudjuk vizsgálni, hogy az egyik ismérv milyen számszerű hatással van a másik (vagy több) ismérv alakulására.
Kontingencia tábla
X/Y
Példa kontingencia táblára
Jövedelem
A szabadságot
Összesen egyszerre 2 hetet egyben elaprózva
veszi igénybe
Alacsony 88 472 240 800
Közepes 120 680 200 1000
Magas 112 497 91 700
Összesen 320 1649 531 2500
Egy reprezentatív felmérés során vizsgálták a magyarok szabadságkivételi
szokásai és jövedelmi helyzete közötti kapcsolatot. A megfigyelést 2500, 14
évesnél idősebb magyar állampolgár megkérdezésével végezték.
Kontingencia tábla
ijf együttes gyakoriságok, tényleges gyakoriság a kontingencia
tábla i sorában és j oszlopában
peremgyakoriságok, az összesen rovat gyakoriságai
Az x ismérvváltozattal rendelkező elemek száma .if
n = a sokaság elemeinek a száma
jf.peremgyakoriságok, az összesen rovat gyakoriságai
az y ismérvváltozattal rendelkező elemek száma
Asszociációs kapcsolat szorosságának mérése
1) Alternatív ismérvek esetén:
2 x 2 (s=t=2) kontingencia tábla:
12212211
12212211
ffff
ffffY
11 Y
22
12
21
11
f
f
f
fA két ismérv függetlensége esetén
Yule –együttható (Y):
X/Y y1 y2 Összesen
x1 f11 f12 f1.
x2 f21 f22 f2.
Összesen f.1 f.2 n
Asszociációs kapcsolat szorosságának mérése
Példa alternatív ismérvek esetén:
Egy városban terjesztett időszaki lapok megoszlása (s=t=2):
418,075862798
75862798
12212211
12212211
xx
xx
ffff
ffffY
11 Y
Yule –együttható (Y):
Terjesztés módja Napilapok Hetilapok Összesen
Árusítás 98 (f11) 75 (f12) 173 (f1.)
Előfizetés 86 (f21) 27 (f22) 113 (f2.)
Összesen 184 (f.1) 102 (f.2) 286 (n)
Asszociációs kapcsolat szorosságának mérése
A Yule-mutató tulajdonságai:
10 Y
0Y
10 Y
1Y
Teljes függetlenség, a kapcsolat teljes hiánya
Sztochasztikus kapcsolat
Függvényszerű kapcsolat
Asszociációs kapcsolat szorosságának mérése
)1()1(nT
2
ts
Csuprov-mutató (T):
2) Általánosan alkalmazható mutatószám (alternatív
és két ismérvváltozatnál több változattal rendelkező ismérvek esetén
egyaránt): (ahol s az egyik ismérv változatainak, míg t a másik ismérv
változatainak a számát jelenti):
ij
ijij
ji f
ff*
2*
2
,ahol
n
fff
jiij
..*
,ahol
ijf * függetlenség esetén feltételezett gyakoriság a
kontingencia tábla i sorában és j oszlopában
Asszociációs kapcsolat szorosságának mérése
Példa: 3-3 ismérvváltozattal rendelkező ismérvek esetén: (ahol s (3)
az egyik minőségi ismérv változatainak, míg t (3) a másik minőségi ismérv
változatainak a számát jelenti):
Jövedelem A szabadságot
Összesen egyszerre 2 hetet egyben elaprózva
veszi igénybe
Alacsony 88 472 240 800
Közepes 120 680 200 1000
Magas 112 497 91 700
Összesen 320 1649 531 2500
Asszociációs kapcsolat szorosságának mérése
A Csuprov-mutató tulajdonságai:
10 T
ts
10 C
2 ts
esetén a Cramer-mutatót (C) használjuk:
Esetén Y és T mutatók is alkalmazhatók, a T
mutató alakja ebben az esetben:
ha s=t
4max
max 1
1,C
t
sTahol
T
T
2121
21122211
ffff
ffffT
4
1
10
t
sT
Asszociációs kapcsolat szorosságának mérése
S=t=3 T mutatót számoljuk
Fizetés – szab. fij fij* (fij-fij*) (fij-fij*)²
fij*
Alacsony – egysz. 88 102,4 -14,4 2,025
Alacsony – 2 hetet 472 527,6 -55,6 5,86
Alacsony – aprózva 240 170 70 28,82
Közepes – egysz. 120 128 -8 0,5
Közepes – 2 hetet 680 659,6 20,4 0,63
Közepes – aprózva 200 212,4 -12,4 0,72
Magas – egysz. 112 89,6 22,4 5,6
Magas – 2 hetet 497 461,8 35,2 2,68
Magas – aprózva 91 148,6 -57,6 22,33
Összesen 2500 2500 0 ²א =69,165
1176,0)13()13(2500
165,69
)1()1(nT
2
ts
n
fff
jiij
..*
ij
ijij
ji f
ff*
2*
2
Feladatok (asszociáció) Perfekt Statisztika I. példatár:
240/2, 241/3, 248/1, 248/2, 249/3, 250/5,
250/6 , 252/10, 254/13
255/14, 255/15, 257/17, 257/18, (ezeknél csak a
kapcsolat szorosságát jelző mutatókat kell kiszámolni)
További gyakorló feladatok az általános
statisztika (zöld) példatárból:
60/127, 60/128, 60/130, 60/132
Sztochasztikus
kapcsolatok Vegyes kapcsolat
Vegyes kapcsolat
Vegyes kapcsolat: az egyik vizsgált ismérv területi
vagy minőségi ismérv (azaz nem mennyiségi ismérv),
a másik mennyiségi ismérv (pl.: iskolai végzettség - 1
főre jutó bruttó havi jövedelem)
A vegyes kapcsolat elemzése során azt vizsgáljuk,
hogy a mennyiségi ismérv szóródását mennyiben
befolyásolja a minőségi vagy a területi ismérv szerinti
csoportosítás.
Heterogén sokaságok
Nappali tagozatos gyakorlati jegyek statisztikából
Osztályzat
Tanulók szakonkénti megoszlása
Összesen GZM EE TV
5 19 23 19 61
4 32 49 40 121
3 24 36 56 116
2 20 36 82 138
1 1 2 18 21
Összesen 96 146 215 457
Heterogén sokaságok
összetett, minőségileg különböző részekből állnak.
Heterogén sokaság átlaga a részsokaságokra számított átlagok súlyozott átlaga.
Jelölések:
: j-edik csoport átlaga
: j-edik csoport tagszáma
: a csoportok száma
: súlyarány
: a teljes sokaságra számított átlag
j
m
j
jm
j
j
m
j
jj
xw
n
xn
x
1
1
1
jx
j
jw
n
n
x
jn
mj , . . . ,1
Heterogén sokaságok
Jelölések:
= a sokaság tagszáma
= a csoportok/részsokaságok száma
= a j-edik csoport/részsokaság tagszáma
= a j-edik csoport/részsokaság átlaga
= a sokaság átlaga (főátlag)
= a j-edik csoport/részsokaság i-edik eleme ijx
jx
x
nm
jn
Csoportok Elemszám Csoportátlag Csoportonkénti
szórás
… … … …
… … … …
Összesen
jnjx j
1C
2C
kC
mC
1n
2n
kn
mn
n
1x
2x
kx
jx
x
1
2
k
m
Nappali tagozatos gyakorlati jegyek statisztikából
Csoportok Elemszám Csoportátlag Csoportonkénti
szórás
GZM 96 GZM GZM
EE 146 EE EE
TV 215 TV TV
Összesen 457
jnjx j
x
x
x
x
Például:
Egy vidéki nagyváros ingatlanügynökségén
értékesítésre váró ingatlanok: Eladási ár
(m Ft)
Panellakások
száma
Nem panelből készült
lakások száma
Összes lakás
(db)
6,1 – 8,0 8 2 10
8,1 – 10,0 15 5 20
10,0 – 15,0 34 12 46
15,0 – 20,0 24 14 38
20,1 – 25,0 7 19 26
25,1 – 30,0 2 8 10
Összesen 90 60 150
Építőanyag Ingatlanok
száma
Csoportátlag
(eladási ár m Ft)
Csoportonkénti
szórás
Panel 90 13,872 4,72
Nem panel 60 18,358 5,93
Összesen 150 15,670 5,68
jx jjn
A könnyebb áttekinthetőség kedvéért a
számításokat táblázatba foglalhatjuk:
x n
A vegyes kapcsolat mutatószámai
S
S
S
SH BKBK 11
2
2
2
22
Szórásnégyzet-hányados: megmutatja, hogy a minőségi vagy területi
ismérv szerinti csoportosítás hány %-ban befolyásolja a mennyiségi
ismérv szóródását.
Szóráshányados: a szórásnégyzet-hányados négyzetgyöke, amely
megmutatja, hogy milyen szoros a kapcsolat a nem mennyiségi
(csoportosító) és a mennyiségi ismérv között.
S
S
S
SHH BKBKK 11
2
2
2
22
A vegyes kapcsolat mutatóinak értelmezése
10 H
02 HH
12 HH
Teljes függetlenség, a kapcsolat teljes hiánya
Sztochasztikus kapcsolat
Függvényszerű, determinisztikus kapcsolat
10 2 H
Jelölések
= teljes eltérés ( )
= belső eltérés ( )
= külső eltérés ( )
= teljes szórásnégyzet
= belső szórásnégyzet
= külső szórásnégyzet
xxij )( jij xx
)( xx j
22
B
2
K
ijd
ijB
jK
Szórásnégyzetek kiszámítása
S: teljes eltérés-
négyzetösszeg
SB: belső eltérés-
négyzetösszeg
SK: külső eltérés-
négyzetösszeg
n
S
n
xxjn
i
ij
m
j
1
2
12
)(
n
S
n
n
n
xxBjjjij
B
22
2)(
n
S
n
xxnKjj
K
2
2)(
Összefüggések
xxij )()( xxxx jjij
Teljes eltérés Belső eltérés Külső eltérés
222
KB
Teljes szórásnégyzet Belső szórásnégyzet Külső szórásnégyzet
KB SSS
Teljes eltérés
négyzet összeg
Belső eltérés
négyzet összeg
Külső eltérés
négyzet összeg
jijij KBd
Feladat:
Egy főiskolán 4 szakon folyik bachelor képzés. Az alábbi
táblázatban a hallgatók napi tanulásra fordított idejére
vonatkozó adatok találhatók:
Szak Napi tanulásra fordított idő (óra) Hallgatók
%-os
megoszlása átlaga szórása
Emberi erőforrás 1,5 1,2 24
Gazdálkodás menedzsment 2,25 0,8 26
Nemzetközi gazdálkodás 1,75 1,5 20
Pénzügy-számvitel 2,75 1,3 30
Számítsa ki a ,, KB mérőszámokat és értelmezze azokat!
Megoldás
12,275,23,075,12,025,226,05,124,0 x
49,0
2431,0)12,275,2(3,0...)12,25,1(24,0 222
k
K
212,1
469,13,13,05,12,08,026,02,124,0 22222
B
B
308,17121,12431,0469,12
222
KB
Megoldás
%58,181858,0308,1
2431,02
22
KH
Szórásnégyzet-hányados: megmutatja, hogy a hallgatók szakonkénti
csoportosítása (szakja) hány %-ban befolyásolja a tanulásra fordított
idejük szóródását.
Szóráshányados: a szórásnégyzet-hányados négyzetgyöke, amely
megmutatja, hogy milyen szoros a kapcsolat a hallgató szakja (minőségi
csoportosító ismérv) és a tanulásra fordított idő (mennyiségi ismérv) között.
4310,01858,02 HH
Feladatok (vegyes kapcsolat)
Perfekt Statisztika I. példatár:
264/1, 267/2, 273/1, 273/2, 274/3, 274/5,
275/6, 275/7, 279/14, 280/15, 280/16,
281/18 (a 18-as feladat b) részének a megoldása a régi
kiadású példatárban hátul nem jó!)
További gyakorló feladatok az általános
statisztika (zöld) példatárból:
63/137, 65/140, 66/141, 66/143, 67/144
Zárthelyi dolgozat
(ZH) 2017. december 9. 9.00 (B/119)
Zárthelyi dolgozat
(Pót ZH) 2017. december 15. 9.00 (B/119)