Ekonometria SP

UNIVERZITA MATEJA BELA V BANSKEJ BYSTRICI

EKONOMICKÁ FAKULTA

KATEDRA KVANTITATÍVNYCH METÓD A INFORMAČNÝCH SYSTÉMOV

Seminárna práca

EKONOMETRICKÝ MODEL LÚPEŽÍ V KRAJOCH

NA SLOVENSKU V ROKU 2009

Bc. Michaela Krkošová

Názov predmetu: Ekonometria

Akademický rok: 2012/2013

Dátum odovzdania: 2013-01-09

Obsah

Úvod ............................................................................................................................................. 3

1 Ekonomický model a empirické dáta ............................................................................... 4

1.1 Závislá premenná trestné činy .................................................................................. 4

1.2 Nezávislé premenné .................................................................................................. 4

2 Predbežná analýza dát ...................................................................................................... 8

2.1 Vývoj premenných v čase .......................................................................................... 8

2.2 Deskriptívna štatistika, testy normality a histogramy ........................................... 12

2.3 Korelačná matica premenných ............................................................................... 15

3 Ekonometrický model...................................................................................................... 17

3.1 Prvotný model .......................................................................................................... 17

3.2 Druhotný model ....................................................................................................... 18

4 Ekonometrická verifikácia modelu ................................................................................. 21

4.1 Testovanie normality OLS-reziduí ........................................................................... 21

4.2 Testovanie heteroskedasticity ................................................................................ 22

4.3 Testovanie autokorelácie ........................................................................................ 25

4.4 Testovanie multikolinearity ..................................................................................... 26

4.5 Testovanie stability .................................................................................................. 27

4.6 Testovanie špecifikácie ............................................................................................ 28

4.7 Posúdenie predikčnej schopnosti modelu ............................................................. 28

Záver .......................................................................................................................................... 30

Bibliografia................................................................................................................................. 32

Prílohy ........................................................................................................................................ 33

3

Úvod

Kriminalita na Slovensku je vážnym problémom dnešnej spoločnosti. Na jednej strane stojí

konzumná spoločnosť, v ktorej ľudia strácajú svoje morálne hodnoty a kladú na prvé miesto

majetok a jeho obstaranie. Na druhej strane stojí chudoba a jej prehlbovanie spôsobené

nedostatkom pracovných miest, čo je ešte podčiarknuté hospodárskou krízou a zatváraním

podnikov v oblastiach s vysokou mierou nezamestnanosti. Ľudia nie sú schopní uživiť svoje

rodiny a v zdanlivo bezvýchodiskovej situácií volia poslednú možnosť ako sa uživiť – trestnú

činnosť. Toto je však iba hrubé zhrnutie motivátorov, ktoré stoja za vysokým počtom trestných

činností. Sú aj iná skutočnosti, ktoré kriminalitu ovplyvňujú. Tie som sa rozhodla skúmať v mojej

práci.

Ako som už spomínala, v tejto práci som sa rozhodla aspoň z časti objasniť, čo stojí za

kriminalitou a v ktorých regiónoch je najvyššia. Je počet trestných činov vyšší v „chudobných“

krajoch s vysokou mierou nezamestnanosti alebo naopak, v krajoch rozvinutejších a bohatších?

Existuje korelácia medzi počtom absolventov vysokoškolského štúdia a celkovým počtom lúpeží

v krajoch? Na tieto aj iné otázky budem odpovedať v mojej práci.

Na ďalších stránkach tejto práce budem skúmať to, či a ako na celkový vplyv trestných

činov v kraji vplývajú rozličné ukazovatele. Ja som sa rozhodla pre ukazovatele počet

absolventov za kalendárny rok (denné aj externé štúdium spolu), miera evidovanej

nezamestnanosti, ekonomicky aktívne obyvateľstvo, stav obyvateľstva a obyvateľstvo podľa

národností – rómska a maďarská. Hodnoty týchto ukazovateľov sú z roku 2009 a sú voľne

dostupné na stránke RegDat – databáza regionálnej štatistiky.

V jednotlivých kapitolách najskôr bližšie rozoberiem skúmané premenné, u ktorých

predpokladám, že ovplyvňujú počet trestných činov. Ukážem tiež, ako sa vyvíjali v čase.

Pomocou programov Eviews, MS Excel a SPSS vytvorím prvotný regresný model, z ktorého

vyčlením nevýznamné premenné. Model overím ekonomicky, štatisticky aj ekonometricky, teda

overím predpoklady klasického lineárneho regresného modelu. Pokiaľ budem v práci overovať

štatistické hypotézy, budem za rozhodujúcu predpokladať 5% hladinu významnosti.

4

1 Ekonomický model a empirické dáta

Pre mnou stanovený model som sa snažila vybrať čo najvhodnejšie premenné – tak ako

vysvetľovanú, rovnako aj vysvetľujúce. Všetky použité údaje (pre rok 2009 aj 2010) sú voľne

dostupné na stránke Štatistického úradu Slovenskej republiky – RegDat databáza regionálnej

štatistiky (url: http://px-web.statistics.sk/PXWebSlovak/). Údaje sú stanovené pre každý z 8

krajov Slovenskej republiky.

1.1 Závislá premenná trestné činy

V mnou skúmanom modeli som určila ako závislú premennú trestné činy (tr_ciny). Táto

premenná sleduje celkový počet trestných činov v jednotlivých krajoch Slovenska v roku 2009.

Ako uvádza Štatistický úrad Slovenskej republiky (2012), do tohto počtu sú započítané

všeobecné (majetková, násilná, mravnostná a tzv. ostatná kriminalita), hospodárske (napríklad

sprenevera, podvod, neoprávnené obstaranie platobnej karty a iné) aj zostávajúce trestné činy

(zanedbanie povinnej výživy, dopravné nehody, týranie zvierat a pod.). Hodnoty na úrovni

krajov a regiónov nedávajú celkový súčet za SR z dôvodu, že trestné činy zistené Železničnou

políciou, Vojenskou políciou, Zborom väzenskej a justičnej stráže a Colným riaditeľstvom sa

nedajú presne lokalizovať do krajov. Táto premenná je udávaná v počte zaevidovaných

trestných činov.

1.2 Nezávislé premenné

Na celkovú výšku trestných činov v jednotlivých krajoch vplýva mnoho faktorov. Ja som si

pre potreby zostavenia daného modelu vybrala ako vysvetľujúce (exogénne) tieto premenné:

počet absolventov za kalendárny rok 2009 (denné aj externé štúdium spolu), miera evidovanej

nezamestnanosti, ekonomicky aktívne obyvateľstvo, stav obyvateľstva a obyvateľstvo podľa

národností – rómska a maďarská. Myslím si, že najmä týchto 6 premenných výrazne vplýva na

celkový počet trestných činov v jednotlivých regiónoch, čo sa budem v ďalšej práci snažiť aj

dokázať.

Počet absolventov za rok 2009 denné aj externé štúdium spolu (absolventi)

Daná premenná zohľadňuje celkový počet absolventov vysokých škôl v krajoch Slovenskej

republiky za rok 2009 a sú k 31.12.2009. Udávané hodnoty predstavujú súčet absolventov

5

denného aj externého štúdia. Študenti a absolventi sú evidovaní v tom regióne, v ktorom sa

daná fakulta skutočne nachádza, pričom vysoká škola, príp. univerzita danej fakulty môže mať

svoje sídlo v inom regióne. Treba podotknúť, že som zvažovala aj možnosť vybrať triedenie

počtu absolventov podľa kraja, v ktorom má absolvent trvalé bydlisko. Domnievam sa však, že

študenti dochádzajúci za štúdiom do vzdialenejších (a aj bohatších) regiónov v nich po ukončení

štúdia začnú vykonávať svoju profesiu (jedná sa obzvlášť o dochádzanie z chudobnejších

regiónov Stredného a Východného Slovenska) a budú tu mať svoje bydlisko. Údaje sú udávané

k 31.12.2009 a v počte občanov.

Výber tejto premennej som zaradila najmä preto, že som predpokladala, že čím vyššia je

vzdelanostná úroveň obyvateľstva, tým menšia bude frekvencia výskytu trestných činov. Súdim

tak hlavne z domnienky, že u vysokoškolsky vzdelaných ľudí sa okrem vedomostí očakávajú aj

vyššie morálne hodnoty a ich striktnejšie dodržiavanie. Predpokladám teda nepriamu závislosť

a záporné znamienko regresného koeficientu pri zostrojenom modeli.

Miera evidovanej nezamestnanosti (nezamestnanost)

Ďalšou zvolenou vysvetľujúcou premennou je miera evidovanej nezamestnanosti. Je

udávaná v percentách a vyjadruje pomer medzi počtom nezamestnaných osôb podľa

výberového zisťovania pracovných síl1 a celkovým počtom ekonomicky aktívneho obyvateľstva.

Pojem ekonomicky aktívne obyvateľstvo vysvetlím ďalej v práci.

Zapojenie tohto parametra do regresného modelu vysvetľujem tým, že pokiaľ je v regióne

vysoká miera nezamestnanosti, rozširuje sa chudoba a ľudia sa viac uchyľujú k trestnej činnosti.

Potrebujú zabezpečiť svoje rodiny a bez stabilného príjmu z pracovnej činnosti im nezostáva

veľa riešení. Hlavne dlhodobo nezamestnaní majú tendenciu sa uchyľovať k užívaniu

návykových látok alebo hazardným hrám, čo môže tiež v konečnom dôsledku ústiť do páchania

trestnej činnosti. Preto očakávam, že vo výstupe z regresie daného modelu bude regresný

koeficient tohto parametra kladný.

1 „Priebežné monitorovaním pracovných síl na základe priameho zisťovania vo vybraných domácnostiach. Základ na zisťovanie tvorí stratifikovaný výber bytov, ktorý rovnomerne pokrýva celé územie Slovenskej republiky.“ (Štatistický úrad SR, 2012)

6

Ekonomicky aktívne obyvateľstvo (ekon_akt_obyv)

Za exogénnu premennú som zvolila aj ekonomicky aktívne obyvateľstvo. Určovanie

hodnôt tejto premennej prebieha pomocou výberového zisťovania pracovných síl. Predstavuje

osoby staršie ako 15 rokov, ktoré sú pracujúce alebo nezamestnané, no aktívne si hľadajú

prácu. Nie sú sem zahrnutí študenti, dôchodcovia, návštevníci rekvalifikačných kurzov, osoby

starajúce sa o domácnosť alebo osoby bez práce, ktoré si je aktívne nehľadajú alebo nie sú do

nej schopné nastúpiť v lehote do dvoch týždňov. Rovnako sem nepatria osoby na rodičovskej

dovolenke. Údaje k 31.12.2009 sú udávané v tisícoch občanov.

Tento parameter súvisí s mierou nezamestnanosti. Pokiaľ je dostatok ľudí v regióne

zamestnaných, je pravdepodobné že bude páchané menšie množstvo trestnej činnosti. Čo sa

týka nezamestnaných, tu sú započítavaní len tí, ktorí si prácu skutočne hľadajú. Práve títo ľudia

sa snažia zmeniť svoju situáciu legálnou cestou a pokúšajú si nájsť zamestnanie. Je menej

pravdepodobné, že budú páchať trestnú činnosť v porovnaní s osobami, ktoré nemajú záujem

pracovať alebo rezignovali na svoju situáciu. Preto očakávam záporný regresný koeficient

a nepriamu úmernosť so vysvetľovanou premennou.

Stav obyvateľstva (populacia)

Stav obyvateľstva predstavuje celkový počet obyvateľov v danom kraji na konci

sledovaného obdobia, teda roku 2009. Mernou jednotkou tejto premennej je počet občanov.

Pokiaľ by páchal trestnú činnosť každý 50-ty obyvateľ (bez ohľadu na iné faktory), je zrejmé, že

so zvyšovaní počtu obyvateľov by sa zvyšoval aj počet trestných činov v regióne. Preto

očakávam pri premennej stav obyvateľstva v regresnom modely kladný regresný koeficient.

Obyvateľstvo podľa národností – rómska a maďarská (romovia, madari)

Za posledné dve vysvetľujúce premenné som zvolila obyvateľstvo podľa národností.

Vybrala som si dve najpočetnejšie národnostné menšiny na Slovensku – rómsku a maďarskú.

Údaje sú zobrazované k 31.12. 2009 a ich jednotkou je počet občanov.

Výberom týchto ukazovateľov som sa snažila vhodne doplniť model. Nerada by som

v tejto práci niekoho odsudzovala alebo škatuľkovala podľa rasy a národnosti. Robiť sociologický

rozbor nie je zámerom tejto práce. Snažím sa zohľadniť len všeobecne známe súvislosti. Rómski

spoluobčania, hlavne tí žijúci v osadách, patria medzi skupiny najviac ohrozené chudobou. Ich

7

spôsob života je veľmi špecifický. Hlavne kvôli tomu sú títo občania viac náchylní na páchanie

trestnej činnosti. Predpokladám, že sa vyskytne súvislosť medzi počtom občanov rómskej

menšiny v regióne a počtom trestných činov v podobe priamej závislosti. Predpokladám, že

regresný koeficient dosiahne kladnú hodnotu.

Maďarská menšinu som zvolila z rozdielneho princípu – nepredpokladám, že občania

hlásiaci sa k maďarskej národnosti majú väčšie sklony k vykonávaniu kriminálnych činov. Skôr

usudzujem, že je na Slovensku mnoho Rómov, ktorí sa akoby hanbili za svoj pôvod a pri

prieskumoch uvádzajú maďarskú národnosť. Z tohto dôvodu očakávam rovnako kladný

regresný koeficient. Či je táto domnienka správna ukáže až model.

8

2 Predbežná analýza dát

2.1 Vývoj premenných v čase

Na porovnanie vývoja trestných činov v jednotlivých krajoch počas rokov 2005 až 2009 mi

poslúži graf 1. Najviac trestných činov je počas celého sledovaného obdobia spáchaných

v Bratislavskom kraji. Ich počet sa drží približne pri úrovni 24 000 trestných činov. Druhým

krajom v počte páchanej kriminálnej činnosti je Košický kraj. Tu však vidíme pozitívny trend

v znižovaní evidovanej trestnej činnosti. Kým v roku 2005 bol počet trestných činností nad

hodnotou 22 000, v ďalších rokoch nasledoval pokles až na úroveň 14 422. Tretím v poradí je

Banskobystrický kraj, kde však tiež kriminalita v sledovanom období poklesla o viac ako 1 000

kriminálnych činov. Minimálny počet trestných činov dosahuje počas celej doby Trnavský kraj.

Ostatné kraje majú podobný vývoj sledovaného ukazovateľa v tomto čase.

Graf 1: Vývoj počtu trestných činov v jednotlivých krajoch v rokoch 2005-2009

Zdroj: Výstup z Eviews

Tiež sledujem, ako sa postupom času vyvíja počet absolventov (graf 2). Pri tejto

premennej som zvolila iné sledované obdobie (roky 2008 -2011) z dôvodu dostupnosti údajov.

Pre moje potreby to však nebude vadiť. Zostrojila som samostatné grafy vývoja počtu

absolventov dennej aj externej formy štúdia. Pri denných študentoch v takmer všetkých krajoch

(okrem Žilinského) narástol v sledovanom období počet absolventov. V dobe krízy je investícia

do vzdelania jednou z najlepších investícií. Tiež nastavenie vysokého školstva na Slovensku

4000

8000

12000

16000

20000

24000

28000

2005 2006 2007 2008 2009

BATTTR

NRZABB

POKE

9

pomáha zvyšovať počty absolventov. Počet absolventov externého štúdia po miernom náraste

v roku 2009 postupne klesol. Rast som zaznamenala len u absolventov, ktorí ukončili svoje

externé štúdium v Bratislavskom kraji. Počas sledovaného obdobia tu narástol počet

absolventov o takmer 70% (z 6 809 z roku 2008 na 11 490 v roku 2011). Hlavne v Bratislave

mnoho študentov už počas bakalárskeho štúdia pracuje v praxi. V ďalšom stupni už títo študenti

študujú ako externisti. Druhým motívom je, že v Bratislavskom kraji je vysoká koncentrácia

úradov štátnej správy aj súkromných firiem, ktorých zamestnanci sa snažia dodatočne získať

vysokoškolský stupeň vzdelania a nastupujú na externé štúdium.

Graf 2: Vývoj počtu denných a externých absolventov vysokých škôl v jednotlivých krajoch

v rokoch 2008- 2011


Pri sledovaní časového radu percentuálnej miery nezamestnanosti v jednotlivých krajoch

sme sa zamerali na roky 2005-2009. Miera evidovanej nezamestnanosti v percentuálnom

vyjadrení dosahovala najvyššie hodnoty vo všetkých krajoch v roku 2005 a potom postupne

klesala. Je to spôsobené hlavne príchodom investorov do oblastí s vyššou mierou

nezamestnanosti (v roku 2005 boli prijaté pravidlá individuálnej štátnej pomoci investorom)

a ponukou lacnejšej pracovnej sily. Len pre zaujímavosť, v roku 2008 prišlo na Slovensko 34

investorov. Kým v roku 2005 bola až v troch krajoch miera nezamestnanosti nad 20%, v roku

2008 takúto mieru nezamestnanosti nedosahoval žiadny z krajov. Tento pozitívny trend

zabrzdila v roku 2009 hospodárska kríza, ktorá spôsobila ukončenie činnosti niektorých

podnikov či zníženie ich výroby, ktoré bolo spojené aj so znižovaní pracovnej sily.

0

2000

4000

6000

8000

10000

12000

14000

16000

2008 2009 2010 2011

BA_DENNETT_DENNETR_DENNE

NR_DENNEZA_DENNEBB_DENNE

PO_DENNEKE_DENNE

0

2000

4000

6000

8000

10000

12000

2008 2009 2010 2011

BA_EXTERNETT_EXTERNETR_EXTERNENR_EXTERNE

ZA_EXTERNEBB_EXTERNEPO_EXTERNEKE_EXTERNE

10

Najvyšší pokles nezamestnanosti zaznamenal košický kraj, v ktorom sa počas sledovaného

obdobia znížila miera nezamestnanosti o viac ako 37 percentuálnych bodov. Východné regióny

sú pre investorov lákavé vďaka blízkosti viac ako 200-tisícovej metropoly – Košíc. Pozitívom je aj

výhodná poloha neďaleko hraníc a Poľskom, Maďarskom aj Ukrajinou a vybudovaná

infraštruktúra. Vďaka tomuto poklesu sa na prvé miesto v úrovni nezamestnanosti dostal

Banskobystrický kraj, ktorý dosahoval v roku 2009 mieru nezamestnanosti na úrovni 18,8%, čím

predbehol Prešovský kraj, ktorý je druhým v poradí, o 2,6%. Najnižšia miera nezamestnanosti je

podľa očakávaní v Bratislavskom kraji, kde kolíše pomerne stabilne okolo 4% hladiny.

Graf 3: Vývoj percentuálnej miery nezamestnanosti v jednotlivých krajoch v rokoch 2005-2009


Ekonomicky aktívne obyvateľstvo sa v období rokov 2005 až 2009 v jednotlivých krajoch

výrazne nemenilo. Najvyšší počet ekonomicky aktívnych obyvateľov je v Prešovskom kraji,

naopak najnižší počet v kraji Trnavskom a Trenčianskom (graf 4). Najvyšší nárast počtu

ekonomicky aktívneho obyvateľstva som počas sledovaného obdobia zaznamenala

v Bratislavskom kraji, bol to nárast o viac ako 5% (z 330,5 tisíc obyvateľov na 348,2 tisíc). Treba

podotknúť, že počet ekonomicky aktívnych obyvateľov úzko súvisí s celkovou populáciou

v danom kraji. Tento ukazovateľ je v čase ešte stabilnejší. Pokiaľ sa v danom období nevyskytne

nejaká závažná udalosť (prírodná katastrofa, epidémia apod.), populácia sa výrazne nemení.

Krajom s najvyššou populáciou je Prešovský kraj nasledovaný krajom Košickým. Kým Prešovský

kraj už v roku 2006 presiahol 800 tisíc obyvateľov, Košický kraj sa k tejto hodnote iba blíži.

0

4

8

12

16

20

24

28

2005 2006 2007 2008 2009

BATTTR

NRZABB

POKE

11

Najmenej obyvateľov má kraj Trnavský, aj keď tu počet obyvateľov vzrástol za 4 roky o viac ako

7 tisíc obyvateľov. Najvyšší vzostup počtu obyvateľov však nastal v Bratislavskom kraji, tu

vzrástla populácia o 3,15%, z 603 699 obyvateľov v roku 2005 na 622 706 v roku 2009.

Graf 4: Vývoj počtu ekonomicky aktívneho obyvateľstva (v tisícoch) a populácie v jednotlivých

krajoch v rokoch 2005- 2009


Posledné dva grafy (graf 5) vývoja v časovom období 2005 až 2009 budú patriť

národnostným menšinám – maďarskej a rómskej. Maďarská menšina je najviac zastúpená podľa

očakávania v Nitrianskom a Trnavskom kraji, čo má opodstatnenie v histórií. Naopak minimálne

množstvo maďarských občanov je v dvoch krajoch, ktoré nehraničia s Maďarskom – Prešovský

a Žilinský kraj. Vývoj počtu občanov tejto národnosti sa v sledovanom období menil len

minimálne. Rómska menšina má najvyššie zastúpenie vo východných regiónoch Slovenska –

Košickom, Prešovskom a Banskobystrickom kraji. Kým v západných krajoch sa počet Rómov drží

na konštantnej úrovni, ich celkový počet stúpa. Za 4 roky sledovaného obdobia vzrástol počet

Rómov o viac ako 7,5 tisíc, t.j. o 7,65%. Najvyšší nárast bol zaznamenaný v Košickom kraji, kde

počet rómskych obyvateľov stúpol o viac ako 12%. V Prešovskom kraji bol tento nárast

miernejší, len 9,46%-ný. V ostatných krajoch bola zmena počtu rómskeho obyvateľstva

minimálna.

280

300

320

340

360

380

400

2005 2006 2007 2008 2009

BATTTR

NRZABB

POKE

Ekonomická aktivita obyvatelstva

550000

600000

650000

700000

750000

800000

850000

2005 2006 2007 2008 2009

BATTTR

NRZABB

POKE

Populacia

12

Graf 5: Vývoj počtu maďarskej a rómskej národnostnej menšiny v jednotlivých krajoch v rokoch

2005- 2009


2.2 Deskriptívna štatistika, testy normality a histogramy

V ďalšej časti tejto práci najskôr priblížim výsledky deskriptívnej štatistiky premenných,

ktoré som získala ako výstup v Eviews a sú uvedené v tabuľke 1. U vysvetľovanej premenné

trestné činy sa hodnoty pohybovali v intervale 8 501; 24 003. Získala som priemernú hodnotu

12 934,25, teda v prieme je v každom kraji za rok zaevidovaných takmer 13 tisíc trestných činov.

Stredná hodnota je o čosi nižšia, štyri kraje dosahujú počet zaevidovaných kriminálnych činov

nižší ako 11 360. Už vďaka poznatku, že medián je výrazne nižší ako priemer, môže odhadnúť

pozitívne zošikmenie. Tento dohad sa potvrdil, koeficient šikmosti je kladný a teda odľahlé

hodnoty sa nachádzajú vpravo. Koeficient špicatosti je tiež kladné číslo a väčšina hodnôt sa

nachádza blízko mediánu. Variabilitu teda ovplyvňujú odľahlé hodnoty. To, či je uvedené

odchýlky výrazné a či je rozdelenie ešte normálne určím pomocou Jarueovho-Berovho testu

normality. Nulová hypotéza predpokladá, že premenná je normálne rozdelená. Keďže táto

premenná dosahuje p-hodnotu vyššiu ako všetky bežné hladiny významnosti, môžeme povedať

že má normálne rozdelenie.

0

40000

80000

120000

160000

200000

2005 2006 2007 2008 2009

BATTTR

NRZABB

POKE

Madari

0

10000

20000

30000

40000

2005 2006 2007 2008 2009

BATTTR

NRZABB

POKE

Romovia

13

Tabuľka 1: Deskriptívna štatistika jednotlivých premenných


Vysvetľujúca premenná absolventi má zo všetkých premenných najvyššiu špicatosť (je

najviac leptokurtická) a tiež dosahuje najavšiu asymetriu pri hodnote zošikmenia, teda je najviac

pravostranne zošikmená. Šikmosť spôsobuje hlavne odľahlá hodnota – počet absolventov

v Bratislavskom kraji čo zobrazuje aj boxplot tejto premennej (graf 6). Takéto výrazné odchýlky

od hodnôt normálneho rozdelenia sa musia prejaviť pri teste normality. p-hodnota na úrovni

0,053 udáva, že na 10% hladine významnosti zamietame nulovú hypotézu (premenná teda

nemá normálne rozdelenie) a na 5% hladine významnosti ju len veľmi tesne potvrdzujeme.

Graf 6: Boxplot premennej počet absolventov


TR_CINY ABSOLVENTIEKON_AKT_

OBYV

NEZAMESTN

ANOSTMADARI ROMOVIA POPULACIA

Mean 12934.25 8799.750 336.2625 11.90000 64220.38 13210.13 678115.6

Median 11360.00 7486.500 340.7000 11.80000 52400.00 3958.000 675344.0

Maximum 24003.00 22040.00 383.4000 18.80000 190741.0 38859.00 807011.0

Minimum 8501.000 3649.000 294.9000 4.700000 642.0000 750.0000 561525.0

Std. Dev. 4877.086 5639.325 30.40639 4.822566 70164.95 16283.09 85573.72

Skewness 1.602172 1.809682 0.011607 -0.052736 0.670150 0.922650 0.221318

Kurtosis 4.488162 5.105990 1.905159 1.804258 2.197718 2.060791 1.857546

Jarque-Bera 4.160817 5.844997 0.399739 0.480308 0.813354 1.429082 0.500376

Probability 0.124879 0.053799 0.818838 0.786507 0.665859 0.489417 0.778654

Sum 103474.0 70398.00 2690.100 95.20000 513763.0 105681.0 5424925.

Sum Sq. Dev. 1.67E+08 2.23E+08 6471.839 162.8000 3.45E+10 1.86E+09 5.13E+10

Observations 8 8 8 8 8 8 8

0

4000

8000

12000

16000

20000

24000

ABSOLVENTI

Bratislavský kraj

14

Pri ostatných sledovaných exogénnych premenných môžem povedať, že odchýlky od

nulovej hodnoty šikmosti a špicatosti nie sú tak výrazne. Pri týchto premenných po otestovaní

Jarqueovim-Berovim testom potvrdzujeme vďaka vysokým p-hodnotám normalitu na všetkých

bežných hladinách významnosti. Histogramy všetkých premenných sú v prílohe 1. Po grafickom

preskúmaní by som však normalitu vylúčila na viacerých premenných. Preto ich ešte v programe

SPSS pomocou Shapirovho-Wilkovho testu (tabuľka 2), ktorý je viac vhodný pre menšie výbery,

ako mám ja. Hypotézy sú stanovené rovnako ako pri Jarqueovom-Berovom teste. P-hodnotu

zobrazuje Sig. Podľa tohto testu by som za normálne rozdelené určila na 10% a 5% hladine

významnosti nezamestnanosť, ekonomicky aktívne obyvateľstvo, počet maďarských občanov

žijúcich v regióne a celkovú populáciu regiónu. Naopak, na 5% a 10% hladine významnosti,

premenné trestné činy, počet absolventov a počet Rómov v regióne nebudú podľa výsledkov

tohto testu normálne rozdelené. Tento test má veľkú silu a je vhodný pre malé súbory dát,

preto jeho výsledky budem brať za smerodajné.

Tabuľka 2: Shapirov-Wilkov test normality pre jednotlivé premenné

Zdroj: Výstup z SPSS

Rozličné premenné dosahujú rozdielnu úroveň variability. Pre možnosť porovnania som

dopočítala zo získaných údajov variačné koeficienty jednotlivých premenných (graf 7). Najvyššia

variabilita je dosiahnutá práve u oboch premenných národnostných menšín. Tento výsledok

potvrdzuje fakt, že národnostné menšiny sú na Slovensku rozdelené nerovnomerne a obývajú

len určité kraje.

15

Graf 7: Variačné koeficienty jednotlivých premenných

Zdroj: Vlastné spracovanie podľa údajov z Eviews

2.3 Korelačná matica premenných

Na pochopenie vzájomných závislostí medzi jednotlivými slúži korelačná matica (tabuľka

3). Premenná trestné činy má silnú priamu lineárnu závislosť (0,924) s premennou absolventi.

Pokiaľ by stúpol počet absolventov VŠ, mal by stúpnuť aj počet vysokých škôl. Takýto záver som

neočakávala. Skôr som sa domnievala, že závislosť medzi týmito dvoma premennými bude

nepriama. Ostatné premenné majú s premennou trestné činy slabú priamu či nepriamu

lineárnu závislosť, dokonca premenné Rómovia a populácia sú s touto premennou takmer

lineárne nezávislé (hodnoty veľmi blízko 0). Ďalej ma zaujíma korelačný koeficient medzi

premennou absolventi a nezamestnanosť. Predpokladám, že s počtom absolventov bude

nezamestnanosť klesať, teda tento koeficient by mal byť záporný. Táto domnienka sa naplnila,

medzi premennými je stredne silná nepriama lineárna závislosť (r = 0,503). Zaujímavý je aj

korelačný koeficient medzi Rómami a mierou nezamestnanosti, ktorý dosahuje hodnotu 0,713.

Jedná sa o stredne silnú až silnú priamu lineárnu závislosť, teda potvrdzujem svoj predpoklad,

že rómsky občania majú problém sa zamestnať. U maďarských občanov táto závislosť nie je až

taká silná (r = 0,206). Poslednou rozobranou dvojicou premenných bude populácia a Rómovia.

Silná priama lineárna závislosť medzi touto dvojicou naznačuje, že so zvýšením počtu rómskeho

obyvateľstva sa zvýši aj celková populácia v danom regióne. U maďarských občanov vidíme

opačný vývoj – slabú nepriamu lineárnu závislosť.

Tabuľka 3: Korelačná matica jednotlivých premenných


TR_CINY ABSOLVENTIEKON_AKT_

OBYV

NEZAMESTN

ANOSTMADARI ROMOVIA POPULACIA

VK 0,377067553 0,640850592 0,090424564 0,405257647 1,092565164 1,232621481 0,12619341

TR_CINY ABSOLVENTI EKON_AKT_OBYV NEZAMESTNANOST MADARI ROMOVIA POPULACIA

TR_CINY 1.000000 0.924385 0.316986 -0.295432 -0.181380 -0.036664 -0.035640ABSOLVENTI 0.924385 1.000000 0.236315 -0.502759 0.027237 -0.299046 -0.189469

EKON_AKT_OBYV 0.316986 0.236315 1.000000 0.379684 -0.057883 0.677284 0.880229

NEZAMESTNANOST -0.295432 -0.502759 0.379684 1.000000 0.206133 0.713296 0.635455MADARI -0.181380 0.027237 -0.057883 0.206133 1.000000 -0.111571 -0.116343

ROMOVIA -0.036664 -0.299046 0.677284 0.713296 -0.111571 1.000000 0.826574

POPULACIA -0.035640 -0.189469 0.880229 0.635455 -0.116343 0.826574 1.000000

16

Korelácie medzi jednotlivými premennými môžem vyjadriť okrem korelačnej matice aj

pomocou scatterplotov (graf 8). Na diagonále vidíme, že body sú zoradené do priamky ktorá

stúpa v 45 stupňovom uhle, čo svedčí i úplnej priamej lineárnej závislosti. Scatterploty

ostatných dvojíc zobrazujú silu a smer závislosti medzi premennými rovnako ako korelačná

matica.

Graf 8: Scatterploty medzi jednotlivými premennými


17

3 Ekonometrický model

Pokiaľ som si zostrojila ekonomický model, je vhodné ho overiť pomocou rôznych

štatistickým metód. Je vhodné otestovať štatistickú významnosť jednotlivých vysvetľujúcich

premenných, rovnako aj modelu ako celku.

3.1 Prvotný model

Prvotný regresný model som zostrojila so zahrnutím všetkých vysvetľujúcich premenných

pomocou metódy najmenších štvorcov v softvéri Eviews. Výstupom je tabuľka 4. Najskôr

vyhodnotím štatistickú významnosť jednotlivých vysvetľujúcich premenných pomocou t-testu.

Pri tomto teste je nulová hypotéza stanovená tak, že premenná nie je štatisticky významná.

Premenné s p-hodnotami nižšími ako zvolená hladina významnosti (ja som zvolila 5% hladinu

významnosti) budú spadať do oblasti alternatívnej hypotézy a budú štatisticky významné. Pri

tomto modely nie je štatisticky významný ani jeden parameter (okrem lokujúcej konštanty) na

všetkých bežných hladinách významnosti. Preto v druhotnom modeli vylúčim premennú

s najvyššou p-hodnotou – populáciu a zostrojím model bez nej. Tento model by na 5% hladine

významnosti nebol významný ani ako celok. Toto stanovujem vďaka p-hodnote pri F-teste, ktorý

skúma štatistickú významnosť modelu ako celku. Hypotézy sú stanovené rovnako ako pri t-

teste, potrebujem teda zostrojiť model s nižšou p-hodnotou F-testu.

Tabuľka 4: Výstup lineárnej regresie pri zahnutí všetkých vysvetľujúcich premenných

Dependent Variable: TR_CINY

Method: Least Squares

Date: 01/04/13 Time: 14:20

Sample: 1 8

Included observations: 8

Variable Coefficient Std. Error t-Statistic Prob.

ABSOLVENTI 1.098381 0.057774 19.01161 0.0335

NEZAMESTNANOST 244.5157 61.19073 3.995959 0.1561

EKON_AKT_OBYV -66.24154 22.82403 -2.902272 0.2112

POPULACIA 0.006624 0.008508 0.778588 0.5788

MADARI -0.016657 0.002641 -6.307106 0.1001

ROMOVIA 0.098116 0.019649 4.993301 0.1258

C 17915.34 2893.843 6.190850 0.1020

R-squared 0.998985 Mean dependent var 12934.25

18

Adjusted R-squared 0.992898 S.D. dependent var 4877.086

S.E. of regression 411.0177 Akaike info criterion 14.54571

Sum squared resid 168935.6 Schwarz criterion 14.61522

Log likelihood -51.18283 F-statistic 164.0989

Durbin-Watson stat 2.825697 Prob(F-statistic) 0.059684


3.2 Druhotný model

Ako som spomínala vyššie, v druhotnom modeli som vylúčila zo vysvetľujúcich

premenných populáciu, ktorá dosahovala pri t-teste najvyššiu p-hodnotu. Vidím z výstupu

(tabuľka 5), že tento krok znížil p-hodnotu všetkých ostatných exogénnych veličín pod 5%

hladinu významnosti, teda tieto premenné sú štatisticky významné. Aj p-hodnota F-testu klesla

na hodnotu 0,004, teda model je na 5% hladine významnosti (aj na 1%) významný ako celok.

Tabuľka 5: Výstup lineárnej regresie bez zahrnutia premennej populácia

Dependent Variable: TR_CINY

Method: Least Squares

Date: 01/04/13 Time: 14:21

Sample: 1 8

Included observations: 8

Variable Coefficient Std. Error t-Statistic Prob.

ABSOLVENTI 1.066693 0.036747 29.02789 0.0012

NEZAMESTNANOST 261.0130 51.44402 5.073729 0.0367

EKON_AKT_OBYV -49.89148 8.013085 -6.226251 0.0248

MADARI -0.017326 0.002238 -7.740051 0.0163

ROMOVIA 0.099123 0.017571 5.641384 0.0300

C 17021.42 2380.494 7.150371 0.0190

R-squared 0.998370 Mean dependent var 12934.25

Adjusted R-squared 0.994296 S.D. dependent var 4877.086

S.E. of regression 368.3369 Akaike info criterion 14.76958

Sum squared resid 271344.2 Schwarz criterion 14.82916

Log likelihood -53.07832 F-statistic 245.0474

Durbin-Watson stat 2.647980 Prob(F-statistic) 0.004069


Ďalším dôležitým ukazovateľom teraz už štatisticky významného modelu je R-squared

(koeficient determinácie) a Adjusted R-squred (korigovaný koeficient determinácie). Oba tieto

19

ukazovatele nadobúdajú hodnotu viac ako 0,99. Môžem to interpretovať tak, že pokiaľ sa zmení

vysvetľovaná premenná, viac ako 99% jej zmeny budem môcť vysvetliť zmenami vysvetľujúcich

premenných.

Druhotný model bude modelom finálnym a bude mať tvar:

TR_CINY = 17 021,42 + 1,067*ABSOLVENTI + 261,013*NEZAMESTNANOST -

- 49,891*EKON_AKT_OBYV - 0,017*MADARI + 0,099*ROMOVIA

Tento model ukazuje, aký vplyv majú jednotlivé vysvetľujúce premenné na počet trestných

činov v jednotlivých regiónoch. Získané koeficienty je možné vysvetliť nasledovne:

ABSOLVENTI – pokiaľ by v danom regióne vzrástol v priemere počet absolventov vysokých

škôl o 1 000, vzrástol by aj počet evidovaných trestných činov o 1 067, ceteris paribus

NEZAMESTNANOSŤ – ak v regióne poklesne miera nezamestnanosti priemerne o 1%, zníži

sa počet kriminálnych činov priemerne o 261 pri konštantnej hodnote ostatných

premenných

EKON_AKT_OBYV – s rastom ekonomicky aktívneho obyvateľstva priemerne o 1 000 ľudí

poklesne počet trestných činov v priemere o takmer 50, ceteris paribus

MADARI – v prípade, že v regióne by sa zvýšil počet Maďarov v priemere o 1 000, poklesla

by kriminalita v priemere o 17 trestných činov, ak by sa ostatné premenné nezmenili

ROMOVIA – po nasťahovaní sa priemerne 1 000 Rómov do regiónu by nastal vzostup

kriminality o priemerne 99 kriminálnych činov, ceteris paribus

Teraz mám možnosť porovnať mnou odhadnuté znamienka regresných koeficientov

s reálne získanými hodnotami. Môj úsudok bol mylný hneď pri prvej exogénnej premennej.

Očakávala som, že so zvýšenou úrovňou vzdelaných ľudí sa bude počet trestných činov znižovať.

Opak je pravdou, zvyšovanie počtu absolventov vysokých škôl zvyšuje aj počet evidovaných

kriminálnych činov. Možno je to len zhoda okolností alebo vysokoškolský titul nezaručuje

morálne hodnoty jeho držiteľa a ich dodržiavanie.

Pri percentuálnej miere nezamestnanosti som očakávala kladný regresný koeficient.

Domnievala som sa, že pokiaľ je v regióne vysoká miera nezamestnanosti, rozširuje sa chudoba

a ľudia sa viac uchyľujú k trestnej činnosti. Tento odhad bol správny, regresný koeficient tejto

premennej je kladný.

20

Môj úsudok bol správny aj pri odhade znamienka regresného koeficientu premennej

ekonomicky aktívne obyvateľstvo. Očakávala som záporný regresný koeficient a nepriamu

úmernosť so vysvetľovanou premennou, čo som zdôvodnila tým, že pracujúci obyvatelia a ľudia

aktívne si hľadajúci prácu sa snažia zmeniť svoju situáciu a zabezpečiť rodiny legálnou cestou

a vyhýbajú sa trestnej činnosti.

U oboch premenných týkajúcich sa národnostných menšín som očakávala kladný regresný

koeficient, aj keď u maďarskej menšiny to bol len hrubý odhad. Čo sa týka rómskeho

obyvateľstva, regresný koeficient má očakávanú kladnú hodnotu. Potvrdil sa teda môj odhad, že

títo občania sú hlavne kvôli pretrvávajúcej chudobe a vysokej nezamestnanosti viac náchylní na

konanie trestnej činnosti. U obyvateľov s maďarskou národnosťou je výsledok odlišný. Záporný

regresný koeficient hovorí o tom, že zvýšenie počtu maďarských občanov v regiónoch by znížilo

kriminalitu. Tento výsledok považujem len za zhodu okolností a pripisujem ho nedokonalosti

modelu, ktorá pramení z nízkeho počtu pozorovaní (malého množstva krajov). Aj keď sa môj

odhad nepotvrdil, tento ukazovateľ je štatisticky významný a v modeli si ho ponechám.

V grafe 9 je ukázané, aké boli empirické hodnoty pre jednotlivé kraje. Je vidieť, že

teoretické hodnoty získané zo zostaveného regresného modelu takmer úplne prekrývajú tieto

hodnoty. Model teda dokáže spoľahlivo odhadnúť endogénnu premennú vtedy, pokiaľ by boli

dostupné len exogénne premenné. Tiež sú tu zobrazené aj rezíduá modelu pre každý z krajov.

Graf 9: Empirické, teoretické hodnoty a rezíduá modelu


-400

-200

0

200

4008000

12000

16000

20000

24000

28000

1 2 3 4 5 6 7 8

Residual Actual Fitted

21

4 Ekonometrická verifikácia modelu

Stanovený model prešiel už ekonomickou aj štatistickou verifikáciou. Posledný krokom je

ekonometrické overenie. Budem sa snažiť potvrdiť, že v danom modeli sa nevyskytujú

ekonometrické problémy (multikolinearity, heteroskedasticity, autokorelácie a pod.). Pokiaľ by

sa takéto problémy vyskytli, bude nutné ich vhodnými metódami odstrániť.

4.1 Testovanie normality OLS-reziduí

Normalitu jednotlivých premenných som už testovala v predchádzajúcej časti práce

pomocou Jarqueovho-Berovho testu a Sharipovho-WIlkovho testu. Na otestovanie normality

rozdelenia regresného modelu využijem opäť Jarqueov-Berov test. Testovať budem rezíduá.

Program Eviews rezíduá vypočíta aj otestuje a výstupom bude graf 10. Pre správne

vyhodnotenie výstupu je potrebné zadefinovať si nulovú aj alternatívnu hypotézu. Nulová

hypotéza predpokladá, že rezíduá majú normálne rozdelenie (H0: iN(0,2)). Alternatívna

hypotéza je stanovená ako non H0 a teda rezíduá nie sú rozdelené normálne. Vo výstupe ma

okrem grafu zaujíma aj p-hodnota spomínaného testu (probability). Jej vysoká hodnota hovorí

o tom, že na všetkých bežných hladinách významnosti nulovú hypotézu nezamietam, rezíduá

majú normálne rozdelenie.

Graf 10: Histogram reziduí regresného modelu


0.0

0.4

0.8

1.2

1.6

2.0

2.4

-400 -300 -200 -100 0 100 200 300

Series: ResidualsSample 1 8Observations 8

Mean 1.82e-12Median 17.71946Maximum 260.2897Minimum -344.8653Std. Dev. 196.8844Skewness -0.421405Kurtosis 2.244720

Jarque-Bera 0.426925Probability 0.807782

22

4.2 Testovanie heteroskedasticity

„Podmienka klasického lineárneho regresného modelu v sebe zahŕňa predovšetkým

požiadavku na konečný a konštantný rozptyl náhodných zložiek, a tiež i rezíduí modelu, ktorú

označujeme ako homoskedasticitu.“ (HUŠEK, 1999, s. 74) Regresný model spĺňať musí teda

spĺňať predpoklad homoskedasticity, resp. neprítomnosť heteroskedasticity. Keďže sa jedná

o malý súbor s pomerne veľkým množstvom exogénnych premenných, nebudem môcť vykonať

niektoré z testov na odhalenie heteroskedasticity premenných. Sú však aj testy, ktorými môžem

otestovať aj tento súbor. Všetky nasledujúce testy som robila v programe MS Excel.

Prvým testom, ktorý som previedla, je Breuschov-Paganov test. V tomto teste bolo

potrebné najskôr získať výstup z regresie. V ANOVE zistím sumu štvorcov rezíduí Residual SS =

271 344,2. Túto hodnotu vydelím počtom pozorovaní, t.j. 8 a dostanem hodnotu 2 =

33 918,02. V nasledujúcom kroku je potrebné vykonať pomocnú regresiu. Tá sa od pôvodnej líši

len v tom, že ako výstupnú premennú určím štvorce rezíduí. Opäť sa pozriem do ANOVI, kde ma

bude zaujímať hodnota Regression SS, ktorá prestavuje vysvetľovanú sumu štvorcov a rovná sa

9 580 076 311,6. Ďalej si zadefinujem hypotézy:

H0: 2 = 3 = 4 = ... = r (homoskedasticita)

H1: aspoň jedno j ≠ 0

Testovacia štatistika, ktorú získam bude mať chí-kvadrát rozdelenie s r – 1 stupňami voľnosti,

pričom r predstavuje stupeň pomocných nezávislých premenných v pomocnej regresií (spolu

s lokujúcou konštantou). Hodnota testovacej štatistiky dostaneme ako TŠ = VSŠ / (2 * 4). Pokiaľ

získanú hodnotu porovnám s kritickou hodnotou (tabuľka 6), môžem potvrdiť, že na 5% hladine

významnosti nulovú hypotézu nezamietam. Podľa p-hodnoty H0 nezamietam na žiadnej

z bežných hladín významnosti. Tento výsledok hovorí o tom, že model nie je zasiahnutý

heteroskedasticitou.

Tabuľka 6: Testovacia štatistika, kritická a p-hodnota pri Breuschovom-Paganovom test

testovacia štatistika 4,1637

kritická hodnota 0,05 11,0705

p-hodnota 0,5261

Zdroj: Vlastné spracovanie

23

Tento test síce heteroskedasticitu nepreukázal, ja sa však toto tvrdenie pokúsim overiť

ešte aj Glejserovým testom. Tento test je vhodnejší pre menšie súbory. Budem postupovať tak,

že najskôr pre každú z piatich exogénnych premenných vytvorím samostatný regresný model,

do ktorého ostatné premenné nezahrniem. Súčasťou regresie budú aj zobrazenie rezíduí. Z tých

si urobím absolútnu hodnotu. Vytvorím ďalší regresný model (pomocnú regresiu), kde

vysvetľovanou premennou bude spomínaná absolútna hodnota rezíduí a vysvetľujúcou

premennou pôvodná premenná. Vo výstupe z pomocnej regresie ma bude zaujímať p-hodnota

vysvetľujúcej premennej. Pokiaľ daná premenná spôsobuje na danej hladine významnosti

heteroskedasticitu, očakávam p-hodnotu nižšia ako hladina významnosti. Pokiaľ je p-hodnota

väčšia, parameter je v pomocnej regresií štatisticky nevýznamný a prijímame nulovú hypotézu,

že parameter nespôsobuje v modeli heteroskedasticitu (H1: parameter spôsobuje

heteroskedasticitu). Pre jednotlivé premenné mi vyšli p-hodnoty zobrazené v tabuľke 7. Na 5%

hladine významnosti zamietame H0 len pri premennej nezamestnanosť. Je tu predpoklad, že

táto premenná spôsobuje hetereskodesticitu v modeli. Pokiaľ by bola hladina významnosti

stanovená na 1%, nulovú hypotézu by sme nezamietali vôbec na žiadnej premennej.

Tabuľka 7: p-hodnoty vysvetľujúcich premenných v pomocnej regresií pri Glejserovom teste

premenná p-hodnota

absolventi 0,707827087

nezamestnanost 0,019839688

ekon_akt_obyv 0,47948921

madari 0,281490045

romovia 0,233390778


V prvom teste vyšlo, že model nie je zaťažený problémom heteroskedasticity. Tento

model to však nepotvrdil. Preto bude vhodné vykonať ešte jeden test pre parameter

nezamestnanosť. Bude ním test trendu rezíduí založený na Spearmanovom korelačnom

koeficiente. Postup je rovnaký ako pri Glejserovom teste až po vypočítanie absolútnych hodnôt

rezíduí. Ďalší postup bude odlišný. Pre každé rezíduum v absolútnej hodnote sa určí celkové

poradie zo všetkých rezíduí. Rovnako sa určí aj poradie hodnôt regresora nezamestnanosť.

Vypočíta sa štvorec rozdielov týchto poradí a spraví sa jeho súčet, v tomto prípade Σdi2 = 140.

V ďalšom kroku spočítam Spearmanov korelačný koeficient

24

ρ� = 1 −�∗��

�

�(��) = 1 −

�∗��

�(��) = -0,667

Významnosť tohto koeficienta určíme pomocou otestujeme na 5% hladine významnosti

pomocou testovacej štatistiky � = ρ��

�� , ktorá má studentovo t-rozdelenie s n-2 stupňami

voľnosti. Nulová hypotéza je zadaná tak, že nepredpokladá koreláciu medzi rezíduami

a hodnotami premennej, t.j. H0 predpokladá homoskedasticitu testovanej premennej. Vyčíslené

výsledky tohto testu zobrazuje tabuľka 8. p-hodnota vyššia ako bežné hladiny významnosti

a testovacia štatistika nižšia ako kritická hodnota (na 5% hladine významnosti) stanovujú, že

nulovú hypotézu nezamietame a teda sa pri premennej nezamestnanosť nepotvrdil výskyt

heteroskedasticity.

Tabuľka 8: Spearmanov koeficient, testovacia štatistika, kritická a p-hodnota pri teste trendu

rezíduí založenom na Spearmanovom korel. koeficiente u premennej nezamestnanosť

Spearmanov koeficient -0,66667

testovacia štatistika 0,05 1,264911

kritická hodnota 2,446912

p-hodnota 0,25281


Na potvrdenie tohto záveru poslúži aj graf závislosti rezíduí modelu a premennej

nezamestnanosť (graf 11). Z neho je zrejmé, že medzi týmito premennými nie je žiadna závislosť

a rezíduá sú rozdelené náhodne a nezávisle.

Graf 11: Graf závislostí rezíduí modelu a nezamestnanosti


4

6

8

10

12

14

16

18

20

-400 -300 -200 -100 0 100 200 300

RESID

NE

ZA

ME

ST

NA

NO

ST

25

4.3 Testovanie autokorelácie

Ďalší z ekonometrických problémom, ktorý sa môže vyskytnúť a spôsobuje nedodržanie

predpokladov lineárneho regresného modelu je autokorelácia. Znamená to, že jednotlivé

náhodné chyby sú navzájom korelované, teda sú ovplyvňované náhodnými chybami iných

pozorovaní.

V tomto sledovanom súbore nie je možné prvý test použiť z dôvodu, že skúmaný model

neobsahuje „dostatočný“ počet pozorovaní (min.15), teda nepoznám tabelované hodnoty

dolnej a hornej hranice, medzi ktorými sa určite bude nachádzať hľadaná kritická hodnota.

Preto využijem Breuscherov-Godfreyov test. Tento test vykonám pomocou programu Eviews.

Nulová hypotéza zamieta výskyt autokorelácie, naopak alternatívna ju potvrdzuje. Je možné

použiť dva druhy testovacích štatistík - buď klasický Fisherov test alebo chí-kvadrát test, ako

špeciálny prípad LM (Lagrange multiplier) testu. Vďaka p-hodnote Fisherovho testu (0,2947)

neprítomnosť autokorelácie potvrdzujem na všetkých bežných hladinách významnosti. Naopak

chí-kvadrát test potvrdzuje prítomnosť autokorelácie, bude pre to potrebné urobiť viacero

testov. Výsledok je zobrazený v tabuľke 9.

Tabuľka 9: Výstup Breuschovho-Godfreyovho testu

Breusch-Godfrey Serial Correlation LM Test: F-statistic 4.015533 Prob. F(1,1) 0.2947

Obs*R-squared 6.404955 Prob. Chi-Square(1) 0.0114


Zistený záver potvrdím aj t-testom urobeným v MS Exceli a výpočtom Von Neumannovho

pomeru. Pri t-teste si najskôr vytvorím tabuľku rezíduí, ktorá je zobrazená v tabuľke 10.

Pomocou vzorca dostanem hodnotu autokorelačného koeficientu �� =∑��∗��

∑�� = −0,368. Pre

získanie testovacej štatistiky dosadím získanú hodnotu do t-testu � = �� ∗√��

√��= −0,445,

pričom n predstavuje počet pozorovaní už po posune. Hypotézy budú stanovené tak, že H0

predpokladá vzájomnú koreláciu medzi rezíduami a alternatívna hypotéza ju vyvracia. Na 5%

hladine významnosti dosiahnem kritickú hodnotu 4,303 a nulovú hypotézu nezamietam,

autokorelácia rezíduí nie je štatisticky významná.

26

Tabuľka 10: Získané rezíduá a ich súčiny

Observation Predicted tr_ciny Residuals Standard Residuals ei*ei-1 ei^2

1 23990,28556 12,71443619 0,064578189 x 161,6568877

2 10253,86531 -344,8653113 -1,751613424 -4384,767996 118932,083

3 8240,710271 260,2897289 1,322043616 -89764,89839 67750,74297

4 10060,83559 156,1644093 0,793178283 40647,99176 24387,32273

5 11594,48265 -100,4826468 -0,510363749 -15691,81319 10096,76232

6 13679,27552 22,72447581 0,115420414 -2283,415478 516,401801

7 11386,5586 -160,5586016 -0,815496928 -3648,610059 25779,06455

8 14267,98649 154,0135096 0,782253599 -24728,19372 23720,16113

-99853,70707 271182,5384

Zdroj: Vlastné spracovanie podľa výstupu z MS Excel

Ďalším testom na detekciu prítomnosti problému autokorelácie je Von Neumannov

pomer. Jeho výpočet prebieha na základe údajov Durbinovho-Watsonovho testu. Hodnota

tohto testu sa nachádza v tabuľke 5 a je 2,648. Von Neumannov pomer vypočítame ako

� =�

��∗ � = 3,026. Ďalším krokom je vyhľadanie dolnej (D+ = 1,1228) a hornej (D- = 3,4486)

hranice v tabuľke kritických hodnôt rozdelenia D pre príslušnú hladinu významnosti. Pokiaľ

hodnota Von Neumannovho pomeru leží v intervale dolnej a hornej hranice, autokorelácia je

nevýznamná na danej hladine významnosti. Môžem teda povedať, že ani tento test prítomnosť

autokorelácie na 5% hladine významnosti nepotvrdil.

4.4 Testovanie multikolinearity

Pri zisťovaní multikolinearity v tomto súbore je potrebné najskôr preskúmať koreláciu

medzi vysvetľujúcimi premennými. Vytvorím si korelačnú maticu v MS Exceli (tabuľka 11).

Budem sa snažiť vyhodnotiť prítomnosť multikolinearity pomocou orientačných kritérií.

V korelačnej matici je najsilnejšia závislosť medzi premennými Rómovia a miera

nezamestnanosti. Koeficient korelácie dosahuje však len hodnotu 0,713 a je menší ako hodnota

0,8. Už táto skutočnosť naznačuje, že v tejto dátovej množine sa multikolinearita nenachádza.

Tabuľka 11: Korelačná matica vysvetľujúcich premenných

absolventi nezamestnanost ekon_akt_obyv madari romovia

absolventi 1 -0,502758994 0,236314831 0,027236676 -0,299045946

nezamestnanost -0,502758994 1 0,379684434 0,206133027 0,713295896

ekon_akt_obyv 0,236314831 0,379684434 1 -0,057883371 0,677284262

madari 0,027236676 0,206133027 -0,057883371 1 -0,111571457

romovia -0,299045946 0,713295896 0,677284262 -0,111571457 1


27

Aby som si mohla byť úplne istá, je potrebné urobiť aj sofistikovanejší test. Rozhodla som

sa pre Farrarovu-Glauberovu metódu. V prvom kroku bolo potrebné z už zostrojenej korelačnej

matice vypočítať jej determinant. Ten má hodnotu D = 0,093. Uvádza sa, že pokiaľ je hodnota

blízko pri 0, bude sa v súbore vyskytovať multikolinearita. Získaná hodnota je síce blízko, ale nie

nejako extrémne. V ďalšom kroku vypočítam testovaciu štatistiku, ktorá bude mať chí-kvadrát

rozdelenie. Je potrebné stanoviť si hypotézy:

H0: D = 1 (v testovanom súbore nie je prítomná multikolinearita)

H1: D < 1 (v testovanom súbore je prítomná multikolinearita)

Hodnota testovacej štatistiky je 2 = 10,676. Počet stupňov voľnosti tohto rozdelenia bude k *

(k - 1) = 20, pričom k predstavuje počet nezávislých premenných. Na zamietnutie alebo

nezamietnutie nulovej hypotézy potrebujem zistiť p-hodnotu a kritickú hodnotu. Výsledky

zobrazuje tabuľka 12. Vysoká p-hodnota a testovacia štatistika pod úrovňou kritickej hodnoty

hovoria o tom, že nemôžeme zamietnuť nulovú hypotézu. Potvrdil sa môj predpoklad, že

v sledovanom súbore sa multikolinearita nevyskytuje.

Tabuľka 12: Testovacia štatistika, kritická a p-hodnota pri Farrarovej-Glauberovej metóde

testovacia štatistika 10,6758374

kritická hodnota 0,05 31,41043284

p-hodnota 0,954199734


4.5 Testovanie stability

Testy stability umožňujú rozpoznať existenciu dátových segmentov, ktorým v príslušnom

modeli zodpovedajú odlišné parametrické hodnoty. Test stability modelu je vykonám za pomoci

CUSUM testu. Na základe tohto testu EViews zostrojí graf, ktorý rozoznáva zmenu modelu v

istom okamihu. CUSUM test počíta kumulatívnu sumu rekurzívnych rezíduí. Tento test zobrazí

túto sumu s 5% hraničnou oblasťou. Ak sa kumulatívna suma nachádza mimo tejto oblasti,

naznačuje to nestabilitu parametrov rovnice. Parametre tejto rovnice nestabilné nie sú s 95%

spoľahlivosťou (graf 12). Pokiaľ by som chcela zistiť nestabilitu parametrov aj mimo vymedzenej

5% hladiny významnosti, je na to vhodný CUSUM of Squares test.

28

Graf 12: Výsledok CUSUM testu a CUSUM of Squares testu


4.6 Testovanie špecifikácie

Zaujíma ma, či zostrojený model má správnu špecifikáciu. „Obecným testom vhodným na

zisťovanie špecifikačných chýb vznikajúcich v dôsledku vynechania vysvetľujúcich premenných

alebo chybnou analytického tvaru modelu je test RESET.“ (HUŠEK, 1999 s. 61) Použijem teda

tento test na posúdenie správnej špecifikácie zostaveného modelu. V nulovej hypotéze budem

predpokladať, že model je špecifikovaný korektne, alternatívna hypotéza opačná. Vo výstupe

z Eviews budem očakávať vysoké p-hodnoty.

Výstup zobrazuje tabuľka 13. Všetky tri testovacie štatistiky dosahujú p-hodnotu oveľa

vyššiu ako bežné hladiny významnosti. Nezamietam nulovú hypotézu a model považujem za

správne a korektne špecifikovaný.

Tabuľka 13: Výstup RESET testu

Ramsey RESET Test Value df Probability

t-statistic 0.441290 1 0.7354 F-statistic 0.194737 (1, 1) 0.7354 Likelihood ratio 1.423407 1 0.2328


4.7 Posúdenie predikčnej schopnosti modelu

V tejto časti práce sa budem snažiť model otestovať. Nakoľko je skúmaný súbor malý

(obsahuje len 8 krajov), nemohla som si dovoliť vybrať z neho ešte ďalšie pozorovania, ktoré by

-6

-4

-2

0

2

4

6

7 8

CUSUM 5% Significance

0.0

0.2

0.4

0.6

0.8

1.0

1.2

1.4

1.6

7 8

CUSUM of Squares5% Significance

29

som použila na predikciu. Preto som sa rozhodla otestovať ho na dátach z nasledujúceho roka

2010. Porovnanie skutočne získaných hodnôt a hodnôt získaných po aplikácií regresného

modelu zobrazuje tabuľka 14. Rozdiely sú rôzne v závislosti od krajov. Najväčšiu odlišnosť som

zaznamenala pri Bratislavskom kraji. Predikovaná hodnota sa od tej reálne líšila takmer o 7 200

trestných činov, čo predstavuje takmer 35% podiel na skutočných hodnotách. Najpresnejšia

predikcia bola pri kraji Nitrianskom, kde rozdiel tvoril menej ako 0,5%. Pomerne vysoká

presnosť bola zaznamenaná aj Banskobystrickom kraji (rozdiel len 5,36%) a Žilinskom kraji

(rozdiel 6,10%). U ostatných krajov sa rozdiel pohyboval v intervale od 13% po 19%.

Tabuľka 14: Rozdiel medzi predikovanými a skutočnými počtami trestných činov v roku 2010

rok 2010 skutočné hodnoty

predikované hodnoty

absolútny rozdiel

percentuálny rozdiel

Bratislavský 20767 27945,30 7178,30 34,57%

Trnavský 8870 10329,95 1459,95 16,46%

Trenčiansky 7581 9017,10 1436,10 18,94%

Nitriansky 9739 9717,51 -21,49 -0,22%

Žilinský 10551 11194,11 643,11 6,10%

Banskobystrický 12316 12976,12 660,12 5,36%

Prešovský 10247 11648,72 1401,72 13,68%

Košický 13761 15558,24 1797,24 13,06% Zdroj: Vlastné spracovanie

Nemôžem povedať, že mnou zostrojený model by mal po aplikácií na rozdielne časové

obdobie uspokojivú predikčnú schopnosť. Kladiem to za následok tomu, že model bol

odhadovaný na malom súbore, nemá teda dostatočnú presnosť, hoci testy špecifikácie

nepotvrdili zlý tvar alebo špecifikáciu modelu.

30

Záver

V mojej práci som sa snažila odhadnúť lineárny regresný model a potvrdiť jeho klasické

predpoklady. Odhadovanou premennou bol počet trestných činov v jednotlivých krajoch

Slovenska. Ako regresory som v prvotnom modeli použila premenné počet absolventov,

percentuálnu mieru nezamestnanosti, ekonomicky aktívnych obyvateľov (v tisícoch osôb),

počet osôb maďarskej a rómskej menšiny žijúcich na danom území a premennú populácia.

Posledná menovaná premenná sa ukázala ako štatisticky nevýznamná pre model, preto som ju

vylúčila. Pomocou programu Eviews som vytvorila model, ktorý mal tvar tr_ciny = 17 021,42 +

+ 1,067*absolventi + 261,013*nezamestnanost - 49,891*ekon_akt_obyv - 0,017*madari +

+ 0,099*romovia.

Už v predchádzajúcich kapitolách práce som sa snažila odhadnúť, aké znamienka dosiahnu

regresné koeficienty jednotlivých exogénnych premenných. Teraz mám možnosť porovnať

mnou odhadnuté znamienka regresných koeficientov s reálne získanými hodnotami.

Pri premennej absolventi som očakávala záporné znamienko regresného koeficientu, no

tento predpoklad sa nenaplnil. Regresný koeficient bol kladný a mal hodnotu 1,067 čo hovorí

o tom, že pokiaľ by v regióne vzrástol počet absolventov vysokých škôl priemerne o 1 000,

vzrástol by aj počet evidovaných trestných činov v priemere o 1 067, pokiaľ by sa ostatné

premenné nezmenili. Možno je to len zhoda okolností alebo vysokoškolský titul nezaručuje

morálne hodnoty jeho držiteľa a ich dodržiavanie ako som sa domnievala.

U premennej nezamestnanosť nadobudol regresný koeficient hodnotu 261,013, teda ak

v regióne poklesne miera nezamestnanosti priemerne o 1%, zníži sa počet kriminálnych činov

v priemere o 261, ceteris paribus. Potvrdil sa mi úsudok, že pokiaľ je v regióne vysoká miera

nezamestnanosti, rozširuje sa chudoba a ľudia sa viac uchyľujú k trestnej činnosti. Regresný

koeficient premennej ekonomicky aktívne obyvateľstvo naopak nadobudol zápornú hodnotu -

49,891, to znamená že s rastom ekonomicky aktívneho obyvateľstva o 1 000 ľudí poklesne

počet trestných činov o priemerne 50. Pracujúci obyvatelia a ľudia aktívne si hľadajúci prácu sa

snažia zmeniť svoju situáciu a zabezpečiť rodiny legálnou cestou a vyhýbajú sa trestnej činnosti.

U premenných týkajúcich sa národnostných menším som v odhade znamienka regresného

koeficientu dosiahla polovičnú úspešnosť. Kým pri premennej Rómovia je naozaj regresný

31

koeficient kladný (0,099), premenná Maďari hod dosiahla záporný (-0,017). odhad. Čo sa týka

rómskeho obyvateľstva, regresný koeficient má očakávanú kladnú hodnotu. Potvrdil sa teda

môj odhad, že rómsky občania sú hlavne vďaka pretrvávajúcej chudobe a vysokej

nezamestnanosti viac náchylní na konanie trestnej činnosti. Po nasťahovaní sa 1 000 Rómov do

regiónu (ceteris paribus) by nastal vzostup kriminality o priemerne 99 kriminálnych činov.

U maďarských občanov sa ukázal opak.

Na otestovanie predikčných schopností modelu som použila dáta z nasledujúceho

časového obdobia (rok 2010). Model ukázal pri jednotlivých regiónoch rozdielnu schopnosť

predikcie, keď sa odchýlky predikovaných hodnôt odchyľovali od skutočne zistených hodnôt

o 0,22 až 34,57%. Nie teda možné potvrdiť jeho dobrú predikčnú schopnosť a bolo by potrebné

ho do budúcna vylepšiť.

V mojej práci som zistila, že je možné znižovať kriminalitu v jednotlivých regiónoch hlavne

ovplyvňovaním miery nezamestnanosti. Pokiaľ by sa výrazne zvýšil počet pracovných miest

a poklesla miera nezamestnanosti, dá sa predpokladať, že kriminalita by tiež výraznejšie

poklesla. Ako však dokazuje Phillipsova krivka, s poklesom miery nezamestnanosti (ceteris

paribus) prichádza rast inflácie. A je otázkou, aký vplyv by mal pokles kúpnej sily peňazí na

počet trestných činov. Korelačná matica ukázala, že silná korelácia je hlavne medzi

nezamestnanosťou a rómskym obyvateľstvom. V výsledkov tejto analýzy vyplýva, že je potrebné

riešiť otázku rómskej nezamestnanosti a tým sa snažiť znižovať kriminalitu.

Najväčšou slabinou tohto modelu je malé množstvo pozorovaní. Tento problém spôsobil,

že niektoré testy nebolo možné vykonať a musela som ich nahradiť inými. No potvrdila som

všetky klasické predpoklady lineárneho regresného modelu. Do budúcna by bolo vhodné model

rozpracovať na regionálnych dáta (okresných) a získané výsledky potvrdiť.

32

Bibliografia

Prednášky a cvičenia doc. Vladimíra Úradníčka z predmetu Ekonometria

Filozofická a Pedagogická fakulta Masarykovy univerzity. 2012. Ekonometria. El-dům. [Online]

2012. [Dátum: 3. 1. 2013.] http://eldum.phil.muni.cz/course/view.php?id=20

HUŠEK, R. 1999. Ekonometrická analýza. Praha : Ekopress, 1999. s. 303. ISBN 80-86119-19-X.

Štatistický úrad SR. 2012. Databáza. RegDat databáza regionálnej štatistiky. [Online] 2012.

[Dátum: 3. 1. 2013.] http://px-web.statistics.sk/PXWebSlovak/.

Štatistický úrad SR. 2012. Trh práce metodické vysvetlivky. RegDat databáza regionálnej

štatistiky. [Online] 2012. [Dátum: 3. 1. 2013.] http://px-web.statistics.sk/PXWebSlovak/.

33

Prílohy

Príloha 1: Histogramy jednotlivých premenných


0.0

0.4

0.8

1.2

1.6

2.0

2.4

2.8

3.2

10000 15000 20000 25000

Trestné ciny

0

1

2

3

4

5

6

7

0 5000 10000 15000 20000 25000

Absolventi

0.0

0.4

0.8

1.2

1.6

2.0

2.4

2.5 5.0 7.5 10.0 12.5 15.0 17.5 20.0

Nezamestnanost

0.0

0.4

0.8

1.2

1.6

2.0

2.4

275 300 325 350 375 400

Ekonomicka aktivita

0

1

2

3

4

5

0 50000 100000 150000 200000

Madari

0

1

2

3

4

5

6

0 10000 20000 30000 40000

Rómovia

0.0

0.4

0.8

1.2

1.6

2.0

2.4

600000 700000 800000

Populacia

Ekonometria SP

Documents

Transcript of Ekonometria SP