Ekonometria SP
Click here to load reader
-
Upload
michaela-krkosova -
Category
Documents
-
view
66 -
download
6
description
Transcript of Ekonometria SP
UNIVERZITA MATEJA BELA V BANSKEJ BYSTRICI
EKONOMICKÁ FAKULTA
KATEDRA KVANTITATÍVNYCH METÓD A INFORMAČNÝCH SYSTÉMOV
Seminárna práca
EKONOMETRICKÝ MODEL LÚPEŽÍ V KRAJOCH
NA SLOVENSKU V ROKU 2009
Bc. Michaela Krkošová
Názov predmetu: Ekonometria
Akademický rok: 2012/2013
Dátum odovzdania: 2013-01-09
Obsah
Úvod ............................................................................................................................................. 3
1 Ekonomický model a empirické dáta ............................................................................... 4
1.1 Závislá premenná trestné činy .................................................................................. 4
1.2 Nezávislé premenné .................................................................................................. 4
2 Predbežná analýza dát ...................................................................................................... 8
2.1 Vývoj premenných v čase .......................................................................................... 8
2.2 Deskriptívna štatistika, testy normality a histogramy ........................................... 12
2.3 Korelačná matica premenných ............................................................................... 15
3 Ekonometrický model...................................................................................................... 17
3.1 Prvotný model .......................................................................................................... 17
3.2 Druhotný model ....................................................................................................... 18
4 Ekonometrická verifikácia modelu ................................................................................. 21
4.1 Testovanie normality OLS-reziduí ........................................................................... 21
4.2 Testovanie heteroskedasticity ................................................................................ 22
4.3 Testovanie autokorelácie ........................................................................................ 25
4.4 Testovanie multikolinearity ..................................................................................... 26
4.5 Testovanie stability .................................................................................................. 27
4.6 Testovanie špecifikácie ............................................................................................ 28
4.7 Posúdenie predikčnej schopnosti modelu ............................................................. 28
Záver .......................................................................................................................................... 30
Bibliografia................................................................................................................................. 32
Prílohy ........................................................................................................................................ 33
3
Úvod
Kriminalita na Slovensku je vážnym problémom dnešnej spoločnosti. Na jednej strane stojí
konzumná spoločnosť, v ktorej ľudia strácajú svoje morálne hodnoty a kladú na prvé miesto
majetok a jeho obstaranie. Na druhej strane stojí chudoba a jej prehlbovanie spôsobené
nedostatkom pracovných miest, čo je ešte podčiarknuté hospodárskou krízou a zatváraním
podnikov v oblastiach s vysokou mierou nezamestnanosti. Ľudia nie sú schopní uživiť svoje
rodiny a v zdanlivo bezvýchodiskovej situácií volia poslednú možnosť ako sa uživiť – trestnú
činnosť. Toto je však iba hrubé zhrnutie motivátorov, ktoré stoja za vysokým počtom trestných
činností. Sú aj iná skutočnosti, ktoré kriminalitu ovplyvňujú. Tie som sa rozhodla skúmať v mojej
práci.
Ako som už spomínala, v tejto práci som sa rozhodla aspoň z časti objasniť, čo stojí za
kriminalitou a v ktorých regiónoch je najvyššia. Je počet trestných činov vyšší v „chudobných“
krajoch s vysokou mierou nezamestnanosti alebo naopak, v krajoch rozvinutejších a bohatších?
Existuje korelácia medzi počtom absolventov vysokoškolského štúdia a celkovým počtom lúpeží
v krajoch? Na tieto aj iné otázky budem odpovedať v mojej práci.
Na ďalších stránkach tejto práce budem skúmať to, či a ako na celkový vplyv trestných
činov v kraji vplývajú rozličné ukazovatele. Ja som sa rozhodla pre ukazovatele počet
absolventov za kalendárny rok (denné aj externé štúdium spolu), miera evidovanej
nezamestnanosti, ekonomicky aktívne obyvateľstvo, stav obyvateľstva a obyvateľstvo podľa
národností – rómska a maďarská. Hodnoty týchto ukazovateľov sú z roku 2009 a sú voľne
dostupné na stránke RegDat – databáza regionálnej štatistiky.
V jednotlivých kapitolách najskôr bližšie rozoberiem skúmané premenné, u ktorých
predpokladám, že ovplyvňujú počet trestných činov. Ukážem tiež, ako sa vyvíjali v čase.
Pomocou programov Eviews, MS Excel a SPSS vytvorím prvotný regresný model, z ktorého
vyčlením nevýznamné premenné. Model overím ekonomicky, štatisticky aj ekonometricky, teda
overím predpoklady klasického lineárneho regresného modelu. Pokiaľ budem v práci overovať
štatistické hypotézy, budem za rozhodujúcu predpokladať 5% hladinu významnosti.
4
1 Ekonomický model a empirické dáta
Pre mnou stanovený model som sa snažila vybrať čo najvhodnejšie premenné – tak ako
vysvetľovanú, rovnako aj vysvetľujúce. Všetky použité údaje (pre rok 2009 aj 2010) sú voľne
dostupné na stránke Štatistického úradu Slovenskej republiky – RegDat databáza regionálnej
štatistiky (url: http://px-web.statistics.sk/PXWebSlovak/). Údaje sú stanovené pre každý z 8
krajov Slovenskej republiky.
1.1 Závislá premenná trestné činy
V mnou skúmanom modeli som určila ako závislú premennú trestné činy (tr_ciny). Táto
premenná sleduje celkový počet trestných činov v jednotlivých krajoch Slovenska v roku 2009.
Ako uvádza Štatistický úrad Slovenskej republiky (2012), do tohto počtu sú započítané
všeobecné (majetková, násilná, mravnostná a tzv. ostatná kriminalita), hospodárske (napríklad
sprenevera, podvod, neoprávnené obstaranie platobnej karty a iné) aj zostávajúce trestné činy
(zanedbanie povinnej výživy, dopravné nehody, týranie zvierat a pod.). Hodnoty na úrovni
krajov a regiónov nedávajú celkový súčet za SR z dôvodu, že trestné činy zistené Železničnou
políciou, Vojenskou políciou, Zborom väzenskej a justičnej stráže a Colným riaditeľstvom sa
nedajú presne lokalizovať do krajov. Táto premenná je udávaná v počte zaevidovaných
trestných činov.
1.2 Nezávislé premenné
Na celkovú výšku trestných činov v jednotlivých krajoch vplýva mnoho faktorov. Ja som si
pre potreby zostavenia daného modelu vybrala ako vysvetľujúce (exogénne) tieto premenné:
počet absolventov za kalendárny rok 2009 (denné aj externé štúdium spolu), miera evidovanej
nezamestnanosti, ekonomicky aktívne obyvateľstvo, stav obyvateľstva a obyvateľstvo podľa
národností – rómska a maďarská. Myslím si, že najmä týchto 6 premenných výrazne vplýva na
celkový počet trestných činov v jednotlivých regiónoch, čo sa budem v ďalšej práci snažiť aj
dokázať.
Počet absolventov za rok 2009 denné aj externé štúdium spolu (absolventi)
Daná premenná zohľadňuje celkový počet absolventov vysokých škôl v krajoch Slovenskej
republiky za rok 2009 a sú k 31.12.2009. Udávané hodnoty predstavujú súčet absolventov
5
denného aj externého štúdia. Študenti a absolventi sú evidovaní v tom regióne, v ktorom sa
daná fakulta skutočne nachádza, pričom vysoká škola, príp. univerzita danej fakulty môže mať
svoje sídlo v inom regióne. Treba podotknúť, že som zvažovala aj možnosť vybrať triedenie
počtu absolventov podľa kraja, v ktorom má absolvent trvalé bydlisko. Domnievam sa však, že
študenti dochádzajúci za štúdiom do vzdialenejších (a aj bohatších) regiónov v nich po ukončení
štúdia začnú vykonávať svoju profesiu (jedná sa obzvlášť o dochádzanie z chudobnejších
regiónov Stredného a Východného Slovenska) a budú tu mať svoje bydlisko. Údaje sú udávané
k 31.12.2009 a v počte občanov.
Výber tejto premennej som zaradila najmä preto, že som predpokladala, že čím vyššia je
vzdelanostná úroveň obyvateľstva, tým menšia bude frekvencia výskytu trestných činov. Súdim
tak hlavne z domnienky, že u vysokoškolsky vzdelaných ľudí sa okrem vedomostí očakávajú aj
vyššie morálne hodnoty a ich striktnejšie dodržiavanie. Predpokladám teda nepriamu závislosť
a záporné znamienko regresného koeficientu pri zostrojenom modeli.
Miera evidovanej nezamestnanosti (nezamestnanost)
Ďalšou zvolenou vysvetľujúcou premennou je miera evidovanej nezamestnanosti. Je
udávaná v percentách a vyjadruje pomer medzi počtom nezamestnaných osôb podľa
výberového zisťovania pracovných síl1 a celkovým počtom ekonomicky aktívneho obyvateľstva.
Pojem ekonomicky aktívne obyvateľstvo vysvetlím ďalej v práci.
Zapojenie tohto parametra do regresného modelu vysvetľujem tým, že pokiaľ je v regióne
vysoká miera nezamestnanosti, rozširuje sa chudoba a ľudia sa viac uchyľujú k trestnej činnosti.
Potrebujú zabezpečiť svoje rodiny a bez stabilného príjmu z pracovnej činnosti im nezostáva
veľa riešení. Hlavne dlhodobo nezamestnaní majú tendenciu sa uchyľovať k užívaniu
návykových látok alebo hazardným hrám, čo môže tiež v konečnom dôsledku ústiť do páchania
trestnej činnosti. Preto očakávam, že vo výstupe z regresie daného modelu bude regresný
koeficient tohto parametra kladný.
1 „Priebežné monitorovaním pracovných síl na základe priameho zisťovania vo vybraných domácnostiach. Základ na zisťovanie tvorí stratifikovaný výber bytov, ktorý rovnomerne pokrýva celé územie Slovenskej republiky.“ (Štatistický úrad SR, 2012)
6
Ekonomicky aktívne obyvateľstvo (ekon_akt_obyv)
Za exogénnu premennú som zvolila aj ekonomicky aktívne obyvateľstvo. Určovanie
hodnôt tejto premennej prebieha pomocou výberového zisťovania pracovných síl. Predstavuje
osoby staršie ako 15 rokov, ktoré sú pracujúce alebo nezamestnané, no aktívne si hľadajú
prácu. Nie sú sem zahrnutí študenti, dôchodcovia, návštevníci rekvalifikačných kurzov, osoby
starajúce sa o domácnosť alebo osoby bez práce, ktoré si je aktívne nehľadajú alebo nie sú do
nej schopné nastúpiť v lehote do dvoch týždňov. Rovnako sem nepatria osoby na rodičovskej
dovolenke. Údaje k 31.12.2009 sú udávané v tisícoch občanov.
Tento parameter súvisí s mierou nezamestnanosti. Pokiaľ je dostatok ľudí v regióne
zamestnaných, je pravdepodobné že bude páchané menšie množstvo trestnej činnosti. Čo sa
týka nezamestnaných, tu sú započítavaní len tí, ktorí si prácu skutočne hľadajú. Práve títo ľudia
sa snažia zmeniť svoju situáciu legálnou cestou a pokúšajú si nájsť zamestnanie. Je menej
pravdepodobné, že budú páchať trestnú činnosť v porovnaní s osobami, ktoré nemajú záujem
pracovať alebo rezignovali na svoju situáciu. Preto očakávam záporný regresný koeficient
a nepriamu úmernosť so vysvetľovanou premennou.
Stav obyvateľstva (populacia)
Stav obyvateľstva predstavuje celkový počet obyvateľov v danom kraji na konci
sledovaného obdobia, teda roku 2009. Mernou jednotkou tejto premennej je počet občanov.
Pokiaľ by páchal trestnú činnosť každý 50-ty obyvateľ (bez ohľadu na iné faktory), je zrejmé, že
so zvyšovaní počtu obyvateľov by sa zvyšoval aj počet trestných činov v regióne. Preto
očakávam pri premennej stav obyvateľstva v regresnom modely kladný regresný koeficient.
Obyvateľstvo podľa národností – rómska a maďarská (romovia, madari)
Za posledné dve vysvetľujúce premenné som zvolila obyvateľstvo podľa národností.
Vybrala som si dve najpočetnejšie národnostné menšiny na Slovensku – rómsku a maďarskú.
Údaje sú zobrazované k 31.12. 2009 a ich jednotkou je počet občanov.
Výberom týchto ukazovateľov som sa snažila vhodne doplniť model. Nerada by som
v tejto práci niekoho odsudzovala alebo škatuľkovala podľa rasy a národnosti. Robiť sociologický
rozbor nie je zámerom tejto práce. Snažím sa zohľadniť len všeobecne známe súvislosti. Rómski
spoluobčania, hlavne tí žijúci v osadách, patria medzi skupiny najviac ohrozené chudobou. Ich
7
spôsob života je veľmi špecifický. Hlavne kvôli tomu sú títo občania viac náchylní na páchanie
trestnej činnosti. Predpokladám, že sa vyskytne súvislosť medzi počtom občanov rómskej
menšiny v regióne a počtom trestných činov v podobe priamej závislosti. Predpokladám, že
regresný koeficient dosiahne kladnú hodnotu.
Maďarská menšinu som zvolila z rozdielneho princípu – nepredpokladám, že občania
hlásiaci sa k maďarskej národnosti majú väčšie sklony k vykonávaniu kriminálnych činov. Skôr
usudzujem, že je na Slovensku mnoho Rómov, ktorí sa akoby hanbili za svoj pôvod a pri
prieskumoch uvádzajú maďarskú národnosť. Z tohto dôvodu očakávam rovnako kladný
regresný koeficient. Či je táto domnienka správna ukáže až model.
8
2 Predbežná analýza dát
2.1 Vývoj premenných v čase
Na porovnanie vývoja trestných činov v jednotlivých krajoch počas rokov 2005 až 2009 mi
poslúži graf 1. Najviac trestných činov je počas celého sledovaného obdobia spáchaných
v Bratislavskom kraji. Ich počet sa drží približne pri úrovni 24 000 trestných činov. Druhým
krajom v počte páchanej kriminálnej činnosti je Košický kraj. Tu však vidíme pozitívny trend
v znižovaní evidovanej trestnej činnosti. Kým v roku 2005 bol počet trestných činností nad
hodnotou 22 000, v ďalších rokoch nasledoval pokles až na úroveň 14 422. Tretím v poradí je
Banskobystrický kraj, kde však tiež kriminalita v sledovanom období poklesla o viac ako 1 000
kriminálnych činov. Minimálny počet trestných činov dosahuje počas celej doby Trnavský kraj.
Ostatné kraje majú podobný vývoj sledovaného ukazovateľa v tomto čase.
Graf 1: Vývoj počtu trestných činov v jednotlivých krajoch v rokoch 2005-2009
Zdroj: Výstup z Eviews
Tiež sledujem, ako sa postupom času vyvíja počet absolventov (graf 2). Pri tejto
premennej som zvolila iné sledované obdobie (roky 2008 -2011) z dôvodu dostupnosti údajov.
Pre moje potreby to však nebude vadiť. Zostrojila som samostatné grafy vývoja počtu
absolventov dennej aj externej formy štúdia. Pri denných študentoch v takmer všetkých krajoch
(okrem Žilinského) narástol v sledovanom období počet absolventov. V dobe krízy je investícia
do vzdelania jednou z najlepších investícií. Tiež nastavenie vysokého školstva na Slovensku
4000
8000
12000
16000
20000
24000
28000
2005 2006 2007 2008 2009
BATTTR
NRZABB
POKE
9
pomáha zvyšovať počty absolventov. Počet absolventov externého štúdia po miernom náraste
v roku 2009 postupne klesol. Rast som zaznamenala len u absolventov, ktorí ukončili svoje
externé štúdium v Bratislavskom kraji. Počas sledovaného obdobia tu narástol počet
absolventov o takmer 70% (z 6 809 z roku 2008 na 11 490 v roku 2011). Hlavne v Bratislave
mnoho študentov už počas bakalárskeho štúdia pracuje v praxi. V ďalšom stupni už títo študenti
študujú ako externisti. Druhým motívom je, že v Bratislavskom kraji je vysoká koncentrácia
úradov štátnej správy aj súkromných firiem, ktorých zamestnanci sa snažia dodatočne získať
vysokoškolský stupeň vzdelania a nastupujú na externé štúdium.
Graf 2: Vývoj počtu denných a externých absolventov vysokých škôl v jednotlivých krajoch
v rokoch 2008- 2011
Zdroj: Výstup z Eviews
Pri sledovaní časového radu percentuálnej miery nezamestnanosti v jednotlivých krajoch
sme sa zamerali na roky 2005-2009. Miera evidovanej nezamestnanosti v percentuálnom
vyjadrení dosahovala najvyššie hodnoty vo všetkých krajoch v roku 2005 a potom postupne
klesala. Je to spôsobené hlavne príchodom investorov do oblastí s vyššou mierou
nezamestnanosti (v roku 2005 boli prijaté pravidlá individuálnej štátnej pomoci investorom)
a ponukou lacnejšej pracovnej sily. Len pre zaujímavosť, v roku 2008 prišlo na Slovensko 34
investorov. Kým v roku 2005 bola až v troch krajoch miera nezamestnanosti nad 20%, v roku
2008 takúto mieru nezamestnanosti nedosahoval žiadny z krajov. Tento pozitívny trend
zabrzdila v roku 2009 hospodárska kríza, ktorá spôsobila ukončenie činnosti niektorých
podnikov či zníženie ich výroby, ktoré bolo spojené aj so znižovaní pracovnej sily.
0
2000
4000
6000
8000
10000
12000
14000
16000
2008 2009 2010 2011
BA_DENNETT_DENNETR_DENNE
NR_DENNEZA_DENNEBB_DENNE
PO_DENNEKE_DENNE
0
2000
4000
6000
8000
10000
12000
2008 2009 2010 2011
BA_EXTERNETT_EXTERNETR_EXTERNENR_EXTERNE
ZA_EXTERNEBB_EXTERNEPO_EXTERNEKE_EXTERNE
10
Najvyšší pokles nezamestnanosti zaznamenal košický kraj, v ktorom sa počas sledovaného
obdobia znížila miera nezamestnanosti o viac ako 37 percentuálnych bodov. Východné regióny
sú pre investorov lákavé vďaka blízkosti viac ako 200-tisícovej metropoly – Košíc. Pozitívom je aj
výhodná poloha neďaleko hraníc a Poľskom, Maďarskom aj Ukrajinou a vybudovaná
infraštruktúra. Vďaka tomuto poklesu sa na prvé miesto v úrovni nezamestnanosti dostal
Banskobystrický kraj, ktorý dosahoval v roku 2009 mieru nezamestnanosti na úrovni 18,8%, čím
predbehol Prešovský kraj, ktorý je druhým v poradí, o 2,6%. Najnižšia miera nezamestnanosti je
podľa očakávaní v Bratislavskom kraji, kde kolíše pomerne stabilne okolo 4% hladiny.
Graf 3: Vývoj percentuálnej miery nezamestnanosti v jednotlivých krajoch v rokoch 2005-2009
Zdroj: Výstup z Eviews
Ekonomicky aktívne obyvateľstvo sa v období rokov 2005 až 2009 v jednotlivých krajoch
výrazne nemenilo. Najvyšší počet ekonomicky aktívnych obyvateľov je v Prešovskom kraji,
naopak najnižší počet v kraji Trnavskom a Trenčianskom (graf 4). Najvyšší nárast počtu
ekonomicky aktívneho obyvateľstva som počas sledovaného obdobia zaznamenala
v Bratislavskom kraji, bol to nárast o viac ako 5% (z 330,5 tisíc obyvateľov na 348,2 tisíc). Treba
podotknúť, že počet ekonomicky aktívnych obyvateľov úzko súvisí s celkovou populáciou
v danom kraji. Tento ukazovateľ je v čase ešte stabilnejší. Pokiaľ sa v danom období nevyskytne
nejaká závažná udalosť (prírodná katastrofa, epidémia apod.), populácia sa výrazne nemení.
Krajom s najvyššou populáciou je Prešovský kraj nasledovaný krajom Košickým. Kým Prešovský
kraj už v roku 2006 presiahol 800 tisíc obyvateľov, Košický kraj sa k tejto hodnote iba blíži.
0
4
8
12
16
20
24
28
2005 2006 2007 2008 2009
BATTTR
NRZABB
POKE
11
Najmenej obyvateľov má kraj Trnavský, aj keď tu počet obyvateľov vzrástol za 4 roky o viac ako
7 tisíc obyvateľov. Najvyšší vzostup počtu obyvateľov však nastal v Bratislavskom kraji, tu
vzrástla populácia o 3,15%, z 603 699 obyvateľov v roku 2005 na 622 706 v roku 2009.
Graf 4: Vývoj počtu ekonomicky aktívneho obyvateľstva (v tisícoch) a populácie v jednotlivých
krajoch v rokoch 2005- 2009
Zdroj: Výstup z Eviews
Posledné dva grafy (graf 5) vývoja v časovom období 2005 až 2009 budú patriť
národnostným menšinám – maďarskej a rómskej. Maďarská menšina je najviac zastúpená podľa
očakávania v Nitrianskom a Trnavskom kraji, čo má opodstatnenie v histórií. Naopak minimálne
množstvo maďarských občanov je v dvoch krajoch, ktoré nehraničia s Maďarskom – Prešovský
a Žilinský kraj. Vývoj počtu občanov tejto národnosti sa v sledovanom období menil len
minimálne. Rómska menšina má najvyššie zastúpenie vo východných regiónoch Slovenska –
Košickom, Prešovskom a Banskobystrickom kraji. Kým v západných krajoch sa počet Rómov drží
na konštantnej úrovni, ich celkový počet stúpa. Za 4 roky sledovaného obdobia vzrástol počet
Rómov o viac ako 7,5 tisíc, t.j. o 7,65%. Najvyšší nárast bol zaznamenaný v Košickom kraji, kde
počet rómskych obyvateľov stúpol o viac ako 12%. V Prešovskom kraji bol tento nárast
miernejší, len 9,46%-ný. V ostatných krajoch bola zmena počtu rómskeho obyvateľstva
minimálna.
280
300
320
340
360
380
400
2005 2006 2007 2008 2009
BATTTR
NRZABB
POKE
Ekonomická aktivita obyvatelstva
550000
600000
650000
700000
750000
800000
850000
2005 2006 2007 2008 2009
BATTTR
NRZABB
POKE
Populacia
12
Graf 5: Vývoj počtu maďarskej a rómskej národnostnej menšiny v jednotlivých krajoch v rokoch
2005- 2009
Zdroj: Výstup z Eviews
2.2 Deskriptívna štatistika, testy normality a histogramy
V ďalšej časti tejto práci najskôr priblížim výsledky deskriptívnej štatistiky premenných,
ktoré som získala ako výstup v Eviews a sú uvedené v tabuľke 1. U vysvetľovanej premenné
trestné činy sa hodnoty pohybovali v intervale 8 501; 24 003. Získala som priemernú hodnotu
12 934,25, teda v prieme je v každom kraji za rok zaevidovaných takmer 13 tisíc trestných činov.
Stredná hodnota je o čosi nižšia, štyri kraje dosahujú počet zaevidovaných kriminálnych činov
nižší ako 11 360. Už vďaka poznatku, že medián je výrazne nižší ako priemer, môže odhadnúť
pozitívne zošikmenie. Tento dohad sa potvrdil, koeficient šikmosti je kladný a teda odľahlé
hodnoty sa nachádzajú vpravo. Koeficient špicatosti je tiež kladné číslo a väčšina hodnôt sa
nachádza blízko mediánu. Variabilitu teda ovplyvňujú odľahlé hodnoty. To, či je uvedené
odchýlky výrazné a či je rozdelenie ešte normálne určím pomocou Jarueovho-Berovho testu
normality. Nulová hypotéza predpokladá, že premenná je normálne rozdelená. Keďže táto
premenná dosahuje p-hodnotu vyššiu ako všetky bežné hladiny významnosti, môžeme povedať
že má normálne rozdelenie.
0
40000
80000
120000
160000
200000
2005 2006 2007 2008 2009
BATTTR
NRZABB
POKE
Madari
0
10000
20000
30000
40000
2005 2006 2007 2008 2009
BATTTR
NRZABB
POKE
Romovia
13
Tabuľka 1: Deskriptívna štatistika jednotlivých premenných
Zdroj: Výstup z Eviews
Vysvetľujúca premenná absolventi má zo všetkých premenných najvyššiu špicatosť (je
najviac leptokurtická) a tiež dosahuje najavšiu asymetriu pri hodnote zošikmenia, teda je najviac
pravostranne zošikmená. Šikmosť spôsobuje hlavne odľahlá hodnota – počet absolventov
v Bratislavskom kraji čo zobrazuje aj boxplot tejto premennej (graf 6). Takéto výrazné odchýlky
od hodnôt normálneho rozdelenia sa musia prejaviť pri teste normality. p-hodnota na úrovni
0,053 udáva, že na 10% hladine významnosti zamietame nulovú hypotézu (premenná teda
nemá normálne rozdelenie) a na 5% hladine významnosti ju len veľmi tesne potvrdzujeme.
Graf 6: Boxplot premennej počet absolventov
Zdroj: Výstup z Eviews
TR_CINY ABSOLVENTIEKON_AKT_
OBYV
NEZAMESTN
ANOSTMADARI ROMOVIA POPULACIA
Mean 12934.25 8799.750 336.2625 11.90000 64220.38 13210.13 678115.6
Median 11360.00 7486.500 340.7000 11.80000 52400.00 3958.000 675344.0
Maximum 24003.00 22040.00 383.4000 18.80000 190741.0 38859.00 807011.0
Minimum 8501.000 3649.000 294.9000 4.700000 642.0000 750.0000 561525.0
Std. Dev. 4877.086 5639.325 30.40639 4.822566 70164.95 16283.09 85573.72
Skewness 1.602172 1.809682 0.011607 -0.052736 0.670150 0.922650 0.221318
Kurtosis 4.488162 5.105990 1.905159 1.804258 2.197718 2.060791 1.857546
Jarque-Bera 4.160817 5.844997 0.399739 0.480308 0.813354 1.429082 0.500376
Probability 0.124879 0.053799 0.818838 0.786507 0.665859 0.489417 0.778654
Sum 103474.0 70398.00 2690.100 95.20000 513763.0 105681.0 5424925.
Sum Sq. Dev. 1.67E+08 2.23E+08 6471.839 162.8000 3.45E+10 1.86E+09 5.13E+10
Observations 8 8 8 8 8 8 8
0
4000
8000
12000
16000
20000
24000
ABSOLVENTI
Bratislavský kraj
14
Pri ostatných sledovaných exogénnych premenných môžem povedať, že odchýlky od
nulovej hodnoty šikmosti a špicatosti nie sú tak výrazne. Pri týchto premenných po otestovaní
Jarqueovim-Berovim testom potvrdzujeme vďaka vysokým p-hodnotám normalitu na všetkých
bežných hladinách významnosti. Histogramy všetkých premenných sú v prílohe 1. Po grafickom
preskúmaní by som však normalitu vylúčila na viacerých premenných. Preto ich ešte v programe
SPSS pomocou Shapirovho-Wilkovho testu (tabuľka 2), ktorý je viac vhodný pre menšie výbery,
ako mám ja. Hypotézy sú stanovené rovnako ako pri Jarqueovom-Berovom teste. P-hodnotu
zobrazuje Sig. Podľa tohto testu by som za normálne rozdelené určila na 10% a 5% hladine
významnosti nezamestnanosť, ekonomicky aktívne obyvateľstvo, počet maďarských občanov
žijúcich v regióne a celkovú populáciu regiónu. Naopak, na 5% a 10% hladine významnosti,
premenné trestné činy, počet absolventov a počet Rómov v regióne nebudú podľa výsledkov
tohto testu normálne rozdelené. Tento test má veľkú silu a je vhodný pre malé súbory dát,
preto jeho výsledky budem brať za smerodajné.
Tabuľka 2: Shapirov-Wilkov test normality pre jednotlivé premenné
Zdroj: Výstup z SPSS
Rozličné premenné dosahujú rozdielnu úroveň variability. Pre možnosť porovnania som
dopočítala zo získaných údajov variačné koeficienty jednotlivých premenných (graf 7). Najvyššia
variabilita je dosiahnutá práve u oboch premenných národnostných menšín. Tento výsledok
potvrdzuje fakt, že národnostné menšiny sú na Slovensku rozdelené nerovnomerne a obývajú
len určité kraje.
15
Graf 7: Variačné koeficienty jednotlivých premenných
Zdroj: Vlastné spracovanie podľa údajov z Eviews
2.3 Korelačná matica premenných
Na pochopenie vzájomných závislostí medzi jednotlivými slúži korelačná matica (tabuľka
3). Premenná trestné činy má silnú priamu lineárnu závislosť (0,924) s premennou absolventi.
Pokiaľ by stúpol počet absolventov VŠ, mal by stúpnuť aj počet vysokých škôl. Takýto záver som
neočakávala. Skôr som sa domnievala, že závislosť medzi týmito dvoma premennými bude
nepriama. Ostatné premenné majú s premennou trestné činy slabú priamu či nepriamu
lineárnu závislosť, dokonca premenné Rómovia a populácia sú s touto premennou takmer
lineárne nezávislé (hodnoty veľmi blízko 0). Ďalej ma zaujíma korelačný koeficient medzi
premennou absolventi a nezamestnanosť. Predpokladám, že s počtom absolventov bude
nezamestnanosť klesať, teda tento koeficient by mal byť záporný. Táto domnienka sa naplnila,
medzi premennými je stredne silná nepriama lineárna závislosť (r = 0,503). Zaujímavý je aj
korelačný koeficient medzi Rómami a mierou nezamestnanosti, ktorý dosahuje hodnotu 0,713.
Jedná sa o stredne silnú až silnú priamu lineárnu závislosť, teda potvrdzujem svoj predpoklad,
že rómsky občania majú problém sa zamestnať. U maďarských občanov táto závislosť nie je až
taká silná (r = 0,206). Poslednou rozobranou dvojicou premenných bude populácia a Rómovia.
Silná priama lineárna závislosť medzi touto dvojicou naznačuje, že so zvýšením počtu rómskeho
obyvateľstva sa zvýši aj celková populácia v danom regióne. U maďarských občanov vidíme
opačný vývoj – slabú nepriamu lineárnu závislosť.
Tabuľka 3: Korelačná matica jednotlivých premenných
Zdroj: Výstup z Eviews
TR_CINY ABSOLVENTIEKON_AKT_
OBYV
NEZAMESTN
ANOSTMADARI ROMOVIA POPULACIA
VK 0,377067553 0,640850592 0,090424564 0,405257647 1,092565164 1,232621481 0,12619341
TR_CINY ABSOLVENTI EKON_AKT_OBYV NEZAMESTNANOST MADARI ROMOVIA POPULACIA
TR_CINY 1.000000 0.924385 0.316986 -0.295432 -0.181380 -0.036664 -0.035640ABSOLVENTI 0.924385 1.000000 0.236315 -0.502759 0.027237 -0.299046 -0.189469
EKON_AKT_OBYV 0.316986 0.236315 1.000000 0.379684 -0.057883 0.677284 0.880229
NEZAMESTNANOST -0.295432 -0.502759 0.379684 1.000000 0.206133 0.713296 0.635455MADARI -0.181380 0.027237 -0.057883 0.206133 1.000000 -0.111571 -0.116343
ROMOVIA -0.036664 -0.299046 0.677284 0.713296 -0.111571 1.000000 0.826574
POPULACIA -0.035640 -0.189469 0.880229 0.635455 -0.116343 0.826574 1.000000
16
Korelácie medzi jednotlivými premennými môžem vyjadriť okrem korelačnej matice aj
pomocou scatterplotov (graf 8). Na diagonále vidíme, že body sú zoradené do priamky ktorá
stúpa v 45 stupňovom uhle, čo svedčí i úplnej priamej lineárnej závislosti. Scatterploty
ostatných dvojíc zobrazujú silu a smer závislosti medzi premennými rovnako ako korelačná
matica.
Graf 8: Scatterploty medzi jednotlivými premennými
Zdroj: Výstup z Eviews
17
3 Ekonometrický model
Pokiaľ som si zostrojila ekonomický model, je vhodné ho overiť pomocou rôznych
štatistickým metód. Je vhodné otestovať štatistickú významnosť jednotlivých vysvetľujúcich
premenných, rovnako aj modelu ako celku.
3.1 Prvotný model
Prvotný regresný model som zostrojila so zahrnutím všetkých vysvetľujúcich premenných
pomocou metódy najmenších štvorcov v softvéri Eviews. Výstupom je tabuľka 4. Najskôr
vyhodnotím štatistickú významnosť jednotlivých vysvetľujúcich premenných pomocou t-testu.
Pri tomto teste je nulová hypotéza stanovená tak, že premenná nie je štatisticky významná.
Premenné s p-hodnotami nižšími ako zvolená hladina významnosti (ja som zvolila 5% hladinu
významnosti) budú spadať do oblasti alternatívnej hypotézy a budú štatisticky významné. Pri
tomto modely nie je štatisticky významný ani jeden parameter (okrem lokujúcej konštanty) na
všetkých bežných hladinách významnosti. Preto v druhotnom modeli vylúčim premennú
s najvyššou p-hodnotou – populáciu a zostrojím model bez nej. Tento model by na 5% hladine
významnosti nebol významný ani ako celok. Toto stanovujem vďaka p-hodnote pri F-teste, ktorý
skúma štatistickú významnosť modelu ako celku. Hypotézy sú stanovené rovnako ako pri t-
teste, potrebujem teda zostrojiť model s nižšou p-hodnotou F-testu.
Tabuľka 4: Výstup lineárnej regresie pri zahnutí všetkých vysvetľujúcich premenných
Dependent Variable: TR_CINY
Method: Least Squares
Date: 01/04/13 Time: 14:20
Sample: 1 8
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.
ABSOLVENTI 1.098381 0.057774 19.01161 0.0335
NEZAMESTNANOST 244.5157 61.19073 3.995959 0.1561
EKON_AKT_OBYV -66.24154 22.82403 -2.902272 0.2112
POPULACIA 0.006624 0.008508 0.778588 0.5788
MADARI -0.016657 0.002641 -6.307106 0.1001
ROMOVIA 0.098116 0.019649 4.993301 0.1258
C 17915.34 2893.843 6.190850 0.1020
R-squared 0.998985 Mean dependent var 12934.25
18
Adjusted R-squared 0.992898 S.D. dependent var 4877.086
S.E. of regression 411.0177 Akaike info criterion 14.54571
Sum squared resid 168935.6 Schwarz criterion 14.61522
Log likelihood -51.18283 F-statistic 164.0989
Durbin-Watson stat 2.825697 Prob(F-statistic) 0.059684
Zdroj: Výstup z Eviews
3.2 Druhotný model
Ako som spomínala vyššie, v druhotnom modeli som vylúčila zo vysvetľujúcich
premenných populáciu, ktorá dosahovala pri t-teste najvyššiu p-hodnotu. Vidím z výstupu
(tabuľka 5), že tento krok znížil p-hodnotu všetkých ostatných exogénnych veličín pod 5%
hladinu významnosti, teda tieto premenné sú štatisticky významné. Aj p-hodnota F-testu klesla
na hodnotu 0,004, teda model je na 5% hladine významnosti (aj na 1%) významný ako celok.
Tabuľka 5: Výstup lineárnej regresie bez zahrnutia premennej populácia
Dependent Variable: TR_CINY
Method: Least Squares
Date: 01/04/13 Time: 14:21
Sample: 1 8
Included observations: 8
Variable Coefficient Std. Error t-Statistic Prob.
ABSOLVENTI 1.066693 0.036747 29.02789 0.0012
NEZAMESTNANOST 261.0130 51.44402 5.073729 0.0367
EKON_AKT_OBYV -49.89148 8.013085 -6.226251 0.0248
MADARI -0.017326 0.002238 -7.740051 0.0163
ROMOVIA 0.099123 0.017571 5.641384 0.0300
C 17021.42 2380.494 7.150371 0.0190
R-squared 0.998370 Mean dependent var 12934.25
Adjusted R-squared 0.994296 S.D. dependent var 4877.086
S.E. of regression 368.3369 Akaike info criterion 14.76958
Sum squared resid 271344.2 Schwarz criterion 14.82916
Log likelihood -53.07832 F-statistic 245.0474
Durbin-Watson stat 2.647980 Prob(F-statistic) 0.004069
Zdroj: Výstup z Eviews
Ďalším dôležitým ukazovateľom teraz už štatisticky významného modelu je R-squared
(koeficient determinácie) a Adjusted R-squred (korigovaný koeficient determinácie). Oba tieto
19
ukazovatele nadobúdajú hodnotu viac ako 0,99. Môžem to interpretovať tak, že pokiaľ sa zmení
vysvetľovaná premenná, viac ako 99% jej zmeny budem môcť vysvetliť zmenami vysvetľujúcich
premenných.
Druhotný model bude modelom finálnym a bude mať tvar:
TR_CINY = 17 021,42 + 1,067*ABSOLVENTI + 261,013*NEZAMESTNANOST -
- 49,891*EKON_AKT_OBYV - 0,017*MADARI + 0,099*ROMOVIA
Tento model ukazuje, aký vplyv majú jednotlivé vysvetľujúce premenné na počet trestných
činov v jednotlivých regiónoch. Získané koeficienty je možné vysvetliť nasledovne:
ABSOLVENTI – pokiaľ by v danom regióne vzrástol v priemere počet absolventov vysokých
škôl o 1 000, vzrástol by aj počet evidovaných trestných činov o 1 067, ceteris paribus
NEZAMESTNANOSŤ – ak v regióne poklesne miera nezamestnanosti priemerne o 1%, zníži
sa počet kriminálnych činov priemerne o 261 pri konštantnej hodnote ostatných
premenných
EKON_AKT_OBYV – s rastom ekonomicky aktívneho obyvateľstva priemerne o 1 000 ľudí
poklesne počet trestných činov v priemere o takmer 50, ceteris paribus
MADARI – v prípade, že v regióne by sa zvýšil počet Maďarov v priemere o 1 000, poklesla
by kriminalita v priemere o 17 trestných činov, ak by sa ostatné premenné nezmenili
ROMOVIA – po nasťahovaní sa priemerne 1 000 Rómov do regiónu by nastal vzostup
kriminality o priemerne 99 kriminálnych činov, ceteris paribus
Teraz mám možnosť porovnať mnou odhadnuté znamienka regresných koeficientov
s reálne získanými hodnotami. Môj úsudok bol mylný hneď pri prvej exogénnej premennej.
Očakávala som, že so zvýšenou úrovňou vzdelaných ľudí sa bude počet trestných činov znižovať.
Opak je pravdou, zvyšovanie počtu absolventov vysokých škôl zvyšuje aj počet evidovaných
kriminálnych činov. Možno je to len zhoda okolností alebo vysokoškolský titul nezaručuje
morálne hodnoty jeho držiteľa a ich dodržiavanie.
Pri percentuálnej miere nezamestnanosti som očakávala kladný regresný koeficient.
Domnievala som sa, že pokiaľ je v regióne vysoká miera nezamestnanosti, rozširuje sa chudoba
a ľudia sa viac uchyľujú k trestnej činnosti. Tento odhad bol správny, regresný koeficient tejto
premennej je kladný.
20
Môj úsudok bol správny aj pri odhade znamienka regresného koeficientu premennej
ekonomicky aktívne obyvateľstvo. Očakávala som záporný regresný koeficient a nepriamu
úmernosť so vysvetľovanou premennou, čo som zdôvodnila tým, že pracujúci obyvatelia a ľudia
aktívne si hľadajúci prácu sa snažia zmeniť svoju situáciu a zabezpečiť rodiny legálnou cestou
a vyhýbajú sa trestnej činnosti.
U oboch premenných týkajúcich sa národnostných menšín som očakávala kladný regresný
koeficient, aj keď u maďarskej menšiny to bol len hrubý odhad. Čo sa týka rómskeho
obyvateľstva, regresný koeficient má očakávanú kladnú hodnotu. Potvrdil sa teda môj odhad, že
títo občania sú hlavne kvôli pretrvávajúcej chudobe a vysokej nezamestnanosti viac náchylní na
konanie trestnej činnosti. U obyvateľov s maďarskou národnosťou je výsledok odlišný. Záporný
regresný koeficient hovorí o tom, že zvýšenie počtu maďarských občanov v regiónoch by znížilo
kriminalitu. Tento výsledok považujem len za zhodu okolností a pripisujem ho nedokonalosti
modelu, ktorá pramení z nízkeho počtu pozorovaní (malého množstva krajov). Aj keď sa môj
odhad nepotvrdil, tento ukazovateľ je štatisticky významný a v modeli si ho ponechám.
V grafe 9 je ukázané, aké boli empirické hodnoty pre jednotlivé kraje. Je vidieť, že
teoretické hodnoty získané zo zostaveného regresného modelu takmer úplne prekrývajú tieto
hodnoty. Model teda dokáže spoľahlivo odhadnúť endogénnu premennú vtedy, pokiaľ by boli
dostupné len exogénne premenné. Tiež sú tu zobrazené aj rezíduá modelu pre každý z krajov.
Graf 9: Empirické, teoretické hodnoty a rezíduá modelu
Zdroj: Výstup z Eviews
-400
-200
0
200
4008000
12000
16000
20000
24000
28000
1 2 3 4 5 6 7 8
Residual Actual Fitted
21
4 Ekonometrická verifikácia modelu
Stanovený model prešiel už ekonomickou aj štatistickou verifikáciou. Posledný krokom je
ekonometrické overenie. Budem sa snažiť potvrdiť, že v danom modeli sa nevyskytujú
ekonometrické problémy (multikolinearity, heteroskedasticity, autokorelácie a pod.). Pokiaľ by
sa takéto problémy vyskytli, bude nutné ich vhodnými metódami odstrániť.
4.1 Testovanie normality OLS-reziduí
Normalitu jednotlivých premenných som už testovala v predchádzajúcej časti práce
pomocou Jarqueovho-Berovho testu a Sharipovho-WIlkovho testu. Na otestovanie normality
rozdelenia regresného modelu využijem opäť Jarqueov-Berov test. Testovať budem rezíduá.
Program Eviews rezíduá vypočíta aj otestuje a výstupom bude graf 10. Pre správne
vyhodnotenie výstupu je potrebné zadefinovať si nulovú aj alternatívnu hypotézu. Nulová
hypotéza predpokladá, že rezíduá majú normálne rozdelenie (H0: iN(0,2)). Alternatívna
hypotéza je stanovená ako non H0 a teda rezíduá nie sú rozdelené normálne. Vo výstupe ma
okrem grafu zaujíma aj p-hodnota spomínaného testu (probability). Jej vysoká hodnota hovorí
o tom, že na všetkých bežných hladinách významnosti nulovú hypotézu nezamietam, rezíduá
majú normálne rozdelenie.
Graf 10: Histogram reziduí regresného modelu
Zdroj: Výstup z Eviews
0.0
0.4
0.8
1.2
1.6
2.0
2.4
-400 -300 -200 -100 0 100 200 300
Series: ResidualsSample 1 8Observations 8
Mean 1.82e-12Median 17.71946Maximum 260.2897Minimum -344.8653Std. Dev. 196.8844Skewness -0.421405Kurtosis 2.244720
Jarque-Bera 0.426925Probability 0.807782
22
4.2 Testovanie heteroskedasticity
„Podmienka klasického lineárneho regresného modelu v sebe zahŕňa predovšetkým
požiadavku na konečný a konštantný rozptyl náhodných zložiek, a tiež i rezíduí modelu, ktorú
označujeme ako homoskedasticitu.“ (HUŠEK, 1999, s. 74) Regresný model spĺňať musí teda
spĺňať predpoklad homoskedasticity, resp. neprítomnosť heteroskedasticity. Keďže sa jedná
o malý súbor s pomerne veľkým množstvom exogénnych premenných, nebudem môcť vykonať
niektoré z testov na odhalenie heteroskedasticity premenných. Sú však aj testy, ktorými môžem
otestovať aj tento súbor. Všetky nasledujúce testy som robila v programe MS Excel.
Prvým testom, ktorý som previedla, je Breuschov-Paganov test. V tomto teste bolo
potrebné najskôr získať výstup z regresie. V ANOVE zistím sumu štvorcov rezíduí Residual SS =
271 344,2. Túto hodnotu vydelím počtom pozorovaní, t.j. 8 a dostanem hodnotu 2 =
33 918,02. V nasledujúcom kroku je potrebné vykonať pomocnú regresiu. Tá sa od pôvodnej líši
len v tom, že ako výstupnú premennú určím štvorce rezíduí. Opäť sa pozriem do ANOVI, kde ma
bude zaujímať hodnota Regression SS, ktorá prestavuje vysvetľovanú sumu štvorcov a rovná sa
9 580 076 311,6. Ďalej si zadefinujem hypotézy:
H0: 2 = 3 = 4 = ... = r (homoskedasticita)
H1: aspoň jedno j ≠ 0
Testovacia štatistika, ktorú získam bude mať chí-kvadrát rozdelenie s r – 1 stupňami voľnosti,
pričom r predstavuje stupeň pomocných nezávislých premenných v pomocnej regresií (spolu
s lokujúcou konštantou). Hodnota testovacej štatistiky dostaneme ako TŠ = VSŠ / (2 * 4). Pokiaľ
získanú hodnotu porovnám s kritickou hodnotou (tabuľka 6), môžem potvrdiť, že na 5% hladine
významnosti nulovú hypotézu nezamietam. Podľa p-hodnoty H0 nezamietam na žiadnej
z bežných hladín významnosti. Tento výsledok hovorí o tom, že model nie je zasiahnutý
heteroskedasticitou.
Tabuľka 6: Testovacia štatistika, kritická a p-hodnota pri Breuschovom-Paganovom test
testovacia štatistika 4,1637
kritická hodnota 0,05 11,0705
p-hodnota 0,5261
Zdroj: Vlastné spracovanie
23
Tento test síce heteroskedasticitu nepreukázal, ja sa však toto tvrdenie pokúsim overiť
ešte aj Glejserovým testom. Tento test je vhodnejší pre menšie súbory. Budem postupovať tak,
že najskôr pre každú z piatich exogénnych premenných vytvorím samostatný regresný model,
do ktorého ostatné premenné nezahrniem. Súčasťou regresie budú aj zobrazenie rezíduí. Z tých
si urobím absolútnu hodnotu. Vytvorím ďalší regresný model (pomocnú regresiu), kde
vysvetľovanou premennou bude spomínaná absolútna hodnota rezíduí a vysvetľujúcou
premennou pôvodná premenná. Vo výstupe z pomocnej regresie ma bude zaujímať p-hodnota
vysvetľujúcej premennej. Pokiaľ daná premenná spôsobuje na danej hladine významnosti
heteroskedasticitu, očakávam p-hodnotu nižšia ako hladina významnosti. Pokiaľ je p-hodnota
väčšia, parameter je v pomocnej regresií štatisticky nevýznamný a prijímame nulovú hypotézu,
že parameter nespôsobuje v modeli heteroskedasticitu (H1: parameter spôsobuje
heteroskedasticitu). Pre jednotlivé premenné mi vyšli p-hodnoty zobrazené v tabuľke 7. Na 5%
hladine významnosti zamietame H0 len pri premennej nezamestnanosť. Je tu predpoklad, že
táto premenná spôsobuje hetereskodesticitu v modeli. Pokiaľ by bola hladina významnosti
stanovená na 1%, nulovú hypotézu by sme nezamietali vôbec na žiadnej premennej.
Tabuľka 7: p-hodnoty vysvetľujúcich premenných v pomocnej regresií pri Glejserovom teste
premenná p-hodnota
absolventi 0,707827087
nezamestnanost 0,019839688
ekon_akt_obyv 0,47948921
madari 0,281490045
romovia 0,233390778
Zdroj: Vlastné spracovanie
V prvom teste vyšlo, že model nie je zaťažený problémom heteroskedasticity. Tento
model to však nepotvrdil. Preto bude vhodné vykonať ešte jeden test pre parameter
nezamestnanosť. Bude ním test trendu rezíduí založený na Spearmanovom korelačnom
koeficiente. Postup je rovnaký ako pri Glejserovom teste až po vypočítanie absolútnych hodnôt
rezíduí. Ďalší postup bude odlišný. Pre každé rezíduum v absolútnej hodnote sa určí celkové
poradie zo všetkých rezíduí. Rovnako sa určí aj poradie hodnôt regresora nezamestnanosť.
Vypočíta sa štvorec rozdielov týchto poradí a spraví sa jeho súčet, v tomto prípade Σdi2 = 140.
V ďalšom kroku spočítam Spearmanov korelačný koeficient
24
ρ� = 1 −�∗���
�
�(����) = 1 −
�∗���
�(����) = -0,667
Významnosť tohto koeficienta určíme pomocou otestujeme na 5% hladine významnosti
pomocou testovacej štatistiky � = ρ�����
���� , ktorá má studentovo t-rozdelenie s n-2 stupňami
voľnosti. Nulová hypotéza je zadaná tak, že nepredpokladá koreláciu medzi rezíduami
a hodnotami premennej, t.j. H0 predpokladá homoskedasticitu testovanej premennej. Vyčíslené
výsledky tohto testu zobrazuje tabuľka 8. p-hodnota vyššia ako bežné hladiny významnosti
a testovacia štatistika nižšia ako kritická hodnota (na 5% hladine významnosti) stanovujú, že
nulovú hypotézu nezamietame a teda sa pri premennej nezamestnanosť nepotvrdil výskyt
heteroskedasticity.
Tabuľka 8: Spearmanov koeficient, testovacia štatistika, kritická a p-hodnota pri teste trendu
rezíduí založenom na Spearmanovom korel. koeficiente u premennej nezamestnanosť
Spearmanov koeficient -0,66667
testovacia štatistika 0,05 1,264911
kritická hodnota 2,446912
p-hodnota 0,25281
Zdroj: Vlastné spracovanie
Na potvrdenie tohto záveru poslúži aj graf závislosti rezíduí modelu a premennej
nezamestnanosť (graf 11). Z neho je zrejmé, že medzi týmito premennými nie je žiadna závislosť
a rezíduá sú rozdelené náhodne a nezávisle.
Graf 11: Graf závislostí rezíduí modelu a nezamestnanosti
Zdroj: Výstup z Eviews
4
6
8
10
12
14
16
18
20
-400 -300 -200 -100 0 100 200 300
RESID
NE
ZA
ME
ST
NA
NO
ST
25
4.3 Testovanie autokorelácie
Ďalší z ekonometrických problémom, ktorý sa môže vyskytnúť a spôsobuje nedodržanie
predpokladov lineárneho regresného modelu je autokorelácia. Znamená to, že jednotlivé
náhodné chyby sú navzájom korelované, teda sú ovplyvňované náhodnými chybami iných
pozorovaní.
V tomto sledovanom súbore nie je možné prvý test použiť z dôvodu, že skúmaný model
neobsahuje „dostatočný“ počet pozorovaní (min.15), teda nepoznám tabelované hodnoty
dolnej a hornej hranice, medzi ktorými sa určite bude nachádzať hľadaná kritická hodnota.
Preto využijem Breuscherov-Godfreyov test. Tento test vykonám pomocou programu Eviews.
Nulová hypotéza zamieta výskyt autokorelácie, naopak alternatívna ju potvrdzuje. Je možné
použiť dva druhy testovacích štatistík - buď klasický Fisherov test alebo chí-kvadrát test, ako
špeciálny prípad LM (Lagrange multiplier) testu. Vďaka p-hodnote Fisherovho testu (0,2947)
neprítomnosť autokorelácie potvrdzujem na všetkých bežných hladinách významnosti. Naopak
chí-kvadrát test potvrdzuje prítomnosť autokorelácie, bude pre to potrebné urobiť viacero
testov. Výsledok je zobrazený v tabuľke 9.
Tabuľka 9: Výstup Breuschovho-Godfreyovho testu
Breusch-Godfrey Serial Correlation LM Test: F-statistic 4.015533 Prob. F(1,1) 0.2947
Obs*R-squared 6.404955 Prob. Chi-Square(1) 0.0114
Zdroj: Výstup z Eviews
Zistený záver potvrdím aj t-testom urobeným v MS Exceli a výpočtom Von Neumannovho
pomeru. Pri t-teste si najskôr vytvorím tabuľku rezíduí, ktorá je zobrazená v tabuľke 10.
Pomocou vzorca dostanem hodnotu autokorelačného koeficientu �� =∑��∗����
∑��� = −0,368. Pre
získanie testovacej štatistiky dosadím získanú hodnotu do t-testu � = �� ∗√���
√����= −0,445,
pričom n predstavuje počet pozorovaní už po posune. Hypotézy budú stanovené tak, že H0
predpokladá vzájomnú koreláciu medzi rezíduami a alternatívna hypotéza ju vyvracia. Na 5%
hladine významnosti dosiahnem kritickú hodnotu 4,303 a nulovú hypotézu nezamietam,
autokorelácia rezíduí nie je štatisticky významná.
26
Tabuľka 10: Získané rezíduá a ich súčiny
Observation Predicted tr_ciny Residuals Standard Residuals ei*ei-1 ei^2
1 23990,28556 12,71443619 0,064578189 x 161,6568877
2 10253,86531 -344,8653113 -1,751613424 -4384,767996 118932,083
3 8240,710271 260,2897289 1,322043616 -89764,89839 67750,74297
4 10060,83559 156,1644093 0,793178283 40647,99176 24387,32273
5 11594,48265 -100,4826468 -0,510363749 -15691,81319 10096,76232
6 13679,27552 22,72447581 0,115420414 -2283,415478 516,401801
7 11386,5586 -160,5586016 -0,815496928 -3648,610059 25779,06455
8 14267,98649 154,0135096 0,782253599 -24728,19372 23720,16113
-99853,70707 271182,5384
Zdroj: Vlastné spracovanie podľa výstupu z MS Excel
Ďalším testom na detekciu prítomnosti problému autokorelácie je Von Neumannov
pomer. Jeho výpočet prebieha na základe údajov Durbinovho-Watsonovho testu. Hodnota
tohto testu sa nachádza v tabuľke 5 a je 2,648. Von Neumannov pomer vypočítame ako
� =�
���∗ � = 3,026. Ďalším krokom je vyhľadanie dolnej (D+ = 1,1228) a hornej (D- = 3,4486)
hranice v tabuľke kritických hodnôt rozdelenia D pre príslušnú hladinu významnosti. Pokiaľ
hodnota Von Neumannovho pomeru leží v intervale dolnej a hornej hranice, autokorelácia je
nevýznamná na danej hladine významnosti. Môžem teda povedať, že ani tento test prítomnosť
autokorelácie na 5% hladine významnosti nepotvrdil.
4.4 Testovanie multikolinearity
Pri zisťovaní multikolinearity v tomto súbore je potrebné najskôr preskúmať koreláciu
medzi vysvetľujúcimi premennými. Vytvorím si korelačnú maticu v MS Exceli (tabuľka 11).
Budem sa snažiť vyhodnotiť prítomnosť multikolinearity pomocou orientačných kritérií.
V korelačnej matici je najsilnejšia závislosť medzi premennými Rómovia a miera
nezamestnanosti. Koeficient korelácie dosahuje však len hodnotu 0,713 a je menší ako hodnota
0,8. Už táto skutočnosť naznačuje, že v tejto dátovej množine sa multikolinearita nenachádza.
Tabuľka 11: Korelačná matica vysvetľujúcich premenných
absolventi nezamestnanost ekon_akt_obyv madari romovia
absolventi 1 -0,502758994 0,236314831 0,027236676 -0,299045946
nezamestnanost -0,502758994 1 0,379684434 0,206133027 0,713295896
ekon_akt_obyv 0,236314831 0,379684434 1 -0,057883371 0,677284262
madari 0,027236676 0,206133027 -0,057883371 1 -0,111571457
romovia -0,299045946 0,713295896 0,677284262 -0,111571457 1
Zdroj: Výstup z Eviews
27
Aby som si mohla byť úplne istá, je potrebné urobiť aj sofistikovanejší test. Rozhodla som
sa pre Farrarovu-Glauberovu metódu. V prvom kroku bolo potrebné z už zostrojenej korelačnej
matice vypočítať jej determinant. Ten má hodnotu D = 0,093. Uvádza sa, že pokiaľ je hodnota
blízko pri 0, bude sa v súbore vyskytovať multikolinearita. Získaná hodnota je síce blízko, ale nie
nejako extrémne. V ďalšom kroku vypočítam testovaciu štatistiku, ktorá bude mať chí-kvadrát
rozdelenie. Je potrebné stanoviť si hypotézy:
H0: D = 1 (v testovanom súbore nie je prítomná multikolinearita)
H1: D < 1 (v testovanom súbore je prítomná multikolinearita)
Hodnota testovacej štatistiky je 2 = 10,676. Počet stupňov voľnosti tohto rozdelenia bude k *
(k - 1) = 20, pričom k predstavuje počet nezávislých premenných. Na zamietnutie alebo
nezamietnutie nulovej hypotézy potrebujem zistiť p-hodnotu a kritickú hodnotu. Výsledky
zobrazuje tabuľka 12. Vysoká p-hodnota a testovacia štatistika pod úrovňou kritickej hodnoty
hovoria o tom, že nemôžeme zamietnuť nulovú hypotézu. Potvrdil sa môj predpoklad, že
v sledovanom súbore sa multikolinearita nevyskytuje.
Tabuľka 12: Testovacia štatistika, kritická a p-hodnota pri Farrarovej-Glauberovej metóde
testovacia štatistika 10,6758374
kritická hodnota 0,05 31,41043284
p-hodnota 0,954199734
Zdroj: Vlastné spracovanie
4.5 Testovanie stability
Testy stability umožňujú rozpoznať existenciu dátových segmentov, ktorým v príslušnom
modeli zodpovedajú odlišné parametrické hodnoty. Test stability modelu je vykonám za pomoci
CUSUM testu. Na základe tohto testu EViews zostrojí graf, ktorý rozoznáva zmenu modelu v
istom okamihu. CUSUM test počíta kumulatívnu sumu rekurzívnych rezíduí. Tento test zobrazí
túto sumu s 5% hraničnou oblasťou. Ak sa kumulatívna suma nachádza mimo tejto oblasti,
naznačuje to nestabilitu parametrov rovnice. Parametre tejto rovnice nestabilné nie sú s 95%
spoľahlivosťou (graf 12). Pokiaľ by som chcela zistiť nestabilitu parametrov aj mimo vymedzenej
5% hladiny významnosti, je na to vhodný CUSUM of Squares test.
28
Graf 12: Výsledok CUSUM testu a CUSUM of Squares testu
Zdroj: Výstup z Eviews
4.6 Testovanie špecifikácie
Zaujíma ma, či zostrojený model má správnu špecifikáciu. „Obecným testom vhodným na
zisťovanie špecifikačných chýb vznikajúcich v dôsledku vynechania vysvetľujúcich premenných
alebo chybnou analytického tvaru modelu je test RESET.“ (HUŠEK, 1999 s. 61) Použijem teda
tento test na posúdenie správnej špecifikácie zostaveného modelu. V nulovej hypotéze budem
predpokladať, že model je špecifikovaný korektne, alternatívna hypotéza opačná. Vo výstupe
z Eviews budem očakávať vysoké p-hodnoty.
Výstup zobrazuje tabuľka 13. Všetky tri testovacie štatistiky dosahujú p-hodnotu oveľa
vyššiu ako bežné hladiny významnosti. Nezamietam nulovú hypotézu a model považujem za
správne a korektne špecifikovaný.
Tabuľka 13: Výstup RESET testu
Ramsey RESET Test Value df Probability
t-statistic 0.441290 1 0.7354 F-statistic 0.194737 (1, 1) 0.7354 Likelihood ratio 1.423407 1 0.2328
Zdroj: Výstup z Eviews
4.7 Posúdenie predikčnej schopnosti modelu
V tejto časti práce sa budem snažiť model otestovať. Nakoľko je skúmaný súbor malý
(obsahuje len 8 krajov), nemohla som si dovoliť vybrať z neho ešte ďalšie pozorovania, ktoré by
-6
-4
-2
0
2
4
6
7 8
CUSUM 5% Significance
0.0
0.2
0.4
0.6
0.8
1.0
1.2
1.4
1.6
7 8
CUSUM of Squares5% Significance
29
som použila na predikciu. Preto som sa rozhodla otestovať ho na dátach z nasledujúceho roka
2010. Porovnanie skutočne získaných hodnôt a hodnôt získaných po aplikácií regresného
modelu zobrazuje tabuľka 14. Rozdiely sú rôzne v závislosti od krajov. Najväčšiu odlišnosť som
zaznamenala pri Bratislavskom kraji. Predikovaná hodnota sa od tej reálne líšila takmer o 7 200
trestných činov, čo predstavuje takmer 35% podiel na skutočných hodnotách. Najpresnejšia
predikcia bola pri kraji Nitrianskom, kde rozdiel tvoril menej ako 0,5%. Pomerne vysoká
presnosť bola zaznamenaná aj Banskobystrickom kraji (rozdiel len 5,36%) a Žilinskom kraji
(rozdiel 6,10%). U ostatných krajov sa rozdiel pohyboval v intervale od 13% po 19%.
Tabuľka 14: Rozdiel medzi predikovanými a skutočnými počtami trestných činov v roku 2010
rok 2010 skutočné hodnoty
predikované hodnoty
absolútny rozdiel
percentuálny rozdiel
Bratislavský 20767 27945,30 7178,30 34,57%
Trnavský 8870 10329,95 1459,95 16,46%
Trenčiansky 7581 9017,10 1436,10 18,94%
Nitriansky 9739 9717,51 -21,49 -0,22%
Žilinský 10551 11194,11 643,11 6,10%
Banskobystrický 12316 12976,12 660,12 5,36%
Prešovský 10247 11648,72 1401,72 13,68%
Košický 13761 15558,24 1797,24 13,06% Zdroj: Vlastné spracovanie
Nemôžem povedať, že mnou zostrojený model by mal po aplikácií na rozdielne časové
obdobie uspokojivú predikčnú schopnosť. Kladiem to za následok tomu, že model bol
odhadovaný na malom súbore, nemá teda dostatočnú presnosť, hoci testy špecifikácie
nepotvrdili zlý tvar alebo špecifikáciu modelu.
30
Záver
V mojej práci som sa snažila odhadnúť lineárny regresný model a potvrdiť jeho klasické
predpoklady. Odhadovanou premennou bol počet trestných činov v jednotlivých krajoch
Slovenska. Ako regresory som v prvotnom modeli použila premenné počet absolventov,
percentuálnu mieru nezamestnanosti, ekonomicky aktívnych obyvateľov (v tisícoch osôb),
počet osôb maďarskej a rómskej menšiny žijúcich na danom území a premennú populácia.
Posledná menovaná premenná sa ukázala ako štatisticky nevýznamná pre model, preto som ju
vylúčila. Pomocou programu Eviews som vytvorila model, ktorý mal tvar tr_ciny = 17 021,42 +
+ 1,067*absolventi + 261,013*nezamestnanost - 49,891*ekon_akt_obyv - 0,017*madari +
+ 0,099*romovia.
Už v predchádzajúcich kapitolách práce som sa snažila odhadnúť, aké znamienka dosiahnu
regresné koeficienty jednotlivých exogénnych premenných. Teraz mám možnosť porovnať
mnou odhadnuté znamienka regresných koeficientov s reálne získanými hodnotami.
Pri premennej absolventi som očakávala záporné znamienko regresného koeficientu, no
tento predpoklad sa nenaplnil. Regresný koeficient bol kladný a mal hodnotu 1,067 čo hovorí
o tom, že pokiaľ by v regióne vzrástol počet absolventov vysokých škôl priemerne o 1 000,
vzrástol by aj počet evidovaných trestných činov v priemere o 1 067, pokiaľ by sa ostatné
premenné nezmenili. Možno je to len zhoda okolností alebo vysokoškolský titul nezaručuje
morálne hodnoty jeho držiteľa a ich dodržiavanie ako som sa domnievala.
U premennej nezamestnanosť nadobudol regresný koeficient hodnotu 261,013, teda ak
v regióne poklesne miera nezamestnanosti priemerne o 1%, zníži sa počet kriminálnych činov
v priemere o 261, ceteris paribus. Potvrdil sa mi úsudok, že pokiaľ je v regióne vysoká miera
nezamestnanosti, rozširuje sa chudoba a ľudia sa viac uchyľujú k trestnej činnosti. Regresný
koeficient premennej ekonomicky aktívne obyvateľstvo naopak nadobudol zápornú hodnotu -
49,891, to znamená že s rastom ekonomicky aktívneho obyvateľstva o 1 000 ľudí poklesne
počet trestných činov o priemerne 50. Pracujúci obyvatelia a ľudia aktívne si hľadajúci prácu sa
snažia zmeniť svoju situáciu a zabezpečiť rodiny legálnou cestou a vyhýbajú sa trestnej činnosti.
U premenných týkajúcich sa národnostných menším som v odhade znamienka regresného
koeficientu dosiahla polovičnú úspešnosť. Kým pri premennej Rómovia je naozaj regresný
31
koeficient kladný (0,099), premenná Maďari hod dosiahla záporný (-0,017). odhad. Čo sa týka
rómskeho obyvateľstva, regresný koeficient má očakávanú kladnú hodnotu. Potvrdil sa teda
môj odhad, že rómsky občania sú hlavne vďaka pretrvávajúcej chudobe a vysokej
nezamestnanosti viac náchylní na konanie trestnej činnosti. Po nasťahovaní sa 1 000 Rómov do
regiónu (ceteris paribus) by nastal vzostup kriminality o priemerne 99 kriminálnych činov.
U maďarských občanov sa ukázal opak.
Na otestovanie predikčných schopností modelu som použila dáta z nasledujúceho
časového obdobia (rok 2010). Model ukázal pri jednotlivých regiónoch rozdielnu schopnosť
predikcie, keď sa odchýlky predikovaných hodnôt odchyľovali od skutočne zistených hodnôt
o 0,22 až 34,57%. Nie teda možné potvrdiť jeho dobrú predikčnú schopnosť a bolo by potrebné
ho do budúcna vylepšiť.
V mojej práci som zistila, že je možné znižovať kriminalitu v jednotlivých regiónoch hlavne
ovplyvňovaním miery nezamestnanosti. Pokiaľ by sa výrazne zvýšil počet pracovných miest
a poklesla miera nezamestnanosti, dá sa predpokladať, že kriminalita by tiež výraznejšie
poklesla. Ako však dokazuje Phillipsova krivka, s poklesom miery nezamestnanosti (ceteris
paribus) prichádza rast inflácie. A je otázkou, aký vplyv by mal pokles kúpnej sily peňazí na
počet trestných činov. Korelačná matica ukázala, že silná korelácia je hlavne medzi
nezamestnanosťou a rómskym obyvateľstvom. V výsledkov tejto analýzy vyplýva, že je potrebné
riešiť otázku rómskej nezamestnanosti a tým sa snažiť znižovať kriminalitu.
Najväčšou slabinou tohto modelu je malé množstvo pozorovaní. Tento problém spôsobil,
že niektoré testy nebolo možné vykonať a musela som ich nahradiť inými. No potvrdila som
všetky klasické predpoklady lineárneho regresného modelu. Do budúcna by bolo vhodné model
rozpracovať na regionálnych dáta (okresných) a získané výsledky potvrdiť.
32
Bibliografia
Prednášky a cvičenia doc. Vladimíra Úradníčka z predmetu Ekonometria
Filozofická a Pedagogická fakulta Masarykovy univerzity. 2012. Ekonometria. El-dům. [Online]
2012. [Dátum: 3. 1. 2013.] http://eldum.phil.muni.cz/course/view.php?id=20
HUŠEK, R. 1999. Ekonometrická analýza. Praha : Ekopress, 1999. s. 303. ISBN 80-86119-19-X.
Štatistický úrad SR. 2012. Databáza. RegDat databáza regionálnej štatistiky. [Online] 2012.
[Dátum: 3. 1. 2013.] http://px-web.statistics.sk/PXWebSlovak/.
Štatistický úrad SR. 2012. Trh práce metodické vysvetlivky. RegDat databáza regionálnej
štatistiky. [Online] 2012. [Dátum: 3. 1. 2013.] http://px-web.statistics.sk/PXWebSlovak/.
33
Prílohy
Príloha 1: Histogramy jednotlivých premenných
Zdroj: Výstup z Eviews
0.0
0.4
0.8
1.2
1.6
2.0
2.4
2.8
3.2
10000 15000 20000 25000
Trestné ciny
0
1
2
3
4
5
6
7
0 5000 10000 15000 20000 25000
Absolventi
0.0
0.4
0.8
1.2
1.6
2.0
2.4
2.5 5.0 7.5 10.0 12.5 15.0 17.5 20.0
Nezamestnanost
0.0
0.4
0.8
1.2
1.6
2.0
2.4
275 300 325 350 375 400
Ekonomicka aktivita
0
1
2
3
4
5
0 50000 100000 150000 200000
Madari
0
1
2
3
4
5
6
0 10000 20000 30000 40000
Rómovia
0.0
0.4
0.8
1.2
1.6
2.0
2.4
600000 700000 800000
Populacia