Többváltozós lineáris regressziós modell feltételeinek...
Transcript of Többváltozós lineáris regressziós modell feltételeinek...
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Többváltozós lineáris regressziós modell feltételeinek tesztelése I.
- A hibatagra vonatkozó feltételek tesztelése -
Kvantitatív statisztikai módszerekPetrovics Petra
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Többváltozós lineáris regressziós modell
• x1, x2, …, xp és y közötti kapcsolatot ábrázoló egyenes.
• Az y függ:
• x1, x2, …, xp – p db magyarázó változótól
• A véletlen ingadozásától (ε)
• β0, β1, …, βp regressziós együtthatóktól.
Y = β0 + β1x1 + β2x2 +…+ βpxp +ε
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A hibatagra vonatkozó feltételek
1. Várható értéke 0 M(ε) = 0
2. Varianciája konstans Var(ε) = 2
3. A hibatag értékei nem autokorreláltak.
4. Normális eloszlású valószínűségi változó.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A magyarázó változókra vonatkozó feltételek
1. Egymástól lineárisan függetlenek legyenek. (egyik magyarázó változót se lehessen a többi magyarázó változó lineáris kombinációjaként előállítani)
2. Értékeik rögzítettek legyenek, neváltozzanak mintáról mintára.
3. Mérési hibát nem tartalmaznak.
4. Nem korrelálnak a hibatényezővel.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Standard lineáris regressziós modell
Ahol az előbb említett feltételek teljesülnek.
Amennyiben a mintabeli adatok nemigazolják a feltételek teljesülését,bonyolultabb modellre és becslésieljárásokra van szükség.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
SPSS (Feladat)
y - árbevétel x1-vagyon x2-létszám
1 35 54 98
2 27 52 120
3 42 50 95
4 47 58 145
5 53 82 184
6 45 72 106
7 61 120 240
8 58 108 175
9 65 92 165
10 77 122 202
10 véletlenszerűen kiválasztott vállalat adatai a következők:
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A hibatagra vonatkozó feltételek ellenőrzése
a) Várható értéke 0 M(ε) = 0
b) Varianciája konstans Var(ε) = 2
c) A hibatag értékei nem autokorreláltak.
d) Normális eloszlású valószínűségi változó.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
1. M(ε) = 0
• A hibatagok pozitív és negatív értékeikiegyenlítik egymást.
• Ha eltér a 0-tól, annak oka lehet, hogykihagytunk a modellből egy szignifikánsmagyarázó változót.
• Nehéz a gyakorlatban ellenőrizni.
• Ha feltételezzük, hogy a legkisebb négyzetekmódszere érvényesül, akkor teljesül ez a feltétel.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A hibatagra vonatkozó feltételek ellenőrzése
a) Várható értéke 0 M(ε) = 0
b) Varianciája konstans Var(ε) = 2
c) A hibatag értékei nem autokorreláltak.
d) Normális eloszlású valószínűségi változó.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
2. Homoszkedaszticitás (Var(ε) = 2)
• A hibatag varianciája állandó.
Ha nem: heteroszkedaszticitás
Logaritmizálni!
• Tesztelése:
o Grafikus – a becsült reziduumokat a kiválasztott
magyarázó változó vagy az ŷ függvényében ábrázoljuk
o Statisztikai tesztek – Goldfeld-Quandt-féle teszt
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
xi xi
Homoszkedaszticitás grafikus tesztelése
Homoszkedasztikus hibatag Heteroszkedasztikus hibatag
e
xi
e e
ŷ ŷŷ
e – reziduum xi – becsült érték
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
• H0: j2 = 2
H1: j2 ≠ 2
• Lépései:
1. Rangsor
2. Független részminták ( , ahol r > 0, > p )
3. Regressziós függvények, reziduális szórásnégyzet (se2)
4. F-próba:
Homoszkedaszticitás Goldfeld-Quandt-féle tesztelése
2
2
r-n
2
2
2
1
2
2
2
1
s
s
e
eF
2
r-n;;
2
r-nr
2
r-n
221
rn
(a varianciák eloszlást követnek és ezek egymástól függetlenek)
H0
F(1-α/2); ν1,ν2F(α/2)
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Analyze / Regression / Linear… - Plots
SPSS
Függő változóStandardizált becsült érték
Standardizált reziduumTörölt reziduum
Korrigált becsült értékStudentizált reziduum
Studentizált törölt reziduum
Standardizált becsült érték (ZPRED) és a standardizált reziduum(ZRESID) viszonya – Homoszkedaszticitás?
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Output
A reziduumok varianciája ~konstans Homoszkedaszticitás
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Ha heteroszkedasztikus…LOGARITMIZÁLÁS!Transform/Computevariable…
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A hibatagra vonatkozó feltételek ellenőrzése
a) Várható értéke 0 M(ε) = 0
b) Varianciája konstans Var(ε) = 2
c) A hibatag értékei nem autokorreláltak.
d) Normális eloszlású valószínűségi változó.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A hibatag értékei korrelálatlanok• Egyszerű véletlen mintavétel esetében ez a feltétel
automatikusan teljesül.
• Ha a modell idősoros adatokra épül, gyakran előfordul ahibatagok autokorreláltsága.
• Autokorreláció oka:
– Nem megfelelő függvénytípus.
– Nem véletlen jellegű mérési hiba.
– A modellben nem szerepel valamennyi lényegesmagyarázó változó (nem tudjuk, hogy kell / túl rövid idősor / nincs
adat).
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A kihagyott változókmiatt a reziduumoknem véletlenszerűek,hanem az egymástkövető értékek közöttjelentős korrelációvan.
Autokorreláció grafikus tesztelése
t
e e
t
e
t
Az autokorreláció afüggvénytípus helytelenmegválasztásának akövetkezménye.
+KVANTITATÍVTESZTEK!
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
H0: ρ = 0 korrelálatlan
H1: ρ ≠ 0 autokorreláció
0 dl du 2 4-du 4-dl 4
Autokorreláció tesztelése Durbin-Watson próbával
- zavaró autokorreláció
+ zavaró autokorreláció
Határai:
Pozitív autokorreláció:
Negatív autokorreláció:
Bizonytalansági tartomány: nem tudunk dönteni
• Növelni kell a megfigyelésekszámát
• Új változót kell bevonni
40 d
20 d
42 d
Elfogadási tartomány
n
t
t
n
t
tt
e
ee
d
1
2
2
2
1)(
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A Durbin-Watson próba döntési táblázata
H1 Elfogadjuk H0:p=0Elvetjük
Nincs döntés
p>0Pozitív autokorreláció
d>du d<dl dl<d<du
p<0Negatív autokorreláció
d<4-du d>4-dl 4-dl<d<4-du
Forrás: Kerékgyártó-Mundruczó [1999]
du illetve dl értékét a Durbin-Watson táblázatból határozzuk meg
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Durbin-Watson próba - SPSS
Analyze / Regression / Linear… - Statistics
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Durbin-Watsonstatisztika (5%-os szignifikanciaszint
mellett)
n m = 1 m = 2 m = 3 m = 4 m = 5dL dU dL dU dL dU dL dU dL dU
15 1,08 1,36 0,95 1,54 0,82 1,75 0,69 1,97 0,56 2,21
16 1,10 1,37 0,98 1,54 0,86 1,73 0,74 1,93 0,62 2,15
17 1,13 1,38 1,02 1,54 0,90 1,71 0,78 1,90 0,67 2,10
18 1,16 1,39 1,05 1,53 0,93 1,69 0,82 1,87 0,71 2,06
19 1,18 1,40 1,08 1,53 0,97 1,68 0,86 1,85 0,75 2,02
20 1,20 1,41 1,10 1,54 1,00 1,68 0,90 1,83 0,79 1,99
21 1,22 1,42 1,13 1,54 1,03 1,67 0,93 1,81 0,83 1,96
22 1,24 1,43 1,15 1,54 1,05 1,66 0,96 1,80 0,86 1,94
23 1,26 1,44 1,17 1,54 1,08 1,66 0,99 1,79 0,90 1,92
24 1,27 1,45 1,19 1,55 1,10 1,66 1,01 1,78 0,93 1,90
25 1,29 1,45 1,21 1,55 1,12 1,66 1,04 1,77 0,95 1,89
26 1,30 1,46 1,22 1,55 1,14 1,65 1,06 1,76 0,98 1,88
27 1,32 1,47 1,24 1,56 1,16 1,65 1,08 1,76 1,01 1,86
28 1,33 1,48 1,26 1,56 1,18 1,65 1,10 1,75 1,03 1,85
29 1,34 1,48 1,27 1,56 1,20 1,65 1,12 1,74 1,05 1,84
30 1,35 1,49 1,28 1,57 1,21 1,65 1,14 1,74 1,07 1,83
31 1,36 1,50 1,30 1,57 1,23 1,65 1,16 1,74 1,09 1,83
32 1,37 1,50 1,31 1,57 1,24 1,65 1,18 1,73 1,11 1,82
33 1,38 1,51 1,32 1,58 1,26 1,65 1,19 1,73 1,13 1,81
34 1,39 1,51 1,33 1,58 1,27 1,65 1,21 1,73 1,15 1,81
35 1,40 1,52 1,34 1,58 1,28 1,65 1,22 1,73 1,16 1,80
36 1,41 1,52 1,35 1,59 1,29 1,65 1,24 1,73 1,18 1,80
37 1,42 1,53 1,36 1,59 1,31 1,66 1,25 1,72 1,19 1,80
38 1,43 1,54 1,37 1,59 1,32 1,66 1,26 1,72 1,21 1,79
39 1,43 1,54 1,38 1,60 1,33 1,66 1,27 1,72 1,22 1,79
40 1,44 1,54 1,39 1,60 1,34 1,66 1,29 1,72 1,23 1,79
50 1,50 1,59 1,46 1,63 1,42 1,67 1,38 1,72 1,34 1,77
60 1,55 1,62 1,51 1,65 1,48 1,69 1,44 1,73 1,41 1,77
70 1,58 1,64 1,55 1,67 1,52 1,70 1,49 1,74 1,46 1,77
80 1,61 1,66 1,59 1,69 1,56 1,72 1,53 1,74 1,51 1,77
90 1,63 1,68 1,61 1,70 1,59 1,73 1,57 1,75 1,54 1,78
100 1,65 1,69 1,63 1,72 1,61 1,74 1,59 1,76 1,57 1,78
Forrás: Statisztikai képletgyűjtemény
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
0 dl du 2 4-du 4-dl 40,95 1,54 2,46 3,05
1,381
dl<d<du → nincs döntés
→Be kell venni még változót a modellbe / Növelni kell a megfigyelések számát!
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A hibatagra vonatkozó feltételek ellenőrzése
a) Várható értéke 0 M(ε) = 0
b) Varianciája konstans Var(ε) = 2
c) A hibatag értékei nem autokorreláltak.
d) Normális eloszlású valószínűségiváltozó.
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
A hibatag eloszlása normális
Tesztelése:
• Grafikusan – a reziduumokat várható értékükfüggvényében ábrázoljuk
haranggörbe – normális eloszlás
• Kvantitatív módszerekkel – illeszkedésvizsgálat
- próba
• Ferdeségi, csúcsossági mérőszámokkal
2
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Analyze / Regression / Linear… - Plots
Grafikus tesztelés - SPSS
Függő változóStandardizált becsült érték
Standardizált reziduumTörölt reziduum
Korrigált becsült értékStudentizált reziduum
Studentizált törölt reziduum
Hisztogram
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Output
A harang alakú standard normális eloszlás középértéke 0, szórása 1.
Közelítőleg NORMÁLIS (de nem egyértelműen)
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
2. megoldás
Analyze / Regression / Linear… - SAVE
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Graphs / Histogram - Display normal curve
Közelítőleg normális eloszlás.
A normális eloszlásgörbe harang alakú.
Normális eloszlás grafikus tesztelése 2. -SPSS
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Nonparametric TestAnalyze / Nonparametric Test / 1-Samle K-S...
H0 - normális eloszlásH1 - nem normális eloszlás
• Gazdaságtudományi Kar• Gazdaságelméleti és Módszertani Intézet
Output
Ha a szignifikanciaszint (p) kisebb mint 5% (0,05), elutasítjuk a nullhipotézist. Most nagyobb 0,05-nél, vagyis elfogadjuk, hogy normális eloszlású a görbe.
Normális eloszlású