Többváltozós lineáris regressziós modell feltételeinek...
Transcript of Többváltozós lineáris regressziós modell feltételeinek...
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Többváltozós lineáris
regressziós modell feltételeinek
tesztelése I.tesztelése I.
- A hibatagra vonatkozó feltételek tesztelése -
Petrovics PetraDoktorandusz
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Többváltozós lineáris
regressziós modell
• x1, x2, …, xp és y közötti kapcsolatot ábrázoló egyenes.
• Az y függ: • Az y függ:
• x1, x2, …, xp – p db magyarázó változótól
• A véletlen ingadozásától (ε)
• β0, β1, …, βp regressziós együtthatóktól.
Y = β0 + β1x1 + β2x2 +…+ βpxp +ε
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
A hibatagra vonatkozó feltételek
1. Várható értéke 0 ⇒ M(ε) = 0
2. Varianciája konstans ⇒ Var(ε) = σ22. Varianciája konstans ⇒ Var(ε) = σ2
3. A hibatag értékei nem autokorreláltak.
4. Normális eloszlású valószínűségi változó.
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
A magyarázó változókra
vonatkozó feltételek
1. Egymástól lineárisan függetlenek legyenek. (egyik magyarázó változót se lehessen a többi magyarázó változó lineáris kombinációjaként előállítani)változó lineáris kombinációjaként előállítani)
2. Értékeik rögzítettek legyenek, neváltozzanak mintáról mintára.
3. Mérési hibát nem tartalmaznak.
4. Nem korrelálnak a hibatényezővel.
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Standard lineáris regressziós
modell
Ahol az előbb említett feltételek teljesülnek.
⇒Amennyiben a mintabeli adatok nemigazolják a feltételek teljesülését,bonyolultabb modellre és becslésieljárásokra van szükség.
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
SPSS (Feladat)
y - árbevétel x1-vagyon x2-létszám
1 35 54 98
2 27 52 120
3 42 50 95
10 véletlenszerűen kiválasztott vállalat adatai a következők:
3 42 50 95
4 47 58 145
5 53 82 184
6 45 72 106
7 61 120 240
8 58 108 175
9 65 92 165
10 77 122 202
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
A hibatagra vonatkozó feltételek
ellenőrzése
a) Várható értéke 0 ⇒⇒⇒⇒ M(ε) = 0a) Várható értéke 0 ⇒⇒⇒⇒ M(ε) = 0
b) Varianciája konstans ⇒ Var(ε) = σ2
c) A hibatag értékei nem autokorreláltak.
d) Normális eloszlású valószínűségi változó.
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
1. M(ε) = 0
• A hibatagok pozitív és negatív értékeikiegyenlítik egymást.
• Ha eltér a 0-tól, annak oka lehet, hogykihagytunk a modellből egy szignifikánskihagytunk a modellből egy szignifikánsmagyarázó változót.
• Nehéz a gyakorlatban ellenőrizni.
• Ha feltételezzük, hogy a legkisebb
négyzetek módszere érvényesül, akkorteljesül ez a feltétel.
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
A hibatagra vonatkozó feltételek
ellenőrzése
a) Várható értéke 0 ⇒ M(ε) = 0
b) Varianciája konstans ⇒⇒⇒⇒ Var(ε) = σσσσ2b) Varianciája konstans ⇒⇒⇒⇒ Var(ε) = σσσσ2
c) A hibatag értékei nem autokorreláltak.
d) Normális eloszlású valószínűségi változó.
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
2. Homoszkedaszticitás (Var(ε) = σσσσ2)
• A hibatag varianciája állandó.
Ha nem: heteroszkedaszticitás
⇒ Logaritmizálni!⇒ Logaritmizálni!
• Tesztelése:o Grafikus – a becsült reziduumokat a kiválasztott
magyarázó változó vagy az ŷ függvényében ábrázoljuk
o Statisztikai tesztek – Goldfeld-Quandt-féle teszt
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Homoszkedaszticitás grafikus
tesztelése
e e e
xi xi
Homoszkedasztikus hibatag Heteroszkedasztikus hibatag
xi
ŷ ŷŷ
e – reziduumxi – becsült érték
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
• H0: σj2 = σ2
H1: σj2 ≠ σ2
• Lépései:
Homoszkedaszticitás Goldfeld-
Quandt-féle tesztelése2
2
r-nχ(a varianciák eloszlást követnek és ezek egymástól függetlenek)
• Lépései:
1. Rangsor
2. Független részminták ( , ahol r > 0, > p )
3. Regressziós függvények, reziduális szórásnégyzet (se2)
4. F-próba: 22
21
22
21
s
s
e
eF ==
∑∑
2
r-n;;
2
r-nr
2
r-n
221
rn −== νν
H0
F(1-α/2); ν1,ν2F(α/2)
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Analyze / Regression / Linear… - Plots
SPSS
Függő változóStandardizált becsült érték
Standardizált reziduum
Törölt reziduumTörölt reziduumKorrigált becsült értékStudentizált reziduum
Studentizált törölt reziduum
Standardizált becsült érték (ZPRED) és a standardizált reziduum(ZRESID) viszonya – Homoszkedaszticitás?
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Output
A reziduumok varianciája ~konstans ⇒ Homoszkedaszticitás
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
?log ( )y
Ha heteroszkedasztikus…LOGARITMIZÁLÁS!
yxx1
x2…xp
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
A hibatagra vonatkozó feltételek
ellenőrzése
a) Várható értéke 0 ⇒ M(ε) = 0
b) Varianciája konstans ⇒ Var(ε) = σ2b) Varianciája konstans ⇒ Var(ε) = σ2
c) A hibatag értékei nem autokorreláltak.
d) Normális eloszlású valószínűségi változó.
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
A hibatag értékei korrelálatlanok
• Egyszerű véletlen mintavétel esetében ez a feltételautomatikusan teljesül.
• Ha a modell idősoros adatokra épül, gyakranelőfordul a hibatagok autokorreláltsága.előfordul a hibatagok autokorreláltsága.
• Autokorreláció oka:– Nem megfelelő függvénytípus.
– Nem véletlen jellegű mérési hiba.
– A modellben nem szerepel valamennyilényeges magyarázó változó (nem tudjuk, hogy kell /túl rövid idősor / nincs adat).
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
A kihagyott változók
miatt a reziduumoknem véletlenszerűek,hanem az egymástkövető értékek között
Autokorreláció grafikus tesztelése
t
e e
t követő értékek közöttjelentős korrelációvan.
t
e
Az autokorreláció afüggvénytípus helytelenmegválasztásának akövetkezménye.
+ KVANTITATÍV TESZTEK!
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
H0: ρ = 0 korrelálatlan
H1: ρ ≠ 0 autokorreláció
Autokorreláció tesztelése Durbin-
Watson próbával
�Határai: 40 ≤≤ d
∑
∑
=
=
−−
=n
t
t
n
t
tt
e
ee
d
1
2
2
21 )(
H1: ρ ≠ 0 autokorreláció
0 dl du 2 4-du 4-dl 4
- zavaró autokorreláció
+ zavaró autokorreláció
�Határai:
�Pozitív autokorreláció:
�Negatív autokorreláció:
�Bizonytalansági tartomány: nem tudunk dönteni• Növelni kell a
megfigyelések számát• Új változót kell bevonni a
modellbe
40 ≤≤ d
20 ≤≤ d
42 ≤≤ d
Elfogadási tartomány
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
A Durbin-Watson próba döntési
táblázata
H1 Elfogadjuk H0:p=0
Elvetjük
Nincs
döntés
p>0 d>du d<dl dl<d<dup>0
Pozitív autokorreláció
d>du d<dl dl<d<du
p<0
Negatív autokorreláció
d<4-du d>4-dl 4-dl<d<4-du
Forrás: Kerékgyártó-Mundruczó [1999]
du illetve dl értékét a Durbin-Watson táblázatból határozzuk meg
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Durbin-Watson próba - SPSS
Analyze / Regression /
Linear… - Statistics
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Durbin-Watson statisztika (5%-os szignifikanciaszint mellett)n m = 1 m = 2 m = 3 m = 4 m = 5
dL dU dL dU dL dU dL dU dL dU
15 1,08 1,36 0,95 1,54 0,82 1,75 0,69 1,97 0,56 2,2116 1,10 1,37 0,98 1,54 0,86 1,73 0,74 1,93 0,62 2,1517 1,13 1,38 1,02 1,54 0,90 1,71 0,78 1,90 0,67 2,1018 1,16 1,39 1,05 1,53 0,93 1,69 0,82 1,87 0,71 2,0619 1,18 1,40 1,08 1,53 0,97 1,68 0,86 1,85 0,75 2,0220 1,20 1,41 1,10 1,54 1,00 1,68 0,90 1,83 0,79 1,9921 1,22 1,42 1,13 1,54 1,03 1,67 0,93 1,81 0,83 1,9622 1,24 1,43 1,15 1,54 1,05 1,66 0,96 1,80 0,86 1,9423 1,26 1,44 1,17 1,54 1,08 1,66 0,99 1,79 0,90 1,9224 1,27 1,45 1,19 1,55 1,10 1,66 1,01 1,78 0,93 1,9025 1,29 1,45 1,21 1,55 1,12 1,66 1,04 1,77 0,95 1,8926 1,30 1,46 1,22 1,55 1,14 1,65 1,06 1,76 0,98 1,8826 1,30 1,46 1,22 1,55 1,14 1,65 1,06 1,76 0,98 1,8827 1,32 1,47 1,24 1,56 1,16 1,65 1,08 1,76 1,01 1,8628 1,33 1,48 1,26 1,56 1,18 1,65 1,10 1,75 1,03 1,8529 1,34 1,48 1,27 1,56 1,20 1,65 1,12 1,74 1,05 1,8430 1,35 1,49 1,28 1,57 1,21 1,65 1,14 1,74 1,07 1,8331 1,36 1,50 1,30 1,57 1,23 1,65 1,16 1,74 1,09 1,8332 1,37 1,50 1,31 1,57 1,24 1,65 1,18 1,73 1,11 1,8233 1,38 1,51 1,32 1,58 1,26 1,65 1,19 1,73 1,13 1,8134 1,39 1,51 1,33 1,58 1,27 1,65 1,21 1,73 1,15 1,8135 1,40 1,52 1,34 1,58 1,28 1,65 1,22 1,73 1,16 1,8036 1,41 1,52 1,35 1,59 1,29 1,65 1,24 1,73 1,18 1,8037 1,42 1,53 1,36 1,59 1,31 1,66 1,25 1,72 1,19 1,8038 1,43 1,54 1,37 1,59 1,32 1,66 1,26 1,72 1,21 1,7939 1,43 1,54 1,38 1,60 1,33 1,66 1,27 1,72 1,22 1,7940 1,44 1,54 1,39 1,60 1,34 1,66 1,29 1,72 1,23 1,7950 1,50 1,59 1,46 1,63 1,42 1,67 1,38 1,72 1,34 1,7760 1,55 1,62 1,51 1,65 1,48 1,69 1,44 1,73 1,41 1,7770 1,58 1,64 1,55 1,67 1,52 1,70 1,49 1,74 1,46 1,7780 1,61 1,66 1,59 1,69 1,56 1,72 1,53 1,74 1,51 1,7790 1,63 1,68 1,61 1,70 1,59 1,73 1,57 1,75 1,54 1,78
100 1,65 1,69 1,63 1,72 1,61 1,74 1,59 1,76 1,57 1,78
Forrás: Statisztikai képletgyűjtemény
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
0 dl du 2 4-du 4-dl 40,95 1,54 2,46 3,05
1,381
dl<d<du → nincs döntés
→Be kell venni még változót a modellbe
/ Növelni kell a megfigyelések számát!
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
A hibatagra vonatkozó feltételek
ellenőrzése
a) Várható értéke 0 ⇒ M(ε) = 0
b) Varianciája konstans ⇒ Var(ε) = σ2b) Varianciája konstans ⇒ Var(ε) = σ2
c) A hibatag értékei nem autokorreláltak.
d) Normális eloszlású valószínűségi
változó.
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
A hibatag eloszlása normális
Tesztelése:
• Grafikusan – a reziduumokat várható értékükfüggvényében ábrázoljukfüggvényében ábrázoljuk
⇒ haranggörbe – normális eloszlás
• Kvantitatív módszerekkel – illeszkedésvizsgálat
- próba
• Ferdeségi, csúcsossági mérőszámokkal
2χ
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Analyze / Regression / Linear… - Plots
Grafikus tesztelés - SPSS
Függő változóStandardizált becsült érték
Standardizált reziduumStandardizált reziduum
Törölt reziduumKorrigált becsült értékStudentizált reziduum
Studentizált törölt reziduum
Hisztogram
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Output
A harang alakú standard normális eloszlás középértéke 0, szórása 1.
Közelítőleg NORMÁLIS(de nem egyértelműen)
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
2. megoldás
Analyze / Regression /
Linear… - SAVE
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
� Graphs / Histogram - Display normal curve
A normális eloszlásgörbe harang alakú.
Normális eloszlás grafikus
tesztelése 2. - SPSS
Közelítőleg normális eloszlás.
A normális eloszlásgörbe harang alakú.
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Nonparametric Test
Analyze / Nonparametric Test / 1-Samle K-S...
H0 - normális eloszlásH1 - nem normális eloszlás
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Output
Ha a szignifikanciaszint (p) kisebb mint 5% (0,05), elutasítjuk a nullhipotézist. Most nagyobb 0,05-nél, vagyis elfogadjuk, hogy normális eloszlású a görbe.
Normális eloszlású
Miskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi KarMiskolci Egyetem Gazdaságtudományi Kar
Üzleti Információgazdálkodási és Módszertani Intézet
Köszönöm a figyelmet!Köszönöm a figyelmet!