MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I HETEROSCEDASTICIDAD Profesor: Barland A. Huamán...
-
Upload
esmaralda-guadalupe -
Category
Documents
-
view
10 -
download
4
Transcript of MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I HETEROSCEDASTICIDAD Profesor: Barland A. Huamán...
MANUAL DE LABORATORIO DE CÓMPUTO
ECONOMETRÍA I
HETEROSCEDASTICIDAD
Profesor: Barland A. Huamán Bravo
2011
UNIVERSIDAD NACIONAL AGRARIA DE LA SELVA
FACULTAD DE CIENCIAS ECONÓMICAS Y ADMINISTRATIVAS
DEPARTAMENTO ACADÉMICO DE CIENCIAS ECONÓMICAS
ESQUEMA
Introducción / Causas de heteroscedasticidad
Problemas con los estimadores MCO.
Identificación del Problema: contrastes de
Heteroscedasticidad.
Posibles Soluciones.
1. INTRODUCCIÓN
• Matriz de varianzas y covarianzas de los términos de perturbación
es igual a:
VuuEuVar
n
2
22
21
00
00
00
)'()(
2
22
222
212
00
00
00
)'()(
nX
X
X
uuEuVar
1. CAUSAS DE HETEROSCEDASTICIDAD • Agregación de datos.
• Omisión de variables relevantes.
• Modelos de aprendizaje. La perturbación se va reduciendo a medida que pasa el tiempo.
• Las técnicas de recolección de datos mejoran con el tiempo.
• Cuando las muestras están compuestas de diferentes grupos de datos que no tienen el mismo tamaño. En este caso, las varianzas son proporcionales a los tamaños de los grupos.
• Heterogeneidad de las observaciones.
• Incorrecta especificación funcional.
2. PROBLEMAS CON LOS ESTIMADORES MCO
• Eficiencia: El estimador de MCO deja de ser eficiente (el estimador MCO sigue
siendo insesgado, pero ya no es el de mínima varianza), por lo que se buscará la
estimación por Mínimos Cuadrados Generalizados Factibles (MCGF) con matrices
de covarianzas consistentes. ¿Es posible trabajar con MCG?
• Inferencia: Los errores MCO son incorrectos, por lo que los intervalos de confianza
y las pruebas de hipótesis son erradas.
• Máxima Verosimilitud: el estimador de MCO ya no será igual al estimador de MV.
2. PROBLEMAS CON LOS ESTIMADORES MCO
1. PROBLEMAS CON LA INFERENCIA
• Si existe heteroscedasticidad, la fórmula convencional de la varianza del
vector de estimadores de MCO cambia.
• Entonces, la inferencia se distorsiona si se usa el estimador MCO convencional
y no el correcto:
112 )'(')'()ˆ( XXXXXXVar HMCO
12 )'()ˆ( XXVar MCO
2. PROBLEMAS CON LOS ESTIMADORES MCO
• El estimador MCO convencional, , es sesgado respecto al
estimador correcto MCO :
– s2 es sesgado.
– Se tiene que:
)ˆ( HMCOVar
)ˆ( MCOVar
111 )')('()'()'( XXXXXXXX
2. PROBLEMAS CON LOS ESTIMADORES MCO
• Si es posible identificar la presencia de heteroscedasticidad, el
modelo relevante es el MRL General (MRLG); usar: MCG.
– Sin embargo, suele suceder que no se conoce la “forma poblacional” de
la heteroscedasticidad.
– Por ello, no es posible encontrar una transformación adecuada de los
datos para eliminar el problema.
– Entonces, dado que no es posible calcular los estimadores MCG se
utilizan los de MCO correctos.
• Si no es posible identificar la heteroscedasticidad, lo natural es seguir
usando MCO en la estimación e inferencia.
2. PROBLEMAS CON LOS ESTIMADORES MCO
• Para seguir usando MCO en la inferencia , es necesario
encontrar un estimador consistente de la matriz de varianzas y
covarianzas de las perturbaciones heteroscedásticas:
cuya forma general sería:
)ˆ( HMCOVar
121 )'(][')'()ˆ( XXXXXXVar HMCO
121 )'(]ˆˆ[')'()ˆ(
XXXXXXVar HMCO
12
1'
]['1'1
)ˆ(
nXX
XXnn
XXn
Var HMCO
2. PROBLEMAS CON LOS ESTIMADORES MCO
• Cuando es desconocido , se utiliza el estimador de White
o Matriz de White, que es un estimador consistente de
.
'' 2 XX
)ˆ.(. HMCOAsVar
2. PROBLEMAS CON LOS ESTIMADORES MCO
2. INEFICIENCIA DEL ESTIMADOR CORRECTO DE MCO
• Sin embargo, cuando existe heteroscedasticidad, el estimador MCO correcto
no es el más eficiente dentro del grupo de estimadores lineales e
insesgados.
• Los Estimadores de Mínimos Cuadrados Generalizados (MCG):
son MELI, pues:
112 )'()ˆ( XXVar MCG )ˆ()ˆ( MCGHMCO VarVar
yXXXMCG111 ')'(ˆ
)ˆ( MCGE
2. PROBLEMAS CON LOS ESTIMADORES MCO
• ¿Por qué los estimadores MCG son más eficientes?
– Utilizan la siguiente información: si una perturbación es grande,
se debe a que la varianza de la misma es grande y positiva.
– MCG minimiza la suma ponderada de los residuos al cuadrado:
se le da menor peso a las perturbaciones que se espera que sean
grandes porque su varianza es grande.
– Los pesos están determinados por los elementos de la matriz de
varianzas y covarianzas de las perturbaciones.
2. PROBLEMAS CON LOS ESTIMADORES MCO
• Cuando se cumplen SC1, Sc2, SC3, SC4 (aim>), SC5Ω (con Ω conocido) utilizar
MCG.
• Sin embargo, en la práctica no se conoce Ω, por lo tanto debemos obtener
un estimador de esta matriz y obtener el estimador MCGF.
yXXXMCGF111 ˆ'ˆ'ˆ
2. PROBLEMAS CON LOS ESTIMADORES MCO
3. EFICIENCIA ASINTÓTICA Y MÁXIMA VEROSIMILITUD.
• Bajo el supuesto que la distribución de los términos de perturbación no
esféricos es normal, se obtiene que:
– Los estimadores convencionales MCO no son estimadores de MV.
– Los estimadores pendiente MV son iguales los estimadores MCG. Por ello, los
estimadores MCG son asintóticamente eficientes.
1 1 1ˆ ˆ ( ' ) 'MV MCG X X X y
3. IDENTIFICACIÓN DEL PROBLEMA
• Para esto, se utilizan las denominadas pruebas o contrastes de
Heteroscedasticidad. Los más importantes y usados son:
(1) Inspección Visual de los Residuos.
• Se utiliza para determinar si:
• Gráfico de dispersión de los residuos elevados al cuadrado:
• Un variable que se sospecha como causante de la
heterocedasticidad. Se incrementa o disminuye la dispersión.
• Una combinación de regresores, sospechosos de generar la
heteroscedasticidad.
ii 2
0
4,000
8,000
12,000
16,000
20,000
24,000
0 100,000 200,000 300,000 400,000 500,000
GDP
ED
UC
0
4,000
8,000
12,000
16,000
20,000
24,000
0 20,000 40,000 60,000 80,000 100,000
POP
ED
UC
0
2,000,000
4,000,000
6,000,000
8,000,000
10,000,000
12,000,000
14,000,000
16,000,000
0 100,000 200,000 300,000 400,000 500,000
GDP
RE
SID
UO
1^2
0
2,000,000
4,000,000
6,000,000
8,000,000
10,000,000
12,000,000
14,000,000
16,000,000
0 20,000 40,000 60,000 80,000 100,000
POP
RE
SID
UO
1^2
0
50,000,000
100,000,000
150,000,000
200,000,000
250,000,000
300,000,000
0 100,000 200,000 300,000 400,000 500,000
GDP
RE
SID
UO
2^2
0
50,000,000
100,000,000
150,000,000
200,000,000
250,000,000
300,000,000
0 20,000 40,000 60,000 80,000 100,000
POPR
ES
IDU
O2^
2
3. IDENTIFICACIÓN DEL PROBLEMA
(1) Test de Goldfeld-Quandt (1965)
• Para el caso proporcional, se ordenan los datos de menor a mayor considerando
los valores de la variable que posiblemente genere la heteroscedasticidad.
• Se extrae un número de observaciones centrales tal que. dos submuestras
restantes tengan el mismo tamaño.
• Se estima por separado cada submuestra y se calculan las respectivas Sumatoria
de cuadrados de residuos (SCR).
• Se construye un estadístico F = [SCR2]/[SCR1], que debería ser cercano a uno si
existe homocedasticidad.
3. IDENTIFICACIÓN DEL PROBLEMA
• La Hipótesis nula del test de Goldfeld-Quandt es que los términos de perturbación son homocedásticos.
• Nota: para aplicar este test es necesario tomar en cuenta la ordenación de los datos!
• El programa GyQ contiene el código para llevar a cabo este test. Los resultados sugieren que rechazamos la hipótesis nula de homocedasticidad.
3. IDENTIFICACIÓN DEL PROBLEMA
(2) Test de Breusch-Pagan (1979): permite evaluar la hipótesis de que la
varianza sea función de una combinación lineal de variables conocidas.
Es un contraste general: no requiere un conocimiento previo de la forma
funcional.
Se realiza la regresión auxiliar de los residuos de la ecuación original
estimada contra . Se divide la SCE de esta regresión auxiliar entre
para obtener el estadístico LM que tiene una distribución Ji-Cuadrado
con z grados de libertad.
ii zh:H 221
220 i:H
3. IDENTIFICACIÓN DEL PROBLEMA
(3) Test de White (con y sin términos cruzados; White, 1980) permite
evaluar la hipótesis de que la varianza sea función de una combinación
lineal de variables conocidas.
Es un contraste general: no requiere un conocimiento previo de la forma
funcional.
Se estima el modelo:
reg.cruz.prodf:H i 21 22
0 i:H
iiii ezbxbby 321
3. IDENTIFICACIÓN DEL PROBLEMA
Se realiza la regresión auxiliar de los residuos de la ecuación original
estimada contra todos los posibles productos cruzados de regresores (no
redundantes):
El estadístico de White es igual a nR2 , donde el es el indicador de
bondad de ajuste centrado de la regresión auxiliar. Este estadístico se
distribuye como Ji-Cuadrado con grados de libertad igual al número de
coeficientes pendiente menos la constante en al regresión auxiliar.
También se construye un LM.
iiiiiiii vzxzxzxe 52
42
32102
2R
3. IDENTIFICACIÓN DEL PROBLEMA
(4) Test ARCH-LM (heteroscedasticidad condicional; Engel, 1982). La hipótesis
nula es de homocedasticidad y la alternativa es de heteroscedasticidad.
Se realiza la regresión auxiliar de los residuos de la ecuación original estimada
contra los rezagos hasta el orden q de los residuos al cuadrado:
El estadístico de White es igual a nR2 , donde el es el indicador de bondad
de ajuste centrado de la regresión auxiliar. Este estadístico se distribuye como Ji-
Cuadrado con q grados de libertad. También se construye un LM.
t
q
sst vee
st
1
20
2
2R
3. IDENTIFICACIÓN DEL PROBLEMA
(5) Test de Harvey (1966): similar al test de BPG, sin embargo se
diferencian en la forma funcional de la heterocedasticidad. En este caso
se parte de un modelo no lineal.
Se realiza la regresión auxiliar de los residuos de la ecuación original estimada
contra (1,Zi) . Se divide la SCE de esta regresión auxiliar entre para
obtener el estadístico LM que tiene una distribución Ji-Cuadrado con z grados
de libertad.
ii zexp:H 21
220 i:H
50.'
3. IDENTIFICACIÓN DEL PROBLEMA
(5) Test de Glesjer (1969):
Regresión auxiliar: valor absoluto de los residuos como función de una
combinación lineal de variables conocidas . Goldfeld y Quandt
(1972), proponen un test de Glesjer alternativo, usando la varianza
estimada a través de la SCR de MCO.
Se divide el indicador de bondad de ajuste por y se
distribuye como Ji-Cuadrado con z grados de libertad.
mii z:H 221
220 i:H
2
1m
iz,1
221 s/
4. POSIBLES SOLUCIONES
• Dos posibles soluciones:
(1) Solución práctica: estimar por MCO, pero hacer inferencia
utilizando la matriz de White.
(2) Solución teóricamente óptima: Estimar por MCG y calcular MCGF.
4. POSIBLES SOLUCIONES
1. Estimar por MCO, pero hacer inferencia utilizando la matriz de
White.
• Esto genera estimados consistentes de los errores estándar de MCO.
• Los estadísticos t y F son válidos sólo asintóticamente. Sin embargo,
es posible evaluar hipótesis lineales a través del contraste de Wald.
• A pesar de ser insesgado y consistente, el estimador correcto MCO
sigue siendo ineficiente.
4. POSIBLES SOLUCIONES
2. Estimar por MCG y calcular el estimador MCGF
• La metodología MCG genera estimadores eficientes.
• Sin embargo, calcular el estimador MCGF es muy complicado
porque se requiere conocer la forma estructural de la
heteroscedasticidad, lo cual muchas veces no es factible.
• Incluso, si fuera posible encontrar el estimador MCGF, este
estimador ya no es lineal ni insesgado. Sus propiedades en
muestras pequeñas son desconocidas.
4. POSIBLES SOLUCIONES
• Para resolver el problema de estimación de la matriz de var-cov, se asume
alguna forma específica de heteroscedasticidad que reduzca el número de
parámetros a estimar en la matriz:
• En este caso, la matriz de var-cov es:
• El modelo tiene k+n parámetros a estimar, lo cual no es posible con n
observaciones.
VuuEuVar
n
2
22
21
00
00
00
)'()(
4. POSIBLES SOLUCIONES
• Por ello se hacen supuestos como: , con lo cual la matriz
de varianzas y covarianzas sería igual a:
• En este caso los parámetros a estimar se reducen nuevamente a k+1
(k parámetros y un término poblacional desconocido).
ii X 222
2
22
222
212
00
00
00
)'()(
nX
X
X
uuEuVar
4. POSIBLES SOLUCIONES
• La transformación adecuada se obtiene dividiendo cada
observación (incluyendo la constante), por la raíz cuadrada de la
varianza estimada del término de perturbación.
• NOTAS:
– El problema de Heteroscedasticidad se presenta
básicamente en estimaciones que utilizan datos de corte
transversal.
– Sin embargo, es posible encontrar heteroscedasticidad
condicional en series de tiempo (procesos ARCH).
Dependent Variable: EDUC Method: Least Squares Sample: 1 38 Included observations: 38 Weighting series: GDP^0.5
Coefficient Std. Error t-Statistic Prob.
C 385.3459 479.3095 0.803961 0.4267 GDP 0.045598 0.001759 25.91928 0.0000
Weighted Statistics
R-squared 0.949139 Mean dependent var 7254.571 Adjusted R-squared 0.947726 S.D. dependent var 12787.94 S.E. of regression 1955.125 Akaike info criterion 18.04549 Sum squared resid 1.38E+08 Schwarz criterion 18.13168 Log likelihood -340.8643 Hannan-Quinn criter. 18.07616 F-statistic 671.8093 Durbin-Watson stat 1.650194 Prob(F-statistic) 0.000000
Unweighted Statistics
R-squared 0.928424 Mean dependent var 4499.227 Adjusted R-squared 0.926436 S.D. dependent var 5530.543 S.E. of regression 1500.035 Sum squared resid 81003776 Durbin-Watson stat 1.558650