MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I HETEROSCEDASTICIDAD Profesor: Barland A. Huamán...

MANUAL DE LABORATORIO DE CÓMPUTO

ECONOMETRÍA I

HETEROSCEDASTICIDAD

Profesor: Barland A. Huamán Bravo

2011

UNIVERSIDAD NACIONAL AGRARIA DE LA SELVA

FACULTAD DE CIENCIAS ECONÓMICAS Y ADMINISTRATIVAS

DEPARTAMENTO ACADÉMICO DE CIENCIAS ECONÓMICAS

ESQUEMA

Introducción / Causas de heteroscedasticidad

Problemas con los estimadores MCO.

Identificación del Problema: contrastes de

Heteroscedasticidad.

Posibles Soluciones.

1. INTRODUCCIÓN

• Matriz de varianzas y covarianzas de los términos de perturbación

es igual a:

VuuEuVar

n

2

22

21

00

00

00

)'()(

2

22

222

212

00

00

00

)'()(

nX

X

X

uuEuVar

1. CAUSAS DE HETEROSCEDASTICIDAD • Agregación de datos.

• Omisión de variables relevantes.

• Modelos de aprendizaje. La perturbación se va reduciendo a medida que pasa el tiempo.

• Las técnicas de recolección de datos mejoran con el tiempo.

• Cuando las muestras están compuestas de diferentes grupos de datos que no tienen el mismo tamaño. En este caso, las varianzas son proporcionales a los tamaños de los grupos.

• Heterogeneidad de las observaciones.

• Incorrecta especificación funcional.

2. PROBLEMAS CON LOS ESTIMADORES MCO

• Eficiencia: El estimador de MCO deja de ser eficiente (el estimador MCO sigue

siendo insesgado, pero ya no es el de mínima varianza), por lo que se buscará la

estimación por Mínimos Cuadrados Generalizados Factibles (MCGF) con matrices

de covarianzas consistentes. ¿Es posible trabajar con MCG?

• Inferencia: Los errores MCO son incorrectos, por lo que los intervalos de confianza

y las pruebas de hipótesis son erradas.

• Máxima Verosimilitud: el estimador de MCO ya no será igual al estimador de MV.


1. PROBLEMAS CON LA INFERENCIA

• Si existe heteroscedasticidad, la fórmula convencional de la varianza del

vector de estimadores de MCO cambia.

• Entonces, la inferencia se distorsiona si se usa el estimador MCO convencional

y no el correcto:

112 )'(')'()ˆ( XXXXXXVar HMCO

12 )'()ˆ( XXVar MCO


• El estimador MCO convencional, , es sesgado respecto al

estimador correcto MCO :

– s2 es sesgado.

– Se tiene que:

)ˆ( HMCOVar

)ˆ( MCOVar

111 )')('()'()'( XXXXXXXX


• Si es posible identificar la presencia de heteroscedasticidad, el

modelo relevante es el MRL General (MRLG); usar: MCG.

– Sin embargo, suele suceder que no se conoce la “forma poblacional” de

la heteroscedasticidad.

– Por ello, no es posible encontrar una transformación adecuada de los

datos para eliminar el problema.

– Entonces, dado que no es posible calcular los estimadores MCG se

utilizan los de MCO correctos.

• Si no es posible identificar la heteroscedasticidad, lo natural es seguir

usando MCO en la estimación e inferencia.


• Para seguir usando MCO en la inferencia , es necesario

encontrar un estimador consistente de la matriz de varianzas y

covarianzas de las perturbaciones heteroscedásticas:

cuya forma general sería:

)ˆ( HMCOVar

121 )'(][')'()ˆ( XXXXXXVar HMCO

121 )'(]ˆˆ[')'()ˆ(

XXXXXXVar HMCO

12

1'

]['1'1

)ˆ(

nXX

XXnn

XXn

Var HMCO


• Cuando es desconocido , se utiliza el estimador de White

o Matriz de White, que es un estimador consistente de

.

'' 2 XX

)ˆ.(. HMCOAsVar


2. INEFICIENCIA DEL ESTIMADOR CORRECTO DE MCO

• Sin embargo, cuando existe heteroscedasticidad, el estimador MCO correcto

no es el más eficiente dentro del grupo de estimadores lineales e

insesgados.

• Los Estimadores de Mínimos Cuadrados Generalizados (MCG):

son MELI, pues:

112 )'()ˆ( XXVar MCG )ˆ()ˆ( MCGHMCO VarVar

yXXXMCG111 ')'(ˆ

)ˆ( MCGE


• ¿Por qué los estimadores MCG son más eficientes?

– Utilizan la siguiente información: si una perturbación es grande,

se debe a que la varianza de la misma es grande y positiva.

– MCG minimiza la suma ponderada de los residuos al cuadrado:

se le da menor peso a las perturbaciones que se espera que sean

grandes porque su varianza es grande.

– Los pesos están determinados por los elementos de la matriz de

varianzas y covarianzas de las perturbaciones.


• Cuando se cumplen SC1, Sc2, SC3, SC4 (aim>), SC5Ω (con Ω conocido) utilizar

MCG.

• Sin embargo, en la práctica no se conoce Ω, por lo tanto debemos obtener

un estimador de esta matriz y obtener el estimador MCGF.

yXXXMCGF111 ˆ'ˆ'ˆ


3. EFICIENCIA ASINTÓTICA Y MÁXIMA VEROSIMILITUD.

• Bajo el supuesto que la distribución de los términos de perturbación no

esféricos es normal, se obtiene que:

– Los estimadores convencionales MCO no son estimadores de MV.

– Los estimadores pendiente MV son iguales los estimadores MCG. Por ello, los

estimadores MCG son asintóticamente eficientes.

1 1 1ˆ ˆ ( ' ) 'MV MCG X X X y

3. IDENTIFICACIÓN DEL PROBLEMA

• Para esto, se utilizan las denominadas pruebas o contrastes de

Heteroscedasticidad. Los más importantes y usados son:

(1) Inspección Visual de los Residuos.

• Se utiliza para determinar si:

• Gráfico de dispersión de los residuos elevados al cuadrado:

• Un variable que se sospecha como causante de la

heterocedasticidad. Se incrementa o disminuye la dispersión.

• Una combinación de regresores, sospechosos de generar la

heteroscedasticidad.

ii 2

0

4,000

8,000

12,000

16,000

20,000

24,000

0 100,000 200,000 300,000 400,000 500,000

GDP

ED

UC

0

4,000

8,000

12,000

16,000

20,000

24,000

0 20,000 40,000 60,000 80,000 100,000

POP

ED

UC

0

2,000,000

4,000,000

6,000,000

8,000,000

10,000,000

12,000,000

14,000,000

16,000,000

0 100,000 200,000 300,000 400,000 500,000

GDP

RE

SID

UO

1^2

0

2,000,000

4,000,000

6,000,000

8,000,000

10,000,000

12,000,000

14,000,000

16,000,000

0 20,000 40,000 60,000 80,000 100,000

POP

RE

SID

UO

1^2

0

50,000,000

100,000,000

150,000,000

200,000,000

250,000,000

300,000,000

0 100,000 200,000 300,000 400,000 500,000

GDP

RE

SID

UO

2^2

0

50,000,000

100,000,000

150,000,000

200,000,000

250,000,000

300,000,000

0 20,000 40,000 60,000 80,000 100,000

POPR

ES

IDU

O2^

2


(1) Test de Goldfeld-Quandt (1965)

• Para el caso proporcional, se ordenan los datos de menor a mayor considerando

los valores de la variable que posiblemente genere la heteroscedasticidad.

• Se extrae un número de observaciones centrales tal que. dos submuestras

restantes tengan el mismo tamaño.

• Se estima por separado cada submuestra y se calculan las respectivas Sumatoria

de cuadrados de residuos (SCR).

• Se construye un estadístico F = [SCR2]/[SCR1], que debería ser cercano a uno si

existe homocedasticidad.


• La Hipótesis nula del test de Goldfeld-Quandt es que los términos de perturbación son homocedásticos.

• Nota: para aplicar este test es necesario tomar en cuenta la ordenación de los datos!

• El programa GyQ contiene el código para llevar a cabo este test. Los resultados sugieren que rechazamos la hipótesis nula de homocedasticidad.


(2) Test de Breusch-Pagan (1979): permite evaluar la hipótesis de que la

varianza sea función de una combinación lineal de variables conocidas.

Es un contraste general: no requiere un conocimiento previo de la forma

funcional.

Se realiza la regresión auxiliar de los residuos de la ecuación original

estimada contra . Se divide la SCE de esta regresión auxiliar entre

para obtener el estadístico LM que tiene una distribución Ji-Cuadrado

con z grados de libertad.

ii zh:H 221

220 i:H


(3) Test de White (con y sin términos cruzados; White, 1980) permite

evaluar la hipótesis de que la varianza sea función de una combinación

lineal de variables conocidas.

Es un contraste general: no requiere un conocimiento previo de la forma

funcional.

Se estima el modelo:

reg.cruz.prodf:H i 21 22

0 i:H

iiii ezbxbby 321


Se realiza la regresión auxiliar de los residuos de la ecuación original

estimada contra todos los posibles productos cruzados de regresores (no

redundantes):

El estadístico de White es igual a nR2 , donde el es el indicador de

bondad de ajuste centrado de la regresión auxiliar. Este estadístico se

distribuye como Ji-Cuadrado con grados de libertad igual al número de

coeficientes pendiente menos la constante en al regresión auxiliar.

También se construye un LM.

iiiiiiii vzxzxzxe 52

42

32102

2R


(4) Test ARCH-LM (heteroscedasticidad condicional; Engel, 1982). La hipótesis

nula es de homocedasticidad y la alternativa es de heteroscedasticidad.

Se realiza la regresión auxiliar de los residuos de la ecuación original estimada

contra los rezagos hasta el orden q de los residuos al cuadrado:

El estadístico de White es igual a nR2 , donde el es el indicador de bondad

de ajuste centrado de la regresión auxiliar. Este estadístico se distribuye como Ji-

Cuadrado con q grados de libertad. También se construye un LM.

t

q

sst vee

st

1

20

2

2R


(5) Test de Harvey (1966): similar al test de BPG, sin embargo se

diferencian en la forma funcional de la heterocedasticidad. En este caso

se parte de un modelo no lineal.

Se realiza la regresión auxiliar de los residuos de la ecuación original estimada

contra (1,Zi) . Se divide la SCE de esta regresión auxiliar entre para

obtener el estadístico LM que tiene una distribución Ji-Cuadrado con z grados

de libertad.

ii zexp:H 21

220 i:H

50.'


(5) Test de Glesjer (1969):

Regresión auxiliar: valor absoluto de los residuos como función de una

combinación lineal de variables conocidas . Goldfeld y Quandt

(1972), proponen un test de Glesjer alternativo, usando la varianza

estimada a través de la SCR de MCO.

Se divide el indicador de bondad de ajuste por y se

distribuye como Ji-Cuadrado con z grados de libertad.

mii z:H 221

220 i:H

2

1m

iz,1

221 s/

4. POSIBLES SOLUCIONES

• Dos posibles soluciones:

(1) Solución práctica: estimar por MCO, pero hacer inferencia

utilizando la matriz de White.

(2) Solución teóricamente óptima: Estimar por MCG y calcular MCGF.


1. Estimar por MCO, pero hacer inferencia utilizando la matriz de

White.

• Esto genera estimados consistentes de los errores estándar de MCO.

• Los estadísticos t y F son válidos sólo asintóticamente. Sin embargo,

es posible evaluar hipótesis lineales a través del contraste de Wald.

• A pesar de ser insesgado y consistente, el estimador correcto MCO

sigue siendo ineficiente.


2. Estimar por MCG y calcular el estimador MCGF

• La metodología MCG genera estimadores eficientes.

• Sin embargo, calcular el estimador MCGF es muy complicado

porque se requiere conocer la forma estructural de la

heteroscedasticidad, lo cual muchas veces no es factible.

• Incluso, si fuera posible encontrar el estimador MCGF, este

estimador ya no es lineal ni insesgado. Sus propiedades en

muestras pequeñas son desconocidas.


• Para resolver el problema de estimación de la matriz de var-cov, se asume

alguna forma específica de heteroscedasticidad que reduzca el número de

parámetros a estimar en la matriz:

• En este caso, la matriz de var-cov es:

• El modelo tiene k+n parámetros a estimar, lo cual no es posible con n

observaciones.

VuuEuVar

n

2

22

21

00

00

00

)'()(


• Por ello se hacen supuestos como: , con lo cual la matriz

de varianzas y covarianzas sería igual a:

• En este caso los parámetros a estimar se reducen nuevamente a k+1

(k parámetros y un término poblacional desconocido).

ii X 222

2

22

222

212

00

00

00

)'()(

nX

X

X

uuEuVar


• La transformación adecuada se obtiene dividiendo cada

observación (incluyendo la constante), por la raíz cuadrada de la

varianza estimada del término de perturbación.

• NOTAS:

– El problema de Heteroscedasticidad se presenta

básicamente en estimaciones que utilizan datos de corte

transversal.

– Sin embargo, es posible encontrar heteroscedasticidad

condicional en series de tiempo (procesos ARCH).

Dependent Variable: EDUC Method: Least Squares Sample: 1 38 Included observations: 38 Weighting series: GDP^0.5

Coefficient Std. Error t-Statistic Prob.

C 385.3459 479.3095 0.803961 0.4267 GDP 0.045598 0.001759 25.91928 0.0000

Weighted Statistics

R-squared 0.949139 Mean dependent var 7254.571 Adjusted R-squared 0.947726 S.D. dependent var 12787.94 S.E. of regression 1955.125 Akaike info criterion 18.04549 Sum squared resid 1.38E+08 Schwarz criterion 18.13168 Log likelihood -340.8643 Hannan-Quinn criter. 18.07616 F-statistic 671.8093 Durbin-Watson stat 1.650194 Prob(F-statistic) 0.000000

Unweighted Statistics

R-squared 0.928424 Mean dependent var 4499.227 Adjusted R-squared 0.926436 S.D. dependent var 5530.543 S.E. of regression 1500.035 Sum squared resid 81003776 Durbin-Watson stat 1.558650

MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I HETEROSCEDASTICIDAD Profesor: Barland A. Huamán...

Documents

Transcript of MANUAL DE LABORATORIO DE CÓMPUTO ECONOMETRÍA I HETEROSCEDASTICIDAD Profesor: Barland A. Huamán...