Modelo básico de regresión Lineal
-
Upload
jessica-mcgowan -
Category
Documents
-
view
61 -
download
0
description
Transcript of Modelo básico de regresión Lineal
Modelo básico de regresión Lineal
José Ángel FernándezUAM
Introducción
Introducción al concepto de econometría
MBRL
MATEMÁTICAS
ESTADÍSTICA
TEORÍA ECONÓMICA
MEDIR RELACIONES ECONÓMICAS
Definición
• Técnica que permite cuantificar la relación existente entre variables todas ellas cuantitativas
– Variable Endógena (explicada) Y• V. Dependiene, V. de respuesta, Regresando, V. Predicha
– Variable/s Exógena/s (explicativas) X• V. Independiente, V de control, Regresor, V. predictora.
• Los MBRL pueden ser
– Simples: Una sola variable exógena– Múltiples: Más de una variable exógena
Estructura de los datos económicos
• Datos de corte transversal– Muestra de individuos, hogares, empresas, ciudades, estados u otras
diversas unidades tomadas en un momento determinado del tiempo.– Por lo general obtenido por una muestreo aleatorio de la población de
origen.
• Datos de serie temporal– Observaciones de una o más variables obtenidas en diferentes
periodos de tiempo.– Un inconveniente: casi todas las series económicas de tiempo no son
independientes al tiempo, ya que están relacionadas con su historia reciente.
• Datos de Panel– Consta de una serie temporal por cada miembro del corte transversal
Aproximación intuitiva
Diagrama de dispersión
60
80
100
120
140
160
180
200
2,5 3,5 4,5 5,5 6,5Porcentaje de Alcohol
Calo
rías p
or
terc
io d
e l
itro
Recta de ajuste
y = 39,543x - 43,332
60
80
100
120
140
160
180
200
2,5 3 3,5 4 4,5 5 5,5 6
Porcentaje de Alcohol
Ca
lorí
as
po
r te
rcio
de
litr
o
y = 39,543x - 43,332
R2 = 0,8502
60
80
100
120
140
160
180
200
2,5 3 3,5 4 4,5 5 5,5 6
Porcentaje de Alcohol
Cal
orí
as p
or
terc
io d
e lit
ro
Recta: El mejor ajuste y un buen ajuste
y = 0,5583x + 2,7297
R2 = 0,0133
0
2
4
6
8
10
12
2,5 3 3,5 4 4,5 5 5,5 6
% de alcohol
Pre
cio
(E
uro
s 3
3 c
l)
Inferencia
• Población Muestra
• Muestreo Aleatorio
– Supondremos que se puede tomar una muestra aleatoria de tamaño n de x y de y.
El modelo básico de regresión lineal
De la relación causal teórica al planteamiento del modelo:
)(xfy
0)( uE
uxy 10 0)()( uExuE
xxyE 10)(
• Las variables explicativa son no estocásticas• E (u) = 0• Var (u) constante• E(ui, uj) = 0 para todo i=j
iii uxy 10
Estimación de los parámetros
• Mínimos Cuadrados Ordinarios– Aquellos que minimizan la suma de los residuos al cuadrado.– El error cometido en la estimación (residuo) es el estimador de la
perturbación, y por tanto el objetivo a minimizar.
• Máximo Versomilitud– Hacen máxima la función de verosimilitud (función de densidad
conjunta de la información muestral)– Requieren conocer la distribución de probabilidad del modelo
iiii
iii
ii
iii
yyuresiduio
uyy
xy
uxy
ˆˆ
ˆ
ˆˆˆ 10
10
Deducción de los estimadores MCO (I)
10
12
14
16
18
20
22
24
0 2 4 6 8 10 12 14 16Xt
Yt
5u
1u
1u
2u
3u
4u
21 101
2 ˆˆˆ..
n
i i
n
i t xyuRS
• Se busca la recta que minimiza la suma al cuadrado de los residuos
Deducción de los estimadores MCO (II)
n
i i
n
i i
n
i ii xTyxyRS
11011 10
0
0ˆˆ0)1(ˆˆ2ˆ..
0ˆˆ0)(ˆˆ2ˆ..
1
21011 10
1
n
i ii
n
i iii
n
i ii xxxyxxyRS
Ecuaciones Normales
Despejando se obtienen los estimadores MCO
ii
iii
xxx
xyxy
xy
21
10
*ˆ
ˆˆ
Coeficiente de determinación de Pearson
SRSEST
yySR
yySE
yyST
ii
i
t
2
2
2
)ˆ(
)ˆ(
)(
ST
SR
ST
SER
ST
SR
ST
SE
ST
SR
ST
SE
ST
ST
1
1
2
Propiedades del estimador MCO
• LINEALIDAD
• INSESGADEZ
UW iix
uxxS 211
1ˆ
ˆE
Propiedades del estimador MCO
• EFICIENCIA
• CONSISTENCIA
minˆ 2 EE
))'(,(ˆ
ˆlim
0)ˆ(lim
12
XXN
V
u
n
n
Asumiendo normalidad
Resumen del modelo
,880a ,775 ,774 $8,115.356Modelo1
R R cuadradoR cuadradocorregida
Error típ. de laestimación
Variables predictoras: (Constante), Salario iniciala.
Coeficientesa
1928,206 888,680 2,170 ,031
1,909 ,047 ,880 40,276 ,000
(Constante)
Salario inicial
Modelo1
B Error típ.
Coeficientes noestandarizados
Beta
Coeficientesestandarizad
os
t Sig.
Variable dependiente: Salario actuala.
ANOVAb
1,068E+11 1 1,07E+11 1622,118 ,000a
3,109E+10 472 65858997
1,379E+11 473
Regresión
Residual
Total
Modelo1
Suma decuadrados gl
Mediacuadrática F Sig.
Variables predictoras: (Constante), Salario iniciala.
Variable dependiente: Salario actualb.
Aplicación Práctica (Modelo simple)
• Ecuación de regresión
• Bondad de ajuste
CONTRASTE
• Sig: Probabilidad de equivocarme si rechazo la hipótesis nula
• Sig <0,05: Rechazo la Hipótesis nula
• Contraste de Significatividad conjunta del modelo: F–
• Contraste de Significatividad individual de cada uno de los parámetros: t
–
0...........: 210 KrrH
0:0 jH
MBRL: Múltiple
• Planteamiento
• Hipótesis– Independencia en los residuos: No autocorrelación– Homocedasticidad: Varianza de residuos constante– No-colinealidad: No existe relación lineal exacta entre
ninguna variable independiente.– Normalildad
ikikiii uxxxy 22110
PREDICCIÓN
• Una vez estimado y validado el modelo, una de sus aplicaciones más importantes consiste en poder realizar predicciones acerca del valor que tomaría la variable dependiente en el futuro o para una unidad extramuestral.
• En la práctica en EXCEL esta predicción se puede realizar:– Para un valor individual Función Pronostico– Para un rango de valores Función Tendencia