Regresión lineal
-
Upload
felicia-munoz -
Category
Documents
-
view
52 -
download
2
description
Transcript of Regresión lineal
Regresión lineal
Rubén MullorDpto. Estadística e Investigación Operativa
Homenaje a Marco A. López. Febrero 2010Homenaje a Marco A. López. Febrero 2010
2 Homenaje a Marco A. López. Febrero 2010
Regresión Lineal
Y = 0 + 1 X +
Y = variable dependiente
X = variable independiente
i = coeficiente de regresión
= error aleatorio ~ N(0,a)
(1805) – LEGENDRE. “Nouvelles méthodes pour la déetermination des orbites des comètes”.
(1809) – GAUSS. “Theoria Motus Corporum Coelestium in Sectionibus Conicis Solem Ambientum”.
(1821) – GAUSS. “Theoria combinationis observationum erroribus minimis obnoxiae”.
MINIMOS CUADRADOS
Determinación de las órbitas de cuerpos celestes a partir de observaciones astronómicas.
3 Homenaje a Marco A. López. Febrero 2010
variables
Y X
1 y1 x1
2 y2 x2
… ….. .....
i-1 yi-1 xi-1
i yi xi
i+1 yi+1 xi+1
… ….. …..
n-1 yn-1 xn-1
n yn xn
ind
ivid
uo
s
X
Y
Regresión Lineal
Homenaje a Marco A. López. Febrero 2010
Regresión Lineal
X
Y
n
1i
2
ii yyMin
i10ii XββYYE ˆ
XY
Xx
YyXx
10
n
1i
2i
n
1iii
1
3
Homenaje a Marco A. López. Febrero 2010
X
Y
Regresión Lineal
n
1i
2i
n
1i
2i
n
1iii
YyXx
YyXx
n
1i
2i
n
1i
2i
2n
1iii
2
YyXx
YyXx
i10ii XββYYE ˆ
n
1i
2
ii yyMin
3
Homenaje a Marco A. López. Febrero 2010
Regresión Lineal
-1 1
X
Y
X
Y
> 0 < 0
4
Homenaje a Marco A. López. Febrero 2010
Regresión Lineal
0 2 1
X
Y
X
Y
2 1 2 = 1 2 0
4
Homenaje a Marco A. López. Febrero 2010
Regresión Lineal
REGRESION LINEAL MULTIPLE
ind
ivid
uo
s
variables
Y X1 .. Xj .. Xk
1 y1 x1,1 .. x1,j .. x1,k
2 y2 x2,1 .. x2,j .. x2,k
… ….. ..... .. ..... .. .....
i-1 yi-1 xi-1,1 .. xi-1,j .. xi-1,k
i yi xi,1 .. xi,j .. xi,k
i+1 yi+1 xi+1,1 .. xi+1,j .. xi+1,k
… ….. ….. .. ….. .. …..
n-1 yn-1 xn-1,1 .. xn-1,j .. xn-1,k
n yn xn,1 .. xn,j .. xn,k
Y = 0 + 1 X1 + … + k Xk +
Regresión stepwise
S, W, R2… (F,,…)
1 < 2 < ... < h
Y = 0 = E(Y)Y = 0 +j1 Xj1
Y = 0 +j1 Xj1 + j2 Xj2
…………….
Y = 0 +j1 Xj1 + … + jh Xjh
0 %1 %2 % …h %
5
Homenaje a Marco A. López. Febrero 2010
Regresión Lineal
6
LA PREDICCION DEL RENDIMIENTO COMO CRITERIO PARA
EL INGRESO EN LA UNIVERSIDAD
MARCO A. LOPEZ et al.
REVISTA DE EDUCACION 283, mayo-agosto 1987.
Homenaje a Marco A. López. Febrero 2010
Regresión Lineal
7
• Modelo de selectividad inadecuado (6%).
• OBJETIVO: Nuevo modelo que asigne puntuaciones con mayorfiabilidad en las predicciones de su rendimiento.
• Ineficacia de una prueba única. Modelos de regresión múltiple para seleccionar las variables predictoras que mejor expliquen elrendimiento del alumno en cada centro.
• Definición de rendimiento académico.
• Aplicación sobre las Facultades de Ciencias, Filosofía y Letras,Derecho, Medicina y CCEE de la UA.
• Predicción de la variación del rendimiento del 50%.
Homenaje a Marco A. López. Febrero 2010
Regresión Lineal
8
Variable respuesta: rendimiento académico. Y = media ponderada expediente.
X1 = Ciencias Naturales.X2 = Filosofía.X3 = Lengua Española.X4 = Idioma extranjero.X5 = Matemáticas.X6 = Física.X7 = Química.X8 = Biología.X9 = Latín.X10 = Literatura Española.X11 = Historia Contemporánea.X12 = Historia del arte.
Variables explicativas:
X1, X2, X3, X4, X5, X6, X7
X2, X3, X4, X9, X10, X11, X12
X2, X3, X4, X9, X10, X11, X12
X1, X2, X3, X4, X5, X6, X7, X8
X2, X3, X4, X5
CIENCIAS:
FILOSOFIA:
DERECHO:
MEDICINA:
CCEE:
100 < ni <150
Homenaje a Marco A. López. Febrero 2010
Regresión Lineal
9
FACULTAD DE DERECHOR2(select) = 0.10
ASIGNATURAR2
Variación explicada
i
Coeficientes de regresión
Latín 0,32 0,30
Idioma Extranjero 0,38 0,21
Filosofía 0,42 0,21
Y = 0.21 X2 + 0.21 X4 + 0.30 X9
Homenaje a Marco A. López. Febrero 2010
Regresión Lineal
9
ASIGNATURAR2
Variación explicada
i
Coeficientes de regresión
Historia del Arte 0,31 0,37
Idioma Extranjero 0,41 0,33
Historia Contemp. 0,44 0,21
Y = 0.33 X4 + 0.21 X11 + 0.37 X12
FACULTAD DE FILOSOFIAR2(select) = 0.21
Homenaje a Marco A. López. Febrero 2010
Regresión Lineal
9
FACULTAD DE MEDICINAR2(select) = 0.09
ASIGNATURAR2
Variación explicada
i
Coeficientes de regresión
Biología 0,02 0,01
Química 0,19 0,49
Y = 0.49 X7 + 0.01 X8
Homenaje a Marco A. López. Febrero 2010
Regresión Lineal
9
FACULTAD DE CCEER2(select) = 0.07
ASIGNATURAR2
Variación explicada
i
Coeficientes de regresión
Matemáticas 0,26 0,46
Historia Contemp. 0,37 0,37
Y = 0.46 X5 + 0.37 X11
Homenaje a Marco A. López. Febrero 2010
Regresión Lineal
9
FACULTAD DE CIENCIASR2(select) = 0.25
ASIGNATURAR2
Variación explicada
i
Coeficientes de regresión
Química 0.31 0.17
Filosofía 0.47 0.24
Matemáticas 0.50 0.24
Idioma extranjero 0.54 0.17
Y = 0.24 X2 + 0.17 X4 + 0.24 X5 + 0.17 X7
Homenaje a Marco A. López. Febrero 2010
Regresión Lineal
10
INTERPRETACION
• Carácter heterogéneo de los estudiantes de Filosofía y Letras, que cursanespecialidades tan distintas como Geografía e Historia o de Filologíaproporciona resultados más pobres que en otros centros, lo queaconsejaría su tratamiento mediante modelos separados.
• La presencia en la Facultad de Derecho de alumnos que cursaronbachillerato de ciencias.
• El carácter poco discriminatorio de notas generalmente altas y con pocavariabilidad en alumnos muy seleccionados como los que accedena la Facultad de Medicina.
Homenaje a Marco A. López. Febrero 2010
Regresión Lineal
11
• QUIMICA: Cuando se realizo el estudio, está facultad sólo ofertaba los estudios de química, por loque no debe extrañar la influencia de esta variable.
INTERPRETACION Fac. de Ciencias
• FILOSOFIA: Aporta información sobre la expresión verbal y escrita, y la capacidad de abstracción.
• MATEMATICAS: Aporta información sobre la capacidad de cálculo y habilidad en la formalizaciónde relaciones entre magnitudes.
• IDIOMA EXTRANJERO: Aunque en principio pueda parecer extraña su influencia, sin duda estárelacionada con el nivel socioeconómico (viajes al extranjero, cursos privados…) queinfluye en el rendimiento de los universitarios.
• FISICA: Su ausencia no debe conducir precipitadamente a la conclusión de que no influye en elmodelo, puesto que está plenamente justificada por su alta correlación con las notas de química y matemáticas, y una vez éstas entran en el modelo, la variable física aportaescasa información adicional.
Homenaje a Marco A. López. Febrero 2010
Regresión Lineal
12
CONCLUSIONES
• OBJETIVO: Selección de los alumnos más capacitados para cursar cada tipo de estudios.
• El método de selección debe contemplar baremos específicos para cada centro.
• Baremos basados en los resultados obtenidos en este estudio, sobre lasnotas obtenidas en institutos y colegios o realización de exámenesde las asignaturas requeridas por las Facultades en las que se desea ingresar, independientemente de la realización o no de una pruebacultural básica común.