Regresión lineal

19
Regresión lineal Rubén Mullor Dpto. Estadística e Investigación Operativa Homenaje a Marco A. López. Homenaje a Marco A. López. Febrero 2010 Febrero 2010

description

Homenaje a Marco A. López. Febrero 2010. Regresión lineal. Rubén Mullor Dpto. Estadística e Investigación Operativa. Y = variable dependiente X = variable independiente  i = coeficiente de regresión = error aleatorio ~ N(0, a ). Y =  0 +  1 X + . MINIMOS CUADRADOS. - PowerPoint PPT Presentation

Transcript of Regresión lineal

Page 1: Regresión lineal

Regresión lineal

Rubén MullorDpto. Estadística e Investigación Operativa

Homenaje a Marco A. López. Febrero 2010Homenaje a Marco A. López. Febrero 2010

Page 2: Regresión lineal

2 Homenaje a Marco A. López. Febrero 2010

Regresión Lineal

Y = 0 + 1 X +

Y = variable dependiente

X = variable independiente

i = coeficiente de regresión

= error aleatorio ~ N(0,a)

(1805) – LEGENDRE. “Nouvelles méthodes pour la déetermination des orbites des comètes”.

(1809) – GAUSS. “Theoria Motus Corporum Coelestium in Sectionibus Conicis Solem Ambientum”.

(1821) – GAUSS. “Theoria combinationis observationum erroribus minimis obnoxiae”.

MINIMOS CUADRADOS

Determinación de las órbitas de cuerpos celestes a partir de observaciones astronómicas.

Page 3: Regresión lineal

3 Homenaje a Marco A. López. Febrero 2010

variables

Y X

1 y1 x1

2 y2 x2

… ….. .....

i-1 yi-1 xi-1

i yi xi

i+1 yi+1 xi+1

… ….. …..

n-1 yn-1 xn-1

n yn xn

ind

ivid

uo

s

X

Y

Regresión Lineal

Page 4: Regresión lineal

Homenaje a Marco A. López. Febrero 2010

Regresión Lineal

X

Y

n

1i

2

ii yyMin

i10ii XββYYE ˆ

XY

Xx

YyXx

10

n

1i

2i

n

1iii

1

3

Page 5: Regresión lineal

Homenaje a Marco A. López. Febrero 2010

X

Y

Regresión Lineal

n

1i

2i

n

1i

2i

n

1iii

YyXx

YyXx

n

1i

2i

n

1i

2i

2n

1iii

2

YyXx

YyXx

i10ii XββYYE ˆ

n

1i

2

ii yyMin

3

Page 6: Regresión lineal

Homenaje a Marco A. López. Febrero 2010

Regresión Lineal

-1 1

X

Y

X

Y

> 0 < 0

4

Page 7: Regresión lineal

Homenaje a Marco A. López. Febrero 2010

Regresión Lineal

0 2 1

X

Y

X

Y

2 1 2 = 1 2 0

4

Page 8: Regresión lineal

Homenaje a Marco A. López. Febrero 2010

Regresión Lineal

REGRESION LINEAL MULTIPLE

ind

ivid

uo

s

variables

Y X1 .. Xj .. Xk

1 y1 x1,1 .. x1,j .. x1,k

2 y2 x2,1 .. x2,j .. x2,k

… ….. ..... .. ..... .. .....

i-1 yi-1 xi-1,1 .. xi-1,j .. xi-1,k

i yi xi,1 .. xi,j .. xi,k

i+1 yi+1 xi+1,1 .. xi+1,j .. xi+1,k

… ….. ….. .. ….. .. …..

n-1 yn-1 xn-1,1 .. xn-1,j .. xn-1,k

n yn xn,1 .. xn,j .. xn,k

Y = 0 + 1 X1 + … + k Xk +

Regresión stepwise

S, W, R2… (F,,…)

1 < 2 < ... < h

Y = 0 = E(Y)Y = 0 +j1 Xj1

Y = 0 +j1 Xj1 + j2 Xj2

…………….

Y = 0 +j1 Xj1 + … + jh Xjh

0 %1 %2 % …h %

5

Page 9: Regresión lineal

Homenaje a Marco A. López. Febrero 2010

Regresión Lineal

6

LA PREDICCION DEL RENDIMIENTO COMO CRITERIO PARA

EL INGRESO EN LA UNIVERSIDAD

MARCO A. LOPEZ et al.

REVISTA DE EDUCACION 283, mayo-agosto 1987.

Page 10: Regresión lineal

Homenaje a Marco A. López. Febrero 2010

Regresión Lineal

7

• Modelo de selectividad inadecuado (6%).

• OBJETIVO: Nuevo modelo que asigne puntuaciones con mayorfiabilidad en las predicciones de su rendimiento.

• Ineficacia de una prueba única. Modelos de regresión múltiple para seleccionar las variables predictoras que mejor expliquen elrendimiento del alumno en cada centro.

• Definición de rendimiento académico.

• Aplicación sobre las Facultades de Ciencias, Filosofía y Letras,Derecho, Medicina y CCEE de la UA.

• Predicción de la variación del rendimiento del 50%.

Page 11: Regresión lineal

Homenaje a Marco A. López. Febrero 2010

Regresión Lineal

8

Variable respuesta: rendimiento académico. Y = media ponderada expediente.

X1 = Ciencias Naturales.X2 = Filosofía.X3 = Lengua Española.X4 = Idioma extranjero.X5 = Matemáticas.X6 = Física.X7 = Química.X8 = Biología.X9 = Latín.X10 = Literatura Española.X11 = Historia Contemporánea.X12 = Historia del arte.

Variables explicativas:

X1, X2, X3, X4, X5, X6, X7

X2, X3, X4, X9, X10, X11, X12

X2, X3, X4, X9, X10, X11, X12

X1, X2, X3, X4, X5, X6, X7, X8

X2, X3, X4, X5

CIENCIAS:

FILOSOFIA:

DERECHO:

MEDICINA:

CCEE:

100 < ni <150

Page 12: Regresión lineal

Homenaje a Marco A. López. Febrero 2010

Regresión Lineal

9

FACULTAD DE DERECHOR2(select) = 0.10

ASIGNATURAR2

Variación explicada

i

Coeficientes de regresión

Latín 0,32 0,30

Idioma Extranjero 0,38 0,21

Filosofía 0,42 0,21

Y = 0.21 X2 + 0.21 X4 + 0.30 X9

Page 13: Regresión lineal

Homenaje a Marco A. López. Febrero 2010

Regresión Lineal

9

ASIGNATURAR2

Variación explicada

i

Coeficientes de regresión

Historia del Arte 0,31 0,37

Idioma Extranjero 0,41 0,33

Historia Contemp. 0,44 0,21

Y = 0.33 X4 + 0.21 X11 + 0.37 X12

FACULTAD DE FILOSOFIAR2(select) = 0.21

Page 14: Regresión lineal

Homenaje a Marco A. López. Febrero 2010

Regresión Lineal

9

FACULTAD DE MEDICINAR2(select) = 0.09

ASIGNATURAR2

Variación explicada

i

Coeficientes de regresión

Biología 0,02 0,01

Química 0,19 0,49

Y = 0.49 X7 + 0.01 X8

Page 15: Regresión lineal

Homenaje a Marco A. López. Febrero 2010

Regresión Lineal

9

FACULTAD DE CCEER2(select) = 0.07

ASIGNATURAR2

Variación explicada

i

Coeficientes de regresión

Matemáticas 0,26 0,46

Historia Contemp. 0,37 0,37

Y = 0.46 X5 + 0.37 X11

Page 16: Regresión lineal

Homenaje a Marco A. López. Febrero 2010

Regresión Lineal

9

FACULTAD DE CIENCIASR2(select) = 0.25

ASIGNATURAR2

Variación explicada

i

Coeficientes de regresión

Química 0.31 0.17

Filosofía 0.47 0.24

Matemáticas 0.50 0.24

Idioma extranjero 0.54 0.17

Y = 0.24 X2 + 0.17 X4 + 0.24 X5 + 0.17 X7

Page 17: Regresión lineal

Homenaje a Marco A. López. Febrero 2010

Regresión Lineal

10

INTERPRETACION

• Carácter heterogéneo de los estudiantes de Filosofía y Letras, que cursanespecialidades tan distintas como Geografía e Historia o de Filologíaproporciona resultados más pobres que en otros centros, lo queaconsejaría su tratamiento mediante modelos separados.

• La presencia en la Facultad de Derecho de alumnos que cursaronbachillerato de ciencias.

• El carácter poco discriminatorio de notas generalmente altas y con pocavariabilidad en alumnos muy seleccionados como los que accedena la Facultad de Medicina.

Page 18: Regresión lineal

Homenaje a Marco A. López. Febrero 2010

Regresión Lineal

11

• QUIMICA: Cuando se realizo el estudio, está facultad sólo ofertaba los estudios de química, por loque no debe extrañar la influencia de esta variable.

INTERPRETACION Fac. de Ciencias

• FILOSOFIA: Aporta información sobre la expresión verbal y escrita, y la capacidad de abstracción.

• MATEMATICAS: Aporta información sobre la capacidad de cálculo y habilidad en la formalizaciónde relaciones entre magnitudes.

• IDIOMA EXTRANJERO: Aunque en principio pueda parecer extraña su influencia, sin duda estárelacionada con el nivel socioeconómico (viajes al extranjero, cursos privados…) queinfluye en el rendimiento de los universitarios.

• FISICA: Su ausencia no debe conducir precipitadamente a la conclusión de que no influye en elmodelo, puesto que está plenamente justificada por su alta correlación con las notas de química y matemáticas, y una vez éstas entran en el modelo, la variable física aportaescasa información adicional.

Page 19: Regresión lineal

Homenaje a Marco A. López. Febrero 2010

Regresión Lineal

12

CONCLUSIONES

• OBJETIVO: Selección de los alumnos más capacitados para cursar cada tipo de estudios.

• El método de selección debe contemplar baremos específicos para cada centro.

• Baremos basados en los resultados obtenidos en este estudio, sobre lasnotas obtenidas en institutos y colegios o realización de exámenesde las asignaturas requeridas por las Facultades en las que se desea ingresar, independientemente de la realización o no de una pruebacultural básica común.