ABC de la Correlación Bivariada de Pearson
-
Upload
luis-medina-gual -
Category
Education
-
view
33.088 -
download
1
description
Transcript of ABC de la Correlación Bivariada de Pearson
EL ABC DEL ANÁLISIS DE CORRELACIÓN DE PEARSON
UNIVERSIDAD ANÁHUAC MN
FACULTAD DE EDUCACIÓN
LUIS MEDINA GUAL
AGO-DIC 2007
Relaciones:Basquetbolista= Persona alta
CI alto= Buenas calif. en mate
Mayor altura= Mayor peso
Relaciones:¿Fuertes? ¿Débiles?
¿Hay relaciones?
¿En que medida están relacionadas? ¿Puedo predecir una variable a partir de la otra?
Relaciones:Si medimos la relación decimos que medimos una CORRELACIÓNCORRELACIÓN entre las variables
Relaciones:
Inteligencia
2 variables= correlación simple
Calificaciones
Relaciones:
Inteligencia
Más de 2 variables= correlación múltiple
Calificaciones
Relaciones familiares
Nivel socio-económico
CORRELACIÓN BIVARIADA
(PEARSON)
Objetivo:¿Relación entre variables?
SíSí cambia X al cambiar de forma definida Y
NoNo cambia X cambiar de forma definida Y
Relación ------ Causalidad
CORRELACIÓNCORRELACIÓN
Relación
Relación
Relación ------ Causalidad
CORRELACIÓNCORRELACIÓN
ProvocaProvoca
ProvocaProvoca
Producto-Momento de Pearson
Gráfico Analítico
Requisitos: DOS variables numéricas, en una escala continua
Relación lineal
Homoscedasticidad
Dos variables de escala: Nominal
Ordinal
Escala
Razón
Método Gráfico:CI
$10004000
60008000
1000012000
1400016000
1800020000
2200024000
70
80
90
100
110
120
130
140
60
50
40
Método Gráfico:“Diagrama de dispersión” o “nube de puntos”
Cada punto representa a un sujeto, y señala la intersección de su valor en X y en Y.
¿Cómo sabemos qué tan fuerte es la relación?
Por el ancho de la nube de puntos
Requisitos: DOS variables numéricas, en una escala continua
Relación lineal
Homoscedasticidad
Relación lineal
Otras Relaciones
Otras Relaciones
Otras Relaciones
¿Relación?Memoria
Edad
40
50
60
70
80
90
100
30
20
10
Juventud Adultez Vejez
Homoscedasticidad
Que exista aproximadamente la misma desviación de los puntos a lo largo de la línea imaginaria
Homocedasticidad
Homoscedasticidad
Homoscedasticidad
Método analítico
Índice “r de Pearson”:
Magnitud
Dirección
Índice “r de Pearson”:
-1 +10
Magnitud (#):
10“A mayor número mayor
correlación”
Magnitud (#):Baja: 0.30
Media: 0.50
Alta: 0.70
Perfecta= 1
Magnitud (#):
r= 0.95
Magnitud (#):
r= 0.82
Magnitud (#):
r= 0.76
Magnitud (#):
r= 0.41
Magnitud (#):
r= 0.001
Dirección (signo):
(+) (-)
(+)
Dirección: ascendente
(-)Dirección: descendente
Magnitud (#):
r= -0.95
Intensidad (#):
r= -0.82
Intensidad (#):
r= -0.76
Intensidad (#):
r= -0.41
Magnitud (#):
r= -0.001
Fuerza de la correlación:
-1 +10
Per
fect
a Perfecta
Nula
r= 0.85
Dibuja los puntos de:
r= 0.85
r= 0.13
Dibuja los puntos de:
r= -0.91
Dibuja los puntos de:
r= -0.21
Dibuja los puntos de:
r= 0.21
¿Cuál correlación es más fuerte?
r= 0.80
r= -0.71
¿Cuál correlación es más fuerte?
r= -0.68
r= -0.91
¿Cuál correlación es más fuerte?
r= 0.87
Producto-Momento de Pearson
Fórmula:
r = N XY – (X) (Y) ____________________________________ [ N X2 – ( X ) 2 ] [ N Y2 – ( Y ) 2 ]
Donde N= # de pares de datos
(Existen varias)
horas de estudio
calificación
X Y XY X2 Y2
1 5 5 1 25
2 8 18 9 36
4 8 32 16 64
6 9 54 36 81
7 9 63 49 81
8 10 80 64 100
28 48 243 170 398
horas de estudio
calificación
X Y XY X2 Y2
28 49 250 170 415
r = _ (__) – (_) (_)
[ _ (__) - (_)2] [ _(__) – (_)2]
N= 6
r = 6 (250) – (28) (49)
[6 (170) - (28)2] [6(415) – (49)2]
r = 1500 – 1372
[1020 - 784] [2490 – 2401]
r = 0.81
r = 128
[236] [89]r = 128
21004
r = 0.88
r = 128
144.927568
Interpretación:
“Se realizó un análisis de correlación de Pearson con la finalidad de saber si la variable horas de estudio y la variable calificaciones están relacionadas entre sí. Se obtuvo un coeficiente de .88 que sugiere que existe una alta correlación positiva entre ambas variables”, es decir, a mayor hora de estudio, mayor calificación.
Consejo: estudien algunas horas para que les vaya bien en sus exámenes…
Interpretación:
“Se realizó un análisis de correlación de Pearson con la finalidad de saber si la variable (nombre) y la variable (nombre) están relacionadas entre sí. Se obtuvo un coeficiente de ________ que sugiere que existe una (alta-media-baja) correlación (signo) entre ambas variables”.
Tabla de significancia de r:
Además, se puede especificar si esta correlación es o no significativa desde el punto de vista estadístico.
Se compara el resultado obtenido con el valor correspondiente en una tabla y se estima qué tan probable sería observar una correlación de semejante magnitud. Si la p es igual o menor que .05 (5%) se dice que es estadísticamente significativa, lo que significa que es poco probable que esta correlación se dé por el azar.
Si la probabilidad es mayor que este valor se dice que no es significativa pues ese resultado bien podría observarse por el azar.
5% 5%
• Para el ejercicio anterior donde obtuvimos una r = .81, buscaríamos los valores de la tabla para N = 5 porque (6 – 1 = 5)
• En la tabla encontramos estos valores:
• Ahora comparamos el resultado obtenido (.81) con los valores de la tabla y vemos que la correlación sí resulta significativa al .05. Podemos afirmar, con un 5% de probabilidad de equivocarnos, que las dos variables sí están correlacionadas.
g.l. .05 .02 .01 .001
5 .7545 .8329 .8745 .95074
Correlación espuria
• Se define como una correlación aparente entre dos variables pero que no puede ser explicada desde el punto de vista teórico.
• Al realizar un análisis de correlación el marco teórico brinda las bases para explicar por qué se espera que se relacionen las variables.