Coeficiente de pearson y spearman (estadistica)
-
Upload
carmen-pastrano -
Category
Presentations & Public Speaking
-
view
85 -
download
1
Transcript of Coeficiente de pearson y spearman (estadistica)
Coeficiente de Correlación de Pearson
En estadística, el coeficiente de correlación de Pearson es una medida de la relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de Pearson es independiente de la escala de medida de las variables.
En el caso de que se esté estudiando dos variables aleatorias X y Y sobre una población; el coeficiente de correlación de Pearson se simboliza con la letra, siendo la expresión que nos permite calcularlo:
Significación del coeficiente de correlaciónUn coeficiente de correlación se dice que es significativo si se puede afirmar, con una cierta probabilidad, que es diferente de cero. Más estrictamente, en términos estadísticos, preguntarse por la significación de un cierto coeficiente de correlación no es otra cosa que preguntarse por la probabilidad de que tal coeficiente proceda de una población cuyo valor sea de cero.
En consecuencia, dado un cierto coeficiente de correlación rxy obtenido en una determinada muestra se trata de comprobar si dicho coeficiente es posible que se encuentre dentro de la distribución maestral especificada por la Hipótesis nula
Usos de enfoques de Pearson a problemas estadísticos
En la perspectiva de Pearson, para establecer el nivel de significación habría que tener en cuenta
algunos aspecto de que lleven a lugar a errores que conlleven a investigador tomar como objetos al cual se puedan minimizar lo mas que se pueda.
Pearson llamo alfa al error que se podría considerar tipo 1 y beta al que se podría tomar en cuenta como
error tipo 2,siendo estos quienes introdujeron el “poder de la prueba estadística”.
Las pruebas mas claras serian las paramétricas y usadas como la T de student, la prueba F, llamada
así en honor de Fisher y es por esto que es simbolizado con esta letra.
Ventajas del coeficiente de Pearson
El valor es independiente de cualquier unidad usada para medir variables.
Mientras mas grande es la muestra, mas grande es la estimación.
Desventajas del coeficiente de Pearson
Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas.
Requiere que las dos variables hayan sido hasta un nivel cuantitativo continuo y que la división de ambas sea semejante a la de la curva normal.
Coeficiente de correlación de Spearman
En estadística, el coeficiente de correlación de Spearman, ρ (rho) es una medida de la correlación (la asociación o interdependencia) entre dos variables aleatorias continuas. Para calcular ρ, los datos son ordenados y reemplazados por su respectivo orden.
Donde D es la diferencia entre los correspondientes estadísticos de orden de x - y. N es el número de parejas.
Se tiene que considerar la existencia de datos idénticos a la hora de ordenarlos, aunque si éstos son pocos, se puede ignorar tal circunstancia El coeficiente de correlación de Spearman es menos sensible que el de Pearson para los valores muy lejos de lo esperado. En este ejemplo: Pearson= 0.30706 Spearman = 0.76270
La aproximación moderna al problema de averiguar si un valor observado de ρ es significativamente diferente de cero (siempre tendremos -1 ≤ ρ ≤ 1) es calcular la probabilidad de que sea mayor o igual que el ρ esperado, dada la hipótesis nula, utilizando un test de permutación. Esta aproximación es casi siempre superior a los métodos tradicionales, a no ser que el conjunto de datos sea tan grande que la potencia informática no sea suficiente para generar permutaciones (poco probable con la informática moderna), o a no ser que sea difícil crear un algoritmo para crear permutaciones que sean lógicas bajo la hipótesis nula en el caso particular de que se trate (aunque normalmente estos algoritmos no ofrecen dificultad).
Determinando la significación estadística
Ventajas del coeficiente de Spearman
Una gran ventaja seria que su distribución es muestral por lo cual se puede calcular su error estándar de estimación.
No esta afectada por los cambios en las unidades de medida.
Es recomendables usarlo cuando los datos presentan valores extremos, ya que dichos valores extremos, ya que dichos valores afectan mucho
Al ser una técnica no paramétrica, es libre de distribución probabilística.
Desventajas de la correlación de Spearman
Requiere supuestos acerca de la naturaleza o formas de las poblaciones afectadas.
Requiere que las dos variables hayan ido medidas hasta un nivel cuantitativo continuo y que la distribución de ambas sea semejante a la curva normal.
Usos del coeficiente de correlación de Spearman
Para aplicar el coeficiente de
correlación de Spearman se
requiere que las diferentes
variables estén al menos en
una escala ordinal.
Muchas veces, este coeficiente
es denotada con la letra griega
que es pronunciada (rho), pero
en el momento de situarnos en
la estadística descriptiva es
denotada por rs.
Propiedades del coeficiente de correlación de Spearman
El coeficiente de correlación de Spearman se encuentra siempre comprendido entre los valores -1 y 1.
Cuando todos los sujetos se sitúan en el mismo puesto para la variable x y para la variable y, el valor de Rs ES 1.Si se ocupan de valores opuestos ,es decir; al primer sujeto en x le corresponde el ultimo lugar en y, el segundo en x le corresponde el penúltimo en Y etc. Entonces el valor de rs -1.
Usos de enfoques de Spearman a problemas estadísticos
Una generalización del coeficiente de Spearman es útil en situación en la cual poseemos mas de tres condiciones, varios individuos cada vez que predecimos las observaciones el orden que tendrán en particular.
El coeficiente de correlación de rangos de Spearman de utilizarse para series de datos en la que existan valores extremos, pues si calculamos la correlación de Pearson los resultados se verán afectados.
La interpretación del resultado del coeficiente de correlación de Spearman se encuentran entre los valores de -1 y 1.
Como determinar el uso de lo coeficientes de correlación de Spearman
Este coeficiente se emplea cuando una o ambas escalas de medidas de las variables son ordinales, es decir, cuando una o ambas escalas de medidas son posiciones. Ejemplo: orden de llegada en una carrera y peso de los atletas.
Se calcula aplicando: Nota: Los datos hay que traducirlos y tratar de ordenarlos en rangos. A los puntajes mas elevados le asignamos el rango 1 al 2 y el siguiente.
Luego se aplica la siguiente formula:
Ejemplos:xi yi Xi,y
ixi2 yi2
2 1 2 4 13 3 9 9 94 2 8 16 44 4 16 16 165 4 20 25 166 4 24 36 166 6 36 36 367 4 28 49 167 6 42 49 368 7 56 64 4910 9 90 100 8110 10 100 100 100
Las notas de 12 alumnos en la clase de física y matemática son los siguientes:
Matemáticas
Física
2 13 34 24 45 46 46 67 47 68 710 9 10 10
Hallar el coeficiente de relación de la distribución e interpretarlo.
72 60 431 504 380
Hallamos las medidas aritméticas Calculamos la covarianza
Calculamos las desviaciones típicas
Aplicamos la formula de coeficiente de correlación lineal
Nota: Al ser el coeficiente de relación positivo, es directo el coeficiente
Para muestras mayores de 20 observaciones, podemos utilizar la siguiente aproximación a la distribución t deStudent
La interpretación de coeficiente de Spearman es igual que la del coeficiente de correlación de Pearson. Oscila entre-1 y +1, indicándonos asociaciones negativas o positivas respectivamente, 0 cero, significa no correlación pero no independencia. La tau de Kenda l es un coeficiente de correlación por rangos, inversiones entre dos ordenaciones de una distribución normal bivariante.
REFERENCIAS BIBLOGRAFICAS (http://web.archive.org/web/http://www.psico.uniovi.es/
Dpto_Psicologia/metodos/tu tor.6/fcope.html) en el Departamento de Psicología de la Universidad de Oviedo.
Weisstein, Eric W. «Correlation Coefficient» (http://mathworld.wolfram.com/CorrelationCoefficient.html). En
Weisstein, Eric W. MathWorld (en inglés). Wolfram Research.
https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Spearman
https://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearson
http://www.uv.es/webgid/Descriptiva/31_coeficiente_de_pearson.html