P.P. N° 05 Pruebas de Contraste de Media con SPSS (Paramétricas)
Estadisticaaaaapruebas Paramétricas Con Spss
-
Upload
moises-angulo -
Category
Documents
-
view
50 -
download
11
description
Transcript of Estadisticaaaaapruebas Paramétricas Con Spss
-
Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 1 de 15
Anlisis cuantitativo de datos con SPSS
Pruebas paramtricas Manual de trabajo para el Taller de Mtodos Estadsticos para
Investigadores.
En general las pruebas paramtricas son ms potentes que las
pruebas no paramtricas, pero exigen que se cumplan una serie de
supuestos como la normalidad en la distribucin variable, la
homocedasticidad (igualdad de varianzas) y la independencia de
las observaciones, requiriendo algunas pruebas que se cumplan todo
el conjunto de supuestos o alguno de ellos, dependiendo de la
prueba a utilizar, sin los cuales, estas pruebas pierden todo su
potencial y resulta imprescindible recurrir a sus homlogas no
paramtricas.
Las pruebas paramtricas a estudiar sern:
Prueba t (para una muestra o para dos muestras relacionadas o independientes) y prueba
ANOVA (para ms de dos muestras independientes).
Temas a tratar
Pruebas paramtricas de
comparacin de medias
Condiciones de parametricidad
Variable numrica
Normalidad
Homocedasticidad
Seleccin de la muestra
Muestras independientes
Muestras dependiente so
relacionadas
Tipos de pruebas paramtricas
Importante.
Ho (hiptesis nula) representa la
afirmacin de que no existe
asociacin entre las dos
variables estudiadas.
Ha (hiptesis alternativa) afirma
que hay algn grado de
relacin o asociacin entre las
dos variables. Dicha decisin
puede ser afirmada con una
seguridad que se decide
previamente a travs del nivel
de significacin
-
Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 2 de 15
Condiciones de parametricidad.
a. Variable numrica: la variable de estudio (la dependiente) debe estar medida en una
escala que sea, por lo menos, de intervalo e, idealmente, de razn.
b. Normalidad: los valores de la variable dependiente deben seguir una distribucin normal;
por lo menos, en la poblacin a la que pertenece la muestra.
Debido a esto es preciso comprobar si la distribucin de nuestro estudio sigue esta estructura
terica. Para ello una simple exploracin v isual de los datos puede sugerir la forma. Existen, no
obstante, otras medidas como son los grficos de normalidad y los contrastes de hiptesis
(Prueba de Kolmogorov -Smirnov (se usa cuando n50) y la Prueba de Shapiro-Wilk (se usa
cuando n
-
Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 3 de 15
Tipos de pruebas paramtricas
A continuacin en la siguiente tabla resumimos el tipo de
prueba que debe utilizarse segn el contraste planteado:
Tipo de Contraste Pruebas
Una muestra Prueba T
Dos muestras independientes Prueba t para muestras
independientes
Dos muestras relacionadas Prueba t para muestras
relacionadas
Ms de dos muestras
independientes
ANOVA
PRUEBA T PARA MUESTRAS INDEPENDIENTES
CASO 01 CON SPSS
La variable raza se desea saber si est relacionada con el peso de
los indiv iduos (una variable cuantitativa, cuya medida est en
kilogramos).
Es decir, pretendemos responder a la pregunta:
Est relacionada la raza del individuo con su peso?
REVISAR EL SIGUIENTE VDEO TUTORIAL: (encontrars la explicacin
paso a poso del desarrollo y resolucin del caso)
http://youtu.be/dMp5dafERVM
En este caso se trata de comparar las medias de una variable
cuantitativa (peso) en dos grupos establecidos por una variable
(raza); por lo que el procedimiento estadstico correspondiente es
Prueba t para muestras independientes.
PASO 1: Verificar el cumplimiento de normalidad y homocedasticidad.
a. Prueba t para una muestra. Contrasta si la media de una
poblacin difiere significativamente
de un valor dado conocido o
hipotetizado.
b. Prueba t para dos muestras independientes. Esta prueba debe
utilizarse cuando la comparacin se
realice entre las medias de dos
poblaciones independientes, por
ejemplo, en el caso de la
comparacin de las poblaciones de
hombres y mujeres.
c. Prueba t para dos muestras relacionadas. Existe una segunda
alternativa para contrastar dos
medias. Esta se refiere al supuesto
caso en el que las dos poblaciones
no sean independientes, es decir, el
caso en el que se trate de
poblaciones relacionadas, por
ejemplo, en los diseos apareados,
diseos en los que los mismos
indiv iduos son observados antes y
despus de una determinada
intervencin.
d. Prueba ANOVA para ms de dos muestras independientes.
ANOVA es el acrnimo de anlisis de
la varianza. Es una prueba
estadstica desarrollada para realizar
simultneamente la comparacin
de las medias de ms de dos
poblaciones. A la asuncin de
Normalidad debe aadirse la de la
homogeneidad de las varianzas de
las poblaciones a comparar.
Si del ANOVA resultase el rechazo de la hiptesis nula de igualdad de
medias, se debe proseguir el anlisis con la realizacin de los
contrastes a posteriori (post hoc).
-
Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 4 de 15
Se hace clic en Grficos y luego se activa grficos con pruebas de normalidad.
-
Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 5 de 15
Seguidamente, se nos muestra las pruebas de normalidad:
En nuestro ejemplo en ambos grupos el p-valor es no significativo
(esto es, p-valor > 0,05). Por lo que aceptamos Ho, es decir, se
asume la normalidad de la variable cuantitativa peso en ambos
grupos (raza blanca y raza negra).
PASO 2:
Para completar el anlisis inferencial debemos recurrir al contraste de hiptesis, es decir, Prueba T
para muestras independientes.
Estadstico gl Sig. Estadstico gl Sig.
Negro ,174 17 ,182 ,943 17 ,350
Blanco ,166 15 ,200* ,903 15 ,107
a. Correccin de la significacin de Lilliefors
Pruebas de normalidad
Raza del individuo
observado
Kolmogorov-Smirnova
Shapiro-Wilk
Peso del
individuo
observado*. Este es un lmite inferior de la significacin verdadera.
Prueba de Kolmogorov -Smirnov (se usa cuando n50) y la
Prueba de Shapiro-Wilk (se usa cuando n0.05 se acepta Ho, en caso contrario se rechaza; teniendo en
cuenta que:
Ho= El peso de los individuos
tiene distribucin normal.
Ha= El peso de los individuos no
tiene distribucin normal .
-
Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 6 de 15
En variables para contrastar seleccionar peso y en variables de agrupacin raza, luego pulsar en
Definir grupos y considerar los grupos 1 y 2, pulsar en Continuar y Aceptar.
Paso 03
Los resultados que se muestran son:
-
Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 7 de 15
Estadsticos de grupo
Raza del
individuo
observado
N Media Desviacin
tp.
Error tp.
de la
media
Peso del
individuo
observado
Negro 17 69,4118 7,34046 1,78032
Blanco 15 69,2667 8,07524 2,08502
p-valor es 0.382 > 0.05, concluimos que las varianzas en los grupos son homogneas.
La prueba T propiamente dicha, para la igualdad de medias nos da la siguiente informacin:
El valor de T (t), los grados de libertad del estadstico (gl) y, lo ms importante, el valor de p-valor (Sig. Bilateral) asociado al contraste.
El valor de la diferencia de medias entre los dos grupos, su error tpico, y el intervalo de confianza al 95% de dicha diferencia de medias
En el ejemplo con el que estamos trabajando la t de Student en la fila superior (se han asumido
varianzas iguales): el estadstico t= 0.053 (con 30 grados de libertad) y el valor p-valor o sig.
bilateral es 0,958.
Conclusin:
No hay asociacin entre el peso y la raza, ya que la media del peso de los de raza negra y los de
raza blanca no son estadsticamente diferentes al nivel de signif icacin alfa = 0,05.
Una prueba de homogeneidad de varianzas (la prueba de Levene), El programa hace un contraste a
travs del estadstico F de
Snedecor y nos aporta una significacin estadstica, o valor p
Ho: las varianzas son homogneas
Ha: las varianzas no son homogneas
-
Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 8 de 15
ANOVA
Comparacin de medias de una variable cuantitativa en tres o
ms grupos establecidos por una variable categrica
REVISAR (encontrars la explicacin paso a poso del desarrollo y resolucin del caso):
http://youtu.be/gOJgq2odXBI
CASO 02 CON SPSS
Hay relacin entre el peso de los individuos y su estado civil?
Antes que nada debemos comprobar si se cumple el requisito de
normalidad en la distribucin de la variable cuantitativa en todos
y cada uno de los estratos.
PASO 01.
Cuando la variable cualitativa tiene tres o ms categoras, el
anlisis de asociacin entre esta
variable y una cuantitativa ya no puede llevarse a cabo por el test t
de Student, sino que debe
recurrirse a una tcnica conocida como Anlisis de Varianza
(ANOVA).
Esta prueba contrasta las hiptesis:
Ho: las medias de las
distribuciones de la variable
cuantitativa en todos y cada
uno de los grupos
independientes son iguales:
Ha: alguna de las medias de
las distribuciones de la variable
cuantitativa en todos y cada
uno de los grupos
independientes es diferente.
-
Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 9 de 15
Con respecto a los test de normalidad, se encuentra significacin estadstica (p-valor > 0,05) en el
test de Shapiro-Wilk(n
-
Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 10 de 15
Los resultados que se obtienen se muestran a continuacin:
Primero se nos muestra un cuadro resumen con los estadsticos descriptivos (de la variable
cuantitativa) ms relevantes en cada grupo que se va a contrastar: las medias (y sus I ntervalos de
Confianzas al 95%), las desv iaciones tpicas y los valores mximo y mnimo.
Descriptivos
Peso del individuo observado
N Media Desviacin
tpica Error tpico
Intervalo de confianza para la
media al 95%
Mnimo Mximo Lmite inferior
Lmite superior
Soltero 11 72,1818 8,17090 2,46362 66,6925 77,6711 58,00 82,00
Casado 10 64,0000 5,09902 1,61245 60,3524 67,6476 58,00 72,00
Otro 11 71,3636 6,74200 2,03279 66,8343 75,8930 59,00 81,00
Total 32 69,3438 7,56737 1,33774 66,6154 72,0721 58,00 82,00
Luego, la homogeneidad de varianzas, el test de Levene.
En nuestro ejemplo la significacin estadstica p-valor (Sig)= 0.492, pudiendo asumirse la
homogeneidad de varianzas.
-
Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 11 de 15
Prueba de homogeneidad de varianzas
Peso del individuo observado
Estadstico de
Levene
gl1 gl2 Sig.
,727 2 29 ,492
Por ltimo, aparece la salida del ANOVA
ANOVA de un factor
PASO 03
Pulsar en la casilla Post hoc y seleccionar algn tipo de pruebas segn varianzas iguales o diferentes,
los contrastes a posteriori ms usadas son Tukey, Bonferroni, DMS. Para el ejemplo se seleccion la
prueba DMS y Tukey-b (por tener diferentes tamaos de grupos)
Para llevar a cabo el contraste, se recurre al estadstico F de
Snedecor, que en nuestro ejemplo
vale 4.480 y tiene un p-valor (sig) =0.020 > 0.05
Conclusin:
las variables PESO y grupos de ESTADO CVIL muestran
asociacin;
Se rechaza la Hiptesis nula.
En este caso habra lugar a evaluar los contrastes a posteriori, puesto que se ha encontrado diferencias
significativas en el ANOVA.
-
Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 12 de 15
Los resultados se muestran a continuacin:
En el cuadro de comparaciones mltiples vemos que cada grupo de ESTADO CIVIL se compara con
los otros dos, obtenindose en cada contraste la diferencia de medias, el IC95%, el error estndar y
el p-valor sig., en la que en algunos casos es no-significativo.
Comparaciones mltiples
Variable dependiente: Peso del individuo observado
(I) Estado civil del individuo Diferencia de medias (I-J)
Error tpico
Sig.
Intervalo de confianza al 95%
Lmite inferior Lmite superior
DMS Soltero Casado 8,18182* 2,98795 ,010 2,0708 14,2929
Otro ,81818 2,91594 ,781 -5,1456 6,7819
Casado Soltero -8,18182* 2,98795 ,010 -14,2929 -2,0708
Otro -7,36364* 2,98795 ,020 -13,4747 -1,2526
Otro Soltero -,81818 2,91594 ,781 -6,7819 5,1456
Casado 7,36364* 2,98795 ,020 1,2526 13,4747
*. La diferencia de medias es significativa al nivel 0.05.
De igual manera la prueba de Tukey nos proporciona los subconjuntos homogneos, como en
nuestro caso hay diferencia significativa en los grupos estados civil, se muestra los tres grupos en
diferente subconjunto; lo indica que hay diferencia entre los grupos.
Peso del individuo observado
Estado civil del individuo N Subconjunto para alfa = 0.05
1 2
Tukey Ba,b
Casado 10 64,0000
Otro 11 71,3636
Soltero 11 72,1818
-
Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 13 de 15
PRUEBA T PARA MUESTRAS RELACIONADAS O
PAREADAS
CASO 03 CON SPSS
REVISAR EL SIGUIENTE VIDEO TUTORIAL (encontrars la explicacin
paso a poso del desarrollo y resolucin del caso):
http://youtu.be/tBVX4vbmbks
Entonces necesitamos probar si:
Hay diferencia significativa entre el peso antes de los ejercicios
anti estrs y despus de los ejercicios anti estrs?
Consideraremos la comparacin de las medias de dos poblaciones
en base a dos muestras
emparejadas o relacionadas. Por ejemplo, los datos de la variable
peso y supongamos que queremos
establecer la influencia de un programa de ejercicios anti estrs,
por lo que se mide el peso antes y
despus de iniciar los ejercicios anti
estrs, aqu cada caso representa a un mismo sujeto..
Las hiptesis a plantear son:
Ho: El nivel promedio de peso antes del los ejercicios anti estrs es igual
al peso despus del los ejercicios
anti estrs.
Ha: El nivel promedio de peso antes del los ejercicios anti estrs es
diferente al peso despus del los
ejercicios anti estrs.
-
Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 14 de 15
Se encuentran los siguientes resultados en: Estadsticos de muestras relacionadas, la media, tamao
muestral comn, desv iacin tpica y error tpico de la media de cada una de las dos variables.
Estadsticos de muestras relacionadas
Media N Desviacin tp. Error tp. de la
media
Par 1
Peso antes del tratamiento
anti estrs 69,3438 32 7,56737 1,33774
Peso despus del
tratamiento anti estrs 66,2500 32 5,90790 1,04438
-
Cuadernillo de trabajo para el taller de mtodos estadstcos Dr. Jean Zapata Pgina 15 de 15
Finalmente, encontramos los resultados de la prueba T de muestras relacionadas: media, desviacin
tpica y error tpico de la media para la diferencia de las dos muestras, un intervalo de confianza y
un contraste para la diferencia de las medias.
Puesto que la significacin o P-valor Sig. bilateral = 0.000 < 0.05 se concluye que hay diferencia
significativa entre el peso antes y despus de iniciar los ejercicios anti estrs, podemos decir que, hay
ev idencia estadstica para afirmar que los ejercicios anti estrs ayudan a reducir el peso.
Inferior Superior
Par 1 Peso antes del
tratamiento anti estrs -
Peso despus del
tratamiento anti estrs
3,09375 2,55721 ,45205 2,17178 4,01572 6,844 31 ,000
Diferencias relacionadas
t gl
Sig.
(bilateral)Media
Desviacin
tp.
Error tp. de la
media
95% Intervalo de
confianza para la
Prueba de muestras relacionadas