Estad Stica II Tema 2
-
Upload
manuel-angel-vega-gonzalez -
Category
Documents
-
view
230 -
download
2
description
Transcript of Estad Stica II Tema 2
1 1
1. Contraste de hipótesis sobre dos medias con muestras independientes
1.1. Suponiendo varianzas iguales 1.2. Suponiendo varianzas distintas
2. Contraste de hipótesis sobre dos medias con muestras relacionadas
3. El tamaño del efecto en los contrastes sobre dos medias 4. Cálculo de la potencia en los contrastes sobre dos medias 5. Contraste de hipótesis sobre igualdad de varianzas 6. Contraste de hipótesis sobre una proporción
Tema 2. Comprobación de hipótesis acerca de algunos parámetros
2 2
POBLACIÓN 1
MUESTRA 2 extraída
POBLACIÓN 2
¿Son las medias muestrales lo bastante diferentes como para pensar que proceden de poblaciones con diferente media?
1. Contraste de hipótesis sobre dos medias con muestras independientes
MUESTRA 1 extraída
Introducción
Ejemplo:
!
¿µy1=µy2 ?
!
Y 1 = 32
Y 2 = 34
3 3
1.1. Dos medias con muestras independientes. Varianzas iguales
1. HIPÓTESIS:
- Contraste bilateral
!
H0 :µ1 " µ2 = k (habitualmente k = 0)
H1 :µ1 " µ2 # k
2. Fijar el n.s.
!
"
- Contraste unilateral derecho H0:µ
1!µ
2= k
H1:µ
1!µ
2> k
- Contraste unilateral de izquierdo H0:µ
1!µ
2= k
H1:µ
1!µ
2< k
4 4
3. SUPUESTOS:
- Normalidad: la variable Y sigue una distribución Normal en las dos poblaciones de las que han sido extraídas las muestras
!
Y1 " N(µ1,#1
2)
Y2 " N(µ2,#2
2)
- Igualdad de varianzas (homocedasticidad)
!
"1
2="2
2="
2
- Dos m.a.s. de tamaños n1 y n2 e independientes entre sí
1.1. Dos medias con muestras independientes. Varianzas iguales
Comprobación: pruebas de bondad de ajuste a la distribución Normal
Comprobación: prueba de Levene sobre la igualdad de varianzas
Comprobación: test de rachas
5 5
4. E.C. Normalmente igual a 0
El estadístico T se distribuye según el modelo de probabilidad t de Student con n1 + n2 – 2 grados de libertad
!
" tn1+n2#2
!
SY 1"Y 2
# E .T.
1.1. Dos medias con muestras independientes. Varianzas iguales
!
T =Y 1 "Y 2 " (µ1 "µ2)
(n1 "1) ˜ S 1
2 + (n2 "1) ˜ S 2
2
n1 + n2 " 2(
1
n1
+1
n2
)
6 6
5. REGIÓN CRÍTICA Y CRITERIO DE DECISIÓN
- Rechazamos H0 si el valor obtenido en la muestra para el E.C. cae en la región crítica
- Mantenemos H0 si el valor obtenido en la muestra para el E.C. cae en la región de aceptación
!
T"# /2 tn1+n2$2 T%1$# /2 tn1+n2$2
!
" /2
!
" /2
Contraste bilateral
!
µ1 "µ2
!
T"# tn1
+n2$2
!
"
Contraste unilateral izquierdo
!
µ1 "µ2
!
T"1#$ tn
1+n
2#2
!
"
Contraste unilateral derecho
!
µ1 "µ2
1.1. Dos medias con muestras independientes. Varianzas iguales
7 7
6. NIVEL CRÍTICO
- Contraste bilateral
!
p = 2 P(tn1+n2"2 # tk )[ ]Valor del E.C. obtenido en la muestra
- Contraste unilateral derecho
!
p = P(tn1+n2"2 # tk )
Valor del E.C. obtenido en la muestra
- Contraste unilateral izquierdo
!
p = P(tn1+n2"2 # tk )
Valor del E.C. obtenido en la muestra
1.1. Dos medias con muestras independientes. Varianzas iguales
tk
p
tk
! tk
p2
p2
tk
p
8 8
7. INTERVALO DE CONFIANZA
!
" /2
!
" /2
!
LI
= (Y 1"Y
2) " # / 2 tn1 +n2 "2
SY 1 "Y 2
Error máximo
!
LS = (Y 1 "Y 2) + # /2 tn1+n2"2 SY 1"Y 2
Error máximo
1.1. Dos medias con muestras independientes. Varianzas iguales
9 9
8. TAMAÑO DEL EFECTO Y POTENCIA
Ver apartados 3 y 4 del tema
1.1. Dos medias con muestras independientes. Varianzas iguales
Este contraste es equivalente al ANOVA de 1 factor con dos niveles de medidas independientes (ver tema 3)
10 10
Ej 1. Un psicólogo está interesado en investigar las diferencias de género en capacidad cognitiva. Para ello administra un test de fluidez verbal a dos muestras aleatorias (40 varones y 40 mujeres). Una vez aplicado el test encuentra que y y se comprobó que la fluidez verbal seguía una distribución normal en ambas poblaciones. Con estos resultados, asumiendo varianzas poblacionales iguales y con un nivel de significación de 0,05, ¿qué podremos decir sobre la hipótesis de que ambas muestras proceden de poblaciones con la misma media?
!
Y v
= 98; ˜ S v
= 16
!
Y m
= 102; ˜ S m
= 14
1. Hipótesis: (contraste bilateral)
!
H0 :µv "µm = 0
H1 :µv "µm # 0
1.1. Dos medias con muestras independientes. Varianzas iguales. Ejemplo
11 11
3. Supuestos:
- La fluidez verbal sigue una distribución normal tanto en la población de hombres como en la de mujeres
- Habría que comprobar que la varianzas poblacionales iguales (en este caso lo resolveremos como si lo fueran)
- Las muestras se han obtenido de forma aleatoria e independientemente una de otra
!
2." = 0,05
1.1. Dos medias con muestras independientes. Varianzas iguales. Ejemplo
12 12
4. E.C.
!
T =Y 1 "Y 2 " (µ1 "µ2)
(n1 "1) ˜ S 1
2 + (n2 "1) ˜ S 2
2
n1 + n2 " 2(
1
n1
+1
n2
)
=
!
" t40+40#2 " t78
!
=(98 "102) " (µ1 "µ2)
(40"1)(16)2 + (40"1)(14)
2
40 + 40" 2(
1
40+
1
40)
= "1,19
E.T.=3,36
1.1. Dos medias con muestras independientes. Varianzas iguales
Ejemplo 1 (cont.)
13 13
!
0,025 t78 = "1,99 0,975t78 = +1,99
!
0,025
!
0,025
Contraste bilateral
!
µ1 "µ2
5. y 6. R.C. y criterio de decisión
Decisión: como -1,19 > - 1,99 (valor de t78 que deja por debajo 0,025) mantenemos H0, mantenemos la hipótesis de que el promedio de la fluidez verbal es el mismo en la población de varones que en la población de mujeres, o lo que es lo mismo, que no existen diferencias estadísticamente significativas de género en fluidez verbal
!
t = "1,19
1.1. Dos medias con muestras independientes. Varianzas iguales. Ejemplo
14 14
Decidimos mantener H0
!
p = 2 P(tn1+n2"2 # tk )[ ] = 2 P(t78 # "1.19 )[ ] $ 2(0,1) = 0,2
7. Nivel crítico (contraste bilateral)
!
0,2 > (0,05)
"
p >#
1.1. Dos medias con muestras independientes. Varianzas iguales. Ejemplo
Contraste bilateral
!
0,025 t78 = "1,99 0,975t78 = +1,99t78= !1,19 t
78= +1,19
15 15
8. Intervalo de confianza
!
LI = (Y 1 "Y 2) " # /2 tn1+n2"2 SY 1"Y 2
=
= (98 "102) " "1,99 3,36 = ("4) " (6,68) = "10,68
Error máximo
!
LS = (Y 1 "Y 2) + # /2 tn1+n2"2 SY 1"Y 2
=
= (98 "102) + "1,99 3,36 = ("4) + (6,68) = 2,68
Error máximo !1,99
!
" /2
!
" /2
+1,99
(!10.68;2, 68)" Nivel de confianza 1-!=0,95
!
H0 :µv "µm = 0Como el valor 0, propuesto en la H0 para la diferencia de medias, está dentro del I.C. mantendremos la hipótesis nula
1.1. Dos medias con muestras independientes. Varianzas iguales. Ejemplo
16 16
Robustez de T frente al incumplimiento de los supuestos
La distribución muestral no sufre mucha alteración
!
"1
2#"2
2 Si n1 y n2 son pequeños y
La distribución muestral no sigue exactamente el modelo propuesto
Supuesto de Normalidad Si n1 y n2 son razonablemente grandes (> 20-25) Si n1 y n2 no son grandes pero las distribuciones son simétricas Si n1 y n2 no son grandes, las distribuciones no son simétricas pero
!
"1
2="2
2
1.1. Dos medias con muestras independientes. Varianzas iguales
17 17
Robustez de T frente al incumplimiento de los supuestos
La distribución muestral no sufre mucha alteración
Si n1 ≠ n2, aunque se cumpla el supuesto de normalidad
La distribución muestral no sigue exactamente el modelo propuesto
Supuesto de Homocedasticidad Si n1=n2 y se cumple el supuesto de normalidad
1.1. Dos medias con muestras independientes. Varianzas iguales
18 18
1. HIPÓTESIS:
- Contraste bilateral
2. Fijar el n.s.
!
"
- Contraste unilateral derecho
- Contraste unilateral izquierdo H0:µ
1!µ
2= k
H1:µ
1!µ
2< k
1.2. Dos medias con muestras independientes. Varianzas distintas
!
H0 :µ1 " µ2 = k (habitualmente k = 0)
H1 :µ1 " µ2 # k
H0:µ
1!µ
2= k
H1:µ
1!µ
2> k
19 19
3. SUPUESTOS:
- Normalidad: la variable Y sigue una distribución Normal en las dos poblaciones de las que han sido extraídas las muestras
!
Y1 " N(µ1,#1
2)
Y2 " N(µ2,#2
2)
- Dos m.a.s. de tamaños n1 y n2 e independientes entre sí
!
"#1
2$#2
2
1.2. Dos medias con muestras independientes. Varianzas distintas
Comprobación: pruebas de bondad de ajuste a la distribución Normal
Comprobación: test de rachas
20 20
4. E.C.
!
T =Y 1 "Y 2 " (µ1 "µ2)
˜ S 1
2
n1
+˜ S 2
2
n2
Normalmente igual a 0
!
" tgl ' gl'=
˜ S 12
n1
+˜ S 2
2
n2
#
$ % %
&
' ( (
2
˜ S 12
n1( )2
n1 )1+
˜ S 22
n2( )2
n2 )1
!
SY 1"Y 2
# E .T.
1.2. Dos medias con muestras independientes. Varianzas distintas
21 21
5. REGIÓN CRÍTICA Y CRITERIO DE DECISIÓN
- Rechazamos H0 si el valor obtenido en la muestra para el E.C. cae en la región crítica
- Mantenemos H0 si el valor obtenido en la muestra para el E.C. cae en la región de aceptación
!
T"# /2 tgl ' T$1%# /2tgl '
!
" /2
!
" /2
Contraste bilateral
!
µ1 "µ2
!
T"# tgl '
!
"
Contraste unilateral izquierdo
!
µ1 "µ2
!
T"1#$ tgl '
!
"
Contraste unilateral derecho
!
µ1 "µ2
1.2. Dos medias con muestras independientes. Varianzas distintas
22 22
6. NIVEL CRÍTICO
1.1. Dos medias con muestras independientes. Varianzas distintas
- Contraste bilateral Valor del E.C. obtenido en la muestra
!
p = 2 P(tgl ' " tk )[ ]
- Contraste unilateral derecho Valor del E.C. obtenido en
la muestra
!
p = P(tgl' " tk )
- Contraste unilateral izquierdo Valor del E.C. obtenido en la
muestra
!
p = P(tgl' " tk )
tk
! tk
p2
p2
tk
p
tk
p
23 23
7. INTERVALO DE CONFIANZA
8. TAMAÑO DEL EFECTO Y POTENCIA
Ver apartados 3 y 4 del tema
Cálculo más complejo (consultar bibliografía recomendada)
1.2. Dos medias con muestras independientes. Varianzas distintas
Este contraste es equivalente al ANOVA de 1 factor con dos niveles de medidas independientes (ver tema 3)
24 24
1. Hipótesis: (contraste unilateral) H0:µ
n= µ
l
H1:µ
n> µ
l
!
Y n = 9; ˜ S n = 6
!
Y l = 6; ˜ S l = 2
Ej 2 Un psicólogo quiere investigar si el fenómeno del habla privada esta guiado por claves contextuales. Para ello registró la frecuencia de dicho fenómeno en unas muestras aleatorias de 40 niños en entornos naturales y de 20 niños en entornos de laboratorio mientras realizaban tareas equivalentes. Los resultados fueron y para cada grupo respectivamente y se comprobó que el habla privada seguía una distribución normal en ambos contextos. A la vista de estos resultados y con un nivel de significación de 0,01, ¿qué podemos decir sobre la hipótesis de que dicho fenómeno se da más en contextos naturales?
1.2. Dos medias con muestras independientes. Varianzas distintas. Ejemplo
25 25
3. Supuestos:
- El habla privada sigue una distribución normal en ambos contextos
- Habría que comprobar que la varianzas poblacionales iguales (en este caso lo resolveremos como si no lo fueran)
- Las muestras se han obtenido de forma aleatoria e independientemente una de otra
!
2." = 0,01
1.2. Dos medias con muestras independientes. Varianzas distintas. Ejemplo
26 26
4. E.C.
!
T =Y 1 "Y 2 " (µ1 "µ2)
˜ S 1
2
n1
+˜ S 2
2
n2
0
!
" tgl ' gl'=
˜ S 12
n1
+˜ S 2
2
n2
#
$ % %
&
' ( (
2
˜ S 12
n1( )2
n1 )1+
˜ S 22
n2( )2
n2 )1
=
62
40+
22
20
#
$ % %
&
' ( (
2
62
40( )2
40 )1+
22
20( )2
20 )1
* 53 t53
!
SY 1"Y 2
# E .T.
!
=9" 6
62
40+
22
20
= 2,86
!
SY 1"Y 2
= 1,04 # E .T.
1.2. Dos medias con muestras independientes. Varianzas distintas. Ejemplo
27 27
!
0,99 t53 = +2,4
!
0,01
Contraste unilateral
!
µ1 "µ2
5. y 6. R.C. y criterio de decisión
Decisión: Como 2,86 > 2,40 (valor de t53 que deja por debajo 0,99) rechazamos H0 y concluimos que el promedio del fenómeno del habla privada es significativamente superior en los contextos naturales frente a los del laboratorio
!
t = 2,86
1.2. Dos medias con muestras independientes. Varianzas distintas. Ejemplo
28 28
Decidimos rechazar H0
!
p = P(t53 > 2,86) = 0,0021
7. Nivel crítico (contraste unilateral)
0,0021< (0, 01)
!
p <!
1.2. Dos medias con muestras independientes. Varianzas distintas. Ejemplo
29
2. Contraste de hipótesis sobre dos medias con muestras relacionadas
Introducción Se puede afirmar que dos muestras están relacionadas cuando:
1. En un diseño de medidas repetidas el mismo grupo de sujetos es evaluado en dos ocasiones; sólo hay una población
2. En un diseño “por pares”, cuando los sujetos de cada par guardan algún tipo de relación entre ellos, por ej.: gemelos, emparejados en alguna variable,…
Una de las puntuaciones de un par nos proporciona alguna información sobre la otra puntuación del par
Se trabaja sobre las puntuaciones diferencia de cada sujeto o par de sujetos relacionados
!
Di = (Yi1 "Yi2)
30 30
POBLACIÓN 1
¿Son las medias muestrales lo bastante diferentes como para pensar que la diferencia media es cero?
MUESTRA 1 extraída
Introducción
Ejemplo:
!
¿µd = 0?
!
Y antes = 30
Y después = 36
2. Contraste de hipótesis sobre dos medias con muestras relacionadas
31 31
1. HIPÓTESIS:
- Contraste bilateral
!
H0 :µD = k (µD = µ1 "µ2 habitualmente k = 0)
H1 :µD # k
2. Fijar el n.s.
!
"
- Contraste unilateral derecho H0:µ
D= k
H1:µ
D> k
- Contraste unilateral izquierdo H0:µ
D= k
H1:µ
D< k
2. Dos medias con muestras relacionadas
32 32
3. SUPUESTOS:
- Normalidad: la variable D (diferencia de las puntuaciones) sigue una distribución Normal
!
D" N(µD,#
D
2)
- Una m.a.s. de n pares o diferencias
2. Dos medias con muestras relacionadas
Comprobación: pruebas de bondad de ajuste a la distribución Normal
Comprobación: test de rachas
33 33
4. E.C.
!
T =D " (µ1 "µ2)
˜ S D
n
Normalmente igual a 0
El estadístico T se distribuye según el modelo de probabilidad t de Student con n-1 grados de libertad
!
" tn#1
!
SD " E .T.
!
D =Di"
n
!SD=
(Di!D)2"
n!1
2. Dos medias con muestras relacionadas
34 34
5. REGIÓN CRÍTICA Y CRITERIO DE DECISIÓN
- Rechazamos H0 si el valor obtenido en la muestra para el E.C. cae en la región crítica
- Mantenemos H0 si el valor obtenido en la muestra para el E.C. cae en la región de aceptación
!
T"# /2 tn$1 T%1$# /2tn$1
!
" /2
!
" /2
Contraste bilateral
!
µD
!
T"# tn$1
!
"
Contraste unilateral izquierdo
!
µD
!
T"1#$ tn#1
!
"
Contraste unilateral derecho
!
µD
2. Dos medias con muestras relacionadas
35
6. NIVEL CRÍTICO
2. Dos medias con muestras relacionadas
!
p = 2 P(tn"1 # tk )[ ]- Contraste bilateral
Valor del E.C. obtenido en la muestra
tk
! tk
p2
p2
- Contraste unilateral derecho Valor del E.C. obtenido en
la muestra
!
p = P(tn"1 # tk )
tk
p
- Contraste unilateral izquierdo Valor del E.C. obtenido en la
muestra
!
p = P(tn"1 # tk )
tk
p
36 36
7. INTERVALO DE CONFIANZA
!
" /2
!
" /2
!
LI = (Y D ) " # /2 tn"1 SD
Error máximo
!
LS = (Y D ) + " /2 tn#1 SD
Error máximo
2. Dos medias con muestras relacionadas
37 37
8. TAMAÑO DEL EFECTO Y POTENCIA
Ver apartado 3 del tema
2. Dos medias con muestras relacionadas
Este contraste es equivalente al ANOVA de 1 factor con dos niveles de medidas repetidas (ver tema 5)
38 38
Ej 3. Un psicólogo deportivo quiere investigar el efecto de la fatiga sobre la capacidad atencional en 10 deportistas de élite. Para ello midió la capacidad atencional en reposo y en condición de fatiga tras 20 minutos de ejercicio a la máxima intensidad. Los resultados obtenidos se presentan en la siguiente tabla. ¿Qué podemos decir sobre la hipótesis de que la fatiga disminuye la capacidad atencional con un nivel de significación de 0,01?
Sujetos 1 2 3 4 5 6 7 8 9 10
Reposo 20 22 19 25 18 24 17 25 21 18
Fatiga 14 23 13 17 10 16 13 20 17 14
1. Hipótesis: (contraste unilateral) H0:µr = µ f
H1:µr > µ f
2. Dos medias con muestras relacionadas. Ejemplo
39 39
3. Supuestos:
- Habría que comprobar si la población de diferencias es normal
- La muestra se ha obtenido de forma aleatoria
!
2." = 0,01
2. Dos medias con muestras relacionadas. Ejemplo
40 40
4. E.C. Sujetos 1 2 3 4 5 6 7 8 9 10
Reposo 20 22 19 25 18 24 17 25 21 18 209
Fatiga 14 23 13 17 11 16 13 20 17 14 158
Di 6 -1 6 8 7 8 4 5 4 4 51
0,81 37,21 0,81 8,41 3,61 8,41 1,21 0,01 1,21 1,21 62,9
Yr=
Yi!
n=209
10= 20,9
Yf=
Yi!
n=158
10= 15,8 !S
D
2=
(Di!D)2"
n !1= 6,9# !S
D= 6,9 = 2,62
D =Di!
n=51
10= 5,1
T =D! (µ
1!µ
2)
!SD
n
=5,1
2,62
10
= 6,2
SD= 0,82
2. Dos medias con muestras relacionadas. Ejemplo
!
D"D ( )2
41 41 0,99t9= +2,81
!
0,01
Contraste unilateral
!
µD
5. y 6. R.C. y criterio de decisión
Decisión: Como 6,2 > 2,81 (valor de t9 que deja por debajo 0,99) , rechazamos H0 y concluimos que el promedio de capacidad atencional disminuye con la fatiga
t = 6,2
2. Dos medias con muestras relacionadas. Ejemplo
42 42
Decidimos rechazar H0
p = P(t9> 6,2)= 0,000...
7. Nivel crítico (contraste unilateral)
0,000...< (0,01)
!
p <!
2. Dos medias con muestras relacionadas. Ejemplo
43 43
8. Intervalo de confianza
Error máximo
Error máximo !3,24
!
" /2
!
" /2
+3,24
(2,44 ;7,75)!Nivel de confianza 1-!=0,99
!
H0 :µD = 0Como el valor 0, propuesto en la H0 para la diferencia de medias, no está dentro del I.C. rechazaríamos la hipótesis nula
LI= (Y
D)!
!/2tn!1SD= 5,1!3,24 "0,82 = 2,44
LS= (Y
D)+
!/2tn!1SD= 5,1!3,24 "0,82 = 7,75
2. Dos medias con muestras relacionadas. Ejemplo
44
3. Tamaño del efecto en los contrastes sobre dos medias
Introducción La significación estadística se refiere únicamente a hasta qué punto una
diferencia encontrada en la muestra puede afirmarse que está presente en la población, basándose en las distribuciones muestrales de los estadísticos
Es un concepto muy diferente de la significación o relevancia científica:
- cuando los tamaños muestrales son muy grandes, podemos llegar a rechazar H0 incluso cuando la diferencia entre las muestras poblaciones sea reducida (estrictamente 0,001 es distinto de 0, pero en psicología no es una diferencia relevante)
- lo contrario puede suceder con tamaños muestrales muy reducidos, mantener que no existe una diferencia porque no hemos podido rechazar la hipótesis nula
45
Introducción (cont.) - El tamaño del efecto es una medida sobre el grado en que el efecto
estudiado está presente en la población; es una medida de hasta qué punto la diferencia encontrada es importante desde un punto de vista científico
- Existen difentes medidas del tamaño del efecto
Medidas del tamaño del efecto 1. Diferencia de medias estandarizada (d de Cohen) 1.1. Para 2 muestras independientes 1.2. Para 2 muestras relacionadas 2. Coeficiente de determinación
3. Tamaño del efecto en los contrastes sobre dos medias
46
d de Cohen para 2 muestras independientes
Ej. Con los datos del ejemplo 1 calcular el tamaño del efecto d
Se puede estimar la d a partir del valor del estadístico de contraste T según:
!
d =Y
1"Y
2
(n1"1) ˜ S
1
2+ (n
2"1) ˜ S
2
2
n1
+ n2" 2
!
d = T (1/n1) + (1/n
2)
!
d =98 "102
(40 "1)162
+ (40 "1)142
40 + 40 " 2
="4
15,03= 0,266
!
d = T (1/n1) + (1/n2) = "1,19 (1/40) + (1/40) = 0,266
3. Tamaño del efecto en los contrastes sobre dos medias
Viene expresado en unidades típicas
47
d de Cohen para 2 muestras relacionadas
Ej. Con los datos del ejemplo 3 calcular el tamaño del efecto d
Se puede estimar la d a partir del valor del estadístico de contraste T según:
!
d =D
˜ S D
!
d =T
n
3. Tamaño del efecto en los contrastes sobre dos medias
!
(Di" D )
2#n "1
d =5,1
2,62= 1,9
d =T
n=6,2
10= 1,9
Viene expresado en unidades típicas
48
Significado de la d de Cohen
µ1 µ2
d = 1
µ1 µ2
d = 2
3. Tamaño del efecto en los contrastes sobre dos medias
49
Coeficiente de correlación r de Pearson
Ej. Con los datos del ejemplo 1
Elevando al cuadrado el coeficiente de correlación r (coeficiente de determinación) se obtiene la proporción de varianza de la variable dependiente que está asociada a pertenecer a cada población
Este resultado indica que solamente el 1,80% de la varianza en fluidez verbal está asociada a la variable género
3. Tamaño del efecto en los contrastes sobre dos medias
!
r = T2/(T
2+ gl) gl = n
1+ n
2" 2
!
r = T2/(T
2+ gl) = ("1,19)
2/(("1,19)
2+ 78) = 0,134
!
r2 = 0,134( )
2= 0,018
50
Equivalencia entre medidas del tamaño del efecto
!
d =r2
p(1" p)(1" r2)
!
r =d
d2
+1/[p(1" p)]
3. Tamaño del efecto en los contrastes sobre dos medias
51
Interpretación magnitud del tamaño del efecto
- grande d ≈ 0,80 y r ≈ 0,50 - mediano d ≈ 0,50 y r ≈ 0,30 - pequeño d ≈ 0,20 y r ≈ 0,10
• Es fundamental que en las diferentes áreas de investigación se defina qué constituye un tamaño del efecto mínimo con significado e importancia para ser detectado, por eso es fundamental comparar el resultado con los obtenidos en otras investigaciones
• En ocasiones un tamaño del efecto pequeño puede ser relevante desde el punto de vista teórico y uno grande no serlo, pero hay que justificarlo desde la propia teoría
• En último caso, si no hay otra referente puede usarse como referencia al propuesto por Cohen:
3. Tamaño del efecto en los contrastes sobre dos medias
52
4. Cálculo de la potencia en los contrastes sobre diferencias de medias
Valor de la H0
Verdadera Falsa
Decisión sobre H0
Mantenerla
Rechazarla
!
µ1" µ
2= 0
Acierto: no encontrar una diferencia que no existe en la población
Probabilidad 1-α Error tipo I: encontrar una diferencia que no existe en la población
Probabilidad α
Error tipo II: no encontrar una diferencia que sí existe en la población
Probabilidad β Acierto: encontrar una diferencia que sí existe en la población
Probabilidad 1-β
53
Introducción La potencia de un contraste depende de: 1. El tamaño del efecto observado en ese contraste (d) 2. El nivel de significación (α) 3. El tamaño muestral (n) Manteniendo constante el resto de factores: αβ Para conseguir que, manteniendo fijo α, la potencia (1-β) sea mayor
es necesario aumentar el tamaño de la muestra En principio, el cálculo de la potencia debe hacerse antes de realizar
la investigación, debe fijarse el valor del tamaño del efecto que se quiere detectar y la potencia que se necesita para ello, lo que determinará el tamaño de muestra necesario para conseguir una potencia deteminada
4. Cálculo de la potencia en los contrastes sobre diferencias de medias
54
Dos medias
Ej. Con los datos del ejemplo 1
1-β= 0,22
lo que significa que si fuera cierta H1 rechazaremos H0 sólo en 22 de cada 100 veces que contrastemos
Para calcular la potencia se utilizan tablas o programas específicos y el valor es siempre función del tamaño del efecto, el nivel de significación y el tamaño de las muestras
4. Cálculo de la potencia en los contrastes sobre diferencias de medias
De la misma forma, también se puede determinar el tamaño muestral necesario para tener determinada potencia; esto resulta de gran utilidad antes de realizar una investigación para saber qué tamaño de muestra mínimo es necesario (se consideran valores adecuados 1-β≥0,8)
55 55
1. HIPÓTESIS:
- Contraste bilateral
2. Fijar el n.s.
!
"
5. Contraste de hipótesis sobre igualdad de varianzas
!
H0 :"1
2
"2
2= 1
H1 :"1
2
"2
2# 1
56 56
3. SUPUESTOS:
- Normalidad: la variable Y sigue una distribución Normal en las dos poblaciones de las que han sido extraídas las muestras
!
Y1 " N(µ1,#1
2)
Y2 " N(µ2,#2
2)
- Dos m.a.s. de tamaños n1 y n2 e independientes entre sí
Comprobación: pruebas de bondad de ajuste a la distribución Normal
Comprobación: test de rachas
5. Contraste de hipótesis sobre igualdad de varianzas
57 57
4. E.C.
El estadístico F se distribuye según el modelo de probabilidad F de Fisher-Snedecor con n1-1 y n2-1 grados de libertad
!
" Fn1#1,n2#1
!
F =˜ S 1
2
˜ S 2
2
5. Contraste de hipótesis sobre igualdad de varianzas
58 58
5. REGIÓN CRÍTICA Y CRITERIO DE DECISIÓN
- Rechazamos H0 si el valor obtenido en la muestra para el E.C. cae en la región crítica
- Mantenemos H0 si el valor obtenido en la muestra para el E.C. cae en la región de aceptación
!
F"# / 2Fn1 $1,n2 $1
!
" /2
!
" /2
Contraste bilateral
5. Contraste de hipótesis sobre igualdad de varianzas
!
F"1#$ / 2Fn1 #1,n2 #1
59 59
Ej 1. Un psicólogo está interesado en investigar las diferencias de género en capacidad cognitiva. Para ello administra un test de fluidez verbal a dos muestras aleatorias (40 varones y 40 mujeres). Una vez aplicado el test encuentra que y y se comprobó que la fluidez verbal seguía una distribución normal en ambas poblaciones. Con estos resultados, asumiendo varianzas poblacionales iguales y con un nivel de significación de 0,05, ¿qué podremos decir sobre la hipótesis de que ambas muestras proceden de poblaciones con la misma media?
!
Y v
= 98; ˜ S v
= 16
!
Y m
= 102; ˜ S m
= 14
1. Hipótesis: (contraste bilateral) H0:!
v
2
!m
2=1
H1:!
v
2
!m
2!1
5. Contraste de hipótesis sobre igualdad de varianzas. Ejemplo
Comprobación del supuesto de igualdad de varianzas
60 60
3. Supuestos:
- La fluidez verbal sigue una distribución normal tanto en la población de hombres como en la de mujeres
- Las muestras se han obtenido de forma aleatoria e independientemente una de otra
!
2." = 0,05
5. Contraste de hipótesis sobre igualdad de varianzas. Ejemplo
61 61
4. E.C.
!
" F40#1,40#1" F
39,39
!
F =˜ S
1
2
˜ S 2
2=
162
142
= 1,3
5. Contraste de hipótesis sobre igualdad de varianzas. Ejemplo
5. R.C.
!
F = 1,30,025
F39,39
= 0,53
!
0,025
0,975F39,39
=1,9
!
0,025
6. Criterio de decisión
Decisión: como 0,53 < 1,3 <1,9 mantenemos H0 y concluimos que las varianzas son iguales, es decir, se cumple el supuesto de homocedasticidad
Valor de F con 39 y 39 g.l. que deja por debajo 0,025
Valor de F con 39 y 39 g.l. que deja por debajo 0,975
62
6. Contraste de hipótesis sobre una proporción
Introducción En psicología es frecuente encontrarse con variables dicotómicas
(Ej. acierto-error, verdadero-falso, tratados-no tratados, recuperados-no recuperados, aprobados-suspensos, con una característica-sin ella,…); se suele llamar de forma genérica éxito-fracaso a los dos niveles de las variables de este tipo
Se pueden hacer contrastes acerca de: - la proporción de éxitos en una población π (o el número de
éxitos) en un número de ensayos (n) - compara las proporciones de éxito en poblaciones distintas (ver
tema 9)
63 63
1. HIPÓTESIS:
- Contraste bilateral
!
H0 :" = "0
H1 :" # "0
2. Fijar el n.s.
!
"
- Contraste unilateral derecho H0:! = !
0
H1:! > !
0
- Contraste unilateral de izquierdo
6. Contraste de hipótesis sobre una proporción
H0:! = !
0
H1:! < !
0
64 64
3. SUPUESTOS:
- La v.a. Y es una variable dicotómica con sólo dos valores posibles en la población y con una probabilidad de éxito igual a π
- Una m.a.s. de n observaciones, manteniéndose constante la probabilidad de éxito en cada extracción
6. Contraste de hipótesis sobre una proporción
65 65
4. E.C.
El estadístico Z se distribuye según N(0,1)
(si n es pequeño sigue una distribución binomial)
Z =n1! n!
0
n!0(1!!
0)=
p!!0
!0(1!!
0) / n
6. Contraste de hipótesis sobre una proporción
Número de éxitos en los n ensayos
Proporción de éxitos en los n ensayos
Valor propuesto para la proporción poblacional en H0
66 66
5. REGIÓN CRÍTICA Y CRITERIO DE DECISIÓN
- Rechazamos H0 si el valor obtenido en la muestra para el E.C. cae en la región crítica
- Mantenemos H0 si el valor obtenido en la muestra para el E.C. cae en la región de aceptación
!
Z " z1#$
!
"
Contraste unilateral derecho
!
"0
6. Contraste de hipótesis sobre una proporción
!
Z " z#
!
"
Contraste unilateral izquierdo
!
"0
!
Z " z# /2 Z $ z1%# /2
!
" /2
!
" /2
Contraste bilateral
!
"0
67 67
6. NIVEL CRÍTICO
- Contraste bilateral
!
p = 2 P(z " Z )[ ]
Valor del E.C. obtenido en la muestra
- Contraste unilateral derecho
!
p = P(z " Z)
Valor del E.C. obtenido en la muestra
- Contraste unilateral izquierdo
!
p = P(z " Z)
Valor del E.C. obtenido en la muestra
6. Contraste de hipótesis sobre una proporción
68 68
7. INTERVALO DE CONFIANZA
!
" /2
!
" /2
!
LI = p " Z# /2 p(1" p) /n
Error máximo
6. Contraste de hipótesis sobre una proporción
!
LS = p + Z" /2 p(1# p) /n
Error máximo
En este caso no coincide con el denominador del E.C.
69 69
6. Contraste de hipótesis sobre una proporción
!
Emax= Z" /2 p(1# p) /n
Determinar el tamaño de la muestra En los estudios sobre proporciones, el tamaño de la muestra a
seleccionar para la estimación es fundamental y, normalmente, se requieren muestra de mayor tamaño que para otros contrastes
Para determinar el tamaño necesario se parte del error máximo que se quiere cometer
Despejamos n
Estimación de la proporción que esperamos obtener basándonos: - en la teoría o en investigaciones previas - si no tenemos este tipo de información, consideramos p= 0,5 que, por ser el valor cuya distribución tiene mayor variabilidad, es el que requiere mayor tamaño muestral
!
n "Z# /2( )
2p(1$ p)
Emax( )2
70 70
Ej 4. En una asignatura de psicología de especial dificultad para los alumnos el porcentaje de aprobados se sitúa en el 30%. Por esta razón, los profesores de la asignatura deciden poner en funcionamiento un programa de estudio continuo asistido en una muestra de 100 alumnos. Los resultados mostraron que siguiendo este programa 52 alumnos aprobaron la asignatura ¿Podemos afirmar que el éxito del nuevo programa difiere significativamente del antiguo (α= 0,05)?
52 aprobados
P = 52/100 = 0,52
6. Contraste de hipótesis sobre una proporción. Ejemplo
1. Hipótesis: (contraste unilateral) H0:!
0= 0,3
H1:!
0> 0,3
71 71
6. Contraste de hipótesis sobre una proporción. Ejemplo
- La v.a. Y es una variable dicotómica con sólo dos valores posibles en la población: aprobar o suspender
- Una m.a.s. de 100 observaciones con probabilidad constante de 0,30 de que una observación cualquiera pertenezca a la categoría de alumnos aprobados
72 72
6. Contraste de hipótesis sobre una proporción. Ejemplo
!
Z =p "#0
#0(1"#0) /n=
0,52 " 0,3
0,3(0,7) /100
= 4,8
!
Z =n1 " n#0
n#0(1"#0)=
52 "100(0,3)
100(0,3)(0,7)= 4,8
4. E.C.
Alternativamente:
73 73
6. Contraste de hipótesis sobre una proporción. Ejemplo
!
z1"#
= 1,64
!
"
Contraste unilateral derecho
!
0,30
!
Z = 4,8
5. y 6. R.C. y criterio de decisión
Decisión: como 4,8 > 1,64 (valor de z que deja por debajo 0,95) rechazamos H0 y concluimos que la proporción de aprobados con el nuevo método es estadísticamente superior a 0,3
74 74
Decidimos rechazar H0
!
p = P(Z > 4,8) = 0,0000...
7. Nivel crítico (contraste unilateral)
!
0,000...< (0,05)
"
p <#
6. Contraste de hipótesis sobre una proporción. Ejemplo
75 75
8. Intervalo de confianza
Error máximo
(0, 422; 0, 618)! Nivel de confianza 1-!=0,95
!
H0 :"0 = 0,3Como el valor 0,3, propuesto en la H0 para la proporción de aprobados, no está dentro del I.C. rechazaríamos la hipótesis nula
6. Contraste de hipótesis sobre una proporción. Ejemplo
LI= p! Z ! /2 p(1! p) / n = 0,52!1,96 0, 52(1! 0,52) /100 = 0,52! 0,098 = 0, 422
Error máximo
LS = p+ Z ! /2 p(1! p) / n = 0,52+1,96 0, 52(1! 0,52) /100 = 0,52+ 0,098 = 0,618
!1,96
!
0,025
!
0,025
1,96
76 76
Ej 5. El presidente de una comunidad autónoma ha decidido implantar una central nuclear siempre y cuando un porcentaje alto de los ciudadanos esté de acuerdo. Para ello encarga un estudio imponiéndo la condición de que la diferencia entre la estimación de la proporción en la muestra y la proporción de la población no sea mayor de 0,1 ¿Qué tamaño de muestra necesita para hacer el estudio con α= 0,01?
6. Contraste de hipótesis sobre una proporción. Ejemplo de cálculo de n
!
n "Z# /2( )
2p(1$ p)
Emax( )2
=Z0,005( )
2
0,5(1$ 0,5)
0,1( )2
=$2,58( )
20,25
0,01( )% 166
Al no disponer de información previa consideramos el valor 0,5