Estad Stica II Tema 2

1 1

1. Contraste de hipótesis sobre dos medias con muestras independientes

1.1. Suponiendo varianzas iguales 1.2. Suponiendo varianzas distintas

2. Contraste de hipótesis sobre dos medias con muestras relacionadas

3. El tamaño del efecto en los contrastes sobre dos medias 4. Cálculo de la potencia en los contrastes sobre dos medias 5. Contraste de hipótesis sobre igualdad de varianzas 6. Contraste de hipótesis sobre una proporción

Tema 2. Comprobación de hipótesis acerca de algunos parámetros

2 2

POBLACIÓN 1

MUESTRA 2 extraída

POBLACIÓN 2

¿Son las medias muestrales lo bastante diferentes como para pensar que proceden de poblaciones con diferente media?

1. Contraste de hipótesis sobre dos medias con muestras independientes

MUESTRA 1 extraída

Introducción

Ejemplo:

!

¿µy1=µy2 ?

!

Y 1 = 32

Y 2 = 34

3 3

1.1. Dos medias con muestras independientes. Varianzas iguales

1. HIPÓTESIS:

- Contraste bilateral

!

H0 :µ1 " µ2 = k (habitualmente k = 0)

H1 :µ1 " µ2 # k

2. Fijar el n.s.

!

"

-  Contraste unilateral derecho H0:µ

1!µ

2= k

H1:µ

1!µ

2> k

-  Contraste unilateral de izquierdo H0:µ

1!µ

2= k

H1:µ

1!µ

2< k

4 4

3. SUPUESTOS:

- Normalidad: la variable Y sigue una distribución Normal en las dos poblaciones de las que han sido extraídas las muestras

!

Y1 " N(µ1,#1

2)

Y2 " N(µ2,#2

2)

-  Igualdad de varianzas (homocedasticidad)

!

"1

2="2

2="

2

- Dos m.a.s. de tamaños n1 y n2 e independientes entre sí


Comprobación: pruebas de bondad de ajuste a la distribución Normal

Comprobación: prueba de Levene sobre la igualdad de varianzas

Comprobación: test de rachas

5 5

4. E.C. Normalmente igual a 0

El estadístico T se distribuye según el modelo de probabilidad t de Student con n1 + n2 – 2 grados de libertad

!

" tn1+n2#2

!

SY 1"Y 2

# E .T.


!

T =Y 1 "Y 2 " (µ1 "µ2)

(n1 "1) ˜ S 1

2 + (n2 "1) ˜ S 2

2

n1 + n2 " 2(

1

n1

+1

n2

)

6 6

5. REGIÓN CRÍTICA Y CRITERIO DE DECISIÓN

- Rechazamos H0 si el valor obtenido en la muestra para el E.C. cae en la región crítica

- Mantenemos H0 si el valor obtenido en la muestra para el E.C. cae en la región de aceptación

!

T"# /2 tn1+n2$2 T%1$# /2 tn1+n2$2

!

" /2

!

" /2

Contraste bilateral

!

µ1 "µ2

!

T"# tn1

+n2$2

!

"

Contraste unilateral izquierdo

!

µ1 "µ2

!

T"1#$ tn

1+n

2#2

!

"

Contraste unilateral derecho

!

µ1 "µ2


7 7

6. NIVEL CRÍTICO


!

p = 2 P(tn1+n2"2 # tk )[ ]Valor del E.C. obtenido en la muestra

- Contraste unilateral derecho

!

p = P(tn1+n2"2 # tk )

Valor del E.C. obtenido en la muestra

- Contraste unilateral izquierdo

!

p = P(tn1+n2"2 # tk )



tk

p

tk

! tk

p2

p2

tk

p

8 8

7. INTERVALO DE CONFIANZA

!

" /2

!

" /2

!

LI

= (Y 1"Y

2) " # / 2 tn1 +n2 "2

SY 1 "Y 2

Error máximo

!

LS = (Y 1 "Y 2) + # /2 tn1+n2"2 SY 1"Y 2

Error máximo


9 9

8. TAMAÑO DEL EFECTO Y POTENCIA

Ver apartados 3 y 4 del tema


Este contraste es equivalente al ANOVA de 1 factor con dos niveles de medidas independientes (ver tema 3)

10 10

Ej 1. Un psicólogo está interesado en investigar las diferencias de género en capacidad cognitiva. Para ello administra un test de fluidez verbal a dos muestras aleatorias (40 varones y 40 mujeres). Una vez aplicado el test encuentra que y y se comprobó que la fluidez verbal seguía una distribución normal en ambas poblaciones. Con estos resultados, asumiendo varianzas poblacionales iguales y con un nivel de significación de 0,05, ¿qué podremos decir sobre la hipótesis de que ambas muestras proceden de poblaciones con la misma media?

!

Y v

= 98; ˜ S v

= 16

!

Y m

= 102; ˜ S m

= 14

1.  Hipótesis: (contraste bilateral)

!

H0 :µv "µm = 0

H1 :µv "µm # 0

1.1. Dos medias con muestras independientes. Varianzas iguales. Ejemplo

11 11

3.  Supuestos:

-  La fluidez verbal sigue una distribución normal tanto en la población de hombres como en la de mujeres

-  Habría que comprobar que la varianzas poblacionales iguales (en este caso lo resolveremos como si lo fueran)

-  Las muestras se han obtenido de forma aleatoria e independientemente una de otra

!

2." = 0,05


12 12

4. E.C.

!

T =Y 1 "Y 2 " (µ1 "µ2)

(n1 "1) ˜ S 1

2 + (n2 "1) ˜ S 2

2

n1 + n2 " 2(

1

n1

+1

n2

)

=

!

" t40+40#2 " t78

!

=(98 "102) " (µ1 "µ2)

(40"1)(16)2 + (40"1)(14)

2

40 + 40" 2(

1

40+

1

40)

= "1,19

E.T.=3,36


Ejemplo 1 (cont.)

13 13

!

0,025 t78 = "1,99 0,975t78 = +1,99

!

0,025

!

0,025

Contraste bilateral

!

µ1 "µ2

5. y 6. R.C. y criterio de decisión

Decisión: como -1,19 > - 1,99 (valor de t78 que deja por debajo 0,025) mantenemos H0, mantenemos la hipótesis de que el promedio de la fluidez verbal es el mismo en la población de varones que en la población de mujeres, o lo que es lo mismo, que no existen diferencias estadísticamente significativas de género en fluidez verbal

!

t = "1,19


14 14

Decidimos mantener H0

!

p = 2 P(tn1+n2"2 # tk )[ ] = 2 P(t78 # "1.19 )[ ] $ 2(0,1) = 0,2

7.  Nivel crítico (contraste bilateral)

!

0,2 > (0,05)

"

p >#


Contraste bilateral

!

0,025 t78 = "1,99 0,975t78 = +1,99t78= !1,19 t

78= +1,19

15 15

8.  Intervalo de confianza

!

LI = (Y 1 "Y 2) " # /2 tn1+n2"2 SY 1"Y 2

=

= (98 "102) " "1,99 3,36 = ("4) " (6,68) = "10,68

Error máximo

!

LS = (Y 1 "Y 2) + # /2 tn1+n2"2 SY 1"Y 2

=

= (98 "102) + "1,99 3,36 = ("4) + (6,68) = 2,68

Error máximo !1,99

!

" /2

!

" /2

+1,99

(!10.68;2, 68)" Nivel de confianza 1-!=0,95

!

H0 :µv "µm = 0Como el valor 0, propuesto en la H0 para la diferencia de medias, está dentro del I.C. mantendremos la hipótesis nula


16 16

Robustez de T frente al incumplimiento de los supuestos

La distribución muestral no sufre mucha alteración

!

"1

2#"2

2  Si n1 y n2 son pequeños y

La distribución muestral no sigue exactamente el modelo propuesto

Supuesto de Normalidad  Si n1 y n2 son razonablemente grandes (> 20-25)  Si n1 y n2 no son grandes pero las distribuciones son simétricas  Si n1 y n2 no son grandes, las distribuciones no son simétricas pero

!

"1

2="2

2


17 17

Robustez de T frente al incumplimiento de los supuestos

La distribución muestral no sufre mucha alteración

  Si n1 ≠ n2, aunque se cumpla el supuesto de normalidad

La distribución muestral no sigue exactamente el modelo propuesto

Supuesto de Homocedasticidad  Si n1=n2 y se cumple el supuesto de normalidad


18 18

1. HIPÓTESIS:


2. Fijar el n.s.

!

"

-  Contraste unilateral derecho

-  Contraste unilateral izquierdo H0:µ

1!µ

2= k

H1:µ

1!µ

2< k

1.2. Dos medias con muestras independientes. Varianzas distintas

!

H0 :µ1 " µ2 = k (habitualmente k = 0)

H1 :µ1 " µ2 # k

H0:µ

1!µ

2= k

H1:µ

1!µ

2> k

19 19

3. SUPUESTOS:


!

Y1 " N(µ1,#1

2)

Y2 " N(µ2,#2

2)


!

"#1

2$#2

2




20 20

4. E.C.

!

T =Y 1 "Y 2 " (µ1 "µ2)

˜ S 1

2

n1

+˜ S 2

2

n2

Normalmente igual a 0

!

" tgl ' gl'=

˜ S 12

n1

+˜ S 2

2

n2

#

$ % %

&

' ( (

2

˜ S 12

n1( )2

n1 )1+

˜ S 22

n2( )2

n2 )1

!

SY 1"Y 2

# E .T.


21 21




!

T"# /2 tgl ' T$1%# /2tgl '

!

" /2

!

" /2

Contraste bilateral

!

µ1 "µ2

!

T"# tgl '

!

"


!

µ1 "µ2

!

T"1#$ tgl '

!

"


!

µ1 "µ2


22 22

6. NIVEL CRÍTICO


- Contraste bilateral Valor del E.C. obtenido en la muestra

!

p = 2 P(tgl ' " tk )[ ]

- Contraste unilateral derecho Valor del E.C. obtenido en

la muestra

!

p = P(tgl' " tk )

- Contraste unilateral izquierdo Valor del E.C. obtenido en la

muestra

!

p = P(tgl' " tk )

tk

! tk

p2

p2

tk

p

tk

p

23 23



Ver apartados 3 y 4 del tema

Cálculo más complejo (consultar bibliografía recomendada)


Este contraste es equivalente al ANOVA de 1 factor con dos niveles de medidas independientes (ver tema 3)

24 24

1.  Hipótesis: (contraste unilateral) H0:µ

n= µ

l

H1:µ

n> µ

l

!

Y n = 9; ˜ S n = 6

!

Y l = 6; ˜ S l = 2

Ej 2 Un psicólogo quiere investigar si el fenómeno del habla privada esta guiado por claves contextuales. Para ello registró la frecuencia de dicho fenómeno en unas muestras aleatorias de 40 niños en entornos naturales y de 20 niños en entornos de laboratorio mientras realizaban tareas equivalentes. Los resultados fueron y para cada grupo respectivamente y se comprobó que el habla privada seguía una distribución normal en ambos contextos. A la vista de estos resultados y con un nivel de significación de 0,01, ¿qué podemos decir sobre la hipótesis de que dicho fenómeno se da más en contextos naturales?

1.2. Dos medias con muestras independientes. Varianzas distintas. Ejemplo

25 25

3.  Supuestos:

-  El habla privada sigue una distribución normal en ambos contextos

-  Habría que comprobar que la varianzas poblacionales iguales (en este caso lo resolveremos como si no lo fueran)


!

2." = 0,01


26 26

4. E.C.

!

T =Y 1 "Y 2 " (µ1 "µ2)

˜ S 1

2

n1

+˜ S 2

2

n2

0

!

" tgl ' gl'=

˜ S 12

n1

+˜ S 2

2

n2

#

$ % %

&

' ( (

2

˜ S 12

n1( )2

n1 )1+

˜ S 22

n2( )2

n2 )1

=

62

40+

22

20

#

$ % %

&

' ( (

2

62

40( )2

40 )1+

22

20( )2

20 )1

* 53 t53

!

SY 1"Y 2

# E .T.

!

=9" 6

62

40+

22

20

= 2,86

!

SY 1"Y 2

= 1,04 # E .T.


27 27

!

0,99 t53 = +2,4

!

0,01

Contraste unilateral

!

µ1 "µ2


Decisión: Como 2,86 > 2,40 (valor de t53 que deja por debajo 0,99) rechazamos H0 y concluimos que el promedio del fenómeno del habla privada es significativamente superior en los contextos naturales frente a los del laboratorio

!

t = 2,86


28 28

Decidimos rechazar H0

!

p = P(t53 > 2,86) = 0,0021

7.  Nivel crítico (contraste unilateral)

0,0021< (0, 01)

!

p <!


29


Introducción Se puede afirmar que dos muestras están relacionadas cuando:

1.  En un diseño de medidas repetidas el mismo grupo de sujetos es evaluado en dos ocasiones; sólo hay una población

2.  En un diseño “por pares”, cuando los sujetos de cada par guardan algún tipo de relación entre ellos, por ej.: gemelos, emparejados en alguna variable,…

Una de las puntuaciones de un par nos proporciona alguna información sobre la otra puntuación del par

Se trabaja sobre las puntuaciones diferencia de cada sujeto o par de sujetos relacionados

!

Di = (Yi1 "Yi2)

30 30

POBLACIÓN 1

¿Son las medias muestrales lo bastante diferentes como para pensar que la diferencia media es cero?

MUESTRA 1 extraída

Introducción

Ejemplo:

!

¿µd = 0?

!

Y antes = 30

Y después = 36


31 31

1. HIPÓTESIS:


!

H0 :µD = k (µD = µ1 "µ2 habitualmente k = 0)

H1 :µD # k

2. Fijar el n.s.

!

"

-  Contraste unilateral derecho H0:µ

D= k

H1:µ

D> k

-  Contraste unilateral izquierdo H0:µ

D= k

H1:µ

D< k

2. Dos medias con muestras relacionadas

32 32

3. SUPUESTOS:

- Normalidad: la variable D (diferencia de las puntuaciones) sigue una distribución Normal

!

D" N(µD,#

D

2)

- Una m.a.s. de n pares o diferencias




33 33

4. E.C.

!

T =D " (µ1 "µ2)

˜ S D

n

Normalmente igual a 0

El estadístico T se distribuye según el modelo de probabilidad t de Student con n-1 grados de libertad

!

" tn#1

!

SD " E .T.

!

D =Di"

n

!SD=

(Di!D)2"

n!1


34 34




!

T"# /2 tn$1 T%1$# /2tn$1

!

" /2

!

" /2

Contraste bilateral

!

µD

!

T"# tn$1

!

"


!

µD

!

T"1#$ tn#1

!

"


!

µD


35

6. NIVEL CRÍTICO


!

p = 2 P(tn"1 # tk )[ ]- Contraste bilateral


tk

! tk

p2

p2

- Contraste unilateral derecho Valor del E.C. obtenido en

la muestra

!

p = P(tn"1 # tk )

tk

p

- Contraste unilateral izquierdo Valor del E.C. obtenido en la

muestra

!

p = P(tn"1 # tk )

tk

p

36 36


!

" /2

!

" /2

!

LI = (Y D ) " # /2 tn"1 SD

Error máximo

!

LS = (Y D ) + " /2 tn#1 SD

Error máximo


37 37


Ver apartado 3 del tema


Este contraste es equivalente al ANOVA de 1 factor con dos niveles de medidas repetidas (ver tema 5)

38 38

Ej 3. Un psicólogo deportivo quiere investigar el efecto de la fatiga sobre la capacidad atencional en 10 deportistas de élite. Para ello midió la capacidad atencional en reposo y en condición de fatiga tras 20 minutos de ejercicio a la máxima intensidad. Los resultados obtenidos se presentan en la siguiente tabla. ¿Qué podemos decir sobre la hipótesis de que la fatiga disminuye la capacidad atencional con un nivel de significación de 0,01?

Sujetos 1 2 3 4 5 6 7 8 9 10

Reposo 20 22 19 25 18 24 17 25 21 18

Fatiga 14 23 13 17 10 16 13 20 17 14

1.  Hipótesis: (contraste unilateral) H0:µr = µ f

H1:µr > µ f

2. Dos medias con muestras relacionadas. Ejemplo

39 39

3.  Supuestos:

-  Habría que comprobar si la población de diferencias es normal

-  La muestra se ha obtenido de forma aleatoria

!

2." = 0,01


40 40

4. E.C. Sujetos 1 2 3 4 5 6 7 8 9 10

Reposo 20 22 19 25 18 24 17 25 21 18 209

Fatiga 14 23 13 17 11 16 13 20 17 14 158

Di 6 -1 6 8 7 8 4 5 4 4 51

0,81 37,21 0,81 8,41 3,61 8,41 1,21 0,01 1,21 1,21 62,9

Yr=

Yi!

n=209

10= 20,9

Yf=

Yi!

n=158

10= 15,8 !S

D

2=

(Di!D)2"

n !1= 6,9# !S

D= 6,9 = 2,62

D =Di!

n=51

10= 5,1

T =D! (µ

1!µ

2)

!SD

n

=5,1

2,62

10

= 6,2

SD= 0,82


!

D"D ( )2

41 41 0,99t9= +2,81

!

0,01

Contraste unilateral

!

µD


Decisión: Como 6,2 > 2,81 (valor de t9 que deja por debajo 0,99) , rechazamos H0 y concluimos que el promedio de capacidad atencional disminuye con la fatiga

t = 6,2


42 42


p = P(t9> 6,2)= 0,000...


0,000...< (0,01)

!

p <!


43 43


Error máximo

Error máximo !3,24

!

" /2

!

" /2

+3,24

(2,44 ;7,75)!Nivel de confianza 1-!=0,99

!

H0 :µD = 0Como el valor 0, propuesto en la H0 para la diferencia de medias, no está dentro del I.C. rechazaríamos la hipótesis nula

LI= (Y

D)!

!/2tn!1SD= 5,1!3,24 "0,82 = 2,44

LS= (Y

D)+

!/2tn!1SD= 5,1!3,24 "0,82 = 7,75


44

3. Tamaño del efecto en los contrastes sobre dos medias

Introducción   La significación estadística se refiere únicamente a hasta qué punto una

diferencia encontrada en la muestra puede afirmarse que está presente en la población, basándose en las distribuciones muestrales de los estadísticos

  Es un concepto muy diferente de la significación o relevancia científica:

-  cuando los tamaños muestrales son muy grandes, podemos llegar a rechazar H0 incluso cuando la diferencia entre las muestras poblaciones sea reducida (estrictamente 0,001 es distinto de 0, pero en psicología no es una diferencia relevante)

-  lo contrario puede suceder con tamaños muestrales muy reducidos, mantener que no existe una diferencia porque no hemos podido rechazar la hipótesis nula

45

Introducción (cont.) -  El tamaño del efecto es una medida sobre el grado en que el efecto

estudiado está presente en la población; es una medida de hasta qué punto la diferencia encontrada es importante desde un punto de vista científico

-  Existen difentes medidas del tamaño del efecto

Medidas del tamaño del efecto 1.  Diferencia de medias estandarizada (d de Cohen) 1.1. Para 2 muestras independientes 1.2. Para 2 muestras relacionadas 2.  Coeficiente de determinación


46

d de Cohen para 2 muestras independientes

Ej. Con los datos del ejemplo 1 calcular el tamaño del efecto d

Se puede estimar la d a partir del valor del estadístico de contraste T según:

!

d =Y

1"Y

2

(n1"1) ˜ S

1

2+ (n

2"1) ˜ S

2

2

n1

+ n2" 2

!

d = T (1/n1) + (1/n

2)

!

d =98 "102

(40 "1)162

+ (40 "1)142

40 + 40 " 2

="4

15,03= 0,266

!

d = T (1/n1) + (1/n2) = "1,19 (1/40) + (1/40) = 0,266


Viene expresado en unidades típicas

47

d de Cohen para 2 muestras relacionadas

Ej. Con los datos del ejemplo 3 calcular el tamaño del efecto d

Se puede estimar la d a partir del valor del estadístico de contraste T según:

!

d =D

˜ S D

!

d =T

n


!

(Di" D )

2#n "1

d =5,1

2,62= 1,9

d =T

n=6,2

10= 1,9

Viene expresado en unidades típicas

48

Significado de la d de Cohen

µ1 µ2

d = 1

µ1 µ2

d = 2


49

Coeficiente de correlación r de Pearson

Ej. Con los datos del ejemplo 1

Elevando al cuadrado el coeficiente de correlación r (coeficiente de determinación) se obtiene la proporción de varianza de la variable dependiente que está asociada a pertenecer a cada población

Este resultado indica que solamente el 1,80% de la varianza en fluidez verbal está asociada a la variable género


!

r = T2/(T

2+ gl) gl = n

1+ n

2" 2

!

r = T2/(T

2+ gl) = ("1,19)

2/(("1,19)

2+ 78) = 0,134

!

r2 = 0,134( )

2= 0,018

50

Equivalencia entre medidas del tamaño del efecto

!

d =r2

p(1" p)(1" r2)

!

r =d

d2

+1/[p(1" p)]


51

Interpretación magnitud del tamaño del efecto

- grande d ≈ 0,80 y r ≈ 0,50 - mediano d ≈ 0,50 y r ≈ 0,30 - pequeño d ≈ 0,20 y r ≈ 0,10

•  Es fundamental que en las diferentes áreas de investigación se defina qué constituye un tamaño del efecto mínimo con significado e importancia para ser detectado, por eso es fundamental comparar el resultado con los obtenidos en otras investigaciones

•  En ocasiones un tamaño del efecto pequeño puede ser relevante desde el punto de vista teórico y uno grande no serlo, pero hay que justificarlo desde la propia teoría

•  En último caso, si no hay otra referente puede usarse como referencia al propuesto por Cohen:


52

4. Cálculo de la potencia en los contrastes sobre diferencias de medias

Valor de la H0

Verdadera Falsa

Decisión sobre H0

Mantenerla

Rechazarla

!

µ1" µ

2= 0

Acierto: no encontrar una diferencia que no existe en la población

Probabilidad 1-α Error tipo I: encontrar una diferencia que no existe en la población

Probabilidad α

Error tipo II: no encontrar una diferencia que sí existe en la población

Probabilidad β Acierto: encontrar una diferencia que sí existe en la población

Probabilidad 1-β

53

Introducción   La potencia de un contraste depende de: 1. El tamaño del efecto observado en ese contraste (d) 2. El nivel de significación (α) 3. El tamaño muestral (n)   Manteniendo constante el resto de factores: αβ   Para conseguir que, manteniendo fijo α, la potencia (1-β) sea mayor

es necesario aumentar el tamaño de la muestra   En principio, el cálculo de la potencia debe hacerse antes de realizar

la investigación, debe fijarse el valor del tamaño del efecto que se quiere detectar y la potencia que se necesita para ello, lo que determinará el tamaño de muestra necesario para conseguir una potencia deteminada


54

Dos medias

Ej. Con los datos del ejemplo 1

1-β= 0,22

lo que significa que si fuera cierta H1 rechazaremos H0 sólo en 22 de cada 100 veces que contrastemos

  Para calcular la potencia se utilizan tablas o programas específicos y el valor es siempre función del tamaño del efecto, el nivel de significación y el tamaño de las muestras


  De la misma forma, también se puede determinar el tamaño muestral necesario para tener determinada potencia; esto resulta de gran utilidad antes de realizar una investigación para saber qué tamaño de muestra mínimo es necesario (se consideran valores adecuados 1-β≥0,8)

55 55

1. HIPÓTESIS:


2. Fijar el n.s.

!

"

5. Contraste de hipótesis sobre igualdad de varianzas

!

H0 :"1

2

"2

2= 1

H1 :"1

2

"2

2# 1

56 56

3. SUPUESTOS:


!

Y1 " N(µ1,#1

2)

Y2 " N(µ2,#2

2)





57 57

4. E.C.

El estadístico F se distribuye según el modelo de probabilidad F de Fisher-Snedecor con n1-1 y n2-1 grados de libertad

!

" Fn1#1,n2#1

!

F =˜ S 1

2

˜ S 2

2


58 58




!

F"# / 2Fn1 $1,n2 $1

!

" /2

!

" /2

Contraste bilateral


!

F"1#$ / 2Fn1 #1,n2 #1

59 59

Ej 1. Un psicólogo está interesado en investigar las diferencias de género en capacidad cognitiva. Para ello administra un test de fluidez verbal a dos muestras aleatorias (40 varones y 40 mujeres). Una vez aplicado el test encuentra que y y se comprobó que la fluidez verbal seguía una distribución normal en ambas poblaciones. Con estos resultados, asumiendo varianzas poblacionales iguales y con un nivel de significación de 0,05, ¿qué podremos decir sobre la hipótesis de que ambas muestras proceden de poblaciones con la misma media?

!

Y v

= 98; ˜ S v

= 16

!

Y m

= 102; ˜ S m

= 14

1.  Hipótesis: (contraste bilateral) H0:!

v

2

!m

2=1

H1:!

v

2

!m

2!1

5. Contraste de hipótesis sobre igualdad de varianzas. Ejemplo

Comprobación del supuesto de igualdad de varianzas

60 60

3.  Supuestos:

-  La fluidez verbal sigue una distribución normal tanto en la población de hombres como en la de mujeres


!

2." = 0,05


61 61

4. E.C.

!

" F40#1,40#1" F

39,39

!

F =˜ S

1

2

˜ S 2

2=

162

142

= 1,3


5. R.C.

!

F = 1,30,025

F39,39

= 0,53

!

0,025

0,975F39,39

=1,9

!

0,025

6. Criterio de decisión

Decisión: como 0,53 < 1,3 <1,9 mantenemos H0 y concluimos que las varianzas son iguales, es decir, se cumple el supuesto de homocedasticidad

Valor de F con 39 y 39 g.l. que deja por debajo 0,025

Valor de F con 39 y 39 g.l. que deja por debajo 0,975

62

6. Contraste de hipótesis sobre una proporción

Introducción   En psicología es frecuente encontrarse con variables dicotómicas

(Ej. acierto-error, verdadero-falso, tratados-no tratados, recuperados-no recuperados, aprobados-suspensos, con una característica-sin ella,…); se suele llamar de forma genérica éxito-fracaso a los dos niveles de las variables de este tipo

  Se pueden hacer contrastes acerca de: -  la proporción de éxitos en una población π (o el número de

éxitos) en un número de ensayos (n) -  compara las proporciones de éxito en poblaciones distintas (ver

tema 9)

63 63

1. HIPÓTESIS:


!

H0 :" = "0

H1 :" # "0

2. Fijar el n.s.

!

"

-  Contraste unilateral derecho H0:! = !

0

H1:! > !

0

-  Contraste unilateral de izquierdo


H0:! = !

0

H1:! < !

0

64 64

3. SUPUESTOS:

- La v.a. Y es una variable dicotómica con sólo dos valores posibles en la población y con una probabilidad de éxito igual a π

- Una m.a.s. de n observaciones, manteniéndose constante la probabilidad de éxito en cada extracción


65 65

4. E.C.

El estadístico Z se distribuye según N(0,1)

(si n es pequeño sigue una distribución binomial)

Z =n1! n!

0

n!0(1!!

0)=

p!!0

!0(1!!

0) / n


Número de éxitos en los n ensayos

Proporción de éxitos en los n ensayos

Valor propuesto para la proporción poblacional en H0

66 66




!

Z " z1#$

!

"


!

"0


!

Z " z#

!

"


!

"0

!

Z " z# /2 Z $ z1%# /2

!

" /2

!

" /2

Contraste bilateral

!

"0

67 67

6. NIVEL CRÍTICO


!

p = 2 P(z " Z )[ ]


- Contraste unilateral derecho

!

p = P(z " Z)


- Contraste unilateral izquierdo

!

p = P(z " Z)



68 68


!

" /2

!

" /2

!

LI = p " Z# /2 p(1" p) /n

Error máximo


!

LS = p + Z" /2 p(1# p) /n

Error máximo

En este caso no coincide con el denominador del E.C.

69 69


!

Emax= Z" /2 p(1# p) /n

Determinar el tamaño de la muestra   En los estudios sobre proporciones, el tamaño de la muestra a

seleccionar para la estimación es fundamental y, normalmente, se requieren muestra de mayor tamaño que para otros contrastes

  Para determinar el tamaño necesario se parte del error máximo que se quiere cometer

Despejamos n

Estimación de la proporción que esperamos obtener basándonos: - en la teoría o en investigaciones previas - si no tenemos este tipo de información, consideramos p= 0,5 que, por ser el valor cuya distribución tiene mayor variabilidad, es el que requiere mayor tamaño muestral

!

n "Z# /2( )

2p(1$ p)

Emax( )2

70 70

Ej 4. En una asignatura de psicología de especial dificultad para los alumnos el porcentaje de aprobados se sitúa en el 30%. Por esta razón, los profesores de la asignatura deciden poner en funcionamiento un programa de estudio continuo asistido en una muestra de 100 alumnos. Los resultados mostraron que siguiendo este programa 52 alumnos aprobaron la asignatura ¿Podemos afirmar que el éxito del nuevo programa difiere significativamente del antiguo (α= 0,05)?

52 aprobados

P = 52/100 = 0,52

6. Contraste de hipótesis sobre una proporción. Ejemplo

1.  Hipótesis: (contraste unilateral) H0:!

0= 0,3

H1:!

0> 0,3

71 71


- La v.a. Y es una variable dicotómica con sólo dos valores posibles en la población: aprobar o suspender

- Una m.a.s. de 100 observaciones con probabilidad constante de 0,30 de que una observación cualquiera pertenezca a la categoría de alumnos aprobados

72 72


!

Z =p "#0

#0(1"#0) /n=

0,52 " 0,3

0,3(0,7) /100

= 4,8

!

Z =n1 " n#0

n#0(1"#0)=

52 "100(0,3)

100(0,3)(0,7)= 4,8

4. E.C.

Alternativamente:

73 73


!

z1"#

= 1,64

!

"


!

0,30

!

Z = 4,8


Decisión: como 4,8 > 1,64 (valor de z que deja por debajo 0,95) rechazamos H0 y concluimos que la proporción de aprobados con el nuevo método es estadísticamente superior a 0,3

74 74


!

p = P(Z > 4,8) = 0,0000...


!

0,000...< (0,05)

"

p <#


75 75


Error máximo

(0, 422; 0, 618)! Nivel de confianza 1-!=0,95

!

H0 :"0 = 0,3Como el valor 0,3, propuesto en la H0 para la proporción de aprobados, no está dentro del I.C. rechazaríamos la hipótesis nula


LI= p! Z ! /2 p(1! p) / n = 0,52!1,96 0, 52(1! 0,52) /100 = 0,52! 0,098 = 0, 422

Error máximo

LS = p+ Z ! /2 p(1! p) / n = 0,52+1,96 0, 52(1! 0,52) /100 = 0,52+ 0,098 = 0,618

!1,96

!

0,025

!

0,025

1,96

76 76

Ej 5. El presidente de una comunidad autónoma ha decidido implantar una central nuclear siempre y cuando un porcentaje alto de los ciudadanos esté de acuerdo. Para ello encarga un estudio imponiéndo la condición de que la diferencia entre la estimación de la proporción en la muestra y la proporción de la población no sea mayor de 0,1 ¿Qué tamaño de muestra necesita para hacer el estudio con α= 0,01?

6. Contraste de hipótesis sobre una proporción. Ejemplo de cálculo de n

!

n "Z# /2( )

2p(1$ p)

Emax( )2

=Z0,005( )

2

0,5(1$ 0,5)

0,1( )2

=$2,58( )

20,25

0,01( )% 166

Al no disponer de información previa consideramos el valor 0,5

Estad Stica II Tema 2

Documents

Transcript of Estad Stica II Tema 2