Tema 3. El estadístico Chi-cuadrado y contrastes asociados
RONALD AYLMER FISHER
¿Qué vamos hacer ahora?
Veamos un estadístico para ver si dos variables están o no asociadas
Hay variables {- Muy relacionadas - Muy poco relacionadas
El estadístico Chi-cuadrado
El estadístico Chi-cuadrado
H0: Las variables en filas y columnas no están asociadas
H1: Las variables en filas y columnas están asociadas
Las hipótesis son:
Necesitamos “frecuencias esperadas”
n
ffe jiji
..,
EJEMPLO (supervivencia en el Titanic)
Sobrevive No sobrevive Total
Primera clase 194 128 322
Segunda clase 119 161 280
Tercera clase 138 573 711
Total 451 862 1313
Frecuencias esperadas
6,1101313
4513221..111
x
n
ffe
2,961313
4512801..221
x
n
ffe
Frecuencias esperadasSobrevive No sobrevive Total
Primera clase 110,6 211,4 322
Segunda clase 96,2 183,8 280
Tercera clase 244,2 466,8 711
Total 451 862 1313
Calculemos Chi-cuadrado
i j ij
ijij
e
ef 22exp
)(
Ya vuelven los matemáticos a complicar las cosas
Traducción
Tenemos dos tablas (sin totales): Frecuencias absolutas Frecuencias esperadas
1) Hagamos otra tabla, donde restamos a la primera la segunda
Sobrevive No sobrevive
Primera clase 194 128
Segunda clase 119 161
Tercera clase 138 573
Sobrevive No sobrevive
Primera clase 110,6 211,4
Segunda clase 96,2 183,8
Tercera clase 244,2 466,8
Sobrevive No sobrevive
Primera clase (194-110,6) (128-211,4)
Segunda clase (119-96,2) (161-183,8)
Tercera clase (138-244,2) (573-466,8)
3) Dividido por el valor que tengamos en la segunda tabla
2) Este valor elevado al cuadrado
Sobrevive No sobrevive
Primera clase (194-110,6)^2 (128-211,4)^2
Segunda clase (119-96,2)^2 (161-183,8)^2
Tercera clase (138-244,2)^2 (573-466,8)^2
Sobrevive No sobrevive
Primera clase (194-110,6)^2/110,6 (128-211,4)^2/211,4
Segunda clase (119-96,2)^2/96,2 (161-183,8)^2/183,8
Tercera clase (138-244,2)^2/244,2 (573-466,8)^2/466,8
Obtenemos la siguiente tabla en nuestro ejemplo
9,626,110
)6,110194( 2
9,324,211
)4,211128( 2
4,52,96
)2,96119( 2
8,28,183
)8,183181( 2
2,462,244
)2,244138( 2
2,248,466
)8,466573( 2
Sobrevive No sobrevive
Primera clase
Segunda clase
Tercera clase
4,1742,242,468,24,59,329,62)( 2
2exp
i j ij
ijij
e
ef
Probabilidad de un valor superior
- Alfa (α)
Grados libertad 0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
4,1742exp Tenemos:
1) grados de libertad, son:
K = (número de fila-1)x(número de columnas-1) = (3-1)x(2-1) = 2
Ahora calculemos el valor de la tabla Chi-cuadrado
2) El valor alfa (0,05 si no se dice).
3) El valor que buscamos
99,5205,0;2
2.;. lg
SIGNIFICADO: La probabilidad de obtener un valor mayor que 5,99 es 0,05
4,1742exp Tenemos:
Por tanto:
99,5205,0;2
2.;. lg
SIGNIFICADO: Las variables no son independientes
205,0;2
2exp
SIGNIFICADO en el ejemplo: El salvamento de los viajeros
en el Titanic no fue independiente de su clase social.
Hemos hecho un contraste de hipótesis
Los pasos en un contraste son:
1) Fijar las hipótesis que se quieren contrastar: 0H
2) Fijar el nivel de significación:
1H
3) Elegir un estadístico de contraste:
2);1()1(
22exp
)(
columnasxfilask
i j ij
ijij
e
ef
4) Se toma la decisión de rechazar o no la hipótesis:
2;
2exp k
2;
2exp k
Aceptar
Rechazar 0H
0H Independientes
Dependientes
Contraste de homogeneidad
1) Fijar las hipótesis que se quieren contrastar:
0H
2) Fijar el nivel de significación:
1H
la distribución de la variable Y en alguna de estas subpoblaciones es diferente
Las subpoblaciones tienen idéntica distribución para la variable Y.
3) Elegir un estadístico de contraste:
2);1()1(
22exp
)(
columnasxfilask
i j ij
ijij
e
ef
4) Se toma la decisión de rechazar o no la hipótesis:
2;
2exp k
2;
2exp k
Aceptar
Rechazar 0H
0H
EJEMPLO
Se desea saber si la distribución de los grupos sanguíneos es similar en los individuos de dos poblaciones. Para ello se elige una muestra aleatoria de cada una de ellas, obteniéndose los siguientes datos ¿Qué decisión se debe tomar?
A B AB 0 Total
Muestra 1 90 80 110 20 300
Muestra 2 200 180 240 30 650
Total 290 260 350 50 950
Calculamos las frecuencias esperadas:n
ffe jiji
..,
A B AB 0
Muestra 1 91.5789 82.105 110.53 15.789
Muestra 2 198.421 177.89 239.47 34.211
Componentes de la Chi-cuadrado
0272,05789,91
)5789,9190( 2
Estadístico de contraste:
76,1...0272,0)( 2
2exp
i j ij
ijij
e
ef
Calculemos el valor
Entonces:
2);1()1( columnasxfilask
Los grados de libertad:
3)14()12()1()1( xcolumnasxfilask
81,7205,0;3
2);1()1( columnasxfilask
La decisión de rechazar o no la hipótesis:
2;
2exp k Aceptar
0H
¿Cuando podemos aplicar el estadístico Chi-cuadrado?
1) Siempre hacemos un contraste unilateral.
2) No debe usarse si hay frecuencias esperadas inferiores a 1.
3) Como máximo el 20% de las frecuencias esperadas pueden ser menores que el valor 5.
RESUMEN
- El estadístico Chi-cuadrado- Fijar hipótesis- Fijar nivel de significación- Grados de libertad - Valores del estadístico
- Contraste de independencia- Contraste de homogeneidad- Condiciones de aplicar el Chi-cuadrado
GRACIAS POR LA ATENCIÓN
Top Related