prueba Ji Cuadrado
description
Transcript of prueba Ji Cuadrado
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 1/47
SEMANA 11
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 2/47
Pruebas de Ji Cuadrada
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 3/47
Objetivos
Al término de este capítulo podrá usted:
• Explicar la diferencia entre la prueba de independencia y
la prueba de bondad de ajuste.
• Calcular las frecuencias esperadas y el estadístico Ji
Cuadrada.
• Aplicar tablas de contingencia a un problema de toma de
decisiones.• Aplicar la prueba de bondad de ajuste a un problema de
toma de decisiones.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 4/47
Introducción
En los capítulos anteriores, se construyeron pruebas de
hipótesis sobre medias o proporciones de una población para una o dos muestras. Se supuso para estas pruebas
que la población que se muestrea sigue una distribución
normal. Las pruebas manejaron datos de escalas de
intervalo, como alturas, edades e ingresos.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 5/47
Existen algunas situaciones en las que los datos no se
miden en escalas de intervalos o de razón, sino son
nominales u ordinales. En estos casos, no se puedenhacer suposiciones sobre la forma de la población. Este
capítulo introducirá las pruebas de Ji Cuadrada que
cubren algunas de estas situaciones.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 6/47
La prueba con tablas de contingencia está diseñada para
determinar si dos variables categóricas están relacionadas. En
ocasiones se la denomina prueba de independencia , ya que lahipótesis nula que se prueba establece que dos variables
categóricas son independientes. Esta prueba es bastante útil
porque con frecuencia el analista está interesado en averiguar si
una variable categórica se relaciona con otra.
Pruebas con Tablas de Contingencia
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 7/47
La prueba con tablas de contingencia
determina si dos variables categóricas se
relacionan entre sí.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 8/47
Los datos necesarios para la prueba con tablas decontingencia consisten en medidas muestrales sobre
dos variables categóricas (con escala nominal u
ordinal). Estos datos se arreglan en una tabla, que
permite al analista ver una exposición de los datos
recogidos. Algunas veces se hace referencia a este
tipo de tabla como una tabla de clasificación
cruzada o simplemente tabla cruzada .
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 9/47
H 1 : las variables en las filas y las columnas son dependientes
Las hipótesis nula y alternativa entre las que el analista debe
elegir después de examinar los datos de la muestra son:
H 0 : las variables en las filas y las columnas son
independientes
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 10/47
La prueba con tablas de contingencia se usa
frecuentemente para analizar aspectos
importantes de los datos investigados. En
general, las encuestas contienen preguntasdiseñadas para medir cierto tipo de
características demográficas de la muestra (por
ejemplo, categoría de edad, sexo, nivel de
ingreso, estado civil y nivel educativo).
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 11/47
Otro tipo de pregunta que muchas veces se
encuentra en un instrumento de investigaciónresalta las actitudes y opiniones de los
encuestados.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 12/47
Muchas pruebas con tablas de contingencia
comparan una variable demográfica con una variable
de actitud. Por ejemplo, la variable hombre/mujer
puede ponerse en una tabla cruzada con la jerarquización de los precios en algunas tiendas, o
bien, las categorías de edades se pueden tabular con
la respuesta a una afirmación sobre un candidato
presidencial.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 13/47
El propósito de tales pruebas es determinar si
distintos tipos poblaciones, definidos por las preguntas demográficas, tienen diferentes actitudes
respecto a los temas investigados.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 14/47
Ejemplo
Un artículo publicado en una revista especializada acerca de
encuestas afirmó: “En temas sensibles, las personas tienden a
dar respuestas aceptables en lugar de respuestas honestas; susrespuestas pueden depender del género o la raza del
entrevistador”.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 15/47
Para sustentar dicha aseveración una empresa
encuestadora proporcionó los datos de una encuesta
en la cual se preguntó a hombres si estaban de
acuerdo con esta afirmación: “El aborto es un asunto privado que la mujer debe decidir, sin intervención
gubernamental”. Analizaremos el efecto del género
sólo en hombres que se encuestaron y la tabla que se
muestra a continuación se basa en tales datos:
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 16/47
Género del entrevistador
Hombre Mujer Total
Hombres que están de acuerdo 560 308 868
Hombres que están en desacuerdo 240 92 332
Total
800
400
1200
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 17/47
Suponga que la encuesta se diseñó de manera que los
entrevistadores hombres recibieron instrucciones
para obtener 800 respuestas de sujetos hombres; en
tanto que las entrevistadoras mujeres recibieron
instrucciones para obtener 400 respuestas de sujetos
hombres. Utilice un nivel de significancia de 0.05 y
prueba la aseveración de que las proporciones de las
respuestas de acuerdo/desacuerdo son las mismas
para los sujetos que entrevistaron hombres y lossujetos que entrevistaron mujeres.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 18/47
Solución
H1: Las proporciones son diferentes.
Puesto que tenemos dos poblaciones separadas (sujetos queentrevistaron hombres y sujetos que entrevistaron mujeres),
probamos la homogeneidad con estas hipótesis:
H0: Las proporciones de las respuestas acuerdo/desacuerdo soniguales para los sujetos que entrevistaron hombres y los sujetos
que entrevistaron mujeres.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 19/47
Hombres Mujeres Total
1 560 308 868*578,67 289,33
0,602 1,204
2 240 92 332
221,33 110,67
1,574 3,149
Total 800 400 1200
Chi-Sq = 6,529. DF = 1. P-Value = 0,011
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 20/47
Valor crítico: = 3.84146
Por tanto rechazamos la hipótesis nula de proporciones
iguales (homogéneas); puesto que el estadístico de prueba
(6.5239) es mayor que el punto crítico (3.84146). Hay
suficiente evidencia para sustentar el rechazo de laaseveración de que las proporciones son las mismas. Parece
que la respuesta y el género del entrevistador son
dependientes . Aunque tal análisis estadístico no puede
utilizarse para justificar ninguna afirmación acerca de la
causalidad, quizá a los hombres los influyó el género delentrevistador.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 21/47
Cálculo de las frecuencias esperadas
Para calcular las frecuencias esperadas para una celda en particular, se multiplica el total
de la fila por el total de la columna y luego se divide este producto entre el tamaño total
de la muestra. Por ejemplo, para la celda con *:
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 22/47
Una regla muy común que se usa
ampliamente para esta prueba establece que
cada frecuencia esperada en una tabla decontingencia debe ser 5 o más para que la
exactitud de la prueba sea buena.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 23/47
Ahora se necesita un estadístico de prueba que
compare las frecuencias observadas con las
esperadas para cada celda de la tabla. Si lasfrecuencias observadas son bastante cercanas a las
frecuencias esperadas, el estadístico debe indicar que
no se rechaza la hipótesis nula de independencia.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 24/47
Esta es la conclusión apropiada, ya que las
frecuencias esperadas se calculan bajo la suposición
de que las dos variables categóricas sonindependientes. Si las frecuencias esperadas y las
observadas son diferentes, el estadístico de prueba
conducirá al rechazo de la hipótesis nula.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 25/47
Si la hipótesis nula es cierta, la distribución de
este valor calculado se aproxima a la distribución ji cuadrada. De hecho, la ji cuadrada es una
familia de distribuciones de probabilidad.
Estadístico Ji Cuadrada
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 26/47
Igual que en el caso de la distribución t , la
distribución de probabilidad ji cuadrada se
caracteriza por un solo parámetro, los grados delibertad. La distribución tiene sesgo positivo, pero
conforme los grados de libertad crecen, se acerca
a la forma de la distribución normal. Se calcula
mediante la siguiente fórmula:
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 27/47
donde:
f 0 = frecuencia observada
f e = frecuencia esperada
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 28/47
Observe que la comparación entre las
frecuencias esperadas y observadas para cada
celda se hace en el numerador. Si existe una
diferencia grande de una celda a otra, se obtieneun estadístico grande; las diferencias pequeñas
producen un estadístico pequeño. Entonces la
prueba de hipótesis con tablas de contingencia es
una prueba de una cola hacia la derecha.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 29/47
Los grados de libertad, se obtiene utilizando la siguiente
fórmula:
gl = (r – 1) (c – 1)
donde:
r = número de filas
c = número de columnas
Cálculo de los grados de libertad
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 30/47
La tabla de contingencia mide el “ajuste” de las
frecuencias observadas a aquellas frecuencias
esperadas bajo la suposición de que la hipótesis
nula es cierta.
Prueba de Bondad de Ajuste
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 31/47
Una aplicación más general de este procedimiento
es la prueba de bondad de ajuste , que determina si
las frecuencias observadas para alguna variablecategórica pudieron haber sido obtenidas de una
distribución poblacional hipotética.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 32/47
H 1 : la muestra no procede de la población
especificada
Las hipótesis nula y alternativa entre las que debe
elegir el analista después de examinar los datosmuestrales son:
H 0 : la muestra procede de la población especificada
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 33/47
La prueba de bondad de ajuste determina
la probabilidad de que las frecuencias
observadas para una variable categórica pudieran haberse obtenido de una
población hipotética.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 34/47
Al usar la tabla de ji cuadrada para encontrar el
valor crítico, deben determinarse los grados de
libertad. Para la prueba de bondad de ajuste, este
número se calcula mediante la siguiente ecuación:
gl = k – 1 – c
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 35/47
donde:
k = número de categorías
c = número de parámetros poblacionales
desconocidos estimados por estadísticosmuestrales.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 36/47
Observe que siempre se pierde un grado de libertad
debido a que las frecuencias esperadas deben sumar
el número total de frecuencias observadas. Otros
grados de libertad se pierden siempre que se usan
estadísticos muestrales para estimar parámetros.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 37/47
El estadístico de prueba usado para comparar los tamaños
relativos de las frecuencias esperadas y observadas tiene una
distribución aproximada a la ji cuadrada. La distribución de
este estadístico de prueba es en realidad discreta, pero puedeaproximarse usando una distribución ji cuadrada continua
cuando el tamaño de la muestra n es grande. La distribución
discreta del estadístico de prueba X 2 se aproxima usando una
distribución ji cuadrada continua.
Regla del Cinco
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 38/47
Para asegurar que n es suficientemente grande, la
regla conservadora es requerir que la frecuencia
esperada para cada celda sea al menos 5. Si la
frecuencia esperada de una celda es menor que 5, las
celdas deben combinarse de manera que resulten
categorías con mayores frecuencias esperadas.
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 39/47
Ejemplo
A un nivel de significancia de 0.01, ¿es razonable suponer que la demanda horaria de un
servicio de cierto tipo en un gran banco está adecuadamente descrito por una
distribución de Poisson con = 1, si en una muestra aleatoria de 1,000 horas hubo 355,
362, 190, 65, 22 y 6 horas con 0, 1, 2, 3, 4 y al menos 5 de estas demandas,
respectivamente?
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 40/47
Mediante la tabla de distribución de Poisson, anotamos las
probabilidades correspondientes a cada clase y luegocalculamos las frecuencias esperadas:
Solución
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 41/47
Demanda f o (horas) Probabilidad de
Poisson
f e
0 355 0.3679 0.3679*1000 = 367.9
1
362
0.3679
0.3679*1000 = 367.9
2
190
0.1839
0.1839*1000 = 183.9
3
65
0.0613
0.0613*1000 = 61.3
4 22 0.0153
0.0153*1000 = 15.3
5 a más 6 1 - 0.9963 = 0.0037 0.0037*1000 = 3.7
n = 1000
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 42/47
Combinamos las dos últimas clases que están en la
tabla de modo que todas las frecuencias esperadas
sean mayores a 5, entonces reorganizando obtenemos
las siguientes categorías:
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 43/47
Categoría
f o (horas)
f e
0
355
367.9
1
362
367.9
2 190 183.9
3 65 61.3
4 a más 28 19.0
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 44/47
Grados de libertad: 5-1= 4
Planteamos las hipótesis:
H0: La población sigue una distribución de Poisson.
H1: La población no sigue una distribución de
Poisson.
El valor crítico de la prueba de ji cuadrada es:
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 45/47
2=13.277
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 46/47
Regla de rechazo: rechazar H0 si X 2
> 13.277
7/21/2019 prueba Ji Cuadrado
http://slidepdf.com/reader/full/prueba-ji-cuadrado-56da68020af00 47/47
Entonces mediante la formula calculamos el valor de X 2
:
2.519
1928
3.61
3.6165
9.183
9.183190
9.367
9.367362
9.367
9.36735522222
2
2
2
X
f
f f X
e
eo
Por tanto no se puede rechazar H0, es decir los datos de la población siguen una
distribución de Poisson..