Prueba de Hipótesis - Área de Operaciones de la … de Operacione… · toman dos muestras de 40...
Transcript of Prueba de Hipótesis - Área de Operaciones de la … de Operacione… · toman dos muestras de 40...
Conceptos Generales• Hipótesis: Enunciado que se quiere demostrar.
• Prueba de Hipótesis: Procedimiento para determinar si se debe rechazar o no una afirmación acerca del valor de un parámetro de la población.
• Hipótesis nula: Ho, hipótesis que propone un valor tentativo acerca de una parámetro poblacional.
• Hipótesis alternativa: Ha, hipótesis opuesta a la hipótesis nula.
Tuesday, August 5, 14
Conceptos Generales
• Para probar una hipótesis se lleva a cabo un experimento, utilizando las técnicas de muestreo.
• Existen dos posibles resultados:
• La Ho se rechaza.
• La Ho no se puede rechazar, es decir, no se cuenta con suficiente evidencia estadística de que la hipótesis alternativa sea verdadera.
Tuesday, August 5, 14
Conceptos Generales
• La hipótesis que se investiga por lo común se expresa como la alternativa.
• Se puede llegar a la conclusión de que la hipótesis que se investiga es verdadera si se rechaza la hipótesis nula.
Tuesday, August 5, 14
Caso 1: Una investigación
• Se desea probar si un nuevo sistema de inyección mejora el rendimiento de un modelo de vehículo cuyo rendimiento promedio es de 24 millas/galón.
• Ho: μ ≤ 24Ha: μ > 24
La Ha se formula de tal modo que el rechazo de Ho respalde la conclusión que se propone.
Tuesday, August 5, 14
Caso 2: Una afirmación
• Un fabricante de bebidas afirma que el contenido de sus botellas no es menor a 2 litros.
• Ho: μ ≥ 2Ha: μ < 2
La Ha se formula de tal modo que el rechazo de Ho proporcione evidencia estadística de que la afirmación es incorrecta.
Tuesday, August 5, 14
Caso 3: Una decisión
• Se prueban unas piezas de un embarque para saber si están o no dentro de especificaciones, en donde un valor menor o mayor a 2 causa problemas de ensamblaje.
• Ho: μ = 2Ha: μ ≠ 2
En estos casos, se toma tanto una decisión si la hipótesis nula se rechaza como si no se pueda rechazar.
Tuesday, August 5, 14
Nivel de Significancia: α
• En la práctica, la persona que efectúa la prueba de hipótesis especifica la máxima probabilidad permisible, llamada nivel de significancia para la prueba, de cometer un error tipo I.
• Se acostumbran los valores de 0,05 y 0,01 para α.
• Un pequeño valor de α significa un alto grado de confianza en que sea correcta la conclusión de rechazar Ho y de que Ha es verdadera.
Tuesday, August 5, 14
Error tipo II: β
• Aunque en la mayoría de las aplicaciones de pruebas de hipótesis se controla la probabildad de cometer un error tipo 1, no siempre se controla la de incurrir en un error tipo II.
• Debido a la incertidumbre de cometer un error tipo II, en estadística se recomienda usar la redacción “no rechazar Ho” en lugar de “aceptar Ho” porque si se acepta Ho se corre el riesgo de cometer un error tipo II.
Tuesday, August 5, 14
Pruebas de Bondad de Ajuste
• Una de las bases fundamentales del control estadístico de la calidad es la inferencia estadística. Por ello, la determinación del tipo de distribución correspondiente a un conjunto de datos provenientes del estudio es absolutamente necesario. La prueba de bondad de ajuste permite probar el ajuste de los resultados de un experimento a una distribución de probabilidad teórica sujeto a un error o nivel de confianza.
Tuesday, August 5, 14
Pruebas de Bondad de Ajuste
• El método en cuestión se basa en la comparación de las frecuencias absolutas observadas y las frecuencias absolutas esperadas, calculadas a partir de la distribución teórica en análisis.
• Para la prueba de hipótesis utilizaremos dos estadísticos: El Chi-cuadrado y la prueba de Kolmogorov-Smirnov
Tuesday, August 5, 14
Chi-Cuadrado
• En donde:
• fo =Frecuencia observada de datos discretos
• fe =Frecuencia esperada de la distribución teórica
• Los grados de libertad se emplea (k-1) y luego se resta un grado adicional de libertad para cada parámetro de población que tenga que ser estimado de los datos de la muestra
(fo – fe)2 χ2 = fe Σ
Tuesday, August 5, 14
Media con datos Agrupados
• En donde:
• d= desviación del punto medio con respecto a la posición de la media supuesta, es medida en unidades de intervalo de clase
• i= amplitud o intervalo de clase
• A= punto medio de la clase que contiene la media supuesta (clase de d=0)
• fo = Frecuencias observadas en número de clases
• n = tamaño de la muestra
X = A + (Σ fo×d)×i n
Tuesday, August 5, 14
Chi-Cuadrado
• Se acepta la hipótesis nula cuando:
• Chi-calculado < Chi-tabular
Tuesday, August 5, 14
Ejercicio Los Líquidos S.A.
• Los valores que se adjuntan corresponden a la fabricación de un producto realizada en tres días sucesivos. La especificación para ese producto es de 50000 ± 6000 milílitros. Pruebe con un nivel de significancia de 0,01que los datos siguen un comportamiento con base en una distribución normal.
Tuesday, August 5, 14
Itervalo fo fo Acum.35000 < X < 40000 6 640000 < X < 45000 15 2145000 < X < 50000 58 7950000 < X < 55000 139 21855000 < X < 60000 66 28460000 < X < 65000 11 29565000 < X < 70000 5 300
Tuesday, August 5, 14
Intervalos de Calse fo Xk d fod fod Pi fe
35000-40000 40000-45000 45000-50000 50000-55000 55000-60000 60000-65000 65000-70000
Ho: La distribución normal con un � de 0,01es una buena descripción del proceso de fabricación del producto X. Ha: La distribución normal con un � de 0,01 no es una buena descripción del proceso de fabricación del producto X.
2
Tuesday, August 5, 14
Límite Límite Fo Xk d Fo*d Fo*d^2 Probabilidad FrecuenciaInferior Superior Esperada Esperada35000 40000 6 37500 -3 -18 54 0.0087 2.6140000 45000 15 42500 -2 -30 60 0.0677 20.31 22.9245000 50000 58 47500 -1 -58 58 0.2428 72.84 72.8450000 55000 139 52500 0 0 0 0.3687 110.61 110.6155000 60000 66 57500 1 66 66 0.2385 71.55 71.5560000 65000 11 62500 2 22 44 0.0654 19.62 21.9665000 70000 5 67500 3 15 45 0.0078 2.34
300 -3 327
Meida muestral = 52500 + (-3*5000)/300 =52450
Desviación estándar = 5000 x (327/300) - (-3^2/300^2) = 5219,91
Tuesday, August 5, 14
Frecuencia Frecuencia Fo-Fe (Fo-Fe)2 (Fo-Fe)2/FeObservada Esperada
21 22.92 -1.92 3.69 0.1658 72.84 -14.84 220.23 3.02
139 110.61 28.39 805.99 7.2966 71.55 -5.55 30.80 0.4316 21.96 -5.96 35.52 1.62
Chi calculado = 12.52
Tuesday, August 5, 14
Kolmogorov-Smirnov • Es un simple método no paramétrico para probar si hay
una diferencia significativa entre una distribución observada y una distribución teórica de frecuencia.
• La hipótesis nula se rechaza sí:
• * Dn > dt, 1-α • En donde Dn es el valor máximo.
Tuesday, August 5, 14
Ejercicio
• En un estudio se obtuvieron los siguientes resultados para el punto de ebullición en grados Celsius, de un compuesto de silicio: 166,141,136,153,170,162,155,146,183,157,148,132,160,175, y 150. Utilizando un nivel de significancia de 0.01 pruebe que los puntos de ebullición provienen de una población normal en donde la media poblacional es de 160 grados Celsius y la desviación estándar poblacional es de 10 grados Celsius.
Tuesday, August 5, 14
Prueba de Hipótesis • Ho: Los puntos de ebullición provienen de
una población normal con µ de 160 grados y σ de 10 grados
• Ha: Los puntos de ebullición no provienen de una población normal con µ de 160 grados y σ de 10 grados
Tuesday, August 5, 14
Intervalos+Límites+de+Clase+ Fo+
Fo+Acumulada+
Fo+Acumulada+Rela7va+
Fe+Acumulada+
D++++++++++++++++++++Ifo+:+feI+
130+:+141+ 130.5+:+141.5+ ++ ++ ++ ++ ++
141+:+152+ 141.5+:+152.5+ ++ ++ ++ ++ ++
152+:+163+ 152.5+:+163.5+ ++ ++ ++ ++ ++
163+:+174+ 163.5+:+174.5+ ++ ++ ++ ++ ++
174+:+185+ 174.5+:+185.5+ ++ ++ ++ ++ ++
Tuesday, August 5, 14
Intervalos Límites de Clase Fo Fo
Acumulada Fo Acum Relativa
Fe Acumulada
D |F(X) - Sn(X)|
130 - 141 103.5 - 141.5 3 3 0.2000 0.0322 0.1678
141 - 152 141.5 - 152.5 3 6 0.4000 0.2266 0.1734
152 - 163 152.5 - 163.5 5 11 0.7333 0.6368 0.0965
163 - 174 163.5 - 174.5 2 13 0.8667 0.9265 0.0598
174 - 185 174.5 - 185.5 2 15 1.0000 0.9946 0.0054
Tuesday, August 5, 14
Tipos de Pruebas en Excel
• Excel nos ofrece varios comandos para poder resolver hipótesis para comparar dos medias, tomando el valor de p y comparándolo con α.
• Si el valor de p es menor que α o que α/2, se concluye que existen diferencias significaMvas entre los grupos que se comparan.
Tuesday, August 5, 14
Tipos de Pruebas en ExcelCaracterísticas de la prueba
de mediasPrueba que se emplea en
Excell
Se conocen σ12 y σ22Prueba Z para medias de dos
muestras
Comparar antes y después del tratamiento
Prueba t para medias de dos muestras emparejadas
Comparar las medias de dos poblaciones
Prueba t para dos muestras suponiendo varianzas igualesComparar las medias de dos
poblaciones Prueba t para dos muestras suponiendo varianzas desiguales
Se supone que σ12 = σ22 =…σn2 Análisis de varianza
Tuesday, August 5, 14
Prueba Z para Dos Medias
• Para realizar esta prueba se requiere cumplir una de las dos siguientes condiciones:
• Que las varianzas poblacionales sean conocidas.
• Que las varianzas poblacionales sean desconocidas pero el tamaño de la muestra sea mayor a 30 para estimar las varianzas a partir de la muestra.
Tuesday, August 5, 14
Ejercicio Los Líquidos S.A.
• Ahora suponga que el producto es fabricado por dos máquinas y se desea saber si entre ellas hay una diferencia en el desempeño, para ello se toman dos muestras de 40 unidades cada una y se realiza una prueba de hipótesis de diferencia de medias utilizando la prueba Z con varianzas poblacionales desconocidas.
Tuesday, August 5, 14
Formulación:Ho: µ1 = µ2Ha: µ1 ≠ µ2
P(dos colas) = 0,00P(dos colas) < α/2Se rechaza Ho, existe suficiente evidencia estadística para indicar que hay diferencias significativas entre las medias.Los valores de la máquina 1 difieren estadísticamente de la máquina 2.
Tuesday, August 5, 14