Análisis de varianza
-
Upload
angel-salazar -
Category
Education
-
view
213 -
download
0
Transcript of Análisis de varianza
FACILITADOR: REALIZADO POR:
LCDA. ESP. MSC CARLENA ASTUDILLO ING. DANIEL ORDAZ. C.I. 17.008.193
ING. ANGEL SALAZAR. C.I. 17.747.156
EL TIGRE, ENERO DE 2015
UNIVERSIDAD NORORIENTAL PRIVADA
GRAN MARISCAL DE AYACUCHO
DECANATO DE POSTGRADO
COORDINACIÓN DE POSTGRADO
NÚCLEO EL TIGRE
MAESTRÍA DE INGENIERÍA DE MANTENIMIENTO
MENCIÓN CONFIABILIDAD INDUSTRIAL
CATEDRA: ESTADÍSTICA APLICADA
ESTADIO COGNOSCIENTE III
CONTENIDO
ANÁLISIS DE VARIANZA
Diseño completamente aleatorizados
Diseño con bloques aleatorizados
Comparaciones múltiples
Análisis de Covarianza
ANÁLISIS DE VARIANZA
• En estadística, el análisis de la varianza (ANOVA, ANalysis Of Variance, segúnterminología inglesa) es una colección de modelos estadísticos y sus procedimientosasociados, en el cual la varianza está particionada en ciertos componentes debidosa diferentes factores (variables).
El ANOVA es la herramienta básica para el análisis de los modelos estadísticos deDiseño de Experimentos y Regresión Lineal, porque permite descomponer lavariabilidad de un experimento en componentes independientes que puedenasignarse a diferentes causas.
• La varianza es la media aritmética del cuadrado de las desviaciones respecto a lamedia de una distribución estadística.
• Se deben satisfacer tres supuestos básicos antes de utilizar el análisis de varianza.1) Las muestras deben ser de tipo aleatorio independiente. 2) Las muestras debenser obtenidas a partir de poblaciones normales. 3) Las muestras deben tenervarianzas iguales
1. DISEÑO COMPLETAMENTE ALEATORIZADOS
Este diseño no impone ninguna restricción en cuanto a las unidades experimentales,
estas deberán ser, en todo caso, homogéneas. Además, su estructura no se ve
afectado por el número igual o desigual de observaciones por tratamiento.
1.1. Definición
1. DISEÑO COMPLETAMENTE ALEATORIZADOS
1.3. Modelo de efectos aleatorios o modelo de componentes de
varianza.
1. DISEÑO COMPLETAMENTE ALEATORIZADOS
Las pruebas exactas de F se pueden obtener por los cuadrados
medios esperados. Por ejemplo, la prueba exacta de F para el
modelo II con igual número de observaciones es:
A manera de ejemplo se exponen los cuadrados medios
esperados para igual y desigual número de observaciones por
tratamiento.
1. DISEÑO COMPLETAMENTE ALEATORIZADOS
Representación simbólica y esquemática para el Diseño Completamente
Aleatorizado.
2. DISEÑO CON BLOQUES ALEATORIZADOS
Consiste en formar bloques con las muestras que reciben diferentes
tratamiento. Un bloque es un equipo de individuos similares a la cual se aplica
un tratamiento. Una forma de reducir el efecto de los factores ajenos es diseñar
el experimento que tenga un diseño completamente aleatorio DCA, en el que
cada elemento que tenga la misma posibilidad de pertenecer a las diferentes
categorías o tratamientos.
2.1. Definición
En este orden de ideas,
los pasos que el
investigador sigue son:
2. DISEÑO CON BLOQUES ALEATORIZADOS
El esquema dado a continuación
ayuda a comprender la filosofía
de la formación de bloques:
2. DISEÑO CON BLOQUES ALEATORIZADOS
Debe existir una variación máxima entre losbloques.
Debe existir una variación mínima entre lasunidades experimentales dentro del bloque.
Todos los tratamientos, se le aplican en todoslos bloques.
La formación de los tamaños del los bloquespueden ser iguales o diferentes.
2.2. Características o criterios para bloquear un
experimento
2. DISEÑO CON BLOQUES ALEATORIZADOS
2.3. Modelo aditivo lineal
Representación
esquemática del diseño en
Bloques completos al azar
3. COMPARACIONES MÚLTIPLES
Al estudiar el comportamiento de los tratamientos de un factor, medianteun análisis de la varianza, el único objetivo es saber si, globalmente,dichos tratamientos difieren significativamente entre sí. Ahora estamosinteresados, una vez aceptada la existencia de diferencias entre losefectos del factor, en conocer qué tratamientos concretos producenmayor efecto o cuáles son los tratamientos diferentes entre sí. En estasmismas condiciones, puede ser útil también realizar comparacionesadicionales entre grupos de medias de los tratamientos.
El ANOVA solamente informa de si hay diferencias entre medias, perono de cuales son estas.
Las comparaciones múltiples se realizan para averiguar que mediasdifieren de cuales otras.
3.1. Definición y características
3. COMPARACIONES MÚLTIPLES
Una vez que el ANOVA ha mostrado que un valor de F es significativo(rechazo de la hipótesis nula), se puede aplicar una prueba como la Dunnett,Duncan, Newman-Keuls, Tuckey o el de la Diferencia Significativa Menor(L.S.D), entre otras que se han propuesto.
Todos los procedimientos involucran el cálculo de un valor que es comparadocon la diferencia entre promedios. Si este valor es más pequeño que lasdiferencias quiere decir que éstas son significativamente diferentes.
Tradicionalmente, las comparaciones múltiples se realizan al mismo nivel designificancia que el ANOVA. Por ejemplo, para un ANOVA significativo a unnivel de 5% (a = 0,05), se realizan comparaciones múltiples al 5%. Sinembargo, algunos investigadores realizan comparaciones a niveles diferenteslo cual, desde el punto de vista estadístico también es posible realizar. Loque no puede hacerse, sin embargo, es realizar comparaciones múltiples alnivel de 1% (a = 0,01) cuando el ANOVA sólo muestra diferencias al 5%.
3. COMPARACIONES MÚLTIPLES
3.3. Tablas y formulas empleadas en los cálculos
Tabla 3.1 Fórmula para calcular tos valores de rango
para las comparaciones múltiples.
3. COMPARACIONES MÚLTIPLES
Tabla 3.2. Tabla de t adaptada para el método da la Diferencia significativa
Mínima (L.S.D.), para comparaciones múltiples, al nivel a = 0,05 y 0,01 (en
negrita)
3. COMPARACIONES MÚLTIPLES
Tabla 3.3. Tabla de Dunnett para comparaciones entre varios
tratamientos con un control, al nivel a = 0,05 y 0,01 (negrita).
3. COMPARACIONES MÚLTIPLES
Tabla 3.4. Tabla de Newman - Keuls y de Tuckey para comparaciones
múltiples, al nivel a = 0,05 y 0,01 (en negrita)
3. COMPARACIONES MÚLTIPLES
Tabla 3.5. Tabla de Duncan para comparaciones múltiples, al nivel =
0,05 y 0,01 (en negrita).
4. ANÁLISIS DE COVARIANZA
Significa variación simultánea de dos variables que se asume están
influyendo sobre la variable respuesta. En este caso se tiene la variable
independiente tratamientos y otra variable que no es efecto de
tratamientos pero que influye en la variable de respuesta, llamada a
menudo: covariable.
El Análisis de Covarianza consiste básicamente en elegir una o más
variables adicionales o covariables que estén relacionadas con la
variable de respuesta, evitando que los promedios de tratamientos se
confundan con los de las covariables, incrementando de esa manera la
precisión del experimento. En este análisis se asume que la variable
dependiente Y está asociada en forma lineal con la variable
independiente X, existiendo homogeneidad de pendientes.
4.1. Covarianza. Definición.
4. ANÁLISIS DE COVARIANZA
4.2. Análisis de Covarianza.
El análisis de covarianza (ANCOVA) combina las ventajas e integra en uno
solo, dos procedimientos:
El análisis de regresión.
El análisis de varianza.
En el ANCOVA se incluyen tres tipos de variables:
1. La(s) variable(s) independiente(s), cuyos efectos se quiere estimar.
2. La(s) variable(s) dependiente(s), que representan los resultados
obtenidos después de aplicar el tratamiento.
3. La(s) variable(s) covariadas, incluidas en el diseño para controlar su
relación con la VD.
5. EJEMPLO PRÁCTICO DE APLICACIÓN
SPSS para Windows. Análisis Estadístico
SPSS Es uno de los programas estadísticos más conocidos teniendo
en cuenta su capacidad para trabajar con grandes bases de datos y un
sencillo interface para la mayoría de los análisis. En la versión 12 de
SPSS se podían realizar análisis con 2 millones de registros y 250.000
variables. El programa consiste en un módulo base y módulos anexos
que se han ido actualizando constantemente con nuevos
procedimientos estadísticos.
5. EJEMPLO PRÁCTICO DE APLICACIÓN
Ejemplo práctico de aplicación.
Determinar las fallas mas comunes presentadas por cuatro tornos,
ubicados en el laboratorio de máquinas y herramientas de la Universidad
Politécnica Territorial José Antonio Anzoátegui.
Información del estudio
•Tornos a estudiar: 4
•Tiempo experimental: 30 días ( 40 horas semanales, 8 horas/día)
•Horas máquinas de estudio: 160 horas
•Fallas a estudiar: 3
•Descripción de las fallas:
•Falla 1: por sellos
•Falla 2: por empacaduras
•Falla 3: por bujes
5. EJEMPLO PRÁCTICO DE APLICACIÓN
Estadísticos
TORNOS FALLAS
HORAS
MÁQUINAS
N Válidos 12 12 12
Perdidos 8 8 8
Varianza 1,364 ,727 843,000
TORNOS
Frecuencia Porcentaje
Porcentaje
válido
Porcentaje
acumulado
Válidos 1 3 15,0 25,0 25,0
2 3 15,0 25,0 50,0
3 3 15,0 25,0 75,0
4 3 15,0 25,0 100,0
Total 12 60,0 100,0
Perdidos Sistema 8 40,0
Total 20 100,0
Resultados obtenidos
1. Análisis de
Varianza
5. EJEMPLO PRÁCTICO DE APLICACIÓN
HORAS MÁQUINAS
Frecuencia Porcentaje
Porcentaje
válido
Porcentaje
acumulado
Válidos 84 (S) 1 5,0 8,3 8,3
100 (B-S) 2 10,0 16,7 25,0
120 (E-B) 2 10,0 16,7 41,7
130 (B) 1 5,0 8,3 50,0
160 (No fallo) 6 30,0 50,0 100,0
Total 12 60,0 100,0
Perdidos Sistema 8 40,0
Total 20 100,0
FALLAS
Frecuencia Porcentaje
Porcentaje
válido
Porcentaje
acumulado
Válidos SELLOS 4 20,0 33,3 33,3
EMPACADURA
S
4 20,0 33,3 66,7
BUJES 4 20,0 33,3 100,0
Total 12 60,0 100,0
Perdidos Sistema 8 40,0
Total 20 100,0
5. EJEMPLO PRÁCTICO DE APLICACIÓN
2. Diseño completamente
aleatorizadosFactores inter-sujetos
N
TORNOS 1 3
2 3
3 3
4 3
HORAS MÁQUINAS 84 1
100 2
120 2
130 1
160 6
Pruebas de los efectos inter-sujetos
Variable dependiente:FALLAS
Origen
Suma de
cuadrados tipo
III gl
Media
cuadrática F Sig.
Modelo corregido 7,000a 9 ,778 1,556 ,452
Intersección 40,371 1 40,371 80,742 ,012
TORNOS 2,582 3 ,861 1,721 ,388
HMAQUINAS 4,962 4 1,241 2,481 ,307
TORNOS * HMAQUINAS 1,923 2 ,962 1,923 ,342
Error 1,000 2 ,500
Total 56,000 12
Total corregida 8,000 11
5. EJEMPLO PRÁCTICO DE APLICACIÓN
Factores inter-sujetos
N
TORNOS 1 3
2 3
3 3
4 3
HORAS MÁQUINAS 84 1
100 2
120 2
130 1
160 6
Contraste de Levene sobre la igualdad de las
varianzas errora
Variable dependiente:FALLAS
F gl1 gl2 Sig.
. 9 2 .
Pruebas de los efectos inter-sujetos
Variable dependiente:FALLAS
Origen
Suma de
cuadrados tipo
III gl
Media
cuadrática F Sig.
Modelo corregido 7,000a 9 ,778 1,556 ,452
Intersección 40,371 1 40,371 80,742 ,012
TORNOS 2,582 3 ,861 1,721 ,388
HMAQUINAS 4,962 4 1,241 2,481 ,307
TORNOS * HMAQUINAS 1,923 2 ,962 1,923 ,342
Error 1,000 2 ,500
Total 56,000 12
Total corregida 8,000 11
2. Diseño completamente
aleatorizados
5. EJEMPLO PRÁCTICO DE APLICACIÓN
TORNOS
Variable dependiente:FALLAS
TORNOS Media Error típ.
Intervalo de confianza 95%
Límite inferior Límite superior
1 1,750a ,433 -,113 3,613
2 2,250a ,433 ,387 4,113
3 2,000a ,408 ,243 3,757
4 2,000a ,408 ,243 3,757
Medias marginales estimadas
Pruebas de los efectos inter-sujetos
Variable dependiente:FALLAS
Origen
Suma de
cuadrados tipo
III gl
Media
cuadrática F Sig.
Modelo corregido 7,000a 9 ,778 1,556 ,452
Intersección 40,371 1 40,371 80,742 ,012
TORNOS 2,582 3 ,861 1,721 ,388
HMAQUINAS 4,962 4 1,241 2,481 ,307
TORNOS * HMAQUINAS 1,923 2 ,962 1,923 ,342
Error 1,000 2 ,500
Total 56,000 12
Total corregida 8,000 11
Factores inter-sujetos
N
TORNOS 1 3
2 3
3 3
4 3
HORAS MÁQUINAS 84 1
100 2
120 2
130 1
160 6
2. Diseño completamente
aleatorizados
5. EJEMPLO PRÁCTICO DE APLICACIÓN
3. Diseño con bloques aleatorizados
Factores inter-sujetos
N
TORNOS 1 3
2 3
3 3
4 3
HORAS MÁQUINAS 84 1
100 2
120 2
130 1
160 6
Pruebas de los efectos inter-sujetos
Variable dependiente:FALLAS
Origen
Suma de
cuadrados tipo
III gl
Media
cuadrática F Sig.
Modelo corregido 5,077a 7 ,725 ,992 ,536
Intersección 34,068 1 34,068 46,620 ,002
TORNOS 2,410 3 ,803 1,099 ,446
HMAQUINAS 5,077 4 1,269 1,737 ,303
Error 2,923 4 ,731
Total 56,000 12
Total corregida 8,000 11
5. EJEMPLO PRÁCTICO DE APLICACIÓN
4. Comparaciones múltiples
Comparaciones múltiples
Variable dependiente:FALLAS
(I)TORNOS (J)TORNOS
Diferencia de
medias (I-J) Error típ. Sig.
DHS de Tukey 1 2 ,00 ,577 1,000
3 ,00 ,577 1,000
4 ,00 ,577 1,000
2 1 ,00 ,577 1,000
3 ,00 ,577 1,000
4 ,00 ,577 1,000
3 1 ,00 ,577 1,000
2 ,00 ,577 1,000
4 ,00 ,577 1,000
4 1 ,00 ,577 1,000
2 ,00 ,577 1,000
3 ,00 ,577 1,000
Bonferroni 1 2 ,00 ,577 1,000
3 ,00 ,577 1,000
4 ,00 ,577 1,000
2 1 ,00 ,577 1,000
3 ,00 ,577 1,000
4 ,00 ,577 1,000
3 1 ,00 ,577 1,000
2 ,00 ,577 1,000
4 ,00 ,577 1,000
4 1 ,00 ,577 1,000
2 ,00 ,577 1,000
3 ,00 ,577 1,000
5. EJEMPLO PRÁCTICO DE APLICACIÓN
4. Comparaciones múltiples
FALLAS
TORNOS N
Subconjunto
1
Student-Newman-Keulsa,b 1 3 2,00
2 3 2,00
3 3 2,00
4 3 2,00
Sig. 1,000
DHS de Tukeya,b 1 3 2,00
2 3 2,00
3 3 2,00
4 3 2,00
Sig. 1,000
5. EJEMPLO PRÁCTICO DE APLICACIÓN
Correlaciones
TORNOS FALLAS
HORAS
MÁQUINAS
TORNOS Correlación de Pearson 1 ,000 -,110
Sig. (bilateral) 1,000 ,734
Suma de cuadrados y
productos cruzados
15,000 ,000 -41,000
Covarianza 1,364 ,000 -3,727
N 12 12 12
FALLAS Correlación de Pearson ,000 1 ,022
Sig. (bilateral) 1,000 ,946
Suma de cuadrados y
productos cruzados
,000 8,000 6,000
Covarianza ,000 ,727 ,545
N 12 12 12
HORAS MÁQUINAS Correlación de Pearson -,110 ,022 1
Sig. (bilateral) ,734 ,946
Suma de cuadrados y
productos cruzados
-41,000 6,000 9273,000
Covarianza -3,727 ,545 843,000
N 12 12 12
5. Covarianzas