Análisis de Covarianza. 2 Contenido Introducción Objetivos del análisis de covarianza ...
-
Upload
jose-manuel-vidal-caballero -
Category
Documents
-
view
256 -
download
2
Transcript of Análisis de Covarianza. 2 Contenido Introducción Objetivos del análisis de covarianza ...
Análisis de CovarianzaAnálisis de Covarianza
22
ContenidoContenido
IntroducciónIntroducción
Objetivos del análisis de covarianzaObjetivos del análisis de covarianza
Suposiciones básicas para el análisis de Suposiciones básicas para el análisis de covarianzacovarianza
Modelos y análisis de covarianzaModelos y análisis de covarianza
Cómo hacer el análisis de covarianzaCómo hacer el análisis de covarianza
EjemplosEjemplos
33
IntroducciónIntroducción
El análisis de covarianza es una El análisis de covarianza es una de las técnicas usadas para reducir de las técnicas usadas para reducir el error experimental, y con ello el error experimental, y con ello poder detectar diferencias entre poder detectar diferencias entre tratamientos.tratamientos.
44
IntroducciónIntroducción
Es frecuente encontrar que al realizar Es frecuente encontrar que al realizar experimentos con alimentos, los resultados experimentos con alimentos, los resultados de una característica determinada (variable de una característica determinada (variable estudiada Y) se vean afectados por la estudiada Y) se vean afectados por la variación en otra de las características (X), la variación en otra de las características (X), la cual se puede medir, pero no se puede cual se puede medir, pero no se puede controlar experimentalmente.controlar experimentalmente.
55
IntroducciónIntroducción
Una covariable (X) es una medición o Una covariable (X) es una medición o característica de cada unidad experimental, la característica de cada unidad experimental, la cual se supone independiente de los cual se supone independiente de los tratamientos, y se conoce que está relacionada tratamientos, y se conoce que está relacionada con la medición de interés (Y). con la medición de interés (Y).
Cuando varía X, se espera un cambio o Cuando varía X, se espera un cambio o variación de Y; este cambio afectará el efecto de variación de Y; este cambio afectará el efecto de los tratamientos sobre Y.los tratamientos sobre Y.
66
Objetivos del análisis de Objetivos del análisis de covarianzacovarianza
Los usos mas frecuentes del análisis de Los usos mas frecuentes del análisis de covarianza son:covarianza son:
Para aumentar la precisión de los experimentos.Para aumentar la precisión de los experimentos. Para remover el efecto de variables que afectan Para remover el efecto de variables que afectan
estudios observacionalesestudios observacionales.. Para dar mayor información sobre la naturaleza de Para dar mayor información sobre la naturaleza de
los tratamientos. los tratamientos. Para ajustar regresiones en modelos de Para ajustar regresiones en modelos de
clasificación múltiple.clasificación múltiple. Para corregir por observaciones perdidas. Para corregir por observaciones perdidas.
77
Objetivos del análisis de Objetivos del análisis de covarianza covarianza
Aumento de precisión de los experimentosAumento de precisión de los experimentos..
La ganancia en precisión experimental La ganancia en precisión experimental dependerá de la relación entre X y Y.dependerá de la relación entre X y Y.
Si sSi s22εε es el error experimental, el uso de la es el error experimental, el uso de la
covarianza lo reducirá en:covarianza lo reducirá en:
SS22εε (1- r(1- r22) [1 + (gl) [1 + (glerrorerror - 2) - 2)-1-1]]
donde:donde: r es el coeficiente de correlación entre X y Y.r es el coeficiente de correlación entre X y Y.
glglerror error son losson los grados de libertad del error (s grados de libertad del error (s22εε).).
88
Objetivos del análisis de Objetivos del análisis de covarianza covarianza
Aumento de precisión de los experimentosAumento de precisión de los experimentos..
Cuando el error experimental se Cuando el error experimental se reduce, se logra un aumento en la precisión reduce, se logra un aumento en la precisión del experimento. Esto sucederá si la del experimento. Esto sucederá si la correlación entre X y Y es mayor que 0.3 correlación entre X y Y es mayor que 0.3 aproximadamente.aproximadamente.
99
Objetivos del análisis de Objetivos del análisis de covarianza covarianza
Remoción del efecto de variables adicionales Remoción del efecto de variables adicionales que afectan la respuesta de interés.que afectan la respuesta de interés.
En un estudio, se compararon 7 variedades de En un estudio, se compararon 7 variedades de frijol tépari con relación a su contenido en hierro frijol tépari con relación a su contenido en hierro soluble. El contenido de hierro soluble depende del soluble. El contenido de hierro soluble depende del hierro total presente, así como de la presencia de hierro total presente, así como de la presencia de factores inhibidores, tales como los fosfatos. factores inhibidores, tales como los fosfatos.
Mediante un análisis de covarianza se puede Mediante un análisis de covarianza se puede estimar, si las variedades cambian en el contenido de estimar, si las variedades cambian en el contenido de hierro soluble hierro soluble per seper se, o el cambio en hierro soluble se , o el cambio en hierro soluble se debe a las diferentes concentraciones de inhibidores, debe a las diferentes concentraciones de inhibidores, como los fosfatos.como los fosfatos.
1010
Objetivos del análisis de Objetivos del análisis de covarianza covarianza
Obtener mayor información sobre la Obtener mayor información sobre la naturaleza de los tratamientos. naturaleza de los tratamientos.
Si las diferencias entre tratamientos Si las diferencias entre tratamientos desaparecen después de ajustar por desaparecen después de ajustar por covarianza, o si cambian de algún modo, esto covarianza, o si cambian de algún modo, esto sugerirá al investigador que las diferencias sugerirá al investigador que las diferencias entre tratamientos pueden proceder de las entre tratamientos pueden proceder de las diferencias entre los promedios de X, no de las diferencias entre los promedios de X, no de las diferencias en respuesta (Y). diferencias en respuesta (Y).
1111
Objetivos del análisis de Objetivos del análisis de covarianza covarianza
Ajuste de regresiones en modelos de Ajuste de regresiones en modelos de clasificación múltiple.clasificación múltiple.
El análisis de covarianza nos puede servir para El análisis de covarianza nos puede servir para conocer si las pendientes de regresión de diferentes conocer si las pendientes de regresión de diferentes factores son homogéneas (paralelas).factores son homogéneas (paralelas).
Corrección por observaciones perdidas. Corrección por observaciones perdidas.
El Andecova permite ajustar las sumas de El Andecova permite ajustar las sumas de cuadrados del Andeva por observaciones perdidas en cuadrados del Andeva por observaciones perdidas en el caso de diseños en bloques al azar o en cuadro el caso de diseños en bloques al azar o en cuadro latino.latino.
1212
MODELO DE COVARIANZAMODELO DE COVARIANZA
El modelo lineal para el análisis de covarianza, El modelo lineal para el análisis de covarianza, dependerá del diseño experimental empleado, de la dependerá del diseño experimental empleado, de la estructura de los tratamientos y del número de estructura de los tratamientos y del número de covariables considerado. covariables considerado.
El caso más sencillo es el de un diseño El caso más sencillo es el de un diseño Completamente al Azar, con r repeticiones por Completamente al Azar, con r repeticiones por tratamiento, con una estructura de tratamientos tratamiento, con una estructura de tratamientos simple, de simple, de tt tratamientos, y con una covariable (X). tratamientos, y con una covariable (X).
1313
MODELO DE COVARIANZAMODELO DE COVARIANZA
i=1,2,...,t ; j=1,2,...r.i=1,2,...,t ; j=1,2,...r. Donde: Donde:
YYij ij : Observación ij-ésima de la variable respuesta Y: Observación ij-ésima de la variable respuesta Y
μ : Promedio general de Y μ : Promedio general de Y
i i : Efecto del tratamiento i-ésimo: Efecto del tratamiento i-ésimo
ß : Coeficiente de regresión entre X y Yß : Coeficiente de regresión entre X y Y
XXijij : Observación ij-ésima de la covariable X : Observación ij-ésima de la covariable X
XXMM: Promedio general de la covariable X : Promedio general de la covariable X
εεij ij : Error aleatorio de la observación ij-ésima.: Error aleatorio de la observación ij-ésima.
ijiji (x )XYij
1414
SUPOSICIONES BASICASSUPOSICIONES BASICAS
Las suposiciones básicas del modelo son:Las suposiciones básicas del modelo son:
1. El modelo es el verdadero, lineal en sus parámetros.1. El modelo es el verdadero, lineal en sus parámetros.
2. La covariable está medida sin error.2. La covariable está medida sin error.
3. La relación entre la variable respuesta (Y), y la 3. La relación entre la variable respuesta (Y), y la covariable (X), no cambia con los covariable (X), no cambia con los tratamientos.tratamientos.
4. La variable Y tiene distribución aproximadamente 4. La variable Y tiene distribución aproximadamente normalnormal
5. Los errores aleatorios son independientes, con media 5. Los errores aleatorios son independientes, con media igual a 0 y varianza σigual a 0 y varianza σ22 (error). (error).
1515
SUPOSICIONES BASICASSUPOSICIONES BASICAS
La suposición que hay que La suposición que hay que confirmar generalmente es la tercera, confirmar generalmente es la tercera, ya que si los tratamientos afectan la ya que si los tratamientos afectan la relación entre X y Y, el modelo de relación entre X y Y, el modelo de covarianza no es el adecuado.covarianza no es el adecuado.
1616
CALCULO DEL ANDECOVA CALCULO DEL ANDECOVA
El análisis de covarianza se hará siguiendo los El análisis de covarianza se hará siguiendo los siguientes pasos:siguientes pasos:
1. Agrupe los datos según se puede ver en el Cuadro I.1. Agrupe los datos según se puede ver en el Cuadro I.
2. Calcule las Sumas de Cuadrados para Y y para X como 2. Calcule las Sumas de Cuadrados para Y y para X como si fueran dos análisis de varianza separados. si fueran dos análisis de varianza separados.
SC (TOTAL)SC (TOTAL)YYYY = ΣΣ Y = ΣΣ Yijij22 - (Y - (Y22../rt) = TYY ../rt) = TYY
3. 3. Calcule las Sumas de Productos Cruzados de X y Y, Calcule las Sumas de Productos Cruzados de X y Y, como en el análisis de regresión:como en el análisis de regresión:
SP(TRAT)SP(TRAT)XYXY = (Y = (Y1.1.*X*X1.1.+Y+Y2.2.*X*X2.2.+...+Y+...+Yt.t.*X*Xt.t.)/r - [(Y..)*(X..)/rt])/r - [(Y..)*(X..)/rt]
1717
CALCULO DEL ANDECOVACALCULO DEL ANDECOVA
REPREP Trat. 1Trat. 1 Trat.1Trat.1 Trat. 2Trat. 2 Trat 2Trat 2 .. .. Trat tTrat t Trat. tTrat. t
11 XX1111 YY1111 XX2121 YY2121 .. .. XX1111 YY
22 XX1212 YY1212 XX2222 YY2222 .. .. XXt2t2 YYt2t2
.. .. .. .. .. .. .. .. ..
.. .. .. .. .. .. .. .. ..
rr XX1r1r YY1r1r XX2r2r YY2r2r .. .. XXtrtr YYtrtr
Subt. Subt. TratTrat
XX1.1. YY1.1. XX2.2. YY2.2. .. .. XXt.t. YYt.t.
1818
CALCULO DEL ANDECOVACALCULO DEL ANDECOVA
4. 4. Use la siguiente notación para ordenar sus cálculos:Use la siguiente notación para ordenar sus cálculos:
Tyy : Suma de Cuadrados Total de Y.Tyy : Suma de Cuadrados Total de Y.Txx : Suma de Cuadrados Total de X.Txx : Suma de Cuadrados Total de X.
Txy : Suma de Productos Cruzados Total de X por Y.Txy : Suma de Productos Cruzados Total de X por Y.Tryy : Suma de Cuadrados de Tratamientos de Y.Tryy : Suma de Cuadrados de Tratamientos de Y.Trxx : Suma de Cuadrados de Tratamientos de X.Trxx : Suma de Cuadrados de Tratamientos de X.
Trxy: Suma de Productos Cruzados De Tratamientos.Trxy: Suma de Productos Cruzados De Tratamientos.Eyy : Suma de Cuadrados del Error de Y.Eyy : Suma de Cuadrados del Error de Y.Exx : Suma de Cuadrados del Error de X.Exx : Suma de Cuadrados del Error de X.
Exy : Suma de Productos Cruzados del Error.Exy : Suma de Productos Cruzados del Error.5. 5. Arme el cuadro de Análisis de Covarianza (ANDECOVA), como se Arme el cuadro de Análisis de Covarianza (ANDECOVA), como se
muestra en siguiente cuadro.muestra en siguiente cuadro.
1919
CALCULO DEL ANDECOVACALCULO DEL ANDECOVA
Fuente Gl
Suma de Cuadrados
XX XY YY
Tratam. t-1 TRXX TRXY TRYY
Error t(r-1) EXX EXY EYY
Suma TRXX + EXX TRXY + EXY TRYY + EYY
Total TXX TXY TYY
2020
CALCULO DEL ANDECOVACALCULO DEL ANDECOVA
6. Haga los siguientes cálculos: 6. Haga los siguientes cálculos:
SCESCECC = EYY - EXY = EYY - EXY22/EXX/EXX
SCTSCTCC = (TRYY+EYY) - (TRXY+EXY) = (TRYY+EYY) - (TRXY+EXY)22/(TRXX+EXX)]/(TRXX+EXX)]
SCTRSCTRCC = SCT = SCTCC -SCE -SCECC
7. Arme el cuadro final de ANDECOVA como 7. Arme el cuadro final de ANDECOVA como sigue:sigue:
2121
CALCULO DEL ANDECOVACALCULO DEL ANDECOVA
FUENTE GL SC CM F
TRAT t-1 SCTRC CMTRC CMTRC/CMEC
REGRESION 1 (EXY)2/EXX CMREG CMREG/CMEC
ERROR t(r-1)-1 SCEC CMEC .
2222
PRUEBAS DE HIPOTESIS EN PRUEBAS DE HIPOTESIS EN ANDECOVAANDECOVA
Las pruebas de hipótesis de interés son dos:Las pruebas de hipótesis de interés son dos:
a. No existe regresión entre X y Y, o sea Ha. No existe regresión entre X y Y, o sea Hoo: ß =0. Esta : ß =0. Esta hipótesis se prueba con el estadístico hipótesis se prueba con el estadístico
F = CMREG /CMEF = CMREG /CMECC. .
Si F es mayor que FSi F es mayor que Fαα,{1,(t(r-1)-1)},{1,(t(r-1)-1)}, entonces la , entonces la regresión entre X y Y es significativa, y el análisis de regresión entre X y Y es significativa, y el análisis de covarianza probará ser eficiente.covarianza probará ser eficiente.
2323
PRUEBAS DE HIPOTESIS EN PRUEBAS DE HIPOTESIS EN ANDECOVAANDECOVA
b. Hay diferencias entre tratamientos:b. Hay diferencias entre tratamientos:
HHoo: τ: τ11=τ=τ22=...=τ=...=τtt
Esta hipótesis se probará con el estadístico Esta hipótesis se probará con el estadístico
F = CMTRF = CMTRCC/CME/CMECC. .
Si F es mayor que FSi F es mayor que Fα,{(t-1),[t(r-1)-1]}α,{(t-1),[t(r-1)-1]}, las diferencias , las diferencias entre tratamientos serán significativas.entre tratamientos serán significativas.
2424
PRUEBAS DE HIPOTESIS EN PRUEBAS DE HIPOTESIS EN ANDECOVAANDECOVA
Tanto si hay diferencias Tanto si hay diferencias significativas o no, cuando la regresión fue significativas o no, cuando la regresión fue significativa, los promedios de los significativa, los promedios de los tratamiento se deberán ajustar por los tratamiento se deberán ajustar por los cambios que ocurren en la covariable para cambios que ocurren en la covariable para cada tratamiento. cada tratamiento.
2525
PRUEBAS DE HIPOTESIS EN PRUEBAS DE HIPOTESIS EN ANDECOVAANDECOVA
La estimación de las medias ajustadas La estimación de las medias ajustadas de Y es:de Y es:
DondeDonde YYi i : Promedio ajustado por covarianza del i-ésimo tratamiento; : Promedio ajustado por covarianza del i-ésimo tratamiento;
YYi i : Promedio del i-ésimo tratamiento.: Promedio del i-ésimo tratamiento.
b = EXY/EXX : Estimación del coeficiente de regresión (ß); b = EXY/EXX : Estimación del coeficiente de regresión (ß); XXi i : Promedio de X del i-ésimo tratamiento: Promedio de X del i-ésimo tratamiento
X.. : Promedio general de las X's.X.. : Promedio general de las X's.
)XX(bYYiii
2626
PRUEBAS DE HIPOTESIS EN PRUEBAS DE HIPOTESIS EN ANDECOVAANDECOVA
Para hacer comparaciones de promedios Para hacer comparaciones de promedios ajustados, se deberán comparar todos los pares ajustados, se deberán comparar todos los pares de promedios de tratamientos, ya que la de promedios de tratamientos, ya que la desviación estándar de la media de un desviación estándar de la media de un tratamiento ajustado, es diferente de la que se tratamiento ajustado, es diferente de la que se usa para el análisis de varianza. (Ver Steel y usa para el análisis de varianza. (Ver Steel y Torrie, pág 406).Torrie, pág 406).
Los paquetes computacionales de Los paquetes computacionales de estadística, como el JMP, hacen el análisis de estadística, como el JMP, hacen el análisis de covarianza en forma más sencilla.covarianza en forma más sencilla.
2727
EJEMPLO EJEMPLO
En un experimento se compararon 11 En un experimento se compararon 11 variedades de habas por su contenido en variedades de habas por su contenido en ácido ascórbico (en microgramos por gramo ácido ascórbico (en microgramos por gramo de muestra). de muestra).
Por experiencias previas se sabe que el Por experiencias previas se sabe que el grado de madurez afecta el contenido de grado de madurez afecta el contenido de ácido ascórbico. ácido ascórbico.
Se midió el porcentaje de materia seca, Se midió el porcentaje de materia seca, como un índice indirecto del grado de como un índice indirecto del grado de madurez.madurez.
2828
EJEMPLO EJEMPLO
Para poder comparar las diferentes Para poder comparar las diferentes variedades hay que realizar un análisis de variedades hay que realizar un análisis de covarianza de estos datos, de forma de covarianza de estos datos, de forma de corregir el contenido de AA por el grado de corregir el contenido de AA por el grado de madurez de las plantas. madurez de las plantas.
La relación entre la materia seca y el La relación entre la materia seca y el ácido ascórbico es inversa, o sea, a mayor ácido ascórbico es inversa, o sea, a mayor % de materia seca, menor contenido de AA.% de materia seca, menor contenido de AA.
2929
EjemploEjemplo
3030
EJEMPLO 2EJEMPLO 2
El diseño experimental empleado fue El diseño experimental empleado fue de bloques completos al azar, con 11 de bloques completos al azar, con 11 variedades y tres repeticiones.variedades y tres repeticiones.
El modelo propuesto para el análisis El modelo propuesto para el análisis es: es:
ijijjiij)X(xbvY
3131
EJEMPLO EJEMPLO
Se verá el ejemplo usando el JMP.Se verá el ejemplo usando el JMP.
3232
DISCUSION DE USOS DEL DISCUSION DE USOS DEL ANDECOVAANDECOVA
Proponga ejemplos de uso del análisis de Proponga ejemplos de uso del análisis de covarianzacovarianza
Cuál de las aplicaciones del ANDECOVA le parece Cuál de las aplicaciones del ANDECOVA le parece más útil en las investigaciones en alimentos.más útil en las investigaciones en alimentos.
Uso de mediciones iniciales como covariables, al Uso de mediciones iniciales como covariables, al analizar mediciones finales.analizar mediciones finales.
Cambios en los promedios estimados de Y, y Cambios en los promedios estimados de Y, y cómo se realizan las pruebas de comparación cómo se realizan las pruebas de comparación múltiple de medias.múltiple de medias.
3333
ResumenResumen
Qué es el ANDECOVAQué es el ANDECOVA Objetivos del ANDECOVAObjetivos del ANDECOVA Usos más frecuentesUsos más frecuentes Modelo y análisis de datosModelo y análisis de datos Pruebas de hipótesis en el Pruebas de hipótesis en el
ANDECOVAANDECOVA ANDECOVA con JMP ANDECOVA con JMP