Diseño de experimentos – p. 1/65
Introducción
Diseño de experimentos – p. 2/65
Introducción
Historia
R.A. Fisher, en la década de los 20’s, fué el iniciador delDiseño de Experimentos, con experimentos en el área deagricultura en Inglaterra. De ahí se generalizaron al área deMedicina. En la década de los 80’s tuvieron un auge en laIndustria, cuando surgió la escuela de Taguchi de Control deCalidad de procesos industriales.
Montgomery define un experimento como una prueba, o seriede pruebas, en las cuales se hacen cambios controlados a lasvariables de entrada de un proceso o sistema, para observar eidentificar las razones de los cambios en la respuesta desalida.
Diseño de experimentos – p. 3/65
Introducción
Los experimentos se realizan en muchas áreas deinvestigación:
Veterinaria. Se desea saber cuál de cuatro dietas diferentesA,B,C y D proporciona mayor ganancia de peso en cerdos.
Biología. Se desea saber cuál es el efecto en el crecimientode las plantas de centeno de la aplicación de ciertas dosis deradiación en presencia de uno de tres radioprotectores.
Agricultura. Se desea saber cuál es el mejor fertilizante de ungrupo de cinco, en cuanto a rendimiento de plantas de maiz.
Industria. Se desea comparar la eficiencia de tres máquinasde hilados. La eficiencia se mide como un índice entre eltiempo que tarda la máquina en hilar una tela de cierto tamañoentre el número de errores.
Diseño de experimentos – p. 4/65
Introducción
Medicina. Se desea investigar el funcionamiento de ciertadroga para aliviar el dolor de cabeza.
Pedagogía. Se quiere investigar el efecto de la T.V. en niñosde 5 a 10 años comparando sus conocimientos de losprogramas de T.V. y algunos hechos históricos.
El experimento es un estudio comparativo, longitudinal,prospectivo y experimental.
El diseño estadístico de experimentos es el proceso de"planear" el experimento de tal manera que se puedananalizar por métodos estadísticos los datos recolectadosy que resulten en conclusiones objetivas y válidas.
Diseño de experimentos – p. 5/65
Lineamientos para diseñar experimentos
1. Reconocimiento y establecimiento del problema.
Esto se hace preferentemente por un equipointerdisciplinario con un estadístico en él.
■ En el ejemplo de agricultura.
Cuál de los cinco fertilizantes produce mayor rendimientoen las plantas de maíz de cierto tipo definido?
Estos cinco fertilizantes modifican su acción según el tipode maíz?. Hay interacción?
Qué dosis de fertilizante es más efectiva para aumentarel rendimiento?
Diseño de experimentos – p. 6/65
Lineamientos para diseñar experimentos
2. Definir factores, niveles. Equipo interdisciplinario.
■ Factor: es la característica cuyo efecto queremosestudiar.En el ejemplo, un solo factor: Fertilizante.
■ Nivel: es la categoría estudiada del factor.En el ejemplo, cinco niveles: fertilizante A, B, C, D y E.
■ Tratamiento: Combinación de niveles de los factoresestudiados. Otro ejemplo,
Factor fertilizante: A,B,C,D,E.
Factor Cantidad de agua: 1,2,3.
Tratamientos: A1, B1,...,E3.
Diseño de experimentos – p. 7/65
Lineamientos para diseñar experimentos
Los tratamientos seleccionados deben ser de una naturalezatal que puedan ser reproducidos en gran escala.Por ejemplo, no tiene sentido práctico estudiar el tratamientoque es poner el fertilizante a mano en cada plantita de maiz.A esto se le llama practicabilidad de los tratamientos.
También es importante considerar un tratamiento que es norecibir ningún fertilizante o recibir el habitual, a éste se lellama:tratamiento testigo o control.
Diseño de experimentos – p. 8/65
Lineamientos para diseñar experimentos
3. Definir la unidad experimental (u.e.)
La unidad experimental es la subdivisión menor delmaterial experimental que puede recibir un tratamiento enforma independiente.
Un aspecto importante es la representatividad de las u.e.Esto es, las u.e. deberán ser reproducciones decondiciones comerciales o de gran escala.
Así, una planta de maíz para comparar fertilizantes no esrepresentativa.
Diseño de experimentos – p. 9/65
Lineamientos para diseñar experimentos
En un experimento médico, si se tienen en un cuarto cincopacientes con bronquitis y a cada uno de ellos se les dátratamiento diferente (cada paciente es una u.e.) y si untratamiento no es efectivo, dicho paciente es un foco deinfección para los demás, por lo que contaminaria todo elexperimento.
La solución es un grupo de pacientes por cuarto como u.e. oun paciente en cada cuarto como u.e.
Unidades experimentales grandes producen menosvariabilidad, sin embargo, el tamaño de las u.e. debeconsiderarse en forma simultánea con el tamaño de muestra yel costo.
Es más efectivo aumentar el tamaño de muestra que eltamaño de las u.e.
El tamaño de muestra es el número de u.e. que reciben elmismo tratamiento.
Diseño de experimentos – p. 10/65
Lineamientos para diseñar experimentos
4. Definir la variable de respuesta.
La variable de respuesta es lo que se va a medir en cadaunidad experimental.
Se debe estar seguro que dé información útil acerca delfenómeno estudiado.
En el ejemplo, Kg. de maíz
No es raro que se mida más de una variable de interésprimario: kg. de maíz, kg. de hojas, etc. Esto se estudiacon técnicas de análisis multivariado.
Se debe tener cuidado en la toma de las mediciones paraeliminar sesgos introducidos por operaciones conscienteso inconscientes.
En medicina, se recomienda que ni los sujetos (u.e.) ni losmédicos que toman las mediciones conozcan lostratamientos asignados a cada u.e., a esto se le llamamétodo de doble ciego.
Diseño de experimentos – p. 11/65
Lineamientos para diseñar experimentos
5. Elección del diseño experimental.
El diseño experimental es la forma de asignar lostratamientos a las unidades experimentales.
El diseño determina el modelo y el análisis estadístico aseguir.
Aleatorización. Introducida por Fisher, sirve para"controlar" factores de variación no incluída en el modeloen forma explícita. Se busca eliminar sesgos sistemáticos yjustificar la independencia de los errores.
Diseño de experimentos – p. 12/65
Lineamientos para diseñar experimentos
Otro ejemplo en Agronomía:
Aleatorizamos dentro de cada bloque (una restricción a laaleatorización). Cada uno de los tratamientos los tenemos encada una de las dos condiciones de terreno.
Diseño de experimentos – p. 13/65
Lineamientos para diseñar experimentos
5. Elección del diseño experimental.
Un bloque es un grupo de u.e. más o menos homogéneas.
El uso de bloques es la inclusión en el diseño (modelo) deun factor que, aunque no es de interés, se sabe que puedecausar una fuerte variación en la u.e.
En general, los factores de bloqueo más importantes sonlas posiciones en el tiempo y en el espacio.
El uso de bloques tiene como objetivo el control de factoresde variación en forma explícita en el modelo, disminuyendoasí la varianza de los errores.
Diseño de experimentos – p. 14/65
Lineamientos para diseñar experimentos
6. Determinación del número de repeticiones.
Las repeticiones (réplicas) son el número de u.e. a las quese les aplica, en forma independiente , un tratamiento.
■ Dan una estimación de la varianza del error experimental■ Incrementan la precisión del experimento. A mayor
número de repeticiones menor la varianza de losestimadores.
7. Hacer el experimento y colectar datos.
El estadístico solo asesora.
8. Efectuar el análisis estadístico.
9. Obtención de conclusiones.
El estadístico auxilia.
Diseño de experimentos – p. 15/65
Error experimental
El error experimental describe la variación entre u.e. idéntica eindependientemente tratadas.
Se origina por:
1. Variación natural entre u.e.
2. Variabilidad en la medición de la respuesta
3. Incapacidad de reproducir las condiciones de lostratamientos exactamente de una u.e. a otra
4. Interacción de tratamientos y u.e.
5. Cualquier otro factor externo que afecte las característicasmedidas
Lo que se busca es tener un diseño que minimice la varianzadel error experimental.
Diseño de experimentos – p. 16/65
Repaso
El objetivo de la inferencia estadística es obtener conclusionesacerca de una población usando una muestra de esapoblación.
Muestra aleatoria. Sean n variables aleatorias x1, x2, . . . , xn
independientes conjuntamente, todas con la misma función dedensidad f(x). Se dice que x1, x2, . . . , xn es una muestraaleatoria de tamaño n de f(x). La densidad conjunta de las nvariables aleatorias es:
g(x1, x2, . . . , xn) = f(x1)f(x2) · · · f(xn)
Nota. x1, x2, . . . , xn son v.a.i.i.d. y forman unamuestra aleatoria de f(x)
Nota. En este curso, a diferencia del de Muestreo,supondremos que trabajamos con poblaciones infinitaso potencialmente infinitas, entonces la definición dem.a.s. no aplica.
Diseño de experimentos – p. 17/65
Repaso
Estadística. Una función de la muestra que no contieneparámetros desconocidos.
Estimador. Es una estadística usada para estimar unparámetro desconocido de la población.
Estimación. Es un valor numérico particular de un estimador,calculado en una muestra.
Hay algunas características que se requieren para ser un buenestimador. Dos de las más importantes:
1. Insesgamiento. Un estimador es insesgado cuando suvalor esperado es el parámetro que está estimando.Aunque es deseable el insesgamiento, esta propiedad porsi sola no garantiza un buen estimador.
2. Varianza mínima. El estimador de varianza mínima tieneuna varianza que es menor que la de cualquier otroestimador del parámetro.
Diseño de experimentos – p. 18/65
Repaso
Suponga y1, y2, . . . , yn una m.a. de fY (y) con E(yi) = µ yV (yi) = σ2.
Sean y =∑
ni=1
yi
n y S2 =∑
ni=1
(yi−y)2
n−1 dos estimadores.
E(y) = E
(∑ni=1 yi
n
)
=1
nE
(
n∑
i=1
yi
)
=1
n
n∑
i=1
E(yi)
=1
nnµ = µ
y es un estimador insesgado de µ.
Diseño de experimentos – p. 19/65
Repaso
E(
S2)
= E
[
n∑
i=1
(yi − y)2
n − 1
]
=1
n − 1E
[
n∑
i=1
(yi − y)2
]
=1
n − 1E [SS]
donde SS =∑n
i=1(yi − y)2 es la Suma de Cuadradoscorregida de las observaciones.
E (SS) = E
[
n∑
i=1
(yi − y)2
]
= E
[
n∑
i=1
y2i − ny2
]
=
n∑
i=1
E(y2i ) − nE(y2)
Diseño de experimentos – p. 20/65
Repaso
Por otro lado:
V (y) = E[
(y − E(y))2]
= E[
y2 − 2yE(y) + [E(y)]2]
= E[
y2]
− 2E(y)E(y) + [E(y)]2
= E[
y2]
− [E(y)]2
σ2 = E[
y2]
− µ2
por lo tanto
E(y2) = σ2 + µ2
Diseño de experimentos – p. 21/65
Repaso
Y por otro:
V (y) = V
(
1
n
n∑
i=1
yi
)
=1
n2V
(
n∑
i=1
yi
)
=iid 1
n2
n∑
i=1
V (yi)
=1
n2nσ2 =
σ2
n.
Entonces,
V (y) = E(
y2)
− [E(y)]2
E(
y2)
= V (y) + [E(y)]2
= σ2/n + µ2.
Diseño de experimentos – p. 22/65
Repaso
Regresando,
E (SS) =
n∑
i=1
E(y2i ) − nE(y2)
=
n∑
i=1
(µ2 + σ2) − n(µ2 + σ2/n)
= nµ2 + nσ2 − nµ2 − σ2
= (n − 1)σ2
Por lo tanto,
E(
S2)
=1
n − 1E (SS) =
1
n − 1(n − 1)σ2 = σ2
S2 es un estimador insesgado de σ2.
Diseño de experimentos – p. 23/65
Repaso
Distribución muestral. Es la distribución de probabilidad deuna estadística.Se puede determinar la distribución muestral de unaestadística si conocemos la distribución de probabilidad de lapoblación de la que se extrajo la muestra.
Diseño de experimentos – p. 24/65
Distribuciones (algunas)
Diseño de experimentos – p. 25/65
Normal
Si y ∼ N(µ, σ2) entonces:
f(y) =1
σ√
2πe−
1
2σ2(y−µ)2 −∞ < y < ∞
−∞ < µ < ∞σ2 > 0
5 10 15 20
0.1
0.2
0.3
0.4
NH10,9L
NH10,4L
NH10,1L
Diseño de experimentos – p. 26/65
Normal
Si y ∼ N(µ, σ2) entonces:
z =y − µ
σ∼ N(0, 1)
Muchas técnicas estadísticas suponen que la variablealeatoria en cuestión se distribuye normalmente. El TeoremaCentral del Límite es muchas veces una justificación parasuponer normalidad.
Teorema Central del Límite.
Sean x1, x2, . . . , xn v.a.i.i.d de una función de probabilidadfX(x) con media µ y varianza σ2.
Sea x = x1+x2+...+xn
n , para un tamaño de muestra grande n ,la distribución de x es aproximadamente:
x∼N(µ, σ2/n) ó√
n(x − µ)
σ∼N(0, 1)
Diseño de experimentos – p. 27/65
Ji-cuadrada
Una distribución muestral que se puede definir a través de v.a.normales es la distribución Ji-cuadrada χ2
Si z1, z2, . . . , zk son v.a.i.i.d. N(0, 1) entonces:
x = z21 + z2
2 + . . . + z2k
tiene una distribución χ2k.
La densidad tiene la forma:
f(x) =1
2k/2Γ(k2 )
xk/2−1e−x/2 x > 0
Diseño de experimentos – p. 28/65
Ji-cuadrada
5 10 15 20 25 30
0.025
0.05
0.075
0.1
0.125
0.15
ΧH15L
ΧH10L
ΧH5L
Diseño de experimentos – p. 29/65
Ji-cuadrada
La distribución es asimétrica con µ = k y σ2 = 2k.
Un ejemplo de v.a. con distribución Ji-cuadrada es elsiguiente:
Suponga que y1, y2, . . . , yn es una m.a. de N(µ, σ2), entonces:
SS
σ2=
∑ni=1(yi − y)2
σ2∼ χ2
n−1
Diseño de experimentos – p. 30/65
t-Student
Si z tiene distribución normal estándar y x tiene distribución χ2k
y z y x son independientes, entonces la v.a.
t =z
√
x/k∼ tk
La función de densidad tiene la forma:
f(t) =Γ[(k + 1)/2]√
kπΓ(k/2)
1
[(t2/k) + 1](k+1)/2
−∞ < t < ∞
La distribución es simétrica con µ = 0 y σ2 = k/(k − 2) parak > 2.
Diseño de experimentos – p. 31/65
t-Student
-6 -4 -2 2 4 6
0.1
0.2
0.3
0.4
tH30L
tH2L
tH1L
Diseño de experimentos – p. 32/65
t-Student
Un ejemplo de v.a. con distribución t es:
Si y1, y2, . . . , yn es una m.a. de N(µ, σ2) entonces:
t =y − µ
S/√
n∼ tn−1
donde,
S =
√
∑ni=1(yi − y)2
n − 1
Diseño de experimentos – p. 33/65
Distribución F
Si χ2u y χ2
v son dos v.a. χ2 independientes con u y v g.l.respectivamente, entonces
F =χ2
u/u
χ2v/v
∼ Fu,v
Diseño de experimentos – p. 34/65
Distribución F
Como ejemplo de una estadística que se distribuye como F ,suponga que tenemos dos poblaciones normalesindependientes con varianza común σ2, es decir,
y11, y12, . . . , y1n1es una m.a. de la primera población
y21, y22, . . . , y2n2es una m.a. de la segunda población
entonces,S2
1
S22
∼ Fn1−1,n2−1
donde
S21 =
∑n1
i=1(y1i − y1)2
n1 − 1y S2
2 =
∑n2
i=1(y2i − y2)2
n2 − 1
Diseño de experimentos – p. 35/65
Distribución F
Sabemos que:
S21 =
SS1
n1 − 1y S2
2 =SS2
n2 − 1
ySS1
σ2=
(n1 − 1)S21
σ2∼ χ2
n1−1
SS2
σ2=
(n2 − 1)S22
σ2∼ χ2
n2−1
Por lo tanto:
(n1−1)S2
1
(n1−1)σ2
(n2−1)S2
2
(n2−1)σ2
∼ Fn1−1,n2−1
Diseño de experimentos – p. 36/65
Pruebas de hipótesis
Diseño de experimentos – p. 37/65
Primero un ejemplo
Un ingeniero desea comparar la resistencia de una fórmulamodificada de cemento a la cual se le agrega látex durante elmezclado. Se tienen diez observaciones de la resistencia parala fórmula modificada y otras diez para la fórmula usual.
mezcla modificada mezca sin modificarj kgf/cm2 (y1j) kgf/cm2 (y2j)
1 16.85 17.502 16.40 17.633 17.21 18.254 16.35 18.005 16.52 17.866 17.04 17.757 16.96 18.228 17.15 17.909 16.59 17.96
10 16.57 18.15
Diseño de experimentos – p. 38/65
Primero un ejemplo
Factor: fórmula con dos niveles: modificada(1) y usual(2). Dostratamientos 10 repeticiones y1 = 16.76 y y2 = 17.92.
Diseño de experimentos – p. 39/65
Primero un ejemplo
Los promedios de resistencia son diferentes entre estas dosmuestras, sin embargo, no es obvio que esta diferencia sea losuficientemente grande para que implique que las dosfórmulas son "realmente" diferentes.
Tal vez esta diferencia observada en los promedios deresistencia es el resultado de fluctuaciones muestrales y quelas dos fórmulas son realmente iguales. Posiblemente otrasdos muestras podrían dar resultados opuestos.
Para probar si las dos fórmulas son iguales o no, se utiliza unatécnica de estadística inferencial llamada Prueba de Hipótesis,la cual permite hacer la comparación de las dos fórmulas entérminos objetivos, con el conocimiento del riesgo asociado allegar a una conclusión errónea.
Diseño de experimentos – p. 40/65
Prueba de hipótesis con un ejemplo
Primero, necesitamos establecer un modelo para los datos:
yij = µi + ǫij i = 1, 2 j = 1, . . . , 10
donde
yij es la j-ésima observación del i-ésimo tratamiento
µi es la media de la respuesta en el tratamiento i, i = 1, 2
ǫij es el error asociado a la ij-ésima observación.
Suponga que ǫij ∼ NID(0, σ2) i = 1, 2 j = 1, . . . , 10.
Esto implica que
yij ∼ NID(µi, σ2) i = 1, 2 j = 1, . . . , 10.
Diseño de experimentos – p. 41/65
Prueba de hipótesis con un ejemplo
5 10 15 20 25 30
0.05
0.1
0.15
0.2
trat 2
trat 1
Diseño de experimentos – p. 42/65
Prueba de hipótesis con un ejemplo
Lo que interesa probar es:
H0 : µ1 = µ2 hipótesis nula
vs.
Ha : µ1 6= µ2 hipótesis alternativa dos colas
µ1 < µ2 ó µ1 > µ2
Para probar una hipótesis necesitamos una estadística deprueba y especificar una región de rechazo o región crítica,que es el conjunto de valores de la estadística de prueba quellevan a rechazar la hipótesis nula.
Diseño de experimentos – p. 43/65
Prueba de hipótesis con un ejemplo
Se pueden cometer dos tipos de error al probar una hipótesis:
situación real (desconocida)H0 es cierta H0 no es cierta
rechazar H0 error Tipo Iconclusiónestadística
no rechazar H0 error Tipo II
α = P (error tipo I) = P (rechazar H0 |H0 es cierta)
β = P (error tipo II) = P (no rechazar H0 |H0 no es cierta)
Diseño de experimentos – p. 44/65
Prueba de hipótesis con un ejemplo
El procedimiento general en pruebas de hipótesis esespecificar un valor de α, llamado nivel de significancia de laprueba y diseñar el procedimiento de tal manera que β seapequeño.
Regresando al ejemplo.
y1 = 16.764 y2 = 17.992
S1 = 0.3164 S2 = 0.2479
S21 = 0.100 S2
2 = 0.061
n1 = 10 n2 = 10
Diseño de experimentos – p. 45/65
Construcción de la estadística de prueba
Suponga, por el momento, que las varianzas de las dospoblaciones son iguales. Es decir,
y1j ∼ NID(µ1, σ2) y2j ∼ NID(µ2, σ
2) j = 1, . . . , 10
y1 ∼ N(µ1, σ2/n1) y2 ∼ N(µ2, σ
2/n2)
Si las dos poblaciones son independientes, entonces:
y1 − y2 ∼ N
(
µ1 − µ2, σ2
(
1
n1+
1
n2
))
Si σ2 es conocida y si H0 : µ1 = µ2 es cierta, entonces:
z0 =y1 − y2−(µ1 − µ2)
σ√
1n1
+ 1n2
∼ N (0, 1)
Diseño de experimentos – p. 46/65
Construcción de la estadística de prueba
Si no conocemos σ2, entonces se utiliza la estadística deprueba:
t0 =y1 − y2
Sp
√
1n1
+ 1n2
∼ tn1+n2−2
donde,
S2p =
(n1 − 1)S21 + (n2 − 1)S2
2
n1 + n2 − 2(pooled)
Diseño de experimentos – p. 47/65
Región de rechazo
Para determinar la región de rechazo, es decir, los valores dela estadística de prueba que llevan a rechazar H0, se fijaprimero el nivel de significancia α.
Diseño de experimentos – p. 48/65
Región de rechazo
Se compara t0 con t1−α/2n1+n2−2 porcentil (1 − α/2) de la
distribución t con n1 + n2 − 2 g.l.
Si |t0| > t1−α/2n1+n2−2 se rechaza H0.
Esto es, si H0 es cierta entonces t0 ∼ tn1+n2−2 yesperaríamos que el 100(1 − α)% de los valores de t0 cayeranentre tα/2 y t1−α/2.
Si una muestra produce un valor de t0 fuera de estos límites,sería "extraño" si la hipótesis nula es cierta, por lo que esevidencia de que H0 se debe rechazar.
Diseño de experimentos – p. 49/65
De vuelta al ejemplo
Haciendo los cálculos del ejemplo:
t0 =y1 − y2
Sp
√
1n1
+ 1n2
=16.76 − 17.92
0.284√
210
= −9.13
Si fijamos α = 0.05 entonces rechazamos H0 si
|t0| > t0.97518 = 2.101
Como 9.13 > 2.101 entonces, rechazamos H0 al 5% de nivelde significancia. Y concluímos que en promedio, la resistenciade las dos fórmulas es diferente.
Diseño de experimentos – p. 50/65
p-value
Esta es una forma de reportar los resultados, es decir, lahipótesis nula se rechazó o no se rechazó a un nivel designificancia α especificado.
Sin embargo, esto no dá al investigador idea de si el valorcalculado de la estadística de prueba estaba en la frontera dela región crítica o si estaba muy adentro de ésta. Para eliminaresta deficiencia se utiliza el p-value.
El p-value (significancia observada) es la probabilidad, si lahipótesis nula es cierta, de que la estadística de pruebaresulte en un valor tan extremo como el observado o más.
Diseño de experimentos – p. 51/65
Suposiciones de la prueba t
■ Ambas muestras provienen de poblaciones independientesy que pueden ser descritas por distribuciones normales.
■ Las varianzas de ambas poblaciones son iguales.■ Las observaciones son independientes.
Las suposiciones de independencia se pueden satisfacer através del diseño.
La suposición de normalidad se verifica a través de gráficas enpapel normal o la prueba de Kolmogorov-Smirnov, entre otras.
Diseño de experimentos – p. 52/65
Intervalos de confianza
Aunque las pruebas de hipótesis son una herramienta muy útil,algunas veces no dan todo el panorama. A veces es preferibledar un intervalo en el que esperamos que esté el verdaderovalor del parámetro. O puede suceder que el investigador yasabe que las medias µ1 y µ2 son diferentes, pero quiere saberqué tan diferentes pueden ser.
Suponga que θ es un parámetro desconocido. Para construirun intervalo de confianza para θ necesitamos dos estadísticasL y U tales que:
P (L ≤ θ ≤ U) = 1 − α
El intervalo (L, U) es llamado intervalo del (1 − α)100% deconfianza para el parámetro θ.
Diseño de experimentos – p. 53/65
Intervalos de confianza
La interpretación de este intervalo es:
Si en un número grande de muestreos repetidos se construyenintervalos de confianza para θ, entonces el (1 − α)100% deéstos contendrán al verdadero valor de θ.
L y U son los límites de confianza, inferior y superior.
1 − α es el coeficiente de confianza.
Los intervalos de confianza tienen una interpretaciónfrecuentista, esto es, no sabemos si la aseveración es ciertapara esta muestra específica, pero sabemos que el métodousado para calcular el intervalo de confianza produceaseveraciones correctas el (1 − α)100% de las veces.
Diseño de experimentos – p. 54/65
Intervalos de confianza
Para el caso que estamos tratando de dos poblaciones normalesindependientes, el intervalo de confianza para µ1 − µ2 se construye de lasiguiente manera:
y1 − y2 − (µ1 − µ2)
Sp
√
1n1
+ 1n2
∼ tn1+n2−2
P
−t(1−α/2)n1+n2−2 ≤ y1 − y2 − (µ1 − µ2)
Sp
√
1n1
+ 1n2
≤ t(1−α/2)n1+n2−2
= 1 − α
P
(
y1 − y2 − t(1−α/2)n1+n2−2Sp
√
1
n1+
1
n2≤ µ1 − µ2
≤ y1 − y2 + t(1−α/2)n1+n2−2Sp
√
1
n1+
1
n2
)
= 1 − α
Diseño de experimentos – p. 55/65
Intervalos de confianza
Un intervalo del (1 − α)100% de confianza para µ1 − µ2 es:[
(y1 − y2) − t(1−α/2)n1+n2−2Sp
√
1
n1+
1
n2, (y1 − y2) + t
(1−α/2)n1+n2−2Sp
√
1
n1+
1
n2
]
Regresando al ejemplo del problema del cemento:
y1 = 16.76 y2 = 17.92
Sp = 0.284 n1 = n2 = 10
t0.97518 = 2.101
El intervalo es: (−1.43,−0.89).
Note que si el valor 0 (cero) no está incluído en el intervaloimplica que los datos no sostienen la hipótesis de que µ1 = µ2
al 5% de nivel de significancia.
Diseño de experimentos – p. 56/65
Prueba de hipótesis cuando σ2
1 6= σ2
2
Si estamos probando
H0 : µ1 = µ2 vs. Ha : µ1 6= µ2
y no podemos suponer que las varianzas σ21 y σ2
2 son iguales,la prueba t se modifica. La estadística de prueba es ahora:
t0 =y1 − y2
√
S2
1
n1
+S2
2
n2
.
Esta estadística no se distribuye exactamente como una t. Sinembargo, se aproxima muy bien a una t si usamos comogrados de libertad:
ν =
(
S2
1
n1
+S2
2
n2
)2
(S2
1/n1)
2
n1−1 +(S2
2/n2)
2
n2−1
Diseño de experimentos – p. 57/65
Datos apareados
En algunos experimentos podemos mejorar grandemente laprecisión haciendo comparaciones con u.e. apareadas.
Ejemplo: Suponga que se tiene una máquina que prueba ladureza de un metal al presionar una varilla con una punta en elmetal, aplicando una fuerza conocida.
Se determina la dureza del metal midiendo la profundidad dela depresión causada por la punta.
Se tienen 2 puntas y se sospecha que las mediciones hechaspor las dos puntas producen lecturas diferentes, a pesar deque la precisión (variabilidad) de las mediciones pareceniguales.
Diseño de experimentos – p. 58/65
Datos apareados
Se lleva a cabo primero el siguiente experimento:
Se seleccionan 20 especímenes de metal. Diez de ellos semedirán con la punta 1 y los otros 10 con la punta 2. Laasignación de los especímenes a las puntas es aleatorio.
Este es un diseño completamente al azar.
Punta 1 Punta 2
7,3,3,4,8, 6,3,5,3,8,3,2,9,5,4 2,4,9,4,5y1 = 4.80 y2 = 4.90
S21 = (2.39)2 S2
2 = (2.23)2
Diseño de experimentos – p. 59/65
Datos apareados
S2p =
(n1 − 1)S21 + (n2 − 1)S2
2
n1 + n2 − 2= 5.3425
t0 =y1 − y2
Sp
√
1n1
+ 1n2
= −0.09674
Si |t0| > t1−α/218 rechazamos H0 : µ1 = µ2
t1−α/218 = 2.101 por lo tanto no rechazamos H0.
p-value=0.924.
En este ejemplo puede haber una desventaja al hacerlo conun diseño completamente al azar. Suponga que losespecímenes de metal fueron cortados de diferentes lotes quefueron producidos con diferentes temperaturas o que no sonhomogéneos en algun factor que puede afectar su dureza.
Esta falta de homogeneidad contribuirá a las mediciones dedureza y tenderá a aumentar el error experimental, haciendoque la verdadera diferencia entre las puntas sea difícil dedetectar.
Diseño de experimentos – p. 60/65
Datos apareados
Para solventar este problema, considere un diseñoexperimental alternativo.
Suponga que cada especimen de metal es lo suficientementegrande para que se puedan hacer 2 determinaciones dedureza en él.
Este diseño consistirá en dividir cada especimen en dospartes, luego se asigna aleatoriamente una punta a una de lasmitades y la otra punta a la otra mitad. El orden en el cual seprueban las puntas es aleatorio también.
Diseño de experimentos – p. 61/65
Datos apareados
Especimen Punta 1 Punta 2 dj
1 7 6 12 3 3 03 3 5 -24 4 3 15 8 8 06 3 2 17 2 4 -28 9 9 09 5 4 1
10 4 5 -1
Diseño de experimentos – p. 62/65
Datos apareados
El modelo estadístico que describe los datos de experimentoes:
yij = µi + βj + ǫij i = 1, 2 j = 1, . . . , 10
donde
yij es la observación de dureza para la punta i en elespecimen j.
µi es la media verdadera de dureza de la punta i.
βj es el efecto del especimen j.
ǫij es el error experimental y suponemos que se distribuyeN(0, σ2)
Diseño de experimentos – p. 63/65
Datos apareados
Sidj = y1j − y2j j = 1, . . . , 10
entonces
µd = E(dj) = E(y1j − y2j) = E(y1j) − E(y2j)
= µ1 + βj − (µ2 + βj)
= µ1 − µ2 (se cancela el efecto de βj)
Entonces, H0 : µ1 = µ2 vs. Ha : µ1 6= µ2 es equivalente aprobar
H0 : µd = 0 vs. Ha : µd 6= 0
De aquí surge la prueba t para datos apareados. Laestadística de prueba es:
t0 =d
Sd/√
n
Diseño de experimentos – p. 64/65
Datos apareados
donde d = 1n
∑
j dj y S2d =
∑
(dj−d)2
n−1 .
Haciendo cálculos, tenemos
d = −0.10 Sd = 1.20 t0 = −0.26
Si |t0| > t1−α/2n−1 se rechaza H0.
t0.9759 = 2.262 p-value = 0.798
No se rechaza H0.
Diseño de experimentos – p. 65/65
Comparación de los dos diseños
Completamente al azar Apareado (Bloques al azar)
18 g.l. 9 g.l.
Sp = 2.31 Sd = 1.20
µ1 − µ2 ∈ (−0.10 ± 2.18) µd ∈ (−0.10 ± 0.86)
Al hacer el experimento apareado se "perdieron" 9 g.l. lo queimplica que la prueba es menos sensible, sin embargo, seredujo la estimación de la variabilidad lo que implica intervalosde confianza más angostos, es decir, más precisión.
Top Related