Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados...
Transcript of Projetos de experimentos com um fator e vários níveis Projetos completamente aleatorizados...
Projetos de experimentos
com um fator e vários níveis
•Projetos completamente aleatorizados•Análise de variância (ANOVA) com um fator
Fonte Principal: Pedro Alberto Barbetta (INE - UFSC)
www.inf.ufsc.br/~barbetta
Porque ANOVA ?
Não Podemos Comparar 2 a 2 ?
Probabilidade de Ocorrer Erro do Tipo I =
A Probabilidade Prob de ocorrer k erros do tipo I em n comparações é dada por:
n kn kkprob k C p 1 p
Probabilidade de ocorrer erros do tipo I:
prob(Erro Tipo I)=prob(1)+prob(2)+...+prob(n)
No exemplo:
prob(Erro Tipo I) =
Exemplo 1: Comparação de três tipos de rede.
• Considere o problema de comparar 3 tipos de rede de
computadores, C1, C2 e C3, em termos do tempo médio
de transmissão de pacotes de dados entre duas
máquinas.
• Experimento (projeto completamente aleatorizado
com um fator): 8 replicações com cada tipo de rede,
aleatorizando a ordem dos 24 ensaios e mantendo fixos
os demais fatores controláveis.
Exemplo 1: Projeto do experimento.
Seqüência número Uso da
dos testes do ensaio rede
1 16 C2
2 14 C2
3 24 C3
4 6 C1
... ... ...
24 11 C3
ensaios de 1 a 8: C1ensaios de 9 a 16: C2ensaios de 17 a 24: C3
Exemplo 1. Dados do experimento:
Seqüência número Tempo de
dos testes do ensaio Rede resposta (y)
1 16 C2 7,8
2 14 C2 8,2
3 24 C3 6,3
4 6 C1 7,2
... ... ... ...
24 11 C2 7,8
Exemplo 1: Perguntas a serem respondidas pela análise estatística.
• Existe diferença real (significativa) entre os 3 tipos de rede?
• Qual é a estimativa do tempo de resposta para cada tipo de rede?
Dados do experimento
Tipo de rede
Replicação C1 C2 C3
1 7,2 7,8 6,3
2 9,3 8,2 6,0
3 8,7 7,1 5,3
4 8,9 8,6 5,1
5 7,6 8,7 6,2
6 7,2 8,2 5,2
7 8,8 7,1 7,2
8 8,0 7,8 6,8
Soma 65,7 63,5 48,1
Média 8,21 7,94 6,01
Notação: (g = 3 tratamentos)
tratamento
(1) (2) (3)
y11 y21 y31
y12 y22 y32
... ... ...
y1n y2n y3n
Média: .1y .2y .3y
Médiaglobal:
..yEstatísticas
Dados
Estatística: função dos elementos da amostra(são estimadores de certos parâmetros de interesse)
Parâmetros: valores reais, mas geralmente desconhecidos
tempo esperado (médio) de resposta;
i tempo esperado (médio) de resposta
sob o tratamento i;
i = i - efeito devido ao tratamento i.
Parâmetros: valores reais, mas geralmente desconhecidos
• Se Y é a variável aleatória que representa a observação do tempo de resposta, tem-se que Y deve ter uma certa densidade de probabilidade f. O parâmetro é o valor esperado desta distribuição: = E{Y}.
• Analogamente: 2 = Var{Y}
• Yi = observação sob o tratamento i, então
i = E{Yi} , i2 = Var{Yi} e i = E{Yi - Y}
tratamento
(1) (2) (3)
y11 y21 y31
y12 y22 y32
... ... ...
y1n y2n y3n
Média: .1y .2y .3y
Médiaglobal:
..yEstatísticas
Parâmetros 1 2 3
O efeito i = i - pode ser estimado pela estatística:
... yyi
Estimativas de
tratamento
(1) (2) (3)
y11 y21 y31
y12 y22 y32
... ... ...
y1n y2n y3n
Média: .1y .2y .3y
Médiaglobal:
..y
ijiij ey i = 1, 2, 3j = 1, 2, ..., n
observaçãoefeito do tratamento i
médiaglobal
erro aleatório
= média do fator iii
Hipóteses
• H0: 1 = 2 =...= g = 0 ou µ1 = µ2 =...= µg
• H1: i 0 ou µi µj
para algum i para algum par (i,j)
ijiij ey ijij ey
As observaçõesSob H1: Sob H0:
Sob H0: 1 = 2 =...= g = 0
ijiij ey ijij ey
Sob H1: i 0 para algum i
ijiij ey
Suposições da ANOVA
• As observações são independentes e provêm de distribuições normais com a mesma variância.
• Observa-se que o teste é razoavelmente robusto a estas suposições.
Análise de variância (ANOVA) com um fator
Tratamento
Replicação 1 2 ... g
1 y11 y21... yg1
2 y12 y22... yg2
... ... ... ... ...
n y1n y2n... ygn
Soma y1. y2.... yg.
Média ...
i
iyy ...
.1y .2y .gy i
iyg
y .1
..
g
i
n
jijTot yySQ
1 1
2..
gl = N - 1onde: N = ng
Soma de quadrados total: Graus de liberdade:
Análise de variância (ANOVA) com um fator
Tratamento
Replicação 1 2 ... g
1 y11 y21... yg1
2 y12 y22... yg2
... ... ... ... ...
n y1n y2n... ygn
Soma y1. y2.... yg.
Média ...
i
iyy ...
.1y .2y .gy i
iyg
y .1
..
gl = g - 1
g
ii
g
i
n
jiTrat yynyySQ
1
2...
1 1
2...
Soma de quadrados dos tratamentos: Graus de liberdade:
Análise de variância (ANOVA) com um fator
Tratamento
Replicação 1 2 ... g
1 y11 y21... yg1
2 y12 y22... yg2
... ... ... ... ...
n y1n y2n... ygn
Soma y1. y2.... yg.
Média ...
i
iyy ...
.1y .2y .gy i
iyg
y .1
..
gl = N - g
g
i
n
jiijErro yySQ
1 1
2.
Soma de quadrados do erro: Graus de liberdade:
Análise de variância (ANOVA) com um fator
Fórmulas equivalente às anteriores
Erro
Trat
QM
QMF
Estatística do teste (possíveis valores da razão f):
Graficamente
Graficamente
Teste F• Se H0: 1 = 2 =...= g = 0 for verdadeira, a estatística F tem
distribuição F com (g - 1) graus de liberdade no
numerador e (N - g) graus de liberdade no denominador.Densidade de probabilidade F
possíveis valores da estatística F, sob H 0
dens
idad
e de
pro
babi
lidad
e
0,00
0,25
0,50
0,75
0 1 2 3 4
f
valor p
Regra de decisão
• p
• p >
rejeita H0 (prova-se
estatisticamente H1)
aceita H0 (os dados não
mostram evidência para
afirmar H1)
= nível de significância (probab. tolerável de se rejeitar Ho quando esta for verdadeira)
Usual: = 0,05 = 5%
Exemplo 1: Comparação de três tipos de rede.
• Considere o problema de comparar 3 tipos de rede de
computadores, C1, C2 e C3, em termos do tempo médio
de transmissão de pacotes de dados entre duas
máquinas.
• Experimento (projeto completamente aleatorizado
com um fator): 8 replicações com cada tipo de rede,
aleatorizando a ordem dos 24 ensaios e mantendo fixos
os demais fatores controláveis.
Dados do experimento
Tipo de rede
Replicação C1 C2 C3
1 7,2 7,8 6,3
2 9,3 8,2 6,0
3 8,7 7,1 5,3
4 8,9 8,6 5,1
5 7,6 8,7 6,2
6 7,2 8,2 5,2
7 8,8 7,1 7,2
8 8,0 7,8 6,8
Soma 65,7 63,5 48,1
Média 8,21 7,94 6,01
Exemplo 1Análise de variância (ANOVA)
O teste F rejeita H0, ou seja, existe alguma diferença significativa entre os tratamentos
Fonte da variação SQ gl QM f
Entre grupos 22,99 2 11,50 21,07
Dentro dos grupos 11,46 21 0,55
Total 34,45 23
f = 21,07 valor p < 0,01
Verificação das suposições: análise dos resíduos
(i = 1, 2, ..., g; j = 1, 2, ..., n).iijij yye Resíduos:
Tempo de resposta Resíduos
Replicação C1 C2 C3 C1 C2 C3
1 7,2 7,8 6,3 -1,01 -0,14 0,29
2 9,3 8,2 6 1,09 0,26 -0,01
3 8,7 7,1 5,3 0,49 -0,84 -0,71
4 8,9 8,6 5,1 0,69 0,66 -0,91
5 7,6 8,7 6,2 -0,61 0,76 0,19
6 7,2 8,2 5,2 -1,01 0,26 -0,81
7 8,8 7,1 7,2 0,59 -0,84 1,19
8 8 7,8 6,8 -0,21 -0,14 0,79
Média 8,21 7,94 6,01 0,00 0,00 0,00
Verificação das suposições: análise dos resíduos
Resíduos x fator
C1 C2 C3
Rede
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
Res
íduo
s
Verificação das suposições: análise dos resíduos
Gráfico de probabilidade normal
-1 0 1
Resíduos
-3
-2
-1
0
1
2
3
Val
or e
sper
ado
pela
nor
mal
0,01
0,05
0,15
0,35
0,55
0,75
0,95
0,99
Verificação das suposições: Normalidade
Kolmogorov-Smirnov
Jarque-Beta
D’Agostino-Pearson
Shapiro-Wilk
Lilliefors
Anderson-Darling
Cramer-von Mises
Verificação das suposições: Normalidade Kolmogorov-Smirnov
máx máx1
D g2n
Estatística do Teste
i 0,5g F z F
0,5
i 0,5F
n
gmáx : maior valor calculado de g;
n : tamanho da amostra ou número de parcelas.
F(zi): função de distribuição normal acumulada;
i: número da amostra;
Normalidade Kolmogorov-Smirnov
Tabela 2.2. Valores Críticos da Distribuição Dn
Verificação das suposições: Kolmogorov-Smirnov
Para n>40
Verificação das suposições: Normalidade Shapiro-Wilk
Estatística do Teste
1 – Ordenar em ordem crescente as n observações da amostra2 – Calcular:
3 – Calcular:
Se N é ímpar, despreza-se a observação mediana
Normalidade Shapiro-Wilk
Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.
Normalidade Shapiro-Wilk
Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.
Normalidade Shapiro-Wilk
Tabela 2.3.Coeficientes N-i+1 para o teste de normalidade W de Shapiro-Wick.
Normalidade Shapiro-Wilk
Normalidade Shapiro-Wilk
4 – Calcular a estatística de teste:.
Valores Críticos da Distribuição W da Estatística Shapiro-Wi
Normalidade D’Agostino-Pearson
Normalidade D’Agostino-Pearson
Normalidade D’Agostino-Pearson
Teste de HomocedasticidadeTeste de Hartley
Estatística do Teste:
2max
max 2min
SF
S
onde Smax e Smin são, respectivamente, os valores
máximo e mínimo de desvio padrão estimados para as n amostras.
Rejeitar H0 se Fmax > F(,a,N-1)
Teste de HomocedasticidadeTeste de Cochran
Estatística do Teste:
Rejeitar H0 se C > C(,a,N-1), com:
2max
a2i
i 1
SC
S
1
C( ,a, n)1 a 1 F (1 ) / a, (a 1)*a,n
Teste de HomocedasticidadeTeste de Bartlett
Estatística do Teste:
onde é o índice de significância do teste, a é o número de amostras sendo testadas e ni é o número de observações da i-ésima amostra.
Rejeitar H0 se 2 2c a 1
2i i 2
i i ii2
c
i i
n 1 Sn 1 ln n 1 ln S
n 1
1 1 11
3 a 1 n 1 n 1
Teste de HomocedasticidadeTeste de Levene
Estatística do Teste:
onde é o índice de significância do teste, k é o número de amostras sendo testadas e ni é o número de observações da i-ésima amostra.
Rejeitar H0 se
Estimação das médias
Tempo de resposta
C1 C2 C3
Média 8,21 7,94 6,01
Médias amostrais sob cada tratamento:
Estimação das médias
n
QMtyIC erro
ii .),(
Fonte da variação SQ gl QM f
Entre grupos 22,99 2 11,50 21,07
Dentro dos grupos 11,46 21 0,55
Total 34,45 23
ANOVA:
55,021,88
55,008,221,8%)95,( 1 IC
Estimação das médias
C1 C2 C3
Rede
5,0
5,5
6,0
6,5
7,0
7,5
8,0
8,5
9,0
9,5
Te
mp
o d
e t
ran
sm
issã
o
Estimativas, através de intervalos de 95% de confiança, para o tempo esperado de transmissão, em três tipos de rede.
O teste consiste em calcular um valor (Dcrít), acima do qual, a diferença entre duas médias amostrais (em absoluto) é significativamente diferente de zero.
, 1 1
2Tr n r
críti j
qD QME
n n
Teste de Tukey (teste para comparação múltipla)
Utilizado quando se deseja comparar todos os pares de médias de r populações, adotando-se um único nível de confiança.
H0 :H1:
0i j 0i j i j
onde representa o valor tabelado (vindo de uma distribuição da amplitude studentizada – “studentized range”) associado ao nível de significância adotado.
, Tr n rq
Distribuição da Amplitude Studentizada
,( ) 0,05r g tabP q q
g
r
onde, F(1−α ) é o quantil de probabilidade (1-α) da distribuição :
Teste de Scheffé (teste para comparação múltipla)
Neste teste a hipótese nula H0: μi = μj é rejeitada se:
Teste de contraste (teste para comparação múltipla)
Um contraste C é uma combinação linear dos totais yi, que permite a comparação das médias dos tratamentos.
a
iii ycC
1
a
iic
1
0
C,1,n a
E
SSF F
MS