Download - Intervalos de Confiança

Transcript

TAD - PUC-Rio, 1999

Intervalos de Confiança

TAD - PUC-Rio, 1999

Testes de significância

• em vários casos que olhamos supusemos que a diferença entre tratamentos, se houvesse, seria positivapor exemplo, no caso de solados, supusemos que

B poderia causar maior desgaste que A, mas nunca que A poderia causar maior desgaste que B.

• para considerar diferenças positivas e negativas, usamos o fato que a distribuição t é simétrica.

TAD - PUC-Rio, 1999

Testes de dois lados

• hipótese nula: média das diferenças é 0• hipótese alternativa: média é diferente de 0

– Pr(t>3,4) com 9 graus de liberdade 0,004– Pr(|t|>3,4) com 9 graus de liberdade 0,008

TAD - PUC-Rio, 1999

hipóteses de interesse

• nem sempre a hipótese nula é o que nos interessa• podemos admitir alguma degradação no desgaste

considerando a economia proporcionada por B• nesse caso usamos a mesma quantidade

(d - m)/sd/(n)1/2 com o valor que admitirmos para a diferença de desgastes.– por ex: (0,41-0,1)/0,12 = 2,6– Pr(t>2,6) 0,008– Pr(|t|>2,6) 0,008

TAD - PUC-Rio, 1999

média da população

• poderíamos construir uma tabela com os níveis de significância para cada possível valor da média das diferenças

valor hipotético da média nível de significância

0,00 0,008 0,10 0,029

TAD - PUC-Rio, 1999

Intervalos de Confiança

• Um intervalo de confiança expressa a idéia de que temos um determinado nível de confiança em que a média se encontra naquele intervalo.

• A idéia é: se a média real estiver fora desse intervalo, as chances de observarmos as amostras que observamos de fato seriam muito pequenas...

TAD - PUC-Rio, 1999

intervalo de confiança é o limite de aceitação: médias que implicariam numa probabilidade menor que para a média amostral observada ficam fora do intervalo de

confiança. =5% => intervalo de confiança (1- ), ie, 95%

média amostral

TAD - PUC-Rio, 1999

tamanho do intervalo de confiança

• Quanto maior o valor de , maior o grau de exigência para um valor ficar dentro do intervalo de confiança.

• Quanto maior o valor de , menor o intervalo de confiança.

TAD - PUC-Rio, 1999

tamanho do intervalo de confiança

TAD - PUC-Rio, 1999

Cálculo de intervalo de confiança

• no exemplo do solado:• Supondo que queremos um intervalo de 95%

procuramos na tabela da distribuição t um valor v tal que Pr(|t|>v)=0,05

v=2,262 |(0,41-m)/0,12|<2,262 -2,62*0,12 -0,41 < m < 2,26*0,12 -0,410,41-0,27 < m < 0,41+0,27

TAD - PUC-Rio, 1999

Cálculo de intervalo de confiança

• de forma geral, dada uma média amostral m, o intervalo de confiança (1-) é dado por:[m-t /2 sd/(n)1/2,m+ t /2 sd/(n)1/2 ]

onde t /2 é o valor para o qual temos uma tail-area /2

• podemos também calcular qual deve ser o tamanho da amostra para um determinado intervalo de confiança

TAD - PUC-Rio, 1999

cálculo do tamanho da amostra

• Supondo que consideramos aceitável uma margem de erro de r%:[m-mr/100,m+mr/100][m-t /2 sd/(n)1/2,m+ t /2 sd/(n)1/2 ]

t /2 sd/(n)1/2 =mr/100 (n)1/2 =100 t /2 sd /mr n = (100 t /2 sd /mr)2

não conhecemos sd, mas podemos usar um experimento preliminar para estimá-lo

TAD - PUC-Rio, 1999

intervalos de confiança x testes de significância

• O descarte ou não da hipótese nula está incluído na informação dada pelo ic.

• Uma vez descartada a hipótese nula, o ic fornece informação sobre a dimensão da diferença de médias.

TAD - PUC-Rio, 1999

intervalos de confiança em projetos sem pares

• podemos usar as mesmas quantidades que foram usadas para fazer o teste t

TAD - PUC-Rio, 1999

números diferentes de experimentos

• Jardineiro quer testar fertilizantes A e B para plantas de tomates…B é fertilizante novo

• Ele tem 11 lotes disponíveis, e resolve tratar 6 deles com B e 5 com A

TAD - PUC-Rio, 1999

Médias

posição 1 2 3 4 5 6 7 8 9 10 11

método Á A B B A B B B A A B

tempo 29,9 11,4 26,6 23,7 25,3 28,5 14,2 17,9 16,5 21,1 24,3

A B

29,9 26,6

11,4 23,7

25,3 28,5

16,5 14,2

21,1 17,9

24,3

20,84 22,53

TAD - PUC-Rio, 1999

teste t

• Com amostras aleatórias de uma população com distribuição normal, comparamos a quantidade

((yB-yA) - (B - A))/s1/nA + 1/nB)1/2

com a distribuição t com nA + nB - 2 graus de liberdade

• podemos usar a mesma quantidade para cálculo do intervalo de confiança

TAD - PUC-Rio, 1999

intervalo de confiança

• substituindo em– ((yB-yA) - (B - A))/s1/nA + 1/nB)1/2

(1,69 - (B - A))/3,82– para um intervalo de 95%, aceitamos as

diferenças tais queabs((1,69-)/3,82) < 2,262

[1,69-8,64, 1,69+8,64]

[d-t /2 sd/(1/na+1/nb)1/2,d+ t /2 sd/(1/na+1/nb )1/2 ]

TAD - PUC-Rio, 1999

Análise de variância

comparação de k métodos

TAD - PUC-Rio, 1999

comparação de 3 tratamentos

• com o experimento (randomizado) abaixo, queremos saber se alguma das dietas representa um diferença real...

dieta médiaA 610 635 580 701 640 632 633B 595 614 550 602 633 612 601C 527 621 564 598 601 593 584 média global 606tabela 1: ganhos de pesos com 3 dietas

• idéia é trabalhar com os diferenças para as médias, e estabelecer parcelas dessas diferenças devidas ao tratamento

TAD - PUC-Rio, 1999

somas de quadrados

• diferenças (desvios) da média global

dieta A 4 29 -26 95 34 26B -11 8 -56 -4 27 6C -79 15 -42 -8 -5 -13tabela 2: desvios da média global

soma total dos quadrados dos desvios das médias:

(soma dos quadrados) (4)2+ (29)2+(-26) 2 +... = 24980

TAD - PUC-Rio, 1999

entre tratamentos• imaginando que em cada tratamento todos os resultados foram iguais:

A 633 633 633 633 633 633B 601 601 601 501 601 601C 584 584 584 584 584 584 média global 606tabela 3: pesos sem discrepâncias intra dieta

A 27 27 27 27 27 27 B -5 -5 -5 -5 -5 -5C -22 -22 -22 -22 -22 -22tabela 4: desvios da média global sem discrepâncias

as diferenças para a média seriam:

soma dos quadrados entre tratamentos: 7428

TAD - PUC-Rio, 1999

intra tratamentos

• desvios da média de cada tratamento

A -23 2 -53 68 7 -1 B -6 13 -51 1 32 11C -57 37 -20 14 17 9tabela 5: desvios entre pesos reais epesos sem discrepâncias intra dieta

soma dos quadrados dos desvios: 17552soma de quadrados de desvios intra tratamentosoma de quadrados residualsoma de quadrados dos erros

17552+7428=24980!!!

TAD - PUC-Rio, 1999

graus de liberdade

• Para usar essas quantidades em testes de hipótese temos precisamos dos graus de liberdade.

• para N observações, consideramos, no cálculo da variância, que a média está fixa, e logo que temos N-1 graus de liberdade

– para a soma de quadrados entre tratamentos:• trabalhamos com 3 valores (tabelas 3 e 4), logo temos 2

graus de liberdade– para a soma de quadrados intra tratamento:

• para cada dieta, 5 graus de liberdade (tabela 5)

TAD - PUC-Rio, 1999

Média dos desvios quadrados

• Se dividirmos cada soma de quadrados pelos graus de liberdade correspondentes temos uma medida da variação correspondente.

• Se as médias das populações com dietas diferentes não diferem, a média dos desvios dentro de uma dieta deve ser parecida com a média dos desvios entre dietas!

• Quão diferentes as médias têm que ser para acreditarmos numa diferença entre as méidas das populações...