COMPARAÇÃO DE DUAS POPULAÇÕES Spencer Barbosa da Silva DEEST.

COMPARAÇÃO DE DUAS POPULAÇÕES

Spencer Barbosa da SilvaDEEST

- Suponha que estamos interessados em comparar duas populações com relação às suas médias.

- Queremos realizar um teste de hipóteses onde a hipótese nula é

Ho: µ1 = µ2

e a hipótese a aternativa é

Ha: µ1 ≠ µ2

ou

Ha: µ1 > µ2

ou

Ha: µ1 < µ2

Erros associados ao teste de hipóteses

α = P(erro Tipo I) = P(rejeitar Ho| Ho verdadeira) = nível de significância

β = P(erro Tipo II) = P(não rejeitar Ho| Ho falsa)

1 - β = 1- P(não rejeitar Ho| Ho falsa) = P(rejeitar Ho| Ho falsa) = poder do teste

Ho verdadeira Ho falsa

Rejeitar Ho Erro Tipo I Sem erroDecisão

Não rejeitar Ho Sem erro Erro Tipo II

Situação

- A região de rejeição de Ho (Ho: µ1 = µ2) depende da hipótese alternativa.

Ha: µ1 ≠ µ2

Rejeitamos Ho se o modulo da estatistica de teste for maior que um valor critico. O valor critico é positivo e a area acima dele é igual a α/2.

Ha: µ1 > µ2Rejeitamos Ho se a estatistica de teste for maior que um valor critico. O valor critico é positivo e a area acima dele é igual a α.

Ha: µ1 < µ2Rejeitamos Ho se a estatistica de teste for menor que um valor critico. O valor critico é negativo e a area abaixo dele é igual a α.

- Como vimos, se o nível de significância muda, a região critica também muda.

- No entanto podemos concluir um teste de hipóteses com base no valor-p, que não muda com o nível de significância.

- O valor-p é uma probabilidade que depende de Ha.

- Se valor-p <= α rejeitamos Ho. Se valor-p > α não rejeitamos Ho.


Ha: µ1 > µ2

Rejeitamos Ho se a estatistica de teste for maior que um valor critico. O valor critico é positivo e a area acima dele é igual a α.

valor-p = P (estatistica de teste > estatistica de teste observada)

Ha: µ1 < µ2

Rejeitamos Ho se a estatistica de teste for menor que um valor critico. O valor critico é negativo e a area abaixo dele é igual a α.

valor-p = P (estatistica de teste < estatistica de teste observada)


Ha: µ1 ≠ µ2

Rejeitamos Ho se o modulo da estatistica de teste for maior que um valor critico. O valor critico é positivo e a area acima dele é igual a α/2.

i) se a estatistica de teste observada é negativa:

valor-p = 2x P(estatistica de teste < estatistica de teste observada)

ii) se a estatistica de teste observada é positiva:

valor-p = 2x P(estatistica de teste > estatistica de teste observada)

- Considere que tomamos uma amostra de tamanho n1 da população 1 e uma amostra de tamanho n2 da população 2.

- Vamos estudar testes paramétricos para as hipóteses estabelecidas, ou seja, testes que só podem ser realizados quando as duas amostras vierem de populações Normais.

- Caso as duas amostras não venham de população Normal mas tenham tamanhos grandes (maior ou igual a 30), os testes paramétricos ainda são válidos.

- Caso alguma das amostras seja pequena e não venha de população precisamos realizar um teste de hipótese não paramétrico.

- Aqui vamos considerar que as duas amostras vem de distribuição Normal e vamos trabalhar com amostras pequenas.

Amostras pareadas x Amostras independentes

Duas amostras são ditas pareadas quando a medida de interesse é

feita para cada unidade amostral em dois momentos diferentes.

A vantagem de trabalhar com amostras pareadas é eliminar possíveis

fontes de confundimento.

CASO 1: Amostras dependentes (teste t pareado)

Exemplo: Queremos comparar a gasolina tradicional com um novo

tipo de combustível. 12 carros são primeiramente abastecidos com a

gasolina tradicional e mede-se o rendimento em km por litro. Em

seguida, os 12 carros são abastecidos com o novo combustível e mede-

se o rendimento em km por litro.

Automovel 1 2 3 4 5 6 7 8 9 10 11 12Novo combustivel 11,6 8,8 9,9 9,5 11,6 9,1 10,6 10,8 13,4 10,6 10,5 11,4Gasolina tradicional 8,1 7,9 6,8 7,8 7,6 7,9 5,7 8,4 8,0 9,5 8,0 6,8D=novo-tradicional 3,5 0,9 3,1 1,7 4,0 1,2 4,9 2,4 5,4 1,1 2,5 4,6

Vamos testar as hipóteses

Ho: µn = µt

Ho: µn - µt = µD = 0 (o novo combustivel não altera o rendimento)

Ha: µn > µt

Ha: µn - µt = µD > 0 (o novo combustivel aumenta o rendimento)

Como a variância populacional é desconhecida nosso teste será

baseado na distribuição t com n-1 graus de liberdade.

Nossa estatística de teste é

Para α = 0,05 o valor crítico da tabela t com 11 graus de liberdade é

1,80.

Como t>1,80 rejeitamos a hipótese nula, ou seja, a amostra

fornece evidencia de que o novo combustível é eficaz na melhora do

rendimento.

48,6

124,2

09,2

/

ns

Dt

D

D

valor-p = P(t>6,84)=1- P(t<6,84)= 1-0,9995=0,0005

Para α = 0,05 rejeitamos a hipótese nula, ou seja, a amostra


rendimento.



rendimento.

valor-p < alfa: rejeito a hipótese nula ao nivel alfa de significancia, ou

seja, as duas populaçõess tem variancias diferentes.

valor-p > alfa: não rejeito a hipótese nula ao nivel alfa de significancia,

ou seja, as duas populaçõess tem variancias iguais.

CASO 2: Amostras independentes com variâncias populacionais

conhecidas (teste Z)

Exemplo: Queremos comparar dois medicamentos. 15 pacientes

receberam o medicamento A e mediu-se o tempo até a cura (em dias).

15 pacientes receberam o medicamento B e mediu-se o tempo até a

cura (em dias).

Sabe-se que a variância populacional do tempo de cura para, tanto para

o medicamento A quanto para o medicamento B, é de 10 dias.

Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15Medicamento A 182 185 193 175 184 192 175 173 186 178 162 179 164 182 186Medicamento B 192 176 176 190 197 190 186 193 100 115 185 180 190 186 194


Ho: µA = µB

Ho: µA - µB = 0 (a eficiência dos dois tratamentos é a mesma)

Ha: µA ≠ µB

Ha: µA - µB ≠ 0 (a eficiência dos dois tratamentos não é a mesma)

Como a variância populacional é conhecida nosso teste será baseado

na distribuição Normal.


Para α = 0,05 o valor crítico da tabela Normal é 1,960.

Como |Z|>1,96 rejeitamos a hipótese nula, ou seja, a amostra

fornece evidencia de que a eficiência dos dois tratamentos não é a

mesma.

65,2

1510

1510

67,17773,17922

B

B

A

A

BA

nn

xxZ

valor-p = 2P(Z>2,65) = 2P(Z< -2,65) = 2.0,004 = 0,008



mesma.



mesma.

CASO 3: Amostras independentes com variâncias populacionais

desconhecidas (teste t)

a) Variâncias populacionais iguais (σ1= σ2)


receberam o medicamento A e mediu-se o tempo até a cura (em dias).

15 pacientes receberam o medicamento B e mediu-se o tempo até a

cura (em dias).

Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15Medicamento A 182 185 193 175 184 192 175 173 186 178 162 179 164 182 186Medicamento B 192 176 176 190 197 190 186 193 100 115 185 180 190 186 194


Ho: µA = µB

Ho: µA - µB = 0 (a eficiência dos dois tratamentos é a mesma)

Ha: µA > µB

Ha: µA - µB > 0 (tratamento B é mais eficiente que tratamento A)


baseado na distribuição t com n1+n2-2 graus de liberdade.


onde

BAp

BA

nns

xxt

112

2

)1()1(

21

22

212

nn

snsns BAp

Então

Para α = 0,05 o valor crítico da tabela t com 28 graus de liberdade é

1,701.

Como t>1,701 rejeitamos a hipótese nula, ou seja, a amostra

fornece evidencia de que o tratamento B é mais eficiente que o

tratamento A.

51,11

151

151

2,457

67,17773,179

112

BAp

BA

nns

xxt

2,45721515

67,834.1478,79.14

2

)1()1(

21

22

212

nn

snsns BAp

valor-p = P(t>11,51)=1- P(t<11,51) =1-1= 0



tratamento A.



tratamento A.

b) Variâncias populacionais diferentes (σ1 ≠ σ2)


receberam o medicamento 1 e mediu-se o tempo até a cura (em dias).

12 pacientes receberam o medicamento 2 e mediu-se o tempo até a

cura (em dias).

Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13Medicamento 1 182 185 193 175 184 192 175 173 186 178 162 179 164Medicamento 2 192 196 176 190 197 190 186 193 148 127 185 189

39,45875,180

91,8808,179

222

211

sx

sx


Ho: µ1 = µ2

Ho: µ1 - µ2 = 0 (a eficiência dos dois tratamentos é a mesma)

Ha: µ1 < µ2

Ha: µ1 - µ2 < 0 (tratamento 1 é mais eficiente que tratamento 2)


baseado na distribuição t com v graus de liberdade.

1/

1/

//

2

2

222

1

2

121

2

2221

21

nns

nns

nsnsv


25,0

1239,458

1391,88

75,18008,179

2

22

1

21

21

ns

ns

xxt

85,14

11212/39,458

11313/91,88

12/39,45813/91,88

1/

1/

//

22

2

2

2

222

1

2

121

2

2221

21

v

nns

nns

nsnsv

Para 5% de significância, o valor critico da tabela t com 15 graus de

liberdade é -1,753.

Como t=-0,25 não é menor que -1,753, não rejeitamos Ho. Ou seja, a

amostra fornece evidencia de que a eficiência dos dois tratamentos é a

mesma.

valor-p = P(t < -0,25) = P(t > 0,25) = 1- P(t < 0,25) =1-0,6=0,4

Para α = 0,05 não rejeitamos a hipótese nula, ou seja, a amostra

fornece evidencia de que a eficiência dos dois tratamentos é a mesma.

Para α = 0,01 não rejeitamos a hipótese nula, ou seja, a amostra

fornece evidencia de que a eficiência dos dois tratamentos é a mesma.

Testes Paramétricos para comparação de duas médias

Amostras Dependentes

Teste t pareado gl = n-1

Amostras Independentes

Variâncias populacionais conhecidas

Variâncias populacionais desconhecidas

Teste Z

Iguais

Diferentes

Teste t

gl = n1+ n2-2

Teste t

gl = v

Testes paramétricos aplicáveis se as duas populações seguem distribuição Normal. Caso as duas amostras sejam grandes (n>=30), testes paramétricos são validos mesmo se a distribuição não é Normal.

Teste F para comparação de duas variâncias

Ho: σ21 = σ2

2 Ha: σ21 ≠ σ2

2

A estatística de teste é

22

21

s

sF

Regiao de rejeicao de Ho

Rejeitamos Ho se a estatistica F for menor que valor critico 1(f1) oumaior que valor critico 2 (f2).

Os dois valores criticos (f1 e f2) sao positivos e podem ser obtidos natabela F (n1-1 graus de liberdade no numerador e n2-1 graus deliberdade no denominador).

f1 < f2

A area abaixo de f1 é igual a α/2 e a área acima de f2 é igual a α/2.

Teste de Normalidade

Ho: a amostra vem de uma população com distribuição Normal

Ha: a amostra não vem de uma população com distribuição Normal

valor-p < alfa: rejeito a hipótese nula ao nivel alfa de significancia, ou

seja, a amostra não vem de uma população com distribuição Normal.

valor-p > alfa: não rejeito a hipótese nula ao nivel alfa de significancia,

ou seja, a amostra vem de uma população com distribuição Normal.

Teste Z para duas proporções

Suponha agora que estamos interessados em comparar duas populações com às suas proporções.

Queremos realizar um teste de hipóteses onde a hipótese nula é

Ho: p1 = p2

e a hipótese a aternativa é

Ha: p1 ≠ p2 ou Ha: p1 > p2 ou Ha: p1 < p2

A estatitsica de teste é

O teste Z para proporcoes pode ser usado se n1 > 30 e n2>30.

21

^

22

^

11^

21

^^

^

2

^

1

)/1/1)(1(nn

pnpnp

nnpp

ppZ

COMPARAÇÃO DE DUAS POPULAÇÕES Spencer Barbosa da Silva DEEST.

Documents

Transcript of COMPARAÇÃO DE DUAS POPULAÇÕES Spencer Barbosa da Silva DEEST.