COMPARAÇÃO DE DUAS POPULAÇÕES Spencer Barbosa da Silva DEEST.
Transcript of COMPARAÇÃO DE DUAS POPULAÇÕES Spencer Barbosa da Silva DEEST.
COMPARAÇÃO DE DUAS POPULAÇÕES
Spencer Barbosa da SilvaDEEST
- Suponha que estamos interessados em comparar duas populações com relação às suas médias.
- Queremos realizar um teste de hipóteses onde a hipótese nula é
Ho: µ1 = µ2
e a hipótese a aternativa é
Ha: µ1 ≠ µ2
ou
Ha: µ1 > µ2
ou
Ha: µ1 < µ2
Erros associados ao teste de hipóteses
α = P(erro Tipo I) = P(rejeitar Ho| Ho verdadeira) = nível de significância
β = P(erro Tipo II) = P(não rejeitar Ho| Ho falsa)
1 - β = 1- P(não rejeitar Ho| Ho falsa) = P(rejeitar Ho| Ho falsa) = poder do teste
Ho verdadeira Ho falsa
Rejeitar Ho Erro Tipo I Sem erroDecisão
Não rejeitar Ho Sem erro Erro Tipo II
Situação
- A região de rejeição de Ho (Ho: µ1 = µ2) depende da hipótese alternativa.
Ha: µ1 ≠ µ2
Rejeitamos Ho se o modulo da estatistica de teste for maior que um valor critico. O valor critico é positivo e a area acima dele é igual a α/2.
Ha: µ1 > µ2Rejeitamos Ho se a estatistica de teste for maior que um valor critico. O valor critico é positivo e a area acima dele é igual a α.
Ha: µ1 < µ2Rejeitamos Ho se a estatistica de teste for menor que um valor critico. O valor critico é negativo e a area abaixo dele é igual a α.
- Como vimos, se o nível de significância muda, a região critica também muda.
- No entanto podemos concluir um teste de hipóteses com base no valor-p, que não muda com o nível de significância.
- O valor-p é uma probabilidade que depende de Ha.
- Se valor-p <= α rejeitamos Ho. Se valor-p > α não rejeitamos Ho.
- Se valor-p <= α rejeitamos Ho. Se valor-p > α não rejeitamos Ho.
Ha: µ1 > µ2
Rejeitamos Ho se a estatistica de teste for maior que um valor critico. O valor critico é positivo e a area acima dele é igual a α.
valor-p = P (estatistica de teste > estatistica de teste observada)
Ha: µ1 < µ2
Rejeitamos Ho se a estatistica de teste for menor que um valor critico. O valor critico é negativo e a area abaixo dele é igual a α.
valor-p = P (estatistica de teste < estatistica de teste observada)
- Se valor-p <= α rejeitamos Ho. Se valor-p > α não rejeitamos Ho.
Ha: µ1 ≠ µ2
Rejeitamos Ho se o modulo da estatistica de teste for maior que um valor critico. O valor critico é positivo e a area acima dele é igual a α/2.
i) se a estatistica de teste observada é negativa:
valor-p = 2x P(estatistica de teste < estatistica de teste observada)
ii) se a estatistica de teste observada é positiva:
valor-p = 2x P(estatistica de teste > estatistica de teste observada)
- Considere que tomamos uma amostra de tamanho n1 da população 1 e uma amostra de tamanho n2 da população 2.
- Vamos estudar testes paramétricos para as hipóteses estabelecidas, ou seja, testes que só podem ser realizados quando as duas amostras vierem de populações Normais.
- Caso as duas amostras não venham de população Normal mas tenham tamanhos grandes (maior ou igual a 30), os testes paramétricos ainda são válidos.
- Caso alguma das amostras seja pequena e não venha de população precisamos realizar um teste de hipótese não paramétrico.
- Aqui vamos considerar que as duas amostras vem de distribuição Normal e vamos trabalhar com amostras pequenas.
Amostras pareadas x Amostras independentes
Duas amostras são ditas pareadas quando a medida de interesse é
feita para cada unidade amostral em dois momentos diferentes.
A vantagem de trabalhar com amostras pareadas é eliminar possíveis
fontes de confundimento.
CASO 1: Amostras dependentes (teste t pareado)
Exemplo: Queremos comparar a gasolina tradicional com um novo
tipo de combustível. 12 carros são primeiramente abastecidos com a
gasolina tradicional e mede-se o rendimento em km por litro. Em
seguida, os 12 carros são abastecidos com o novo combustível e mede-
se o rendimento em km por litro.
Automovel 1 2 3 4 5 6 7 8 9 10 11 12Novo combustivel 11,6 8,8 9,9 9,5 11,6 9,1 10,6 10,8 13,4 10,6 10,5 11,4Gasolina tradicional 8,1 7,9 6,8 7,8 7,6 7,9 5,7 8,4 8,0 9,5 8,0 6,8D=novo-tradicional 3,5 0,9 3,1 1,7 4,0 1,2 4,9 2,4 5,4 1,1 2,5 4,6
Vamos testar as hipóteses
Ho: µn = µt
Ho: µn - µt = µD = 0 (o novo combustivel não altera o rendimento)
Ha: µn > µt
Ha: µn - µt = µD > 0 (o novo combustivel aumenta o rendimento)
Como a variância populacional é desconhecida nosso teste será
baseado na distribuição t com n-1 graus de liberdade.
Nossa estatística de teste é
Para α = 0,05 o valor crítico da tabela t com 11 graus de liberdade é
1,80.
Como t>1,80 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que o novo combustível é eficaz na melhora do
rendimento.
48,6
124,2
09,2
/
ns
Dt
D
D
valor-p = P(t>6,84)=1- P(t<6,84)= 1-0,9995=0,0005
Para α = 0,05 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que o novo combustível é eficaz na melhora do
rendimento.
Para α = 0,01 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que o novo combustível é eficaz na melhora do
rendimento.
valor-p < alfa: rejeito a hipótese nula ao nivel alfa de significancia, ou
seja, as duas populaçõess tem variancias diferentes.
valor-p > alfa: não rejeito a hipótese nula ao nivel alfa de significancia,
ou seja, as duas populaçõess tem variancias iguais.
CASO 2: Amostras independentes com variâncias populacionais
conhecidas (teste Z)
Exemplo: Queremos comparar dois medicamentos. 15 pacientes
receberam o medicamento A e mediu-se o tempo até a cura (em dias).
15 pacientes receberam o medicamento B e mediu-se o tempo até a
cura (em dias).
Sabe-se que a variância populacional do tempo de cura para, tanto para
o medicamento A quanto para o medicamento B, é de 10 dias.
Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15Medicamento A 182 185 193 175 184 192 175 173 186 178 162 179 164 182 186Medicamento B 192 176 176 190 197 190 186 193 100 115 185 180 190 186 194
Vamos testar as hipóteses
Ho: µA = µB
Ho: µA - µB = 0 (a eficiência dos dois tratamentos é a mesma)
Ha: µA ≠ µB
Ha: µA - µB ≠ 0 (a eficiência dos dois tratamentos não é a mesma)
Como a variância populacional é conhecida nosso teste será baseado
na distribuição Normal.
Nossa estatística de teste é
Para α = 0,05 o valor crítico da tabela Normal é 1,960.
Como |Z|>1,96 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que a eficiência dos dois tratamentos não é a
mesma.
65,2
1510
1510
67,17773,17922
B
B
A
A
BA
nn
xxZ
valor-p = 2P(Z>2,65) = 2P(Z< -2,65) = 2.0,004 = 0,008
Para α = 0,05 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que a eficiência dos dois tratamentos não é a
mesma.
Para α = 0,01 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que a eficiência dos dois tratamentos não é a
mesma.
CASO 3: Amostras independentes com variâncias populacionais
desconhecidas (teste t)
a) Variâncias populacionais iguais (σ1= σ2)
Exemplo: Queremos comparar dois medicamentos. 15 pacientes
receberam o medicamento A e mediu-se o tempo até a cura (em dias).
15 pacientes receberam o medicamento B e mediu-se o tempo até a
cura (em dias).
Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15Medicamento A 182 185 193 175 184 192 175 173 186 178 162 179 164 182 186Medicamento B 192 176 176 190 197 190 186 193 100 115 185 180 190 186 194
Vamos testar as hipóteses
Ho: µA = µB
Ho: µA - µB = 0 (a eficiência dos dois tratamentos é a mesma)
Ha: µA > µB
Ha: µA - µB > 0 (tratamento B é mais eficiente que tratamento A)
Como a variância populacional é desconhecida nosso teste será
baseado na distribuição t com n1+n2-2 graus de liberdade.
Nossa estatística de teste é
onde
BAp
BA
nns
xxt
112
2
)1()1(
21
22
212
nn
snsns BAp
Então
Para α = 0,05 o valor crítico da tabela t com 28 graus de liberdade é
1,701.
Como t>1,701 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que o tratamento B é mais eficiente que o
tratamento A.
51,11
151
151
2,457
67,17773,179
112
BAp
BA
nns
xxt
2,45721515
67,834.1478,79.14
2
)1()1(
21
22
212
nn
snsns BAp
valor-p = P(t>11,51)=1- P(t<11,51) =1-1= 0
Para α = 0,05 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que o tratamento B é mais eficiente que o
tratamento A.
Para α = 0,01 rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que o tratamento B é mais eficiente que o
tratamento A.
b) Variâncias populacionais diferentes (σ1 ≠ σ2)
Exemplo: Queremos comparar dois medicamentos. 13 pacientes
receberam o medicamento 1 e mediu-se o tempo até a cura (em dias).
12 pacientes receberam o medicamento 2 e mediu-se o tempo até a
cura (em dias).
Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13Medicamento 1 182 185 193 175 184 192 175 173 186 178 162 179 164Medicamento 2 192 196 176 190 197 190 186 193 148 127 185 189
39,45875,180
91,8808,179
222
211
sx
sx
Vamos testar as hipóteses
Ho: µ1 = µ2
Ho: µ1 - µ2 = 0 (a eficiência dos dois tratamentos é a mesma)
Ha: µ1 < µ2
Ha: µ1 - µ2 < 0 (tratamento 1 é mais eficiente que tratamento 2)
Como a variância populacional é desconhecida nosso teste será
baseado na distribuição t com v graus de liberdade.
1/
1/
//
2
2
222
1
2
121
2
2221
21
nns
nns
nsnsv
Nossa estatística de teste é
25,0
1239,458
1391,88
75,18008,179
2
22
1
21
21
ns
ns
xxt
85,14
11212/39,458
11313/91,88
12/39,45813/91,88
1/
1/
//
22
2
2
2
222
1
2
121
2
2221
21
v
nns
nns
nsnsv
Para 5% de significância, o valor critico da tabela t com 15 graus de
liberdade é -1,753.
Como t=-0,25 não é menor que -1,753, não rejeitamos Ho. Ou seja, a
amostra fornece evidencia de que a eficiência dos dois tratamentos é a
mesma.
valor-p = P(t < -0,25) = P(t > 0,25) = 1- P(t < 0,25) =1-0,6=0,4
Para α = 0,05 não rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que a eficiência dos dois tratamentos é a mesma.
Para α = 0,01 não rejeitamos a hipótese nula, ou seja, a amostra
fornece evidencia de que a eficiência dos dois tratamentos é a mesma.
Testes Paramétricos para comparação de duas médias
Amostras Dependentes
Teste t pareado gl = n-1
Amostras Independentes
Variâncias populacionais conhecidas
Variâncias populacionais desconhecidas
Teste Z
Iguais
Diferentes
Teste t
gl = n1+ n2-2
Teste t
gl = v
Testes paramétricos aplicáveis se as duas populações seguem distribuição Normal. Caso as duas amostras sejam grandes (n>=30), testes paramétricos são validos mesmo se a distribuição não é Normal.
Teste F para comparação de duas variâncias
Ho: σ21 = σ2
2 Ha: σ21 ≠ σ2
2
A estatística de teste é
22
21
s
sF
Regiao de rejeicao de Ho
Rejeitamos Ho se a estatistica F for menor que valor critico 1(f1) oumaior que valor critico 2 (f2).
Os dois valores criticos (f1 e f2) sao positivos e podem ser obtidos natabela F (n1-1 graus de liberdade no numerador e n2-1 graus deliberdade no denominador).
f1 < f2
A area abaixo de f1 é igual a α/2 e a área acima de f2 é igual a α/2.
Teste de Normalidade
Ho: a amostra vem de uma população com distribuição Normal
Ha: a amostra não vem de uma população com distribuição Normal
valor-p < alfa: rejeito a hipótese nula ao nivel alfa de significancia, ou
seja, a amostra não vem de uma população com distribuição Normal.
valor-p > alfa: não rejeito a hipótese nula ao nivel alfa de significancia,
ou seja, a amostra vem de uma população com distribuição Normal.
Teste Z para duas proporções
Suponha agora que estamos interessados em comparar duas populações com às suas proporções.
Queremos realizar um teste de hipóteses onde a hipótese nula é
Ho: p1 = p2
e a hipótese a aternativa é
Ha: p1 ≠ p2 ou Ha: p1 > p2 ou Ha: p1 < p2
A estatitsica de teste é
O teste Z para proporcoes pode ser usado se n1 > 30 e n2>30.
21
^
22
^
11^
21
^^
^
2
^
1
)/1/1)(1(nn
pnpnp
nnpp
ppZ