Teste de hipoteses
-
Upload
henrique2016 -
Category
Documents
-
view
323 -
download
1
Transcript of Teste de hipoteses
TESTE DE HIPÓTES
Trata-se de uma técnica para se fazer a inferência estatística sobre uma
população a partir de uma amostra
TEORIA POPPERIANA
• NÃO SE PODE PROVAR NADA, APENAS “DESPROVAR”.
• SÓ APRENDEMOS QUANDO ERRAMOS.• É MAIS FACIL REFUTAR DO QUE PROVAR
ALGUMA ASSERTIVA.• OS ESTATÍSTICOS NÃO PERGUNTAM QUAL
É A PROBABILIDADE DE ESTAREM CERTOS, MAS A PROBABILIDADE DE ESTAREM ERRADOS. Para fazerem isso estabelecem um hipótese nula.
PRINCIPAIS CONCEITOS
HIPÓTESE ESTATÍSTICATrata-se de uma suposição quanto ao valor de um parâmetro populacional, ou quanto à natureza da distribuição de probabilidade de uma variável populacional.
TESTE DE HIPÓTESEÉ uma regra de decisão para aceitar ou rejeitar uma
hipótese estatística com base nos elementos amostrais
PRINCIPAIS CONCEITOSTIPOS DE HIPÓTESES
Designa-se por Ho, chamada hipótese nula, a hipótese estatística a ser testada, e por H1, a hipótese alternativa. A HIPÓTESE NULA É UMA ASSERTIVA DE COMO O MUNDO DEVERIA SER, SE NOSSA SUPOSIÇÃO ESTIVESSE ERRADA.A hipótese nula expressa uma igualdade, enquanto a hipótese alternativa é dada por uma desigualdade.Ex: Ho - = 1,65 m
H1 - 1,65 m
TIPOS DE ERRO DE HIPÓTESE
EXISTEM DOIS TIPOS DE ERRO DE HIPÓTESE.
Erro tipo 1 - rejeição de uma hipótese verdadeira;
Erro tipo 2 – aceitação de uma hipótese falsa.As probabilidades desses dois tipos de erros são designadas
e .
A probabilidade do erro tipo I é denominada “nível de significância” do teste.
LÓGICA DO TESTE DE SIGNIFICÂNCIA
• ATRIBUEM-SE BAIXOS VALORES PARA , GERALMENTE 1-10%;
• FORMULA-SE Ho COM A PRETENSÃO DE REJEITÁ-LA, DAÍ O NOME DE HIPÓTESE NULA;
• SE O TESTE INDICAR A REJEIÇÃO DE Ho TEM-SE UM INDICADOR MAIS SEGURO DA DECISÃO;
• CASO O TESTE INDIQUE A ACEITAÇÃO DE Ho, DIZ-SE QUE, COM O NÍVEL DE SIGNIFICÂNCIA , NÃO SE PODE REJEITAR Ho.
ESTATÍSTICA NÃO PARAMÉTRICA
São extremamente interessantes para análises de dados qualitativos.
• As técnicas de estatística não paramétrica são particularmente adaptáveis aos dados das ciências do comportamento.
• A aplicação dessas técnicas não exige suposições quanto à distribuição da população da qual se tenha retirado amostras para análises.
• Podem ser aplicadas a dados que se disponham simplesmente em ordem, ou mesmo para estudo de variáveis nominais.Contrariamente à estatística paramétrica, onde as variáveis são, na maioria das vezes, intervalares.
• Exigem poucos cálculos e são aplicáveis para análise de pequenas amostras.
• Independe dos parâmetros populacionais e amostrais (média, variância, desvio padrão).
TIPOS DE TESTE
• Qui-Quadrado
• Teste dos sinais
• Teste de Wilcoxon
• Teste de Mann-Whitney
• Teste da Mediana
• Teste de Kruskal-Wallis
QUI-QUADRADO (2)
Testes de Adequação de amostras e Associação entre variáveis
QUI-QUADRADO (2)• Teste mais popular• Denominado teste de adequação ou ajustamento.
Usos 1. Adequação ou Aderência dos dados: freqüência
observada adequada a uma freqüência esperada);
2. Independência ou Associação entre duas variáveis Comportamento de uma variável depende de outra.
2 =
k
i Fei
FeiFoi
1
2)(
QUI-QUADRADO (2)
Restrições ao uso:
Se o número de classes é k=2, a freqüência esperada mínima deve ser 5;
Se k >2, o teste não deve ser usado se mais de 20% das freqüências esperadas forem abaixo de 5 ou se qualquer uma delas for inferior a 1.
ADEQUAÇÃO DOS DADOS
Exemplos:
1. avaliar se uma moeda ou um dado é honesto;
2. número de livros emprestados em um biblioteca durante os dias de uma determinada semana;
3. Tipo de sangue para uma determinada raça
ADEQUAÇÃO DOS DADOSPROCEDIMENTO
1. Enunciar as hipóteses (Ho e H1);
2. Fixar ; escolher a variável 2 com = (k-1). k é o número de eventos;
3. Com auxílio da tabela de 2, determinar RA (região de aceitação de Ho) e RC (região de rejeição de Ho)
2
ADEQUAÇÃO DOS DADOSEXEMPLO
Em 100 lances de moeda, observaram-se 65 coroas e 35 caras. Testar se a moeda é honesta.
1° Ho- a moeda é honesta;
H1- a moeda não é honesta;
2° = 5%; escolhe-se um 2, pois k = 2 e 2-1=1;
3° Determinação de RA e RC;
2 =
2 = (35-50)2/50 + (65-50)2/50=9
2tab
= 3,84, logo rejeita-se Ho.
A moeda não é honesta.
Eventos Cara Coroa
Freq. observada 35 65
Freq. Esperada 50 50
k
i Fei
FeiFoi
1
2)(
ADEQUAÇÃO DOS DADOS• 4 ocorrência de 4 tipos de sangue em uma dada raça
K=4, =3 e = 2,5%
2 =(230-180)2/180 + (470-480)2/480 + (170-200)2/200 + (130-140)2/140
2calc =16.04
2tab = 9,25
Logo rejeita-se Ho com 2,5% de probabilidade de erro.
Classes A B AB O
Freq. Observada 230 470 170 130
Freq. esperada 180 480 200 140
ADEQUAÇÃO DOS DADOS• Número de acidentes na rodovia, de acordo com o dia da semana
Freqüência esperada – 1/7 x 175 = 25
2calc =12,0
2tab=12,6
Logo aceita-se Ho com 95% de probabilidade de acerto.
Classes Seg Ter Qua Qui Sex Sab Dom
Número de acidentes 26 21 22 17 20 36 33
Classes Seg Ter Qua Qui Sex Sab Dom
Acidentes Observados 26 21 22 17 20 36 33
Acidentes esperados 25 25 25 25 25 25 25
INDEPENDÊNCIA OU ASSOCIAÇÃO ENTRE DUAS
VARIÁVEIS
EXEMPLOS• Dependência entre sabor de pasta de dente e o
bairro;• Notas dos alunos e nível salarial;• Efeito da vacinação em animais;
INDEPENDÊNCIA OU ASSOCIAÇÃO ENTRE DUAS
VARIÁVEISA representação das freqüências observadas é dada por uma tabela de
dupla entrada ou tabela de contingência.
PROCEDIMENTO
1. Ho: as variáveis são independentes;
H1: as variáveis são dependentes;
2. Fixar . Escolher a variável qui-quadrado com = (L-1) x (C-1), onde L = número de linhas da tabela de contingência e C+ número de colunas.
3. Com auxílio da tabela calculam-se RA e RC
INDEPENDÊNCIA OU ASSOCIAÇÃO
EXEMPLODependência entre bairro e escolha do sabor de pasta de denteDados:
Ho: a preferencia pelo sabor independe do bairro;H1: a preferência pelo sabor depende do
bairro
= 5%
2tab = = (4-1) x (3-1) = 6 graus de
liberdade
Freqüência esperada = (soma da linha i) x (soma da coluna J)/(total de observações)
2=
Sabor
Bairros
A B C
Limão 70 44 86 200
Chocolate 50 30 45 125
Hortelã 10 6 34 50
Menta 20 20 85 125
150 100 250 500
C
j
L
i Feij
FeijFoij
1
2
1
)(
INDEPENDÊNCIA OU ASSOCIAÇÃO
Tabela de freqüências esperadas Fe11 = 200 x 150/500 = 60
Fe12 = 200 x 100/500 = 40 Fe13 = 200 x 250/500 = 100 Fe21 = 125 x 150/500 = 37.5 Fe22 = 125 x 100/500 = 25 Fe23 = 125 x 250/500 = 62.5 Fe31 = 50 x 150/500 = 15 Fe32 = 50 x 100/500 = 10 Fe33 = 50 x 250/500 = 25
2cal
=37.88 Fe41 = 125 x 150/500 = 37.5
2tab =12.6 Fe42 = 125 x 100/500 = 25
Logo rejeita-se Ho Fe43 = 125 x 250/500 = 62,5
SABOR BAIRRO
A B C
(1)Limão 60 40 100
(2)Chocolate 37.5 25 62.5
(3)Hortelã 15 10 25
(4)Menta 37.5 25 62.5
TESTE DOS SINAIS
Análise de dados emparelhados
(O mesmo indivíduo é submetido a duas medidas)
TESTE DOS SINAIS• É utilizado na análise de dados emparelhados.
Situações em que o pesquisador deseja determinar se duas condições são diferentes.
• A variável pode ser intervalar ou ordinal.• O nome do teste dos sinais se deve ao fato de se
utilizar sinais + e – em lugar do dados numéricos.• A lógica do teste é que as condições podem ser
consideradas iguais quando as quantidades de + e _ forem aproximadamente iguais. Isto é, a proporção de + equivale 50%, ou seja: p=0,5.
TESTE DOS SINAIS
PROCEDIMENTO1. Ho: não há diferença entre os grupos, ou seja: p = 0,5;
H1: há diferença, ou seja: uma das alternativas
a) p 0,5 -Distribuição “z “bicaudal.
b) p 0,5 – Distribuição “z” unicaudal a esquerda.
c) p 0,5 – Distribuição “z” unicaudal a direita.
2. Fixar . Escolher a distribuição N(0,1) se n>25 ou Binomial se n 25.
3. Com auxílio da tabela, determinar-se RA e RC (para n > 25), caso n <25 utiliza-se distribuição binomial.
4. Cálculo do valor da variável Z
TESTE DOS SINAISExemplo: Sessenta alunos matricularam-se num curso de inglês. Na primeira aula aplica-se um teste que mede o conhecimento da língua. Após seis meses, aplica-se um segundo teste. Os resultados mostram que 35 alunos apresentaram melhora (35 +), 20 se conduziram melhor no primeiro teste (20 -) e 5 não apresentaram modificações (5 “0”).
Ho: O curso não alterou (p=0,50)
H1: O curso melhorou o conhecimento de inglês (p > 0,5).
= 5% (variável N(0,1).
Cálculo da variável “Z”.
Zcal = , onde:
y - número de sinais positivos (35);
n – tamanho da amostra descontado os empates (60-5=55);
p – 0,5
q – 1-p = 0,5 Zcal = = 2,02
Ztab= 1.64, logo rejeita Ho.
...
.
qpn
pny
)5,0()5,0(55
5,05535
xx
x
Teste de Wilcoxon
• É uma extensão do teste de sinais. É mais interessante pois leva em consideração a magnitude da diferença para cada par.
• Exemplo: um processo de emagrecimento em teste. Cada par no caso é o mesmo indivíduo com peso antes e depois do processo.
Teste Mann-Whitney
• É usado para testar se das amostras independentes foram retiradas de populações com média iguais.
• Trata-se de uma interessante alternativa ao teste paramétrico para igualdade de médias, pois o teste não exige considerações sobre a distribuição populacional. Aplicado à variáveis intervalares e ordinais.
• Exemplo: a média de vendas de dois shoppings são diferentes?.
Teste da mediana
• Trata-se de uma alternativa ao teste de Mann-Whitney. Testa as hipótese se dois grupos independentes possuem mesma mediana. Dados ordinais e intervalares.
Teste Kruskal-Wallis
• Trata-se de um teste para decidir se K amostras (K>2) independentes provêm de populações co médias iguais.
• Exemplo: testar, no nível de 5% de probabilidade, a hipótese de igualdade das médias para os três grupos de alunos que foram submetidos a esquemas diferentes de aulas. Notas para uma mesma prova. Aulas com recursos audiovisuais, aulas expositivas e aulas ensino programado.