Estatística Aula 14: Distribuição normal Prof. Diovani Milhorim.
Distribuição Normal Propriedades: 1 - Uma distribuição normal é unimodal (uma moda), simétrica...
Transcript of Distribuição Normal Propriedades: 1 - Uma distribuição normal é unimodal (uma moda), simétrica...
Distribuição NormalPropriedades:
1 - Uma distribuição normal é unimodal (uma moda), simétrica (lado direito e esquerdo são idênticos) e tem a forma de um sino, com a altura máxima coincidindo com a média;
2 - Uma distribuição normal é contínua, onde “X” é assumido ser uma variável contínua;
3 - Uma distribuição normal é assimptótica ao eixo “X”: quanto mais a curva se afasta da média, mais próximo ela chega do valor zero; mas nunca chega ao valor zero absoluto.
4 - A área sob a curva totaliza 1, portanto, …
Distribuição Normal
… portanto, é possível estimar a propabilidade de ocorrência de eventos … com base na área sob a curva
Área = 1
Distribuição Normal Padrão Y e X 1
2
2 22
( ) /
Onde: = 0 = 1
+/- 1 desvio padrão = 68,2%+/- 2 desvios padrão = 95,5%+/- 3 desvios padrão = 99,7%
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,00 0,500 0,504 0,508 0,512 0,516 0,520 0,524 0,528 0,532 0,536
0,10 0,540 0,544 0,548 0,552 0,556 0,560 0,564 0,567 0,571 0,575
0,20 0,579 0,583 0,587 0,591 0,595 0,599 0,603 0,606 0,610 0,614
0,30 0,618 0,622 0,626 0,629 0,633 0,637 0,641 0,644 0,648 0,652
0,40 0,655 0,659 0,663 0,666 0,670 0,674 0,677 0,681 0,684 0,688
0,50 0,691 0,695 0,698 0,702 0,705 0,709 0,712 0,716 0,719 0,722
0,60 0,726 0,729 0,732 0,736 0,739 0,742 0,745 0,749 0,752 0,755
0,70 0,758 0,761 0,764 0,767 0,770 0,773 0,776 0,779 0,782 0,785
0,80 0,788 0,791 0,794 0,797 0,800 0,802 0,805 0,808 0,811 0,813
0,90 0,816 0,819 0,821 0,824 0,826 0,829 0,831 0,834 0,836 0,839
1,00 0,841 0,844 0,846 0,848 0,851 0,853 0,855 0,858 0,860 0,862
1,10 0,864 0,867 0,869 0,871 0,873 0,875 0,877 0,879 0,881 0,883
1,20 0,885 0,887 0,889 0,891 0,893 0,894 0,896 0,898 0,900 0,901
1,30 0,903 0,905 0,907 0,908 0,910 0,911 0,913 0,915 0,916 0,918
1,40 0,919 0,921 0,922 0,924 0,925 0,926 0,928 0,929 0,931 0,932
1,50 0,933 0,934 0,936 0,937 0,938 0,939 0,941 0,942 0,943 0,944
1,60 0,945 0,946 0,947 0,948 0,949 0,951 0,952 0,953 0,954 0,954
1,70 0,955 0,956 0,957 0,958 0,959 0,960 0,961 0,962 0,962 0,963
1,80 0,964 0,965 0,966 0,966 0,967 0,968 0,969 0,969 0,970 0,971
1,90 0,971 0,972 0,973 0,973 0,974 0,974 0,975 0,976 0,976 0,977
2,00 0,977 0,978 0,978 0,979 0,979 0,980 0,980 0,981 0,981 0,982
2,10 0,982 0,983 0,983 0,983 0,984 0,984 0,985 0,985 0,985 0,986
2,20 0,986 0,986 0,987 0,987 0,987 0,988 0,988 0,988 0,989 0,989
2,30 0,989 0,990 0,990 0,990 0,990 0,991 0,991 0,991 0,991 0,992
2,40 0,992 0,992 0,992 0,992 0,993 0,993 0,993 0,993 0,993 0,994
2,50 0,994 0,994 0,994 0,994 0,994 0,995 0,995 0,995 0,995 0,995
2,60 0,995 0,995 0,996 0,996 0,996 0,996 0,996 0,996 0,996 0,996
2,70 0,997 0,997 0,997 0,997 0,997 0,997 0,997 0,997 0,997 0,997
2,80 0,997 0,998 0,998 0,998 0,998 0,998 0,998 0,998 0,998 0,998
2,90 0,998 0,998 0,998 0,998 0,998 0,998 0,998 0,999 0,999 0,999
3,00 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999
3,10 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999 0,999
Distribuição Normal Padrão
Para calcular a área:- adiciona as área se os valores “z”estão em lados opostos da média;- subtrai se os valores estão do mesmo lado da média.
Cálculo da Área
Distribuição Normal: a mais usada em estatística indutiva ...
Probabilidade e Distribuição Estatística
Distribuição estatística: distribuição que representa todos os resultados possíveis de um particular evento.
Ex: soma de dois dados
2 3 4 5 6 7 8 9 10 11 12
SOMA
0
1
2
3
4
5
6
Fre
quên
cia
Qual a probabilidade de 10, 11 e 12?
Soma Freq/Total Probabilidade 10 3/36 .083 11 2/36 .056 12 1/36 .028
P(10 ou 11 ou 12) = P(10) + P(11) + P(12) = .083 + .056 + .028 = .167
Distribuição Normal e Distribuição Estatística
Qual é a probabilidade de ocorrência de um valor entre 50 e 60?
Distribuição Normal:N =15.000 = 60 = 10
1 desvio padrão => 0,3413 ou 34,13%
Qual é a probabilidade de ocorrência de um valor maior que 80 ou menor que 40?
z80 = +2z40 = - 2
2 desvios padrão = 0,0228 ou 2,28%, então>80 ou < 40 = 0,0228 + 0,0228 = 0,0456 ou 4,56 %
Distribuição Normal Padrão
Valores de “z”Y e X 1
2
2 22
( ) /
Onde: = 0 = 1
Variáveis observadas na prática apresentam valores cujas áreas não estão tabeladas … entretanto é possível transformar valores observados (x) em valores de z
Distribuição Normal Padrão
Valores de “z”
onde:x = valores da variável observada = média = desvio padrão
x
z
Distribuição Normal padronizada e, portanto, com área conhecida ...
Estatística Aplicada à Motricidade
Teste de Hipóteses
J. A. Barela & E. Kokubun
Encontro #2
Estatística Inferencial
nós precisamos de estatística INFERENCIAL
(indutiva)
Aula anterior … foi discutido estatística descritiva
entretanto ...
permite tirar conclusões probabilisticas sobre uma população
com base em resultados verificados em amostras retiradas desta população
Estatística Inferencial:
Estatística Inferencial
Estatística Inferencial tem dois objetivos:• testar hipóteses• estimar parâmetros
População com
Parâmetros
Amostra com
Estatística*
Distribuição Estatística*
Probabilidade
SeleçãoAleatória
Inferência
* estatísitica => formulações teóricas
Estatística Inferencial
Para utilizar estatística inferencial:
1 - A amostra precisa ser selecionada aleatoriamente;
2 - Qualquer estimativa da amostra deve ser comparada com estimativas baseadas em pressupostos de uma distribuição (geralmente normal);
3 - Baseada nesta comparação e a probabilidade associada com resultados esperados quando a amostra é obtida aleatoriamente, inferências podem ser realizadas sobre parâmetros (população).
Teste de
Hipóteses
Realizar inferências sobre a natureza da população com base em observações de
amostras retiradas desta população (estatística inferencial).
Não rejeita a hipótese
Qual é a magnitude da diferença entre o valor
observado e o parâmetro hipotético?
População:valor do
parâmetro hipotético
Amostra:valor observado (estatístico)
Rejeita a hipótese
Selecion
ada
aleatoriamen
te
=455
X=535
DIF
EREN
ÇA
PEQ
UEN
A
DIFER
ENÇ
A
GR
AN
DE
Teste de Hipótese
Envolve quatro passos:
1 - Formular a hipótese;
2 - Decidir o critério para rejeitar esta hipótese;
3 - Computar o teste estatístico
4 - Decidir se rejeita ou aceita a hipótese
1 - Formulação de hipótese
Hipótese: conjectura sobre um ou mais parâmetros da população
a ser testada Hipótese nula H0
Hipótese de nenhum
relacionamento ou diferençaEx: H0: = 455 ou
H0: - 455 = 0
Hipótese alternativaHa
Hipótese que cobre o possível resultado
não coberto pela hipótese nulaEx: Ha: 455 ou
Ha: - 455 0
A hipótese alternativa geralmente considera a hipótese da pesquisa e pode ser aceita somente se a a hipótese nula for rejeitada
Teste de Hipótese
2 - Critério para Rejeição da Hipótese
O quão diferente as médias precisam ser para que a hipótese nula seja rejeitada?
Resposta relacionadaa três conceitos
1 - erros no teste de hipóteses2 - nível de significância3 - região de rejeição
Teste de Hipótese
2 - Critério para Rejeição da Hipótese
Erros no Teste de Hipóteses
Quatro possíveis decisões testando hipóteses:
1 - Uma hipótese verdadeira é rejeitada
2 - Uma hipótese verdadeira não é rejeitada
3 - Uma hipótese falsa não é rejeitada
4 - Uma hipótese falsa é rejeitada
Decisão correta
Decisão correta
Erro Tipo I
Erro Tipo II
Teste de Hipótese
Teste de Hipótese 2 - Critério para Rejeição da Hipótese
ERRO TIPO IProbabilidade:
Hipótese Nulaé Verdadeira
Hipótese Nulaé Falsa
RejeitaHipótese Nula
Não RejeitaHipótese Nula
Problema:
Não é possível eliminar a possibilidade de realizar um erro no teste de hipótese MAS é possível controlar um erro ou outro!!!
ERRO TIPO IIProbabilidade:
Decisão CorretaProbabilidade: 1 -
Decisão CorretaProbabilidade: 1 - (poder estatístico)
Erros no Teste de Hipóteses
Teste de Hipótese 2 - Critério para Rejeição da Hipótese
Exemplo:
Testando duas drogas:D1 - nova droga caríssimaD2 - droga utilizadaH0: D1 = D2
As condições específicas da situação experimental determinam que tipo de erro é mais sério
Erro Tipo I: nova droga não é melhor mas H0 é rejeitada=> nova droga será usada
Erro Tipo II: nova droga é melhor mas H0 é aceita=> nova droga não será usada
Erros no Teste de Hipóteses
Teste de Hipótese 2 - Critério para Rejeição da Hipótese
Nível de Significância
= 0,05 e 0,01 são os mais utilizados em nossa área
ou alpha () é definido como a probabilidade de realizar um erro do Tipo I no teste de hipóteses (uma hipótese
verdadeira é rejeitada)
o pesquisador assume o risco que a decisão de rejeitar a hipótese pode estar incorreta 5% ou 1% das vezes,
respectivamente.
Teste de Hipótese 2 - Critério para Rejeição da Hipótese
Região de Rejeição
Representa a proporção da área na distribuição amostral que é igual à probabilidade de rejeição da hipótese nula, se ela é verdadeira
= 0,05 = 0,01
A região de rejeição é ___________ com =0,05 do que com =0,01, portanto, será
Influência do alpha
Teste de Hipótese
Região de Rejeição
H0: = 455Ha: < 455
Unidirecional
H0: = 455Ha: > 455
Bidirecional
H0: = 455Ha: 455
=0,05
Valores críticos = 1.96
Valor crítico =+ 1.645
Valor crítico =- 1.645
Influência da Hipótese
Teste de Hipótese
Valores Críticos do Teste Estatístico (mais comuns) usando uma distribuição normal
Nível de Significância Nível de Significância Valores Críticos Teste de 2-caudas Teste de 1-cauda do Teste Estatístico
.20 .10 1.282
.10 .05 1.645
.05 .025 1.960
.02 .01 2.326
.01 .005 2.576
.001 .0005 3.291
Teste de Hipótese 2 - Critério para Rejeição da Hipótese
Região de Rejeição
Exemplo:• Amostra com distribuição normal• = 455• x = 8,33• = 0,05
Representa a proporção da área na distribuição amostral que é igual à probabilidade de rejeição da hipótese nula
se ela é verdadeira
- x = (455 - 8,33) = 446,67 - 2x = (455 - 2 * 8,33) = 438,33
+ x = (455 + 8,33) = 463,33 + 2x = (455 + 2 * 8,33) = 471,67
Problema: Qual é a área entre 2x?
A resposta é 0,9544, acima de 95%.
Teste de Hipótese Critério para Rejeição da Hipótese
Região de Rejeição
- 1,96x = 455 - (1,96 * 8,33) = 438,67 + 1,96x = 455+ (1,96 * 8,33) = 471,33
Exemplo:• Amostra com distribuição normal• = 455• x = 8,33• = 0,05
Onde: 1,96 corresponde a 0,025 daárea - Valor Tabela de Dist. Normal
Região de rejeição: área da distribuição que representa os valores da amostra que são improváveis se a hipótese nula é verdadeira
Região de aceite: área dos valores prováveis se a hipótese nula é verdadeira
Teste de Hipótese
2 - Critério para Rejeição da Hipótese
Nível de Significância? = 0,05 = 0,01
Região de RejeiçãoBidirecionalUnidirecional
Que tipo de erro?Erro Tipo IErro tipo II
Poder estatístico…
mais tarde
Teste de Hipótese
3 - Computando o Teste Estatístico
x
n Erro Padrão da Média
zX
x
1 - Calcular o escore padrão (z calculado)
6,933,8
455535
z
A média da amostra observada (X=535) está 9,6 erros padrão acima da média da população (455).
Exemplo:• = 455• n = 144• X = 535• = 100
Teste de Hipótese
4 - Decidindo sobre a H0
Uma vez que o valor observado (+9,6) excede o valor crítico (1,96), a probabilidade é menor que 0,05 que a média da amostra teria ocorrido
por change se a hipótese nula fosse verdadeira (p<0,05).
A hipótese nula é rejeitada e. consequentemente, a hipótese alternativa é aceita
Exemplo:• = 455• n = 144• X = 535• = 100
A média da amostra observada (X=535) está 9,6 erros padrão acima da média da população (455).
Teste de Hipótese
4 - Computando o Teste Estatístico
zX
x
2,1
33,8
455465
z
1,2
Uma vez que o valor observado (+1,2) está abaixo do valor crítico (1,96), a probabilidade é maior que 0,05 que a média da amostra teria
ocorrido por chance se a hipótese nula fosse verdadeira (p>0,05).
A hipótese nula é aceita
Outro Exemplo:• = 455• n = 144• X = 465• = 100
Teste de Hipótese
Distribuição “t” Student
Para amostra pequena:• distribuição difere da distribuição normal• distribuição muda com o tamanho da amostra• aproxima da normal conforme o tamanho da amostra aumenta
Gosset (1906) e Gosset & Fischer (1926): fórmula para estas distribuições
As distribuições “t” são famílias de distribuições simétricas e com formas de sino que mudam conforme
o tamanho da amostra muda
Teste de Hipótese
Distribuição “t” Student
Graus de Liberdade: é o número de observações menos o número de restrições colocados sobre eles
Ex: a média de 2 números = 50, então apenas um número precisa ser conhecido para que o outro possa ser determinado
n-1= 2 -1 = 1 gl
Teste de Hipótese
Distribuição “t” Student
É realizado da mesma forma que usando uma distribuição normal. Apenas a área sob a curva é ajustada de acordo com os Graus de Liberdade (Tabela A2)
Gl = 15
Gl acima de 120, distribuição normal e “t” são consideradas iguais
Poder estatístico
“Power”
Poder estatístico: probabilidade de rejeitar a hipótese nula quando ela é falsa (1-)
Se uma hipótese nula é falsa
PROBLEMA: e, consequentemente, 1- podem ser determinados apenas quando valores forem especificados para ambas hipóteses: nula e alternativa
ERRO TIPO II
(não rejeitar uma hipótese falsa)
probabilidade
Decisão Correta
probabilidade
1 -
(rejeitar uma hipótese falsa)
Poder estatístico
Exemplo:• = 455• n = 144• = 100• =0,05• unidirecional
Necessidade de especificar valores para H0 e Ha:
H0: = 455
Ha: = 465Poder estatístico do teste em determinar
essa diferença de 10 pontos
Valor padrão para o valor crítico da amostra:
+ 1,645x = 455+ (1,645 * 8,33) = 468,70
=455468,70
Poder estatístico(cont. exemplo anterior)
=455468,70
=465
zX
x
44,033,8
46570,468
z
z=0,44Área cinza () = 0,67Área clara (1-)= 0,33
Poder estatístico: 0,33 (33%) probabilidade de detectar uma diferença de 10 pontos
Poder estatístico
“Power”
Fatores que afetam:
• Natureza da direção da Ha: (uni- ou bi-direcional)
• Nível de significância ()
• Tamanho da amostra (n)
• Tamanho do efeito (effect size)
Poder estatístico
Natureza da direção da Ha
(mesmo exemplo anterior mas bi-direcional)
16,333,8
46567,438
z
área (esquerda)=0,4992
76,033,8
46533,471
z
área (direita)=0,2764
= 0,4992 + 0,2764 = 0,7756
1- = 1 - 0,7756 = 0,2244 (22%)
Com todos os fatores constantes, testes unidirecionais têm poder
estatístico maior que bi-direcionais
Poder estatístico
Nível de significância ()
(mesmo exemplo anterior unidirecional mas com =0,1)
área (esquerda)=0,5
08,033,8
46568,465
z
área (direita)=0,0319
= 0,5 + 0,0319 = 0,5319
1- = 1 - 0,5319 = 0,4681 (46%)Com todos os fatores constantes,
aumentando o valor de , aumenta o poder estatístico
Poder estatístico
Tamanho da amostra (n)
x
n Erro Padrão da Média
n=576
Exemplo anterior:• = 455• n = 144• X = 465• = 100
33,8144
100x
Exemplo novo:• = 455• n = 576• X = 465• = 100
16,4576
100x
Poder estatístico
Tamanho da amostra (n)
(exemplo anterior unidirecional, =0,05, mas
n=576)
75,017,4
46586,461
z
área (esquerda)=0,2734
= 0,5 - 0,2734 = 0,2266
1- = 1 - 0,2266 = 0,7734 (77%)
Com todos os fatores constantes, aumentando o tamanho da amostra (n) o erro padrão diminui, aumenta o poder estatístico
Poder estatístico
Tamanho do efeito
76,033,8
47570,468
z
área (esquerda)=0,2764
= 0,5 - 0,2764 = 0,2236
1- = 1 - 0,2236 = 0,7764 (77%)
Com todos os fatores constantes, aumentando o tamanho do efeito, aumenta o poder estatístico
(exemplo anterior unidirecional, =0,05, n=100,
mas X=475)