Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas...
Transcript of Sérgio Mário Lins Galdino. Estimativas não-tendenciosos e Estimativas Eficientes Estimativas...
Probabilidade e Estatística Básica:Um curso para inocentes com o
companheiro R Ministrado por um bobo.
Teoria da Estimação
Sérgio Mário Lins Galdino
Estimativas não-tendenciosos e Estimativas Eficientes
Estimativas pontuais e Estimativas Intervalares
Estimativas do Intervalo de Confiança dos Parâmetros da População
Intervalos de Confiança para Médias Intervalos de Confiança para Proporções Intervalos de Confiança para Diferenças e
Somas
Agenda
Uma estimativa é não tendenciosa quando a média ou esperança da estatística é igual ao parâmetro da população.
Quando duas estatísticas da distribuição amostral tem mesma média, a estatística coma menor variância é a mais eficiente.
Estatística eficiente e não tendenciosa nem sempre é possível
Estimativas não-tendenciosos e Estimativas Eficientes
Um estimador pontual de um parâmetro populacional é dado por um único valor.
Um estimador intervalar de um parâmetro populacional é dado por dois números (limites inferior e superior) no qual o parâmetro é considerado pertencer.
Exemplo: Temperatura: 28ºC (pontual) Temperatura: 28±2 (intervalar)
Estimativas pontuais e Estimativas Intervalares
Estimativas do Intervalo de Confiança dos Parâmetros da População
Sejam s e s a média e o desvio padrão (erro padrão) da distribuição amostral de uma estatística amostral S. Assumindo S normalmente distribuída ( n ≥ 30, lei dos grandes números). Espera-se encontrar S nos intervalos
s ± s , s ±2 s e s ± 3s em cerca de 68,27%, 98,45% e 99,83% das vezes.
Estimativas do Intervalo de Confiança dos Parâmetros da População
Os números extremos dos intervalosS1.96s e S2.58s, são chamados limites de confiança 1- 95% e 99% (ou 0.95 e 0.99). Os números 1.96, 2.98, etc. são os valores críticos (zc).
Exemplo: > LC= 0.95> ZC = qnorm(1 - (1-LC)/2)> ZC[1] 1.959964
Limite de confiança
99 98 96 95 90 80 50
zc 2.58 2.33 2.05 1.96 1.645 1.28 0.6745
Estimativas do Intervalo de Confiança dos Parâmetros da População
O limite de confiança (1-)100% onde [0, 1] (LC = 1- ) pode-se determinar um z com∗
P (−z∗ < z < z∗) = 1 − α
z∗ é chamado de z1−α/2 . Em R ele é calculado pela função qnorm
> alpha = c(0.01,0.02,0.04,0.05,0.10,0.20,0.5)> zasterisco = qnorm(1 - alpha/2)> zasterisco[1] 2.5758293 2.3263479 2.0537489 1.9599640 1.6448536 1.2815516 0.6744898>
Amostras grandes ( n ≥ 30). Os limites de confiança para a média da população
são
no caso de uma população infinita, ou por
no caso de amostragem com reposição de uma população finita,
Intervalos de Confiança para Médias
nZX C
1
N
nN
nZX C
Exemplo: Encontre os limites de confiança de 95% e 99% de uma amostra de tamanho 30 com média 1.82 e desvio padrão amostral 0.17.
Resposta: Os limites de confiança de 95% são
> qnorm(1-(1-0.95)/2)*0.17/sqrt(30)[1] 0.0608326>
no caso de amostragem com reposição de uma população finita,
Intervalos de Confiança para Médias
06.082.130
17.096.182.1
Os limites de confiança de 99% são
> qnorm(1-(1-0.99)/2)*0.17/sqrt(30)[1] 0.07994759>
Intervalos de Confiança para Médias
08.082.130
17.058.282.1
Amostras pequenas (n < 30) e População Normal.
Usa-se a distribuição T (t de Student) para obtenção dos limites de confiança.
Por exemplo -t0.95 e t0.95 são os valores de T para os quais 5% da área pertence a cada lado da distribuição T
Intervalos de Confiança para Médias
95.095.0 ˆtn
S
Xt
Amostras pequenas (n < 30) e População Normal. pode ser estimado pertencer ao intervalo
com 95% de confiança. Os limites de confiança são
com tc obtido por tabela ou calculado
Intervalos de Confiança para Médias
n
StX
n
StX
ˆˆ975.0975.0
n
StX c
ˆ
Amostras pequenas (n < 30) e População Normal.
Exemplo: Os valores de tc em R são calculado pela função qt.
> qt(.975, df = c(1:10,20,50,100,1000)) [1] 12.706205 4.302653 3.182446 2.776445 2.570582
2.446912 2.364624 2.306004 2.262157 2.228139 2.085963
[12] 2.008559 1.983972 1.962339>
Intervalos de Confiança para Médias
Amostras pequenas (n < 30) e População Normal.
Exemplo:x=c(175, 176, 173, 175, 174, 173, 173, 176, 173,
179)n=length(x)xm=mean(x)df=n-1tc=qt(0.975,df)delta.x=tc*sd(x)/sqrt(n)x.inf=xm-delta.xx.sup=xm+delta.x
Intervalos de Confiança para Médias
Amostras pequenas (n < 30) e População Normal.
Exemplo(continuação)># Intervalo de confiança de 95%> x.inf[1] 173.3076> x.sup[1] 176.0924> # Média de x> xm[1] 174.7> xm/sd(x)*sqrt(10)[1] 283.8161>
Intervalos de Confiança para Médias
Amostras pequenas (n < 30) e População Normal.
Exemplo(continuação)> t.test(x)
One Sample t-test
data: x
t = 283.8161, df = 9, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
173.3076 176.0924
sample estimates:
mean of x
174.7
>
Intervalos de Confiança para Médias
Suponha que a estatística S é a proporção de “sucesso” em uma amostra de tamanho n≥30 extraída de uma população binomial em que p é a proporção de sucessos (i. é., probabilidade de sucesso).
Os limites de confiança para a proporção da população são dadas por
para uma amostra de população infinita, ou uma amostra com reposição de uma população finita.
Intervalos de Confiança para Proporções
n
ppzP
n
pqzP cc
)1(
(continuação)
Os limites de confiança para a proporção da população são dadas por
se a amostragem é sem reposição , de uma população finita de tamanho N.
Intervalos de Confiança para Proporções
1
N
nNzP
n
pqzP cc
(continuação) Exemplo: Uma amostra aleatória de 600 eleitores de certo
distrito eleitoral dá 55% como favoráveis a determinado candidato A. Determine limites de confiança para a proporção global de eleitores favoráveis ao candidato na base de 99%.
Os limites de confiança de 99% para população são
Conclusão: O candidato A está com 99% de chance para vencer as eleições
Intervalos de Confiança para Proporções
04.055.01000
45.055.058.255.0
)1(58.2
n
ppPP PP
Intervalos de Confiança para Diferenças e Somas
222121 2121 SScSSc zSSzSS
222121 2121 SScSSc zSSzSS
Se S1 e S2 são duas estatísticas amostrais com distribuições amostrais aproximadamente normais, a expressão
dá limites de confiança para as diferenças dos parâmetros populacionais, e
dá os limites de confiança para a soma dos parâmetros populacionais, desde que as amostras sejam independentes.
No caso de populações infinitas
dá limites de confiança para as diferenças dos parâmetros
populacionais onde são as respectivas médias, desvios padrões e tamanhos das duas amostras populacionais.
Analogamente,
dá os limites de confiança para a soma dos parâmetros populacionais, desde que as amostras sejam independentes.
Intervalos de Confiança para Diferenças e Somas
222121
2121 XXcXXc zXXzXX
2
22
1
112121
)1()1(21 n
pp
n
ppzPPzPP cPPc
22111 ,,,, 2 nXenX