Detecção de Anomalias e Estimação da Qualidade dos Dados ...
Teoria Da Estimação
-
Upload
joaoshotokan -
Category
Documents
-
view
223 -
download
0
description
Transcript of Teoria Da Estimação
![Page 1: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/1.jpg)
Probabilidade e Estatística Básica:Um curso para inocentes com o
companheiro R Ministrado por um bobo.
Teoria da Estimação
Sérgio Mário Lins Galdino
![Page 2: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/2.jpg)
Estimativas não-tendenciosos e Estimativas Eficientes
Estimativas pontuais e Estimativas Intervalares
Estimativas do Intervalo de Confiança dos Parâmetros da População
Intervalos de Confiança para Médias Intervalos de Confiança para Proporções Intervalos de Confiança para Diferenças e
Somas
Agenda
![Page 3: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/3.jpg)
Uma estimativa é não tendenciosa quando a média ou esperança da estatística é igual ao parâmetro da população.
Quando duas estatísticas da distribuição amostral tem mesma média, a estatística coma menor variância é a mais eficiente.
Estatística eficiente e não tendenciosa nem sempre é possível
Estimativas não-tendenciosos e Estimativas Eficientes
![Page 4: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/4.jpg)
Um estimador pontual de um parâmetro populacional é dado por um único valor.
Um estimador intervalar de um parâmetro populacional é dado por dois números (limites inferior e superior) no qual o parâmetro é considerado pertencer.
Exemplo: Temperatura: 28ºC (pontual) Temperatura: 28±2 (intervalar)
Estimativas pontuais e Estimativas Intervalares
![Page 5: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/5.jpg)
Estimativas do Intervalo de Confiança dos Parâmetros da População
Sejam s e s a média e o desvio padrão (erro padrão) da distribuição amostral de uma estatística amostral S. Assumindo S normalmente distribuída ( n ≥ 30, lei dos grandes números). Espera-se encontrar S nos intervalos
s ± s , s ±2 s e s ± 3s em cerca de 68,27%, 98,45% e 99,83% das vezes.
![Page 6: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/6.jpg)
Estimativas do Intervalo de Confiança dos Parâmetros da População
Os números extremos dos intervalosS1.96s e S2.58s, são chamados limites de confiança 1- 95% e 99% (ou 0.95 e 0.99). Os números 1.96, 2.98, etc. são os valores críticos (zc).
Exemplo: > LC= 0.95> ZC = qnorm(1 - (1-LC)/2)> ZC[1] 1.959964
Limite de confiança
99 98 96 95 90 80 50
zc 2.58 2.33 2.05 1.96 1.645 1.28 0.6745
![Page 7: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/7.jpg)
Estimativas do Intervalo de Confiança dos Parâmetros da População
O limite de confiança (1-)100% onde [0, 1] (LC = 1- ) pode-se determinar um z com∗
P (−z∗ < z < z∗) = 1 − α
z∗ é chamado de z1−α/2 . Em R ele é calculado pela função qnorm
> alpha = c(0.01,0.02,0.04,0.05,0.10,0.20,0.5)> zasterisco = qnorm(1 - alpha/2)> zasterisco[1] 2.5758293 2.3263479 2.0537489 1.9599640 1.6448536 1.2815516 0.6744898>
![Page 8: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/8.jpg)
Amostras grandes ( n ≥ 30). Os limites de confiança para a média da população
são
no caso de uma população infinita, ou por
no caso de amostragem com reposição de uma população finita,
Intervalos de Confiança para Médias
nZX C
1
NnN
nZX C
![Page 9: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/9.jpg)
Exemplo: Encontre os limites de confiança de 95% e 99% de uma amostra de tamanho 30 com média 1.82 e desvio padrão amostral 0.17.
Resposta: Os limites de confiança de 95% são
> qnorm(1-(1-0.95)/2)*0.17/sqrt(30)[1] 0.0608326>
no caso de amostragem com reposição de uma população finita,
Intervalos de Confiança para Médias
06.082.13017.096.182.1
![Page 10: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/10.jpg)
Os limites de confiança de 99% são
> qnorm(1-(1-0.99)/2)*0.17/sqrt(30)[1] 0.07994759>
Intervalos de Confiança para Médias
08.082.13017.058.282.1
![Page 11: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/11.jpg)
Amostras pequenas (n < 30) e População Normal.
Usa-se a distribuição T (t de Student) para obtenção dos limites de confiança.
Por exemplo -t0.95 e t0.95 são os valores de T para os quais 5% da área pertence a cada lado da distribuição T
Intervalos de Confiança para Médias
95.095.0 ˆ tnS
Xt
![Page 12: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/12.jpg)
Amostras pequenas (n < 30) e População Normal. pode ser estimado pertencer ao intervalo
com 95% de confiança. Os limites de confiança são
com tc obtido por tabela ou calculado
Intervalos de Confiança para Médias
nStX
nStX
ˆˆ975.0975.0
nStX c
ˆ
![Page 13: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/13.jpg)
Amostras pequenas (n < 30) e População Normal.
Exemplo: Os valores de tc em R são calculado pela função qt.
> qt(.975, df = c(1:10,20,50,100,1000)) [1] 12.706205 4.302653 3.182446 2.776445 2.570582
2.446912 2.364624 2.306004 2.262157 2.228139 2.085963
[12] 2.008559 1.983972 1.962339>
Intervalos de Confiança para Médias
![Page 14: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/14.jpg)
Amostras pequenas (n < 30) e População Normal.
Exemplo:x=c(175, 176, 173, 175, 174, 173, 173, 176, 173,
179)n=length(x)xm=mean(x)df=n-1tc=qt(0.975,df)delta.x=tc*sd(x)/sqrt(n)x.inf=xm-delta.xx.sup=xm+delta.x
Intervalos de Confiança para Médias
![Page 15: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/15.jpg)
Amostras pequenas (n < 30) e População Normal.
Exemplo(continuação)># Intervalo de confiança de 95%> x.inf[1] 173.3076> x.sup[1] 176.0924> # Média de x> xm[1] 174.7> xm/sd(x)*sqrt(10)[1] 283.8161>
Intervalos de Confiança para Médias
![Page 16: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/16.jpg)
Amostras pequenas (n < 30) e População Normal.
Exemplo(continuação)> t.test(x)
One Sample t-test
data: x t = 283.8161, df = 9, p-value < 2.2e-16alternative hypothesis: true mean is not equal to 0 95 percent confidence interval: 173.3076 176.0924 sample estimates:mean of x 174.7
>
Intervalos de Confiança para Médias
![Page 17: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/17.jpg)
Suponha que a estatística S é a proporção de “sucesso” em uma amostra de tamanho n≥30 extraída de uma população binomial em que p é a proporção de sucessos (i. é., probabilidade de sucesso).
Os limites de confiança para a proporção da população são dadas por
para uma amostra de população infinita, ou uma amostra com reposição de uma população finita.
Intervalos de Confiança para Proporções
nppzP
npqzP cc
)1(
![Page 18: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/18.jpg)
(continuação)
Os limites de confiança para a proporção da população são dadas por
se a amostragem é sem reposição , de uma população finita de tamanho N.
Intervalos de Confiança para Proporções
1
NnNzP
npqzP cc
![Page 19: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/19.jpg)
(continuação) Exemplo: Uma amostra aleatória de 600 eleitores de certo
distrito eleitoral dá 55% como favoráveis a determinado candidato A. Determine limites de confiança para a proporção global de eleitores favoráveis ao candidato na base de 99%.
Os limites de confiança de 99% para população são
Conclusão: O candidato A está com 99% de chance para vencer as eleições
Intervalos de Confiança para Proporções
04.055.01000
45.055.058.255.0)1(58.2
nppPP PP
![Page 20: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/20.jpg)
Intervalos de Confiança para Diferenças e Somas
222121 2121 SScSSc zSSzSS
222121 2121 SScSSc zSSzSS
Se S1 e S2 são duas estatísticas amostrais com distribuições amostrais aproximadamente normais, a expressão
dá limites de confiança para as diferenças dos parâmetros populacionais, e
dá os limites de confiança para a soma dos parâmetros populacionais, desde que as amostras sejam independentes.
![Page 21: Teoria Da Estimação](https://reader031.fdocument.pub/reader031/viewer/2022020311/577c827e1a28abe054b1051f/html5/thumbnails/21.jpg)
No caso de populações infinitas
dá limites de confiança para as diferenças dos parâmetros
populacionais onde são as respectivas médias, desvios padrões e tamanhos das duas amostras populacionais.
Analogamente,
dá os limites de confiança para a soma dos parâmetros populacionais, desde que as amostras sejam independentes.
Intervalos de Confiança para Diferenças e Somas
222121
2121 XXcXXc zXXzXX
2
22
1
112121
)1()1(21 n
ppnppzPPzPP cPPc
22111 ,,,, 2 nXenX