Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf ·...
Transcript of Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf ·...
![Page 1: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/1.jpg)
Estatística DescritivaComo construir uma distribuição de freqüências.Como construir gráficos de freqüências.Como encontrar medidas de tendência central.Como encontrar medidas de variabilidade.Como encontrar separatrizes
![Page 2: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/2.jpg)
Motivação
Idades de uma amostra com 80 residentes em Alaska:25, 5, 18, 12, 60, 44, 24, 22, 2, 7, 15, 39, 58, 53, 36, 42,
16, 20, 1, 5, 39, 51, 44, 23, 3, 13, 37, 56, 58, 13, 47, 23, 1, 17, 39, 13, 24, 0, 39, 10, 41, 1, 48, 17, 18, 3, 72, 20, 3, 9, 0, 12, 33, 21, 40, 68, 25, 40, 59, 4, 67, 29, 13, 18, 19, 13, 16, 41, 19, 26, 68, 49, 5, 26, 49, 26, 45, 41, 19, 49
Média
Rangeanos
Idade
Freq
üênc
ia
![Page 3: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/3.jpg)
Distribuição de FreqüênciasDados Quantitativos
Uma tabela de classes ou intervalos de valores de uma amostra com um número total de observações em cada classes.
Classe Freqüência
![Page 4: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/4.jpg)
Etapas para construção de uma distribuição de freqüências
1. Decida o tamanho do número de intervalos. Um bom tamanho é onde n é o tamanho da amostra. 2. Determine a amplitude de cada intervalo. Divida o range dos valores pelo tamanho do número de intervalos. Arredonde até o próximo número.3. Calcule os limites das classes. O valor mínimo dos dados pode ser o limite inferior da primeiro intervalo. Adicione o range para formar o limite máximo deste intervalo e obter os próximos intervalos. Os intervalos não podem sobrepor.4. Conte as freqüências de cada classe.
],1[ n
![Page 5: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/5.jpg)
Exemplo: Tempo (em min) gasto na Internet
Conjunto de dados amostrais: lista do número de minutos de 50 assinantes.
50 40 41 17 11 7 22 44 28 21 19 23 37 51 54 42 88 41 78 56 72 56 17 7 69 30 80 56 29 33 46 31 39 20 18 29 34 59 73 77 36 39 30 62 54 67 39 31 53 44
![Page 6: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/6.jpg)
Construindo a distribuição de freqüências
1. O número de intervalos é 7.2. Os valores mínimo e máximo são 7 e 88, respectivamente. Logo a amplitude total é81. A amplitude dos intervalos é 12.3. Os limites inferior e superior do primeiro intervalo são 7 e 18, respectivamente.4. Estabeleça a freqüência de cada classe.
![Page 7: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/7.jpg)
Distribuição de freqüências
Freqüência FreqüênciaRelativa
FreqüênciaAcumulado
Ponto Médio
Classe
![Page 8: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/8.jpg)
Gráficos da distribuição de freqüências
Histograma usando os pontos médios Histograma usando as fronteiras
Classe Fronteiras Freqüência
![Page 9: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/9.jpg)
Gráficos da distribuição de freqüências
Polígono de freqüências Histograma de freqüência relativa
![Page 10: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/10.jpg)
Gráficos da distribuição de freqüências
LimitesSuperiores
FreqüênciaAcumuladaf
Ogiva
![Page 11: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/11.jpg)
Gráficos de dados qualitativos
CarroCaminhão
7% Outros 1%Motos
Carros
Motos
Caminhões
Outros
Gráfico de Pizza
Freqüência Relativa Angulo
![Page 12: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/12.jpg)
Gráficos de dados qualitativos
Gráfico de barras verticais
Roubo Assaltos Erros Fraudes
Causas de redução de ativos
![Page 13: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/13.jpg)
Gráfico de dados emparelhados
Conjunto de dados Iris
Comprimento da pétala
Larg
ura
da p
é tal
a
![Page 14: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/14.jpg)
Gráfico de série temporal
Ano Assinantes Conta Média
Número de assinantes de telefones celulares(em milhões)
![Page 15: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/15.jpg)
Medidas de tendência central
MédiaAmostra
PopulaçãoMediana
Valor que divide o conjunto em duas partes de iguais. Se o tamanho do conjunto é par , a mediana é a média entre os dois elementos mais centrais.
ModaValor que tem a maior freqüência
Em uma distribuição normal a média, a mediana e a moda são iguais.
∑=
=n
iix
nx
1
1
∑=
=N
iix
N 1
1μ
![Page 16: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/16.jpg)
Comparação entre Média, Moda e Mediana
Vantagens e desvantagens:Média: funciona bem com muitos métodos estatísticosMediana: costuma ser uma boa escolha se há alguns valores extremos.Moda: apropriada para dados ao nível nominal
![Page 17: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/17.jpg)
Exemplo
Idades em uma classe
Média= 23,75Mediana=21,5Moda= 20
Valor aberrante
![Page 18: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/18.jpg)
Média ponderada
Fonte Nota x Peso w
Média testesExame do meioLaboratórioTrabalho de casa
6,881
==∑=
i
n
iiwxx
![Page 19: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/19.jpg)
Média de dados agrupados
x f x.f
80,4111
== ∑=
i
n
ii fx
nx
![Page 20: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/20.jpg)
Aspectos das distribuiçõesSimétrica
MédiaModaMediana
Uniforme
MédiaMediana
Media < Mediana < Moda Moda < Mediana < Média
Assimétricaà esquerda
Assimétricaà direita
![Page 21: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/21.jpg)
Aspectos das distribuições
Assimetria Sk: mede o grau de deformação . Assume valores entre –1 e 1.
onde Mo é a moda.Curtose: mede o grau de achatamento ou afilamento
SMoxSk −
=
4
4)(1
S
xxnK i
i∑ −=
![Page 22: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/22.jpg)
Usando Regra Empírica
Usada para determinar a porcentagem de valores que precisam estar dentro de um número especificado de desvios-padrões da média.Para dados que tem uma distribuição na forma de um sino:
Aproximadamente 68% dos valores dos dados estarão dentro de um desvio padrão da média.Aproximadamente 95% dos valores dos dados estarão dentro de dois desvios padrões da média.Aproximadamente 99% dos valores dos dados estarão dentro de três desvios padrões da média.
![Page 23: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/23.jpg)
Assimetria e Curtose
SkSk = 0 (Sim= 0 (Siméétrica) trica) SkSk > 0 (Assimetria positiva)> 0 (Assimetria positiva)SkSk < 0 (Assimetria negativa< 0 (Assimetria negativa
Menores que 0,15 distribuição é simétrica0,15<IA<1,0 Distribuição é moderadamente assimétricaMaior que 1,0 Distribuição é fortemente assimétrica
K = 3 (K = 3 (MesocMesocúúrticartica) (Distribui) (Distribuiçção Normal)ão Normal)K > 3 (K > 3 (LeptocLeptocúúrticartica))K < 3 (K < 3 (PlatocPlatocúúrticartica))
![Page 24: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/24.jpg)
Medidas de Variabilidade
Amplitude totalDiferença entre o maior valor e o menor valor.
VariânciaPopulacional Amostral
Desvio padrãoPopulacionalAmostral
Coeficiente de variação
2
1
2 )(1 μσ −= ∑=
n
iix
N
2
1
)(1
1 xxn
Sn
ii −−
= ∑=
2
1)(1 μσ −= ∑
=
n
iix
N
2
1
2 )(1
1 xxn
Sn
ii −−
= ∑=
100×xS
![Page 25: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/25.jpg)
Interpretando o desvio padrão
Quanto mais espalhados estiverem os dados maior será o desvio padrão
![Page 26: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/26.jpg)
Desvio padrão de dados agrupados
Distribuição de número de criançasem 50 domicílios
7,1)(1
1 2
1=−
−= ∑
=i
n
ii fxx
ns
![Page 27: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/27.jpg)
Medidas de posição
Os três quartis Q1, Q2 e Q3 dividem ao conjunto de dados em quatro partes iguais: 25% ficam dentro ou abaixo de Q1, 50% ficam dentro ou abaixo de Q2 e 75% ficam dentro ou abaixo de Q3.
Amplitude interquartílica: é diferença entre Q3 e Q1.Fornece uma idéia de quanto 50% centrais (médios) dos dados variam.
Metade inferior Metade superior
![Page 28: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/28.jpg)
Decis e percentis
Decis: divide o conjunto de dados em dez partes iguais.Percentis: divide o conjunto de dados em cem partes iguais.
São freqüentemente usados na educação e nos campos relacionados a saúde para indicar como um indivíduo se compara com outros em um determinado grupo. Pontuações em testes e medidas de crescimento infantil são freqüentemente expressos em percentis.
![Page 29: Estatística Descritiva - cin.ufpe.brcin.ufpe.br/~rmcrs/ESAP/arquivos/EstatisticaDescritiva.pdf · Mediana Media < Mediana < Moda Moda < Mediana < Média Assimétrica à esquerda](https://reader030.fdocument.pub/reader030/viewer/2022021611/5c1635bc09d3f28f0a8c22bd/html5/thumbnails/29.jpg)
Box PLot
Um gráfico que permite identificar os pontos aberrantes em uma amostra e realça características importantes.
Etapas:1. Obtenha Q1, Q2, Q3 Q3-Q1. Calcule os limites inferior: LI=Q1 – 1,5×(Q3-Q1) e LS= Q1+1,5×(Q3-Q1). Os dados fora do intervalo [LI,lS] são considerados fora da curva. 2. Construa uma escala total que abrange todos os dados.3. Plote os cincos números acima da escala horizontal.4. Faça uma caixa acima de Q1 a Q3 e trace uma reta vertical passando por Q2.5. Faça as tranças
Limiteinferior Mediana
Limitesuperior
TrançaTrança Caixa