Montgomery & Runger - Cap. 6 - est.ufmg.brest.ufmg.br/ftp/fcruz/ep/Cap06-Hi.pdf · Fig. 6.7...
Transcript of Montgomery & Runger - Cap. 6 - est.ufmg.brest.ufmg.br/ftp/fcruz/ep/Cap06-Hi.pdf · Fig. 6.7...
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 1
ESQUEMA DO CAPÍTULO
6.1 IMPORTÂNCIA DO SUMÁRIO E
APRESENTAÇÃO DE DADOS
6.2 DIAGRAMA DE RAMO E FOLHAS
6.3 DISTRIBUIÇÕES DE FREQUÊNCIA E
HISTOGRAMAS
6.4 DIAGRAMA DE CAIXA
6.5 GRÁFICOS SEQUENCIAIS DE TEMPO
6.6 DIAGRAMAS DE DISPERSÃO
6.7 GRÁFICOS DE PROBABILIDADE
Estatística Descritiva
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 2
Objetivos de Aprendizagem
Após estudo cuidadoso deste capítulo você deverá ser capaz de:
1. Calcular e interpretar a média da amostra, a variância da amostra, o desvio-padrão da amostra, a mediana da amostra e a amplitude da amostra;
2. Explicar os conceitos de média da amostra, variância da amostra, média populacional e variância populacional;
3. Construir e interpretar apresentações visuais de dados, inclusive o diagrama de ramo e folhas, o histograma e o diagrama de caixa (box-plot);
4. Explicar como usar diagramas de caixa e outros recursos de apresentação de dados para comparar visualmente duas ou mais amostras de dados;
5. Saber como usar gráficos sequenciais simples para apresentar visualmente características importantes de dados temporais.
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 3
6.1 Sumário de Dados
• Média da amostra: • Exemplo:
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 4
6.1 Sumário de Dados
• Interpretação física: • Média da população: A média da amostra é uma estimativa razoável da média da população.
Fig. 6.1 Média da amostra como um ponto de equilíbrio para um sistema de pesos
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 5
6.1 Sumário de Dados
• Variância da amostra:
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 6
6.1 Sumário de Dados
• Interpretação da variância:
Fig. 6.2 Como a variância mede a variabilidade através dos desvios xi-xbarra
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 7
6.1 Sumário de Dados
• Exemplo:
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 8
6.1 Sumário de Dados
Tab. 6.1 Cálculo dos termos para a variância e desvio-padrão da amostral
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 9
6.1 Sumário de Dados
• Cálculo alternativo de s2, que é mais fácil
quando feito com calculadoras científicas
sem funções estatísticas:
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 10
6.1 Sumário de Dados
• Exemplo:
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 11
6.1 Sumário de Dados
• Variância da população: Quando a população é finita e consiste de N valores,
podemos definir a variância populacional como A variância da amostra é uma estimativa razoável da
variância populacional.
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 12
6.1 Sumário de Dados
• Amplitude da amostra:
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 13
6.2 Diagramas de Ramo e Folhas
• Um diagrama de ramo e folhas é uma boa maneira de obter uma apresentação visual informativa de um conjunto de dados x1, x2, ..., xn, em que cada número xi consiste em, no mínimo, dois dígitos;
• Passos para construção de um diagrama de ramo e folhas:
1) Dividir cada número em duas partes, (i) um ramo, que consiste em um ou mais dígitos iniciais, e (ii) uma folha, que consiste nos dígitos restantes;
2) Listar os valores dos ramos em uma coluna vertical; 3) Para cada número, escrever a folha ao lado da respectivo ramo; 4) Escrever as unidades dos ramos e folhas.
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 14
6.2 Diagramas de Ramo e Folhas
• Exemplo:
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 15
6.2 Diagramas de Ramo e Folhas
Tab. 6.2 Resistência à compressão de 80 corpos de prova da liga de alumínio-lítio
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 16
6.2 Diagramas de Ramo e Folhas
Fig. 6.4 Diagrama de
ramo e folhas para os
dados de resistência à
compressão na Tab. 6.1
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 17
6.2 Diagramas de Ramo e Folhas
• Exemplo:
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 18
6.2 Diagramas de Ramo e Folhas
Fig. 6.6 Diagrama
de ramo e folhas
para o exemplo
sobre os
rendimentos de
uma batelada de
um processo
químico
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 19
6.2 Diagramas de Ramo e Folhas
Fig. 6.7 Diagrama de ramo
e folhas do Minitab
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 20
6.2 Diagramas de Ramo e Folhas
• Características dos dados:
– A mediana é uma medida de tendência central que divide os dados em duas partes, metade abaixo da mediana e metade acima. Se o número de observações é par, a mediana está a meio caminho entre dois valores centrais;
– Da Fig. 6.7, o 40° e o 41° valores de resistência são respectivamente 160 e 163,; a mediana é (160 + 163)/2 = 161.5; se o número de observações é ímpar, a mediana é o valor central;
– A amplitude é uma medida de variabilidade que pode ser facilmente calculada pelo diagrama de ramo e folhas ordenado; é a diferença entre os valores máximo e mínimo;
– Da Fig. 6.7, a amplitude é 245 - 76 = 169.
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 21
6.2 Diagramas de Ramo e Folhas
• Características dos dados:
– Quando um conjunto ordenado de dados é dividido em quatro partes, os pontos de divisão são denominados quartis;
– O primeiro quartil (ou quartil inferior), q1, é o valor que tem aproximadamente um quarto (25%) das observações abaixo dele e aproximadamente 75% das observações acima;
– O segundo quartil (ou mediana), q2, tem aproximadamente metade (50%) as observações abaixo do seu valor;
– O terceiro quartil (ou quartil superior), q3, tem aproximadamente três quartos (75%) das observações abaixo de seu valor;
– Como no caso da mediana, os quartis podem não ser únicos.
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 22
6.2 Diagramas de Ramo e Folhas
• Características dos dados:
– Os dados da Tab. 6.2 contêm n = 80 observações; o
pacote Minitab calcula o primeiro e o terceiro quartis
como sendo as (n + 1)/4 e 3(n + 1)/4 observações
ordenadas, interpolando quando necessário;
– Exemplo:
• (80 + 1)/4 = 20,25 e 3(80 + 1)/4 = 60,75;
– Assim, o Minitab interpola entre o 20° e 21°
observação ordenada, para obter q1 = 143,50 e entre a
60° e 61° observação ordenada para obter q3 =181,00.
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 23
6.2 Diagramas de Ramo e Folhas
• Características dos dados:
– A faixa interquartil é a diferença entre o quartil superior e o quartil inferior e é utilizada algumas vezes como medida de variabilidade;
– Em geral, o 100k° percentil é o valor de modo que aproximadamente 100k% das observações estão nesse ou abaixo desse valor e aproximadamente 100(1-k)% deles estão acima dele.
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 24
6.3 Distribuições de Frequência e
Histogramas
• Uma distribuição de frequência é um sumário mais compacto dos dados, em relação ao diagrama de ramo e folhas;
• Para construir uma distribuição de frequência, precisamos dividir a faixa de dados em intervalos (normalmente de igual amplitude), que são geralmente denominados intervalos de classes ou células;
• Na prática, o número de intervalos é aproximadamente igual à raiz quadrada do número de observações; – Exemplo:
Aproximadamente 9 intervalos, para 80 observações da Tab. 6.2.
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 25
6.3 Distribuições de Frequência e
Histogramas
• Exemplo:
Tab. 6.4 Distribuição de frequências para os dados da Tab. 6.2
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 26
6.3 Distribuições de Frequência e
Histogramas
• O histograma é uma forma de representação gráfica da distribuição de frequência;
• Passos para construção de um histograma de intervalos iguais:
1. Defina o número de intervalos de classe (aproximadamente a raiz quadrada do número de observações) e calcule e marque os limites das classes na escala horizontal;
2. Marque na escala vertical as frequências absolutas (ou as relativas);
3. Sobre cada intervalo de classe, trace um retângulo cuja altura seja proporcional à frequência absoluta (ou frequência relativa) correspondente àquele intervalo.
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 27
6.3 Distribuições de Frequência e
Histogramas
• Exemplo:
Fig. 6.7 Histograma da resistência à compressão para 80 corpos de
prova da liga alumínio-lítio
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 28
6.3 Distribuições de Frequência e
Histogramas
• Exemplo (cont.):
Fig. 6.8 Um histograma dos dados de resistência à compressão com 17
intervalos de classe
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 29
6.3 Distribuições de Frequência e
Histogramas
• Variante do histograma:
Fig. 6.10 Gráfico de distribuição cumulativa dos dados de resistência à
compressão
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 30
6.3 Distribuições de Frequência e
Histogramas
• O histograma como indicador de forma geral da população:
Fig. 6.11 Histograma para distribuições simétricas e deslocadas
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 31
6.4 Diagrama de Caixa (Box plot)
• O diagrama de caixa (box plot) é uma representação gráfica que descreve simultaneamente várias características importantes de um conjunto de dados, tais como
– centro,
– dispersão,
– desvio da simetria e
– identificação das observações que estão surpreendentemente longe da parte principal dos dados:
• whisker (“bigode”);
• outlier;
• outlier extremo.
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 32
6.4 Diagrama de Caixa (Box plot)
• Exemplo:
Fig. 6.13 Descrição de um diagrama de caixa
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 33
6.4 Diagrama de Caixa (Box plot)
Fig. 6.14 Diagrama de caixa para os dados de resistência à compressão
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 34
6.4 Diagrama de Caixa (Box plot)
Fig. 6.15 Diagramas de caixa
comparativos de um índice
de qualidade em três plantas
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 35
6.5 Gráficos Sequencias
Temporais
• Uma série temporal ou sequência temporal é um conjunto de dados no qual as observações são registradas na ordem em que elas ocorreram;
• Um gráfico de série temporal é aquele em que o eixo vertical denota o valor observado da variável (por exemplo, x) e o eixo horizontal denota o tempo (que poderia ser minutos, dias, ano etc.);
• Quando as medidas são grafadas como uma série temporal, frequentemente vemos: – tendências,
– ciclos, ou
– outras características gerais dos dados que não poderiam ser vistos de outra forma.
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 36
6.5 Gráficos Sequencias de Tempo
Fig. 6.16 Vendas da companhia por (a) ano e (b) por trimestre
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 37
6.5 Gráficos Sequencias de Tempo
Fig. 6.17 Gráfico digiponto dos dados de resistência à compressão da
Tab. 6.2
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 38
6.5 Gráficos Sequencias de Tempo
Fig. 6.18 Gráfico digiponto das leituras de concentração de um
processo químico, observadas de hora em hora
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 39
6.6 Diagramas de Dispersão
• Em muitos problemas, os dados são
multivariados;
• Diagramas de dispersão são uma
ferramenta exploratória apropriadas
para tais dados;
• Dados apresentados na Tab. 6.5 contém
um exemplo de dados multivariados;
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 40
6.6 Diagramas de Dispersão
Tab. 6.5 Dados sobre a qualidade de vinhos tintos novos
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 41
6.6 Diagramas de Dispersão
Fig. 6.19 Diagrama de dispersão da qualidade de vinho e da cor a
partir da Tab. 6.5
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 42
6.6 Diagramas de Dispersão
Fig. 6.20 Matriz dos diagramas de dispersão para os dados da
qualidade de vinhos da Tab. 6.5
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 43
6.6 Diagramas de Dispersão
Fig. 6.21 Relação potencial
entre as variáveis
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 44
6.7 Gráficos de Probabilidade
• Método para determinar se determinados
dados obedecem a uma distribuição
hipotética (modelo probabilístico
hipotético);
• Baseado em análise visual;
• Uma distribuição bastante frequente em
engenharia é a Normal;
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 45
6.7 Gráficos de Probabilidade
• Exemplo:
Tab. 6.6 Cálculo para construção de um gráfico de probabilidade normal
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 46
6.7 Gráficos de Probabilidade
• Exemplo (cont.):
– Uma vez que os pontos na Fig. 6.22 caem aproximadamente sobre uma reta, concluímos que a distribuição normal é um modelo apropriado para tais dados;
Fig. 6.22 Gráfico de probabilidade normal para a vida da bateria
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 47
6.7 Gráficos de Probabilidade
• O papel de probabilidade normal:
UFMG-ICEx-EST Cap. 6 - Estatística Descritiva 48
TERMOS E CONCEITOS IMPORTANTES
Diagrama de caixa
Distribuição de
frequência e
histograma
Mediana, quartis e
percentis
Média populacional
Desvio-padrão
populacional
Variância
populacional
Distribuição de
frequência relativa
Média da amostra
Desvio-padrão da
amostra
Variância da amostra
Diagrama de ramo e
folhas
Gráficos sequenciais de
tempo