Estatística Descritiva (Tabelas e Gráficos)
-
Upload
alessandro-leitao -
Category
Documents
-
view
234 -
download
3
description
Transcript of Estatística Descritiva (Tabelas e Gráficos)
1
1
Aula 1
� Introdução� Estatística Descritiva (Tabelas e Gráficos)
Prof. Cosme Marcelo Furtado Passos da Silva
2
O que é Estatística?
Um estatístico é aquele que,
tendo a cabeça a arder e os pés
enterrados no gelo, ainda diz
que na média está tudo bem!...
2
3
O que é Estatística?
Usa-se por vezes a Estatística
como um bêbado usa um poste
de luz: Mais para suporte do
que para iluminação...
4
O que é Estatística?
Métodos estatísticos são essenciais no estudo de
situções em que as características de interesse estão
sujeitas, inerentemente, a flutuações aleatórias.
Mesmo em um grupo homogêneo de indivíduos,
observa-se grande variabilidade entre indivíduos, e no
mesmo indivíduo, em ocasiões diferentes.
3
5
O que é Estatística?
A qualidade das informações depende da qualidade dos dados!!!
Conjunto de métodos para a coleta e análise de dados, provenientes
de qualquer área do conhecimento, possibilitando a interpretação e
construção de inferências neles baseados.
6
Motivos para se estudar Estatística
• Saber fazer para fazer ou criticar o que está feito.
• Tornar-se mais crítico em sua análise de informações quantitativas;
• Tornar-se menos sujeito a afirmações enganosas baseadas em
números ou gráficos distorcidos.
• Aguçar sua capacidade de reconhecer dados estatísticos distorcidos
e de interpretar adequadamente dados não distorcidos.
• Validar as informações levantadas na dissertação/tese.
4
7
Pesquisa e Dados
• Planejamento de uma pesquisa (definir problema, objetivos, tipo de
pesquisa, população e amostra, coleta de dados);
• Dados e variáveis (definir e medir variáveis);
• Elaboração de questionário (definir forma de aplicação, fazer teste piloto);
8
Amostragem
5
9
Técnicas de Amostragem
10
Técnicas de Amostragem
6
11
Técnicas de Amostragem
12
Fases para Análise Estatística
Estatística
Planejamento InferencialDescritiva
7
13
Estatística Descritiva
� O que deve serfeito com os dadosdepois que elesforam coletados?
� O que pode serconcluído a partirda informaçãodisponível?
14
Folha de Dados
OBSERVAÇÕES
VARIÁVEIS
Identificação Sexo Idade Fuma Tratamento Raça1 1 35 0 1 negra2 2 27 1 2 branca3 2 32 0 3 negra4 1 45 0 1 pardo5 1 63 0 1 mulato6 1 54 0 2 branca7 2 78 1 18 2 36 1 39 1 42 0 3
10 2 39 1 211 1 51 1 112 1 63 0 313 2 32 0 114 2 41 0 115 2 54 0 216 1 56 0 217 2 65 0 318 1 48 1 219 1 37 0 120 2 46 0 321 1 51 0 222 2 48 0 123 2 53 0 124 1 62 1 125 1 39 0 326 2 47 1 327 1 58 0 228 2 62 0 229 1 34 0 3
8
15
Basicamente, a Análise Descritiva consiste na
organização e descrição dos dados, na identificação de
valores que represente o elemento típico e na
percepção, avaliação e quantificação da variabilidade do
conjunto de dados.
Descrição e Apresentação de Dados
Além de se familiarizar com os dados, possibilitaidentificar estruturas interessantes, como a de valoresatípicos.
16
• Em estudos pequenos podemos descrever cada
observação (este procedimento é tedioso).
Ex: Estudo de casos
• Na maioria das vezes é impossível analisar
observação por observação.
Ex: Pesquisas domiciliares
Descrição e Apresentação de Dados
9
17
Há várias formas de sumarizar os dados,
dependendo da natureza dos dados.
As mais utilizadas são:
●Tabelas
●Gráficos
●Medidas-resumo numéricas
Descrição dos Dados
18
Distribuição de Freqüências
Tabela de Dados Brutos: obtidos diretamente da
pesquisa. Sem tratamento ou síntese.
Exemplo: Teor de gordura fecal (g/24 horas) em 43crianças (Penna, 1984; Penna et al. 1987)
3,7 1,6 2,5 3,0 3,9 1,9 3,8 1,5 1,11,8 1,4 2,7 2,1 3,3 3,2 2,3 2,3 2,40,8 3,1 1,8 1,0 2,0 2,0 2,9 3,2 1,91,6 2,9 2,0 1,0 2,7 3,0 1,3 1,5 4,62,4 2,1 1,3 2,7 2,1 2,8 1,9
10
19
Distribuição de Freqüências
Consiste na construção de uma tabela a partir dos
dados brutos, em que se leva em consideração a
frequência com que cada observação ocorre.
A interpretação pode ser auxiliada pela análise de
gráficos.
20
Distribuição de Freqüênciascom intervalos de classe
Exemplo: Uma das tarefas rotineiras na prática médica éa comparação de um valor de uma medida de importânciaclínica, tal como parâmetros hematológicos com umpadrão. Uma vez que há uma grande variação dessasmedidas entre diferentes pacientes, o padrão não é umnúmero, mas uma faixa.
Para a construção desta faixa são obtidos dados
através da medição da característica de interesse em um
grupo representativo de pessoas supostamente sadias.
11
21
Tipos de Dados (Variáveis)
Variável
Qualitativa(categórica)
Quantitativa(numérica)
Nominal
Ordinal
Discreta
Contínua
Variável é a quantificação ou categorização dacaracterística de interesse do estudo.
Facilita o tratamento estatístico de variáveis,classificá-las em categóricas e quantitativas:
22
Tipos de Dados (Variáveis)
• Variável resposta: variável a ser explicada no estudo.
• Variável explicativa ou covariável: variável que serve de
suporte na explicação da variabilidade da variável reposta.
Conhecer o tipo da variável resposta é um ponto
de partida para determinar os métodos de análise mais
apropriados ou válidos.
12
23
Exemplo de Dados Coletados
� Qual é a sua idade?
� Qual o número de pessoas da sua
família?
� Qual é a renda total de sua família?
� Qual é o seu estado civil?
� Você tem emprego fixo?
Questionário de um Inquérito Epidemiológico:
� Idade
� Tamanho da família
� Renda familiar
� Estado Civil
� Emprego
24
Variáveis Nominais
• Estado Civil:1. Casada2. Solteira3. Separada / divorciada4. Viúva
• Sexo:1. Feminino2. Masculino
Variável binária ou
Dicotômica
Não há ordem entre as categorias:
• Tipo sanguíneo: A, B, AB, O ⇒ mais categorias
13
25
Variáveis Nominais
- Distribuição de Freqüências:
Sarcoma de Kaposi Número de casos
SimNão
2462314
Casos de Sarcoma de Kaposi para os primeiros
2560 casos de Aids registrados nos Centro de
Controle de Doença, Atlanta, Geórgia.
26
Variáveis Nominais
- Distribuição de melanomas por localização anatômica
Localização anatômica No de casos (Freqüência absoluta)
Percentual(Freqüência relativa)
Cabeça/pescoço 10 33,3
Tronco 7 23,3Membros superiores 6 20,0Membros inferiores 2 6,7
Acral 5 16,7Total 30 100
14
27
Variáveis Ordinais
• Auto-avaliação do estado de saúde:1. Muito boa2. Boa3. Regular4. Ruim5. Muito ruim
A ordem deve ser levada em consideração:
• Estadiamento de uma doença: leve, moderada, grade
28
Tabelas de Dupla Entrada (Tabelas de Contingência)
Lesão na cabeça
Uso de capacete
TotalSim Não
Sim 17 218 235
Não 130 428 558
Total 147 646 793
Estudo para avaliar a efetividade do uso decapacetes de segurança de acidentes de bicicleta.Amostra de 793 indivíduos envolvidos em acidentesciclísticos.
15
29
Comparação entre Grupos/Categorias
Comparações entre grupos/categorias devem ser feitas
através de freqüências relativas.
Qual cursinho pode ser considerado melhor em termos de
aprovação de seus alunos?
Cursinho Aprovados Candidatos % de Aprovação
Alpha 1600 4000 1600/4000 = 0,40 ou 40%
Beta 400 500 400/500 = 0,80 ou 80%
Gama 2400 6000 2400/6000 = 0,40 ou 40%
30
Gráficos – Variáveis Nominais e Ordinais
16
31
Gráficos – Variáveis Nominais e Ordinais
32
Variáveis Discretas
Ordem e magnitude são importantes. Os valores
diferem entre si por quantidades fixas. Nenhum valor
intermediário é possível. Geralmente são resultados de
contagens.
• Tamanho da família: (1, 2, 3, 4, ...18)
• Número de internações desde 1980 a 2004
• Número de óbitos
17
33
Variáveis Discretas
34
Variáveis Discretas
18
35
Variáveis Contínuas
Os valores possíveis pertencem a um intervalo de
números reais, que resultam de mensuração. A diferença
entre medidas pode ser arbitrariamente pequena e são
anotadas até a precisão da medida usada.
• Peso;
• Altura;
• Pressão Sanguínea.
Variáveis Contínuas - Tabela
19
37
Variáveis Contínuas - Histograma
38
Variáveis Contínuas - Histograma
20
39Freq. Simples
10
30
10
Freq. Relativa
0.2 0.2
0.6
Densidade
0.02 0.02
0.06
Área=11050
0.210
- Diferentes formas de construir um histograma sem alterar sua forma.
Variáveis Contínuas - Área
40
Variáveis Contínuas Polígono de Freqüências
21
41
Variáveis Contínuas Polígono de Freqüências
Vantagem: sobreposição
42
Variáveis Contínuas Polígono de Freqüência Acumulada
22
43
Variáveis Contínuas Diagrama de Pontos
Distribuição do Teor de gordura fecal (g/24 horas) em 43 crianças
1 2 3 4
44
Variáveis Contínuas Diagrama de Ramo-e-Folhas
The decimal point is 2 digit(s) to the right of the |
0 | 110 | 1 | 21 | 55567777788888888999992 | 0000000111111111222222333333334444442 | 55555666788888993 | 23 | 64 | 4 | 8
Taxa de colesterol (mg/dL)
em 80 indivíduos.
23
45
Diagrama de dispersão (Variável numérica X variável numérica)
46
Gráfico de Linhas (Variável numérica no tempo)
24
47
Aspectos Gerais – Distribuição de Freqüências -
• Tendência Central• Variabilidade• Forma
48
Aspectos Gerais – Distribuição de Freqüências -
25
49
Exercícios
Classifique as variáveis abaixo quanto ao tipo (qualitativanominal, qualitativa ordinal, quantitativa discreta, quantitativacontínua):
1) Número de crises depressivas sofridas por cinco pessoas: 3,1, 2, 3, 2;
2) Área (em metros quadrados - m2) ocupada de trêsconsultórios: 9, 12, 10;
50
3) Cor de olhos de quatro pacientes: verde, castanho, azul,
castanho;
4) Diâmetro (em cm) do pulso de cinco pessoas: 18, 17, 15, 17,
16;
5) Nível de depressão de quatro pacientes de um Psicólogo:
Baixo, Alto, Alto, Regular;
6) Número de internações de quatro pacientes de um Psicólogo:
2, 1, 3, 3;
Exercícios
26
51
7) Distância percorrida (em quilômetros - Km) por cinco atletas
em treinamento: 8, 6, 12, 8, 11;
8) Doenças manifestadas em quatro pacientes internados no setor
de pediatria: sarampo, catapora, sarampo, rubéola;
9) Estatura (em cm) de cinco pessoas: 178, 177, 176, 177, 176;
10) Número de dentes obturados por cinco dentistas em um dia
de trabalho: 13, 12, 14, 11, 12;
Exercícios
52
11) Fator Rh do sangue de três pacientes: negativo, positivo,
negativo;
12) Grau de instrução de cinco pessoas entrevistadas: superior,
superior, médio, fundamental, médio;
13) Número de filhos de quatro casais: 2, 1, 2, 0;
14) Grupo sangüíneo de seis pessoas: O, AB, O, A; O, B;
15) Nacionalidade de cinco estrangeiros: Portuguesa, Portuguesa,
Francesa, Americana, Japonesa;
Exercícios
27
53
16) Número de visitas feitas ao Brasil por cinco turistas
estrangeiros: 4, 3, 2, 4, 2;
17) Patente de quatro militares: soldado, sargento, soldado,
coronel;
18) Peso de cinco pacientes em kg: 45, 46, 45, 47, 47;
19) Número de sessões de Psicologia de cinco pacientes: 5, 6, 7,
6, 6;
20) Plantação de cinco fazendas: milho, café, soja, soja, café;
21) Pressão sangüínea de quatro pacientes: 10, 12, 11, 11;
Exercícios
54
22) Número de pacientes internados, em um ano, em cinco
clínicas: 44, 32, 34, 41, 29;
23) Profissão de cinco pessoas: Fisioterapeuta, Psicólogo,
Fisioterapeuta, Médico, Psicólogo;
24) Raça de quatro pessoas: negra, branca, amarela, negra;
25) Número de livros lidos por cinco pessoas, em um ano: 10,
10, 7, 9, 9.
Exercícios
28
55
1) Soares, J F; Siqueira, A L. Introdução à Estatística Médica. Coopmed Editora Médica, 2a
edição, 2002, Belo Horizonte, MG.
2) Magalhães, M. N.; Lima, A. C. P (2005). Noções de Probabilidade e Estatística. 6ª ed. Edusp.
São Paulo.
3) Silva, Nilsa Nunes (2004). Amostragem Probabilística: Um curso introdutório. Edusp. Brasil.
4) Mood, A. M. et al. 1974. Introduction to the Theory of Statistics. 3. ed. Tokyo, McGraw-Hill
Kogakusha.
5) Triola, M.F. Introdução à Estatística. Rio de Janeiro: LTC Editora, 1999
6) Pagano, M., e Gauvreau, K. Princípios de Bioestatística, Segunda Edição São Paulo: Thomson,
2004
7) Venables WN, Ripley, BD (2002). Moderns Applied Statistics with S. Fourth Edition. Springer.
8) Venables WN, Smith DM, et al. (2002). An introduction to R: notes on R: a programming
environment for data. Bristol, Network Theory
9) Dalgaard, P. (2002) Introductory Statistics with R. Springer.
Bibliografia