Estatãstica descritiva
-
Upload
nilo-sampaio -
Category
Education
-
view
330 -
download
1
description
Transcript of Estatãstica descritiva
UERJ - 2013
Prof.Dr. Nilo Sampaio
Medidas de tendência central e dispersão
Variáveis contínuas: distribuição normal
Amostra
Variabilidade amostral
Categóricas(ou qualitativas)
Numéricas(ou quantitativas)
Dicotômicas
Politômicas
Nominais(ordem não importa)
Ordinais(tem uma ordem lógica)
Discretas(números inteiros)
Contínuas(aceitam decimais)
Sexo, raça, estado civil, religião...
NSE, IMC categ, avaliação
qualitativa...
“CONTAGENS” Nº filhos, anos
de estudo...
“MEDIDAS”Peso, altura,
pressão. Renda
familiar (R$)
Categórica(ou qualitativa)
Numérica(ou quantitativa)
Medidas de ocorrênciaFREQUÊNCIA ou PORCENTAGEM Incidência Prevalência OddsMedida de precisãoINTERVALO DE CONFIANÇA
Medidas tendência centralMODAMÉDIAMEDIANA
Medidas de dispersãoAMPLITUDEVARIÂNCIADESVIO PADRÃOERRO PADRÃO
Descrição de uma variável qualitativas ou categóricas
Dicotômicas ou binárias
Politômicas
Cálculo de proporções
Divisão de um número por outro, onde onumerador está contido (é subconjunto) nodenominador
Exemplo: Desnutrição: sim /não
Em 100 crianças, 20 estão desnutridas (20%)
Dados da coorte de nascimentos de 2004. Pelotas, RS (n=6000)
NúmeroPeso ao nascer
(g)
Número de
gravidez
1 750 1
2 1500 3
3 1520 2
4 2450 4
5 1790 1
6 3000 2
7 1930 2
..... ..... ...
5999 3510 1
6000 2900 1
Descrição de uma variável numérica
Tabela que mostra um número deobservações ou valores dentro de certosintervalos
Número de gravidezes das mães da coorte de 2004. Pelotas, RS
(n=6000)
Número de gravidez Frequência (n) %
1 2092 34,9
2 1644 27,4
3 970 16,1
4 544 9,1
5 282 4,7
6 168 2,8
7 105 1,8
8 69 1,2
9 48 0,8
10 39 0,7
11 20 0,3
12 11 0,1
13 8 0,1
Número de gravidez das mães da coorte de 2004. Pelotas, RS (n=6000)
Número de gravidezes Frequência (n) %
1 2092 34,9
2 1644 27,4
3 970 16,1
≥4 1294 21,6
Peso ao nascer das crianças da coorte de 2004. Pelotas, RS (n=4555)
Peso ao nascer (gramas) Frequência %
<1000 52 1,1
1000-1499 43 0,9
1500-1999 98 2,2
2000-2499 305 6,7
2500-2999 1112 24,4
3000-3499 1747 38,3
3500-3999 976 21,5
4000 222 4,9
... mas para variáveis contínuas queremos descrever os dados de forma ainda mais sucinta!
◦ Medidas de tendência central
◦ Medidas de posição
◦ Medidas de dispersão
MEDIDAS DE TENDÊNCIA CENTRAL
MEDIDAS DE DISPERSÃO
MEDIDAS DE POSIÇÃO
MEDIDAS DE POSIÇÃO
MÉDIAMEDIANAMODA
AMPLITUDEINTERVALO INTERQUARTILVARIÂNCIADESVIO PADRÃO
TERCILQUARTILQUINTILDECILPERCENTIL
Utilizadas para variáveis:
◦ Quantitativas ou numéricas
Discreta
Contínua
São valores calculados com o objetivo dedescrever os dados de forma ainda maisresumida do que usando uma tabela
Média
Moda
Mediana
Média
◦ xi: valor de cada indivíduo◦ ∑: somatória◦ n: total de indivíduos
x
x
n
i
i
n
1
Vantagem:Utiliza TODOS os
valores da distribuição
Desvantagem:É influenciada por valores extremos
Moda◦ Valor que mais se repete na amostra (na
distribuição)
1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9
Moda: 2
◦ Quando mais de um valor se repete o mesmo número de vezes BIMODAL
Mediana Valor que divide a distribuição ao meio
1º passo: ordenar os dados de menor a maior
2º passo: ver qual valor ocupa o “meio” da distribuição
Se... Número ímpar de dados: valor do meio
1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 4, 8, 9, 9
Número par de dados: média dos dois do meio1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 8, 9, 9
Fórmula:(n + 1)/2
Semelhantes para distribuições simétricas: Peso ao nascer
◦ Média: 3131 g
◦ Mediana: 3180 g
Distantes para distribuições assimétricas: Renda familiar
◦ Média: R$ 791
◦ Mediana: R$ 500
Qual medida de tendência central usar?◦ MÉDIA ou MEDIANA?
Distribuição simétrica
0
500
1000
1500
2000
n
1000 2000 3000 4000 5000 6000Peso ao nascer
Média: 3131 gramas; Mediana: 3180 gramas
Média
Distribuição assimétrica
0
1000
2000
3000
n
0 5000 10000 15000 20000Renda familiar (reais)
Média: R$ 791; Mediana: R$ 500
Mediana
Percentis (dividem os dados em 100 partes iguais)◦ Percentil 10, percentil 50, percentil 99...
Quartis◦ Primeiro, segundo, terceiro, quarto quartil
Quintil◦ Primeiro, segundo, terceiro, quarto, quinto quintil
. su peson,d
peso ao nascer em gramas
-------------------------------------------------------------
Percentiles Smallest
1% 1950 1100
5% 2340 1490
10% 2570 1550 Obs 962
25% 2870 1570 Sum of Wgt. 962
50% 3180 Mean 3200.639
Largest Std. Dev. 511.0475
75% 3510 4690
90% 3830 4700 Variance 261169.5
95% 4050 4700 Skewness -.1061833
99% 4450 4880 Kurtosis 3.579037
Várias maneiras de medir a dispersão
◦ Amplitude (maior - menor)
◦ Amplitude interquartil (p75 - p25)
◦ Variância
◦ Desvio padrão
Amplitude◦ Valor maior – valor menor
◦ Apenas considera os valores extremos
◦ Ex: 5 medidas de glicemia em mmol/l
80; 85; 88; 90; 500
Amplitude: 500-80=480
◦ Medidas que se distanciam muito das demais influenciam muito a amplitude
Amplitude interquartil◦ Percentil 75 – percentil 25
◦ Considera apenas a parte central dos valores de um conjunto de dados
◦ Joga fora os valores mais altos e os mais baixos
Não influenciada pelos valores discrepantes
Variância (S2)◦ Boas propriedades estatísticas
◦ Usa todas as observações
◦ É uma medida dos “desvios” (ao quadrado) de cada observação em relação à média
Pq ao quadrado?
Unidade de medida ao quadrado difícil interpretação
Desvio padrão (S)◦ É a raiz quadrada da variância
◦ Quanto mais próximos os valores individuais estiverem de sua média, < a dispersão e < o desvio-padrão
◦ Muito útil para distribuições dos dados aproximadamente normais
Ou Gaussiana
Simétrica
Forma de “sino”
É uma distribuição contínua
Descreve bem fenômenos biológicos
5 4 0 0
5 0 0 0
4 6 0 0
4 2 0 0
3 8 0 0
3 4 0 0
3 0 0 0
2 6 0 0
2 2 0 0
1 8 0 0
1 4 0 0
1 0 0 0
6 0 0
1 8
1 6
1 4
1 2
1 0
8
6
4
2
0
S t d . D e v = 5 5 7 . 3 8
M e a n = 3 1 5 2
N = 5 2 5 8 . 0 0
Percentagem
Peso ao nascer
1) UMA REVISÂO SOBRE GRÀFICOS E TABELAS E SUAS
APLICAÇÔES.
• População (universo) = conjunto de todos os possíveis valores de uma variável ou característica.
• Amostra = conjunto de observações extraída de uma população.
Em Estatística, variável é atribuição de um número acada característica da unidade experimental de umaamostra ou população.
Vários tipos de variáveis são encontradas no dia-a-dia,sendo importante a distinção entre as mesmas.
Quando uma característica ou variável é não-numérica,denomina-se variável qualitativa ou atributo.
Exemplos de variável qualitativa
a) Sexo
b) Religião
c) Cor de olhos
d) Faixa etária
Uma variável qualitativa é expressa em categorias
Quando a variável é expressa numericamente, denomina-se variável quantitativa.
Uma variável quantitativa pode ser discreta ou contínua.
Exemplos de variável quantitativa
a) Peso dos órgãos
b) Idade
c) Número de filhos
d) Altura
Uma etapa importante no trabalho científico é a
divulgação à comunidade dos resultados obtidos.
É assim que a contribuição do trabalho ao
patrimônio científico da humanidade é colocada
à disposição de todos. Essa divulgação é feita
principalmente em revistas científicas
especializadas de circulação nacional e
internacional e obedece a certos padrões na sua
apresentação.
Durante os cursos de graduação e pós-graduação (não
importa a carreira escolhida), muitos, provavelmente,
terão alguma bolsa de pesquisa, farão algum estágio e
principalmente publicarão trabalhos em revistas
científicas. Tais atividades requerem do aluno a
apresentação de seu trabalho (resultados) de forma
compatível com os padrões acadêmicos nacionais e
internacionais. Além disso, na atividade profissional de
cada um, certamente haverá a necessidade de apresentar
relatórios, projetos e estudos desenvolvidos para seus
clientes.
Conteúdo de hoje:
• Tabelas de Frequência;
• Gráficos;
•Exercícios de Fixação valendo nota.
Os dados são registrados em fichas, com várias informações.
Para obter apenas os dados é preciso fazer uma apuração.
Variável qualitativa – apuração é a simples contagem
Exemplo: número de nascidos vivos para cada sexo
Variável quantitativa – anotar cada valor observado
Exemplo: número do prontuário e peso ao nascer
Após a apuração, há necessidade dos dados serem dispostos de
uma forma ordenada, quando possível, e resumida, a fim de
auxiliar o pesquisador na sua análise e facilitar a compreensão
das conclusões apresentadas ao leitor. Os dados podem estão
serem apresentados na forma de tabelas estatísticas. Essas
devem ser auto-suficientes, isto é, devem ter significado próprio,
de modo a prescindir, quando isoladas, de consultas ao texto.
Uma tabela estatística deve conter o número, o título, o corpo e
o rodapé (fonte, notas e notas específicas).
Componentes mais importantes de uma tabela:
Título – explica o que a tabela contém
Corpo – formado pelo cabeçalho, pela coluna indicadora e pelas linhas e
colunas de dados:
Cabeçalho – especifica o conteúdo das colunas
Coluna indicadora – especifica o conteúdo das linhas
título
cabeçalho
coluna indicadora
corpo
coluna de dados
Tabela de contingência: os elementos da amostra ou
população são classificados de acordo com dois ou mais
fatores (diferentes anos de arrecadação).
mais interessante!
frequência relativa
(porcentagem)
frequência
frequência
relativa
frequência
relativa
frequência
Como definir o número de classes?
- poucas: perde-se muita informação
- muitas: pode-se ter pormenores desnecessários
O número adequado de classes é definido pelo
pesquisador.
Na escolha, é conveniente usar extremos de classes fáceis
de trabalhar.
Exemplo - Tabela de variáveis contínuas
Informações sobre peso de recém-nascidos medidos
ao longo de um ano. Como fazer uma tabela com essa
informação?
1)Definir as faixas de pesos (classes)
1,0 – 1,5 1,5 – 2,0 2,0 – 2,5 2,5 – 3,0
3,0 – 3,5 3,5 – 4,0 4,0 – 4,5 4,5 – 5,0
Intervalo de classe: 0,5 kg (escolha pessoal)
2) Contar quantos dados existem em cada classe
1,0 |– 1,5 ---> 1
1,5 |– 2,0 ---> 3
2,0 |– 2,5 ---> 16
2,5 |– 3,0 ---> 31
3,0 |– 3,5 ---> 34
3,5 |– 4,0 ---> 11
4,0 |– 4,5 ---> 4
4,5 |– 5,0 ---> 2 1,5 2,0
fechado aberto
(pertence) (não pertence)
extremos de classe:
valores limites dos intervalos
de classe
podem pertencer ou não à
classe
3) Determinar o Ponto médio de cada classe: a metade de cada
intervalo considerado. PM1= (1,5 + 2,0)/2 = 1,75.
4) Somar a freqüência total das classes e determinar a freqüência
relativa fR(i)= f(i)/ftotal
Peso (kg) f(i) fR
1,25 1 1%
1,75 2 2%
2,25 16 16%
2,75 31 31%
3,25 34 34%
3,75 11 11%
4,25 4 4%
5,25 1 1%
Total 100 100%
Tabela 01 – Peso de Recém-nascidos*
* Medido até 5 horas do nascimento
Gráfico que fornece os intervalos de classe ao longo do eixo
horizontal e as frequências (absolutas ou relativas) no eixo
vertical.
1 2 3 4 50
5
10
15
20
25
30
35
40
Peso de Recém-nascidosF
req
uên
cia
Peso (Kg)
freq
1,25 1,75 2,25 2,75 3,25 3,75 4,25 4,75 5,25
1 2 3 4 5
0
5
10
15
20
25
30
35
40
Peso de Recém-nascidos
freqF
req
uên
cia
Peso (Kg)
1,25 1,75 2,25 2,75 3,25 3,75 4,25 4,75 5,25
São normalmente utilizados pararepresentar uma série temporal, conduzindoa uma interpretação dinâmica do fenômenoestudado.
Neste tipo de gráfico considera-se apenasuma variável, devendo-se tomar cuidadocom a quantidade de categorias arepresentar, afim de não prejudicar avisualização do gráfico.
Tabelas:◦ São convenientes quando há necessidade ou
relevância em explicitar todos os valores.
◦ Quando deseja-se que os parâmetrosapresentados sejam conhecidos para fins deaplicação, reprodução etc.
◦ Quando a comparação entre diferentes colunasde uma mesma linha não correlacionam-se,diretamente, com as demais linhas da tabela.
Exemplo de tabela
Gráficos:◦ Para um grande número de dados, quando não
há relevância na apresentação dos valores, é maisconveniente agrupar os dados e, se possível,grafa-los diretamente. Caso contrário, pode-segerar uma nova tabela (enxugada).
◦ Quando deseja-se avaliar ocomportamento,tendências ou a relação entreduas colunas de uma tabela.
◦ Comparar duas ou mais colunas em relação auma determinada variável. Neste caso, aapresentação em um único gráfico permite umarápida comparação.
Cabeçalhos de tabelas devem ser curtos para evitarcolunas com largura desproporcional aos seus dados.Em tais casos, é conveniente a criação de uma legendalogo abaixo da tabela. O tamanho efetivo da tabela podeneste caso ser bastante reduzido.
Quando há muitas linhas numa tabela, e a largura entreelas é estreita, convém separar com traços para evitar adescontinuidade do leitor ao comparar diferentescolunas de uma mesma linha.
O uso de continuidade de colunas deve ser avaliadoquando principalmente há espaços suficientes para quetodas as diferentes colunas da tabela sejam repetidasem cada linha.
Tabelas envolvendo matrizes simétricas podemdispensar repetições de valores e, conseqüentemente,economizar a metade do espaço.
deve propiciar uma visualização rápida do fenômeno e paraisso, conter apenas o essencial para sua execução;
o tamanho deve ser adequado à sua publicação emtrabalhos técnico-científicos, revistas, periódicos, cartazesou livros;
deve sempre ter um título e a fonte dos dados originais e,se necessário, números e notas explicativas;
deve ser construído em uma escala que não desfigure osfatos ou as relações que se deseja destacar;
atenção ao comparar diferentes gráficos - verificar apossibilidade de manter as escalas na mesma proporção;
Alguns pontos devem ser respeitados na construção de um gráfico,
a saber:
2) (FUVEST) Sabe-se que a média aritmética de 5 números inteiros distintos, estritamente positivos, é 16. O maior valor que um desses inteiros pode assumir é:
a) 16 b) 20 c) 50 d) 70 e) 100
RESPOSTA: D
3) O time de futebol do Cruzeiro de Minas Gerai, fez 6 partidas amistosas, obtendo os seguintes resultados, 4 x 2, 4 x 3, 2 x 5, 6 x 0, 5 x 3, 2 x 0. Qual a média de gols marcados nestes amistoso?
X = 4+4+2+6+5+2/ 6 = 3,8
4) 1. Um colégio resolveu inovar a forma de calcular a média final de seu alunos.
1º bimestre teve peso 2.2º bimestre teve peso 2.3 bimestre teve peso 3.4 bimestre teve peso 3.
Vamos calcular a média anual de Ricardo que obteve as seguintes notas em historia. 1 bim = 3, 2 bim = 2,5, 3 bim = 3,5 e 4 bim = 3
Classifique as variáveis abaixo em qualitativas ou quantitativas
(discretas ou contínuas):
a) População: Estação meteorológica de uma cidade.
Variável: precipitação pluviométrica, durante o ano.
Resp.:
b) P: Alunos de uma cidade.
V: Cor dos olhos.
Resp.:
c) P: Bolsa de valores de São Paulo.
V: Número de ações negociadas.
Resp.:
d) P: Funcionários de uma empresa.
V: Salários.
Resp.:
Quantitativa contínua
Qualitativa
Quantitativa discreta
Quantitativa discreta
Exercícios:
Faça a distribuição dos dados abaixo:
a) Sendo limite inferior 30 e 10 para intervalo de classe:
54429889693948669465
74645545359456784167
60738576655350418059
88853557556591817174
77736168734752336884
b) Os resultados obtidos pelo lançamento de um dado 50 vezes foram
os seguintes:
3425164265
1563152522
6244531345
4363153361
5626346256
Respostas:
a)
Σ = 1,000Σ = 50
0,080
0,200
0,380
0,600
0,780
0,920
1,000
4
10
19
30
39
46
50
0,080
0,120
0,180
0,220
0,180
0,140
0,080
35
45
55
65
75
85
95
4
6
9
11
9
7
4
30 ? 40
40 ? 50
50 ? 60
60 ? 70
70 ? 80
80 ? 90
90 ? 100
1
2
3
4
5
6
7
FriFifrixifiNOTASi
Respostas:
b)
Σ = 1,000Σ = 50
0,120
0,280
0,460
0,600
0,800
1,000
6
14
23
30
40
50
0,120
0,160
0,180
0,140
0,200
0,200
6
8
9
7
10
10
1
2
3
4
5
6
FriFifrifixi
MÉDIA ARITMÉTICA
Dados Agrupados: Sem intervalo de classes
Fórmula:
X = Σ fixi
Σ fi
Σ fi.xi = 78Σ = 34
0
6
20
36
16
2
6
10
12
4
0
1
2
3
4
fi.xifiIdade (xi)
X = 2,29
Fórmula:
X = Σ xifiΣ fi
MÉDIA ARITMÉTICA
Dados Agrupados: Com intervalo de classes
Σ fi.xi = 6440Σ = 40
608
1404
1760
1312
840
516
152
156
160
164
168
172
4
9
11
8
5
3
150 ? 154
154 ? 158
158 ? 162
162 ? 166
166 ? 170
170 ? 174
1
2
3
4
5
6
fi.xixifiEstaturas
(cm)
i
X = 161
1. 3) População ou universo é:
a) Um conjunto de pessoas;
b) Um conjunto de elementos quaisquer
c) Um conjunto de pessoas com uma característica comum;
d) Um conjunto de elementos com pelo menos uma característica em comum;
e) Um conjunto de indivíduo de um mesmo município, estado ou país.
2. 4) Uma parte da população retirada para analisá-la denomina-se:
a) Universo;
b) Parte;
c) Pedaço;
d) Dados Brutos;
e) Amostra.
3. 5) A parte da estatística que se preocupa somente com a descrição de determinadas
características de um grupo, sem tirar conclusões sobre um grupo maior denomina-se:
a) Estatística de População;
b) Estatística de Amostra;
c) Estatística Inferencial
d) Estatística Descritiva;
e) Estatística Grupal.
1. 4)Uma série estatística é denominada Temporal quando?
a) a) O elemento variável é o tempo;
b) b) O elemento variável é o local;
c) c) O elemento variável é a espécie;
d) d) É o resultado da combinação de séries estatísticas de tipos diferentes;
e) e) Os dados são agrupados em subintervalos do intervalo observado.
2. 5) Suponha que uma pesquisa de opinião pública deve ser realizada em um estado que
tem duas grandes cidades e uma zona rural. Os elementos na população de interesse são todos
os homens e mulheres do estado com idade acima de 21 anos. Que tipo de amostragem você
sugeriria?. Amostragem Estratificada
3. 6) Um médico está interessado em obter informação sobre o número médio de vezes em
que 15.000 especialistas prescreveram certa droga no ano anterior (N = 15.000). Deseja-se obter
uma amostra n = 1.600. Que tipo de amostragem você sugeriria e por que? Amostragem
Sistemática
7) 1. De acordo com as normas para representação tabular de dados, quando o valor
de um dado é muito pequeno, para ser expresso com o número de casa decimais utilizadas ou
com a unidade de medida utilizada, deve-se colocar na célula correspondente.
a) Zero (0);
b) Três pontos (...);
c) Um traço horizontal (-)
d) Um ponto de interrogação (?);
Um ponto de exclamação (!).
1. 8) Assinale a afirmativa verdadeira:
a) a) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos
horizontalmente.
b) b) Um gráfico de barras ou colunas é aquele em que os retângulos que o compõem estão dispostos
verticalmente.
c) c)Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos verticalmente e
um gráfico de colunas, horizontalmente.
d) d)Um gráfico de barras é aquele em que os retângulos que o compõem estão dispostos
horizontalmente e um gráfico de colunas, verticalmente.
e) e) Todas as alternativa anteriores são falsas.
1. 9) Um dado foi lançado 50 vezes e foram registrados os seguintes resultados
5 4 6 1 2 5 3 1 3 3
4 4 1 5 5 6 1 2 5 1
3 4 5 1 1 6 6 2 1 1
4 4 4 3 4 3 2 2 2 3
6 6 3 2 4 2 6 6 2 1
9a. .A amplitude Total (n)
6 a) 5
7 b) 6
8 c) 7
9 d) 10
10 e) 50
11
12
a. A freqüência simples absoluta do primeiro elemento:
a) a) 10%
b) b) 20%
c) c) 1
d) d) 10
e) e) 20
1. Qualquer variável com distribuiçãosimétrica (normal) pode ser relacionadacom uma distribuição normal padrão◦ Média: zero; DP: 1
◦ Posso estimar entre quais valores está x% dosmeus dados
2. Área abaixo da curva◦ A área abaixo de toda a curva normal = 1, ou
seja, a probabilidade de que uma observaçãofique em algum lugar abaixo da curva é 100%
3. A probabilidade de se estimar alocalização exata de um indivíduo emespecífico é “zero”◦ Não posso estimar a posição de um valor
específico, mas posso calcular: Proporção de indivíduos abaixo ou acima de certo valor
Proporção de indivíduos entre certos valores
Exemplo
Qual a probabilidade de uma criança terpeso ao nascer igual a 4000 gramas?◦ Não tenho como calcular esta probabilidade
exata, mas posso calcular...
Qual é a proporção de crianças com peso aonascer maior de 4000 gramas?
Média = 3230
DP = 610
Crianças com peso ao nascer > 4000
gramas
Distribuição normal padrão◦ (x - média)/desvio padrão
◦ (4000 - 3230)/610 = 1,26 = z
Olhando as tabelas de distribuição normal...
z = 0,1038, ou seja, 10,4% das crianças tempeso ao nascer maior do que 4000 gramas
O que seria uma amostra? Não é melhoravaliar toda a população ?
Quero conhecer um atributo de uma população (alvo)◦ Estado nutricional das crianças brasileiras
menores de 5 anos
Escolho um grupo para estudar◦ Crianças menores de 5 anos da cidade de Pelotas
Deste grupo tiro uma amostra
UNIVERSO ou POPULAÇÃO TOTAL
POPULAÇÃO ALVO
AMOSTRA
1. Representar a população◦ Equiprobabilidade = representatividade Todos os indivíduos da população alvo têm a mesma
chance de participar do estudo (de serem sorteados)
POPULAÇÃO ALVO POPULAÇÃO ALVO
2. Precisão◦ Amostra de tamanho adequado
◦ Garantir o mínimo de precisão
◦ Garantir a chance de demonstrar uma diferençaentre dois grupos PODER: probabilidade de encontrar uma diferença qdo ela
realmente existe
Quanto maior a amostra, maior o poder
◦ Estudos com baixo poder (amostra pequena) para testar associações são um desperdício de tempo e dinheiro
3. Variabilidade amostral◦ Cada amostra dá um resultado◦ Repetir o processo de amostragem e estudar a
distribuição dos resultados
Como será que a distribuição das amostrasse compara com a distribuição em todapopulação?◦ Se coletarmos muitas amostras independentes,
do mesmo tamanho, de uma mesma população ecalcularmos a média de cada amostra... Distribuição das médias amostrais
Tem importância pelo que nos conta sobrea população que representa
A média e o desvio padrão da amostra sãousados para estimar a média e o desviopadrão da população
s
xamostra
população
A média da distribuição das médiasamostrais é a média da população (isso eujá sei!!!)
E como é a variabilidade da média dapopulação?◦ O desvio padrão da distribuição das amostras se
denomina ERRO PADRÃO
Enquanto o desvio padrão mede avariabilidade dos indivíduos da amostra
... o erro padrão mede a variabilidade damédia das amostras◦ E indica com que precisão a média da população
pode ser estimada pela média amostral
Erro padrão
nep
Desvio padrão da população
Tamanho da amostra
Dificilmente nós conhecemos o desvio
padrão da população ( )
Então se usa o desvio padrão da amostra (s)para estimar o erro padrão
n
sep
Desvio padrão da amostra
Tamanho da amostra
Serve para calcular o Intervalo de Confiança
Intervalo de Confiança: intervalo de valoresque contém o parâmetro de interesse◦ Valores dentro dos quais existe uma certa
probabilidade de estar incluída a real média dapopulação
◦ Usado para comparar se existem diferenças entredois ou mais grupos Testes de hipóteses
◦ Isso será visto nas próximas aulas...
Massad E, Menezes R, Silveira P, Ortega N. MétodosQuantitativos em Medicina. SP: Manole, 2004
Kirkwood B and Sterne J. Essential of medical statistics.Blackwell Science, 2003