bioestatistica1
-
Upload
felipe-barretos -
Category
Documents
-
view
21 -
download
0
Transcript of bioestatistica1
-
HEP5800 DPBergamaschi 1
HEP 5800 Bioestatstica DATA AULA CONTEDO PROGRAMTICO 02/03 1 Levantamento e apresentao tabular de dados
04/03 2 Apresentao tabular e grfica
09/03 3 Apresentao tabular e grfica Exerccios
11/03 4 Medidas de tendncia central ou de posio
16/03 5 Medidas de disperso ou de variabilidade Exerccios
18/03 6 Medidas de correlao, noes de regresso linear simples, estimando a equao da reta - Exerccios
23/03 7 Medidas de associao
25/03 8 AVALIAO 06/04 9 Noes de probabilidade; noes de amostragem
08/04 10 Distribuio binomial
13/04 11 Distribuio normal, distribuio amostral da mdia
15/04 12 Teste de hipteses de parmetros populacionais
20/04 13 Teste de hipteses de uma proporo populacional
22/04 14 Teste de hipteses de uma mdia populacional
27/04 15 Exerccios
29/04 16 Teste de hipteses de associao
04/05 17 Estimao de parmetros por intervalo de confiana: mdia e proporo
06/05 18 Exerccios
11/05 19 AVALIAO
-
HEP5800 DPBergamaschi 2
Levantamento de dados e apresentao tabular
Nveis de mensuraoApurao de dados Apresentao tabularExerccios
Nveis de mensurao (Berqu et al, 1981)
Escalas
Nominal
Ordinal
Intervalar
De razes
Discreta
Contnua
-
HEP5800 DPBergamaschi 3
Escala nominal
Os indivduos so classificados em categorias segundo uma caracterstica.
Ex: sexo (masculino, feminino), hbito de fumar (fumante, no fumante),sobrepeso (sim, no)causa de bito (C1,C2, C3, C4)
Nveis de mensurao
-
HEP5800 DPBergamaschi 4
Escala ordinal
Os indivduos so classificados em categorias que possuem algum tipo inerente de ordem. Neste caso, uma categoria pode ser "maior" ou "menor" do que outra.
EX: nvel scio-econmico (A, B, C e D)
Nveis de mensurao
-
HEP5800 DPBergamaschi 5
Escala intervalar
Este nvel de mensurao possui um valor zero arbitrrio.
Ex: temperatura em graus Celsius e Fahrenheit.
Como o zero, da escala, arbitrrio, somente faz sentido o clculo da diferena mas no o da razo entre dois valores.
Exemplo: material 0C 0F |dif0C| |dif 0F| dif0C/dif0F razo0C razo0F Razo0C/razo0F A 20 68 |A-B|=20 |A-B|=36 0,56 A/B=0,50 A/B=0,65 0,77 B 40 104 |B-C|=20 |B-C|=36 0,56 B/C=0,67 B/C=0,74 0,91 C 60 140 |A-C|=40 |A-C|=72 0,56 A/C=0,33 A/C=0,49 0,67
a temperatura em graus Fahrenheit dada por
+ 32)(
59 Celsiousgrausematemperaturda
comprimento cm polegada |difcm| |dif pol| Difcm/difpol Razocm Razopol Razocm/razopol A 20 50,8 |A-B|=15 |A-B|=38,1 0,394 A/B=0,571 A/B=0,571 1 B 35 88,9 |B-C|=5 |B-C|=12,7 0,394 B/C=0,875 B/C=0,875 1 C 40 101,6 |A-C|=20 |A-C|=50,8 0,394 A/C=0,5 A/C=0,5 1
1 polegada = 2,54 cm
Nveis de mensurao
-
HEP5800 DPBergamaschi 6
Escala de razes discreta
O resultado numrico da mensurao um valor inteiro
Ex: nmero de refeies em um dia (0, 1, 2, 3,...)
Escala de razes contnua
O resultado numrico um valor pertencente ao conjunto dos nmeros reais
Ex: idade (anos), peso (g), altura (cm), nvel de retinol srico (g/dl), circunferncia da cintura (cm)
Nveis de mensurao
-
HEP5800 DPBergamaschi 7
Outra denominao:
Varivel qualitativa nominal
qualitativa ordinal
quantitativa discreta
quantitativa contnua
nominal
ordinal
intervalar
razes
Idoso (sim/no) Criana 1, 4, 15, 24, 32, 40, 51, 56, 59, 61, 63, 70, 74, 80, 86Jovem
Adulto
Idoso
Nveis de mensurao
-
HEP5800 DPBergamaschi 8
Apurao de dados
Processo no qual conta-se o nmero de vezes que a varivel assumiu um determinado valor (freqncia de ocorrncia).
Pode ser manual, mecnica ou eletrnica
programas estatsticos: Epi info[1], Stata, Excel, SPSS, SAS, R, S-Plus
Distribuio de freqncias - correspondncia entre categorias (valores) e freqncia de ocorrncia.
[1] www.cdc.gov/epiinfo/
-
HEP5800 DPBergamaschi 9
Apurao de dados
. tab ir
ir | Freq. Percent Cum.------------+-----------------------------------
no | 428 88.25 88.25sim | 57 11.75 100.00
------------+-----------------------------------
Total | 485 100.00
| irsexo | no sim | Total
-----------+----------------------+----------
masc | 334 46 | 380 | 87.89 12.11 | 100.00
-----------+----------------------+----------
fem | 94 11 | 105 | 89.52 10.48 | 100.00
-----------+----------------------+----------
Total | 428 57 | 485 | 88.25 11.75 | 100.00
. tab sexo ir,row chi
-
HEP5800 DPBergamaschi 10
Elementos essenciais: ttulo, corpo, cabealho e coluna indicadora.
Tabela 1 - Ttulo: o que (natureza do fato estudado)?como (variveis)?onde? quando?
Fonte notas, chamadas
OBS: nenhuma casela (interseco entre linha e coluna) deve ficar em branco.
A tabela deve ser uniforme quanto ao nmero de casas decimais e conter os smbolos ou 0 quando o valor numrico nulo e ... quando no se dispe do dado.
Apresentao tabular
Varivel n % Total
-
HEP5800 DPBergamaschi 11
Apresentao tabular
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico gravesegundo condio de sobrevivncia, New South Wales, Australia, 1973*.
Condio do recm-nascido n %
Sobrevivente 23 46
No sobrevivente 27 54
Total 50 100
Fonte: van Vliet PKJ, Gupta JM. (1973)* ano da publicao do artigo
Nvel de colesterol (mg / 100ml) n %
120|--140 1 2,5
140|--160 2 5,0
160|--180 2 5,0
180|--200 6 15,0
200|--220 6 15,0
220|--240 6 15,0
240|--260 10 25,0
260|--280 3 7,5
280|--300 1 2,5
300|--320 1 2,5
320|--340 1 2,5
340|--360 1 2,5
Total 40 100
Distribuio de homens de meia idade segundo nvel de colesterol (mg/100ml), San Fracisco, EUA, 1961-62
Como o nvel de colesterol varivel quantitativa contnua, a melhor forma de apresent-la em tabelas utilizando intervalos de valores denominados intervalos de classe .
Fonte: Western Collaborative Group Study
-
HEP5800 DPBergamaschi 12
Apresentao tabularExemploX: 5,5,15,20,20,20,21,21,22,22
Idade Freqncia %
5|-- 10 2 2010|--15 0 -15|--20 1 1020|--25 7 70Total 10 100
Intervalos de classe: conjunto de observaes contidas entre dois valores limite (limite inferior e limite superior) Representao: 5 | -- 10 intervalo fechado no limite inferior e aberto no limite
superior (contm o valor 5 mas no contm o valor 10) 5 -- 10 intervalo aberto nos limites inferior e superior
(no contm os valores 5 e 10) 5 |-- | 10 intervalo fechado nos limites inferior e superior
(contm os valores 5 e 10) OBS: Representar o intervalo 0 |-- | 11 meses equivalente a represent-lo como 0 |-- 12 meses
-
HEP5800 DPBergamaschi 13
Os intervalos de classe devem ser mutuamente exclusivos (um indivduo no pode ser classificado em dois intervalos ao mesmo tempo) e exaustivos (nenhum indivduo pode ficar sem classificao).
A amplitude do intervalo o tamanho do intervalo de classe. A amplitude do intervalo e o nmero de intervalos dependem basicamente do problema especfico e da literatura existente sobre o assunto.
O ponto mdio do intervalo calculado somando-se o limite inferior e limite superior, dividindo-se o resultado por dois.
Perceber que o ponto mdio do intervalo da varivel idade, 5|--10 7,5 [ou seja, (5+10)/2] e o ponto mdio do intervalo 5|--|10 8 [ou seja, (5+11)/2]
Apresentao tabular
-
HEP5800 DPBergamaschi 14
Apresentao tabular
Tabela de dupla entrada ou de contingncia
N % N % N %
Baixo peso (
-
HEP5800 DPBergamaschi 15
Apresentao tabular
N % N % N %
Baixo peso (
-
HEP5800 DPBergamaschi 16
Exerccios
Classificar quanto natureza, as seguintes variveis: Varivel Tipo (natureza) condio de sade (doente, no doente) tipo de parto (normal, cesrio) Nvel de colesterol srico (mg/100cc) tempo de um procedimento cirrgico (minutos) nmero de praias consideradas poludas Custo do procedimento (reais)
Questo 1
-
HEP5800 DPBergamaschi 17
Questo 2
Exerccios
Os dados a seguir so de peso (kg) de 80 mulheres. Apresente-os em uma tabela Peso (kg)
58 65 67 70 72 75 81 81 59 65 68 70 72 75 81 81 59 65 68 71 72 75 81 81 61 65 68 71 73 75 81 81 63 65 68 71 73 76 82 82 63 66 68 71 73 76 82 82 64 66 69 72 73 76 82 82 64 66 69 72 74 76 83 83 64 66 70 72 74 77 84 84 58 67 70 72 75 77 85 85
Fonte: Osborn JF. Statistical Exercises in Medical Research. John Wiley & Sons Inc., 1979. (adaptado)
-
HEP5800 DPBergamaschi 18
Exerccios
Os dados a seguir so relativos ao peso ao nascer (g) de recm nascidos com sndrome de desconforto respiratrio idioptico grave. Algumas crianas foram a bito (*) e outras sobrevieram. Apresente os dados em uma tabela de dupla entrada considerando as variveis peso ao nascer e condio de sobrevivncia.
1050* 2500* 1890* 1760 2830 1175* 1030* 1940* 1930 1410 1230* 1100* 2200* 2015 1715 1310* 1185* 2270* 2090 1720 1500* 1225* 2440* 2600 2040 1600* 1262* 2560* 2700 2200 1720* 1295* 2730* 2950 2400 1750* 1300* 1130 2550 3160 1770* 1550* 1575 2570 3400 2275* 1820* 1680 3005 3640
Fonte: Hand DJ et al., 1994.
Questo 3
-
HEP5800 DPBergamaschi 19
Os dados a seguir so de altura de uma amostra de 351 mulheres idosas selecionadas aleatoriamente de uma comunidade para um estudo de osteoporose. Faa uma apurao dos dados e represente-os em uma tabela. Interprete os resultados.
ExercciosQuesto 4
142 152 154 156 157 158 160 161 163 164 165 169 145 152 154 156 157 158 160 161 163 164 165 169 145 152 154 156 157 158 160 161 163 164 165 169 145 152 154 156 157 158 160 161 163 164 165 169 146 152 155 156 157 158 160 161 163 164 166 169 147 152 155 156 157 158 160 161 163 164 166 169 147 153 155 156 158 158 160 161 163 164 166 169 147 153 155 156 158 158 160 161 163 164 166 170 147 153 155 156 158 159 160 162 163 164 166 170 148 153 155 156 158 159 160 162 163 164 166 170 148 153 155 156 158 159 160 162 163 164 166 170 149 153 155 156 158 159 160 162 163 164 166 170 150 153 155 156 158 159 160 162 163 164 166 170 150 153 155 156 158 159 160 162 163 164 166 170 150 153 155 156 158 159 160 162 163 164 166 170 150 153 155 157 158 159 160 162 163 165 167 170 150 153 155 157 158 159 160 162 163 165 167 170 150 153 155 157 158 159 161 162 163 165 167 170 151 153 155 157 158 159 161 162 163 165 167 171 151 153 155 157 158 159 161 162 163 165 167 171 151 153 155 157 158 159 161 162 163 165 167 171 151 153 155 157 158 159 161 162 163 165 167 173 151 153 155 157 158 159 161 162 163 165 168 173 151 154 155 157 158 159 161 162 163 165 168 173 152 154 155 157 158 159 161 162 163 165 168 174 152 154 156 157 158 160 161 162 163 165 168 176 152 154 156 157 158 160 161 163 163 165 168 177 152 154 156 157 158 160 161 163 164 165 168 178 152 154 156 157 158 160 161 163 164 165 169 178 152 154 156
Fonte: Hand DJ et al., 1994.
-
HEP5800 DPBergamaschi 20
Exerccios
Os dados abaixo so de um estudo de prevalncia de doena cardaca e investigao de fatores de risco associados. Calcular os valores relativos (percentuais). Distribuio de pacientes segundo ronco noturno e doena cardaca
Ronco noturno Doena cardaca Sim No Total N % N % N %
No 24 1355 1379 Ocasional 35 603 638
Quase todas as noites 21 192 213 Sempre 30 224 254 Total 110 2374 2484
Fonte: Hand DJ et al., 1994.
Questo 5
-
HEP5800 DPBergamaschi 21
Exerccios
Questo 6
Com base nos dados da tabela abaixo, a) Calcular o percentual de mes com dieta boa, razovel e pobre entre os casos de spina bfida e entre os controles (fixando o 100% no total de casos e de controles); b) Analise e discuta os resultados. Distribuio de recm-nascidos casos (acometidos de spina bfida) e controles segundo dieta da me. Dieta materna Casos Controles Total n % n % n % Boa 34 43 77 Razovel 110 48 158 Pobre 100 32 132 Total 244 123 367
Fonte: Hand DJ et al., 1994.
-
HEP5800 DPBergamaschi 22
Exerccios
Questo 7A tabela abaixo foi extrada do artigo Tendncia secular do peso ao nascer na cidade de So Paulo (1976-1998) deMONTEIRO CA et al. (Rev. Sade Pblica; 2000:34 (6, supl): 26-40).Comente os resultados apresentados.
-
HEP5800 DPBergamaschi 23
Apresentao grfica
Diagrama de barrasSetores circulares Diagrama linearHistogramaPolgono de freqncias simplesPolgono de freqncias acumuladasRepresentao de duas variveisEscalas aritmtica e logartmicaExerccios
-
HEP5800 DPBergamaschi 24
Diagrama de barras representa variveis qualitativas e quantitativa discreta
Apresentao grfica
Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996 Estado nutricional n % Nutrido 2061 51,5 Desnutrido 1905 47,6 Sem diagnstico 34 0,9 Total 4000 100 Fonte: adaptado de Soares JF et al., 2002.
Fonte: adaptado de Soares JF et al., 2002.
Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996
0
500
1000
1500
2000
2500
Nutrido Desnutrido Sem diagnstico
Estado nutricional
N
m
e
r
o
-
HEP5800 DPBergamaschi 25
Caractersticas:Barras separadas e bases de mesmo tamanho.
Apropriados para representar as variveis qualitativa nominal, ordinal e quantitativa discreta.
Apresentao grfica
Diagrama de barras
-
HEP5800 DPBergamaschi 26
Apresentao grfica
Excluindo-se os registros com informao ignorada
0500
1000
150020002500
Nutrido DesnutridoEstado nutricional
N
m
e
r
o
Fonte: adaptado de Soares JF et al., 2002.Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996
Diagrama de barras
-
HEP5800 DPBergamaschi 27
Apresentao grfica
Diagrama de barras
A representao grfica abaixo est correta?
1800185019001950200020502100
Nutrido DesnutridoEstado nutricional
N
m
e
r
o
3966Total1905Desnutrido2061Nutrido
nEstado nutricional
-
HEP5800 DPBergamaschi 28
Apresentao grfica
Diagrama de barras
Distribuio de famlias segundo nmero de bens* que possuem. Nmero de bens n % 0 146 40,6 1 97 26,9 2 87 24,2 3 26 7,2 4 4 1,1 Total 360 100 * automvel, telefone, TV a cabo e computador
0
10
20
30
40
50
0
1
2
3
4
Nmero de bens
%
-
HEP5800 DPBergamaschi 29
Apresentao grfica
Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996. Estado nutricionala n % Nutrido 2061 52,0 Desnutrido moderado 1407 35,4 Desnutrido grave 498 12,6 Total 3966 100
a excluindo-se 34 (0,9%) de pacientes sem diagnstico Fonte: adaptado de Soares JF et al., 2002.
a excluindo-se 34 (0,9%) de pacientes sem diagnstico Fonte: adaptado de Soares JF et al., 2002. Distribuio de pacientes(a) segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.
52,0%35,4%
12,6%
Nutrido Desnutrido moderado Desnutrido grave
Diagrama de setores circulares -Adequado para representar variveis: qualitativa nominal, ordinal e quantitativa discreta
-
HEP5800 DPBergamaschi 30
Diagrama linear - representa variveis qualitativas ordinais relativas a tempo. Constitui uma exceo das variveis qualitativas ordinais
Apresentao grfica
Coeficientes de mortalidade por cncer de esfago (por 100.000 hab.) segundo sexo.
Municpio de So Paulo, 1968-1998.
Fonte: Incidncia de cncer no Municpio de So Paulo, 1997-1998. Registro de Cncer de So Paulo.
FSP/USP.
Masculino
0 2 4 6 8
10 12 14
1970 1980 1990 2000 Ano
C
o
e
f
i
c
i
e
n
t
e
(
1
0
0
.
0
0
0
h
a
b
)
Feminino
0
0,5
1
1,5
2
2,5
3
1970
1980
1990
2000
Ano C
o
e
f
i
c
i
e
n
t
e
(
1
0
0
.
0
0
0
h
a
b
)
-
HEP5800 DPBergamaschi 31
Apresentao grfica Produo de leite (milhes de toneladas). ndia e Estados Unidos, 1966 2000.
Ano ndia Estados Unidos 1966 20 58 1970 23 56 1980 29 60 1990 50 70 2000 80 75
Fonte: State of the World, 2001. W W Norton&Company, N.Y.
Diagrama linear
Fonte: State of the World, 2001. W W Norton&Company, N.Y. Produo de leite (milhes de toneladas). ndia e Estados Unidos, 1966 2000.
0
20
40
60
80
100
1970
1980
1990
2000
Ano
m
i
l
h
e
s
d
e
t
o
n
e
l
a
d
a
s
ndia
EUA
-
HEP5800 DPBergamaschi 32
HistogramaAdequado para representar uma varivel quantitativa contnua
Intervalos de classe com mesma amplitudeIntervalos de classe com amplitudes diferentes
Apresentao grfica
-
HEP5800 DPBergamaschi 33
Apresentao grfica Distribuio de recm-nascidos acometidos de sndrome de desconforto respiratrio grave segundo peso ao nascer (g)
Peso(g) No % 1000 |-- 1500 13 26 1500 |-- 2000 15 30 2000 |-- 2500 9 18 2500 |-- 3000 9 18 3000 |-- 3500 3 6 3500 |-- 4000 1 2 Total 50 100
Fonte: van Vliet PKJ et al., 1973.
Histograma- amplitudes iguais
Fonte: van Vliet PKJ et al., 1973. Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g).
0 5
10 15
20 25 30
35
1000 1500 2000 2500 3000 3500 4000 Peso ao nascer (g)
%
-
HEP5800 DPBergamaschi 34
Apresentao grfica Histograma- amplitudes diferentes
Distribuio de mulheres idosas segundo a altura. Altura (cm) No % 140|--150 12 3,4 150|--155 52 14,8 155|--160 109 31,1 160|--170 156 44,4 170|--180 22 6,3 Total 351 100
Fonte: Hand DJ et al., 1994. necessrio fazer o ajuste
Altura (cm) No Amplitude No/amplitude 140|--150 12 10 1,2 150|--155 52 5 10,4 155|--160 109 5 21,8 160|--170 156 10 15,6 170|--180 22 10 2,2 Total 351
-
HEP5800 DPBergamaschi 35
Apresentao grfica Histograma- amplitudes diferentes Altura (cm) No Amplitude No/amplitude 140|--150 12 10 1,2 150|--155 52 5 10,4 155|--160 109 5 21,8 160|--170 156 10 15,6 170|--180 22 10 2,2 Total 351
Fonte: Hand DJ et al., 1994. Distribuio de mulheres idosas segundo a altura.
0
5
10
15
20
25
140 145 150 155 160 165 170 175 180
altura (cm)
Mulheres/cm
Distribuio de mulheres idosas segundo a altura. Altura (cm) No % 140|--150 12 3,4 150|--155 52 14,8 155|--160 109 31,1 160|--170 156 44,4 170|--180 22 6,3 Total 351 100
Fonte: Hand DJ et al., 1994.
0
10
20
30
40
50
140 145 150 155 160 165 170 175 180
Altura (cm)
%
-
HEP5800 DPBergamaschi 36
Apresentao grfica
Polgono de freqncia simples
Adequado para representar uma varivel quantitativa contnua
Intervalos de classe com mesma amplitudeIntervalos de classe com amplitudes diferentes
-
HEP5800 DPBergamaschi 37
Polgono de freqncia simples amplitudes iguais
Apresentao grfica
Distribuio de recm-nascidos acometidos de sndrome de desconforto respiratrio grave segundo peso ao nascer (g).
Peso(g) No % 1000 |-- 1500 13 26 1500 |-- 2000 15 30 2000 |-- 2500 9 18 2500 |-- 3000 9 18 3000 |-- 3500 3 6 3500 |-- 4000 1 2 Total 50 100
Fonte: Hand DJ et al., 1994.
02468
10121416
0 500 1000 1500 2000 2500 3000 3500 4000 4500
peso (g)
Nmero
Fonte: Hand DJ et al., 1994.
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g).
-
HEP5800 DPBergamaschi 38
Apresentao grfica Polgono de freqncia simples amplitudes diferentes
Distribuio de mulheres idosas segundo a altura. Altura (cm) no % 140|--150 12 3,4 150|--155 52 14,8 155|--160 109 31,1 160|--170 156 44,4 170|--180 22 6,3 Total 351 100
Fonte: Hand DJ et al., 1994. Fazendo-se o ajuste: Altura (cm) No Amplitude No/amplitude 140|--150 12 10 1,2 150|--155 52 5 10,4 155|--160 109 5 21,8 160|--170 156 10 15,6 170|--180 22 10 2,2 Total 351
Fonte: Hand DJ et al., 1994. Distribuio de mulheres idosas segundo a altura (cm).
0
5
10
15
20
25
130 135 140 145 150 155 160 165 170 175 180 185 190
Altura (cm)
n
m
e
r
o
d
e
p
e
s
s
o
a
s
/
c
m
-
HEP5800 DPBergamaschi 39
Polgono (ogiva) de freqncias acumuladasApresentao grficaDistribuio de mulheres idosas segundo a altura.
Altura (cm) No % % acumulado
140|-145 1 0,29 0,29 145|-150 11 3,13 3,42 150|-155 52 14,81 18,23 155|-160 109 31,05 49,28 160|-165 106 30,20 79,48 165|-170 50 14,25 93,73 170|-175 18 5,13 98,86 175|-180 4 1,14 100 Total 351 100
Fonte: Hand DJ et al., 1994.
0
20
40
60
80
100
140 145 150 155 160 165 170 175 180
altura (cm)
% acumulado
Fonte: Hand DJ et al., 1994.Distribuio acumulada de mulheres idosas segundo a altura
Percentil Valor da varivel
Medidas estatsticas
25% 156 cm Q1 primeiro quartil 50% 160 cm Q2 - segundo quartil ou mediana 75% 164 cm Q3 terceiro quartil
-
HEP5800 DPBergamaschi 40
Apresentao grfica Polgono (ogiva) de freqncias acumuladas
Fonte: Koga CR, 2004. Avaliao nutricional de escolares de 7 a 10 anos. Dissertao de Mestrado. FSP/USP
Grfico 2- Distribuio acumulada de escolares de 7 a 10 anos, segundo estatura (cm) e idade. Duas escolas pblicas de So Paulo, 2004.
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
estatura (cm)
f
r
e
q
n
c
i
a
a
c
u
m
u
l
a
d
a
(
%
)
7 anos
8 anos
9 anos
10 anos
-
HEP5800 DPBergamaschi 41
Representao grfica de duas variveis
Medida do trceps Idade da menarca Pequeno Intermedirio Grande < 12 anos 15 29 36 12 anos e mais 156 197 150
Fonte: Hand DJ et al., 1994.
Calculando-se as porcentagens tem-se: Medida do trceps
Idade (anos)
Pequeno Intermedirio Grande Total
n % n % n % n %
-
HEP5800 DPBergamaschi 42
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido Sobrevivente No sobrevivente Total Peso(g) no % no % no % 1000 |-- 1500 2 9 11 41 13 26 1500 |-- 2000 6 26 9 33 15 30 2000 |-- 2500 5 22 4 15 9 18 2500 |-- 3000 6 26 3 11 9 18 3000 |-- 3500 3 13 0 - 3 6 3500 |-- 4000 1 4 0 - 1 2 Total 23 100 27 100 50 100
Fonte: Hand DJ et al., 1994.
Fonte: Hand DJ et al., 1994. Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.
0
5
10
15
20
25
30
35
40
45
Sobrevivente
No sobrevivente
Condio do recm nascido
%
1000 1500 2000 2500 3000 3500 4000 1000 1500 2000 2500 3000
-
HEP5800 DPBergamaschi 43
Polgono de freqncias
Fonte: Hand DJ et al., 1994. Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.
0 5
10 15 20 25 30 35 40 45
500 1000 1500 2000 2500 3000 3500 4000 4500 peso ao nascer (g)
%
Sobrevivente
No sobrevivente
-
HEP5800 DPBergamaschi 44
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido. Sobrevivente No sobrevivente Total Peso(g) No % No % No % 1000 |-- 1500 2 15 11 85 13 100 1500 |-- 2000 6 40 9 60 15 100 2000 |-- 2500 5 56 4 44 9 100 2500 |-- 3000 6 67 3 33 9 100 3000 |-- 3500 3 100 0 - 3 100 3500 |-- 4000 1 100 0 - 1 100 Total 23 46 27 54 50 100
Fonte: Hand DJ et al., 1994.
Fonte: Hand DJ et al., 1994. Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.
0
20
40
60
80
100
120
1000 |--1500
1500 |--2000
2000 |--2500
2500 |--3000
3000 |--3500
3500 |--4000
peso (g)
% Sobrevivente
No sobrevivente
-
HEP5800 DPBergamaschi 45
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido. Sobrevivente No sobrevivente Total Peso(g) No % No % No % 1000 |-- 1500 2 15 11 85 13 100 1500 |-- 2000 6 40 9 60 15 100 2000 |-- 2500 5 56 4 44 9 100 2500 |-- 3000 6 67 3 33 9 100 3000 |-- 3500 3 100 0 - 3 100 3500 |-- 4000 1 100 0 - 1 100 Total 23 46 27 54 50 100
Fonte: Hand DJ et al., 1994. Outro grfico possvel:
Fonte: Hand DJ et al., 1994. Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.
0
20
40
60
80
100
1000 1500 2000 2500 3000 3500 4000
peso (g)
% no sobreviviente sobrevivente
-
HEP5800 DPBergamaschi 46
Apresentao grfica escalas aritmtica e logartmica
Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.
Ano Sobrepeso Obesas 2000 300 100 2002 150 50
Fonte: dados hipotticos
Grfico em escala aritmtica
Fonte: dados hipotticos
Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.
0
100
200
300
400
2000 2002
Ano
N
m
e
r
o
Sobrepeso
Obesa
-
HEP5800 DPBergamaschi 47
Apresentao grfica escalas aritmtica e logartmica
Fonte: dados hipotticos
Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.
1
10
100
1000
2000 2002
Ano
N
m
e
r
o
Sobrepeso
Obesa
-
HEP5800 DPBergamaschi 48
Apresentao grfica escalas aritmtica e logartmica
Coeficiente de mortalidade pela doena X e Y (100.000hab). Determinada localidade, 1990- 1995.
Ano Doena X Doena Y
1990 123,5 28,7
1991 121,4 22,4
1992 111,9 17,7
1993 85,9 13,9
1994 77,1 14,8
1995 62,2 10,5
Fonte: Dados hipotticos
Fonte: Dados hipotticos
Coeficiente de mortalidade pela doena X e Y (100.000hab). Determinada localidade, 1990- 1995.
0
50
100
150
1990 1991 1992 1993 1994 1995 Ano
C
o
e
f
i
c
i
e
n
t
e
Doena X Doena Y
-
HEP5800 DPBergamaschi 49
Apresentao grfica escalas aritmtica e logartmicaGrfico em escala logartmica
Fonte: dados hipotticos
Coeficiente de mortalidade pela doena X e Y (100.000hab). Determinada localidade, 1990- 1995.
1
10
100
1000
1990
1991
1992
1993
1994
1995
Ano
C
o
e
f
i
c
i
e
n
t
e
Doena X Doena Y
0
50
100
150
1990 1991 1992 1993 1994 1995 Ano
C
o
e
f
i
c
i
e
n
t
e
Doena X Doena Y
-
HEP5800 DPBergamaschi 50
Apresentao grfica escalas aritmtica e logartmicaGrfico em escala logartmica
Fonte: dados hipotticos
Coeficiente de mortalidade pela doena X e Y (100.000hab). Determinada localidade, 1990- 1995.
1
10
100
1000
1990
1991
1992
1993
1994
1995
Ano
C
o
e
f
i
c
i
e
n
t
e
Doena X Doena Y
-
HEP5800 DPBergamaschi 51
Questo 9 Apresente os dados da tabela em um grfico apropriado. Distribuio de crianas segundo nvel de retinol srico. Cansao, Bahia, 1992.
Retinol srico (g/dl) No % Aceitvel (20-49) 89 55,3 Baixo (10-19,9) 65 40,4 Deficiente (
-
HEP5800 DPBergamaschi 52
Apresentao grfica
Questo 10 Apresente os dados da tabela em:
a) um histograma. b) um polgono de freqncias.
Distribuio de homens adultos segundo comprimento do antebrao
Comprimento (polegadas) No % 16,0 |-- 16,5 4 2,9 16,5 |-- 17,0 3 2,1 17,0 |-- 17,5 12 8,6 17,5 |-- 18,0 11 7,9 18,0 |-- 18,5 21 15,0 18,5 |-- 19,0 25 17,9 19,0 |-- 19,5 23 16,4 19,5 |-- 20,0 19 13,6 20,0 |-- 20,5 10 7,1 20,5 |-- 21,0 10 7,1 21,0 |-- 21,5 2 1,4 Total 140 100
Fonte: Hand DJ et al., 1994.
-
HEP5800 DPBergamaschi 53
Apresentao grfica
Questo 11 Apresente os dados da tabela em um grfico apropriado. Distribuio de homens segundo presena de doena coronariana (CHD) e consumo de caf
Condio Alto consumo de caf (>=100xcaras/ms)
Moderado consumo de caf (
-
HEP5800 DPBergamaschi 54
Questo 12Interprete os grficos dos itens a seguira) Artigo: Diagnstico de sobrepeso em adolescentes: estudo do desempenho de diferentes
critrios para o ndice de Massa Corporal de MONTEIRO POA et al. (Rev. Sade Pblica, 2000;34(5):506-13).
Apresentao grfica
-
HEP5800 DPBergamaschi 55
Apresentao grfica b) Artigo: Mortalidade por desnutrio em idosos, regio Sudeste do Brasil, 1980-1997 de OTERO UB et al. (Rev. Sade Pblica, 2002; 36(2):141-48).
-
HEP5800 DPBergamaschi 56
d) Artigo: Tendncia secular da anemia na cidade de So Paulo (1984-1996) de MONTEIRO CA et al. (Rev. Sade Pblica, 2000; 34(6, sup):62-72).
-
HEP5800 DPBergamaschi 57
Medidas de tendncia central e de disperso
Mdia aritmticaMediana ModaValores mnimo e mximoAmplitude de variaoVarinciaDesvio padroCoeficiente de variao de PearsonQuartisPercentisBox plotExerccios
-
HEP5800 DPBergamaschi 58
Medidas de tendncia central e de disperso
Mdia aritmtica
Valores individuaisValores em distribuio de freqnciaValores em intervalos de classe
-
HEP5800 DPBergamaschi 59
Medidas de tendncia central e de disperso
Notao: X varivel
N tamanho da populao n tamanho da amostra mdia populacional (parmetro, geralmente desconhecido)
X Estatstica (frmula) x mdia amostral (estimativa, valor calculado na amostra)
-
HEP5800 DPBergamaschi 60
Mdia aritmtica
Medidas de tendncia central e de disperso
Supor a idade (anos) de 5 pessoas: 3, 5, 8, 12, 12
Mdia = anos85
1212853=
=+++ Definio: a soma dos valores de uma varivel, dividida pelo nmero de valores.
Mdia aritmtica o valor que indica o centro de equilbrio de uma distribuio de freqncias de uma varivel quantitativa
Desvios em torno da mdia:
3 8 =-5 anos5 8 =-3 anos8 8 = 0 anos2 8 = 4 anos
12 8 = 4 anossoma = 0 anos
-
HEP5800 DPBergamaschi 61
Medidas de tendncia central e de disperso
s existe para variveis quantitativas e seu valor nico;
da mesma natureza da varivel considerada (mdia = 8 anos); e
sofre influncia dos valores aberrantes (3, 5, 8, 12, 42; mdia = 14 anos)
X: idade (anos) 3, 5, 8, 12, 12
x1 = 3; x2 = 5; x3=8; x4=12; x5= 12
xx x x
n
x
n
n
ii
n
=
+ + +=
=
1 2 1...
Valores individuais
Mdia aritmtica
-
HEP5800 DPBergamaschi 62
Medidas de tendncia central e de disperso
Os dados a seguir so provenientes do grupo Western Collaborative Group Study, Califrnia (1960-61). Foram estudados 3154 homens de meia idade para investigar arelao entre padres de comportamento e risco de doena coronariana.
Os dados apresentados so de 40 homens para os quais foram medidos os nveis de colesterol (mg por 100ml) e realizada uma categorizao segundo comportamento.
O comportamento de tipo A caracterizado pela urgncia, agressividade e ambio.
O de tipo B relaxado, no competitivo e menos preocupado. Tipo A: nvel de colesterol 233 291 312 250 246 197 268 224 239 239 254 276 234 181 248 252 202 218 212 325
mlmgxA 100/05,24520325212...291233
=
++++=
Mdia aritmtica
-
HEP5800 DPBergamaschi 63
Medidas de tendncia central e de dispersoMdia aritmtica
Tipo B: nvel de colesterol 344 185 263 246 224 212 188 250 148 169 226 175 242 252 153 183 137 202 194 213
mlmgxB 100/3,21020213169...226344
=
++++=
-
HEP5800 DPBergamaschi 64
Medidas de tendncia central e de dispersoMdia aritmtica
Valores em distribuio de freqncias
grupo A Colesterol (X) fi xifi
181 1 181 197 1 197 202 1 202 212 1 212 218 1 218 224 1 224 233 1 233 234 1 234 239 2 478 246 1 246 248 1 248 250 1 250 252 1 252 254 1 254 268 1 268 276 1 276 291 1 291 312 1 312 325 1 325 soma 20 4901
05,24520
4901==x
n
fxx
k
i
ii=
=1
mg/100ml
i representa o i-simo valor da varivel
-
HEP5800 DPBergamaschi 65
Medidas de tendncia central e de dispersoMdia aritmtica - valores em intervalos de classe
n
fxX
k
i
iipm=
=1
i representa o i-simo intervaloipmx representa o ponto mdio do intervalo,
fi a freqncia de indivduos no intervalo i, k o nmero de intervalos e n o nmero de observaes
concentrao fi ponto mdio (xipm) xipmfi 180,0|--200,0 2 190 380 200,0|--220,0 3 210 630 220,0|--240,0 5 230 1150 240,0|--260,0 5 250 1250 260,0|--280,0 2 270 540 280,0|--300,0 1 290 290 300,0|--320,0 1 310 310 320,0|--340,0 1 330 330
total 20 4880
mlmgx 100/0,24420
4880==
-
HEP5800 DPBergamaschi 66
Medidas de tendncia central e de disperso
Mediana (Med) o valor que ocupa a posio central de uma srie de n observaes, quando estas esto ordenadas de forma crescente ou decrescente.
a) valores individuais Quando nmero de observaes (n) for mpar:
a mediana o valor da varivel que ocupa o posto n + 1
2
Quando o nmero de observaes (n) for par:
a mediana a mdia aritmtica dos valores da varivel que ocupam os
postos n2
e n + 22
-
HEP5800 DPBergamaschi 67
Medidas de tendncia central e de disperso
Mediana (Med)
Exemplo: Tipo A: nvel de colesterol
233 291 312 250 246 197 268 224 239 239 254 276 234 181 248 252 202 218 212 325
Ordenando-se os valores:
181 202 218 233 239 246 250 254 276 312 197 212 224 234 239 248 252 268 291 325
Mediana = mlmg 100/5,2422
246239=
+
-
HEP5800 DPBergamaschi 68
Medidas de tendncia central e de disperso
Mediana (Med)
valores em distribuio de freqncia pontualColesterol (X) fi facumulada
181 1 1
197 1 2
202 1 3
212 1 4
218 1 5
224 1 6
233 1 7
234 1 8
239 2 10
246 1 11
248 1
250 1
252 1
254 1
268 1
276 1
291 1
312 1
325 1
Total 20
Mediana = mlmg 100/5,2422
246239=
+
-
HEP5800 DPBergamaschi 69
Medidas de tendncia central e de disperso Mediana (Med)
Valores em intervalos de classe
Nvel de Colesterol (mg/100ml) (xi) fi facumulada 180|--200 2 2 200|--250 10 12 250|--300 6 300|--350 2 Total 20
Como so 20 observaes, a mediana estar na posio 10 (20/2)Mediana est na classe de 200|-- 250 mg/100ml10 observaes -------50 mg/100ml 8 observaes ------- x
4010
508==
xx
Mediana = valor inicial do intervalo + 40 = 240 mg/100ml
-
HEP5800 DPBergamaschi 70
Medidas de tendncia central e de disperso
Mediana (Med) Valores em intervalos de classe
anaclassemedi
oracumanteri
i ffn
aLMed
+= 2
Li o limite inferior da classe que contm a mediana
a a amplitude da classe que contm a mediana
oracumanterif a freqncia acumulada at a classe anterior classe que contm a mediana
anaclassemedif a freqncia da classe que contm a mediana
mlmgMed 100/2404020010
2220
50200 =+=
+=
-
HEP5800 DPBergamaschi 71
Medidas de tendncia central e de disperso
OBS: existe para varivel quantitativa e qualitativa ordinal; da mesma natureza da varivel considerada; torna-se inadequada quando h muitos valores repetidos; no sofre influncia de valores aberrantes;
EX: 4,3 4,6 5,2 5,2 6,6 7,2 8,4 9,0 10,4 14,0 17,8 Mdia aritmtica: 8,43 pmol/l; Mediana: 7,2 pmol/l
4,6 5,2 5,2 6,6 7,2 8,4 9,0 10,4 14,0 37,8 Mdia aritmtica: 10,25 pmol/l; Mediana: 7,2 pmol/l
pode ser calculada mesmo quando os dados esto agrupados em intervalos
de classe e os extremos de algum intervalo no esteja definido (a no ser que a mediana caia neste intervalo).
Mediana (Med)
-
HEP5800 DPBergamaschi 72
Medidas de tendncia central e de disperso
Moda (Mo)
o valor da varivel que apresenta freqncia mxima.
Classe modal: intervalo de classe onde se encontra a moda.
OBS: pode ser calculada para varivel quantitativa e qualitativa; nem sempre existe ou nica; da mesma natureza da varivel considerada; no caso da varivel quantitativa estar apresentada em intervalos de classes
muito afetada pela maneira como as classes foram construdas.
-
HEP5800 DPBergamaschi 73
Distribuio de mulheres idosas segundo a altura. Altura (cm) No % %
acumulado 140|-145 1 0,29 0,29 145|-150 11 3,13 3,42 150|-155 52 14,81 18,23 155|-160 109 31,05 49,28 160|-165 106 30,20 79,48 165|-170 50 14,25 93,73 170|-175 18 5,13 98,86 175|-180 4 1,14 100 Total 351 100
Fonte: Hand DJ et al., 1994.
Moda (Mo)
Medidas de tendncia central e de disperso
-
HEP5800 DPBergamaschi 74
Medidas de disperso Valores mnimo e mximo: valores extremos da distribuio Amplitude de variao: a diferena entre os 2 valores extremos da distribuio Idade (grupo 1): 2, 4, 3, 5, 6, 4, 17 amplitude de variao = 17-2 = 15 Idade (grupo 2): 2, 2, 2, 2, 2, 2, 17 amplitude de variao = 15
Medidas de tendncia central e de disperso
-
HEP5800 DPBergamaschi 75
Medidas de tendncia central e de disperso
Supor a idade (anos) de 5 pessoas: 3, 5, 8, 12, 12
Mdia = anos85
1212853=
=+++
Desvios em torno da mdia: 3 8 =-5 anos 5 8 =-3 anos 8 8 = 0 anos 12 8 = 4 anos 12 8 = 4 anos soma = 0 anos
Desvios quadrticos em torno da mdia: (3 8)2 =(-5 anos)2 = 25 anos2 (5 8)2 =(-3 anos)2 = 9 anos2 (8 8)2 = (0 anos)2= 0 anos2 (12 8)2= (4 anos)2= 16 anos2 (12 8)2= (4 anos)2 = 16anos2 soma dos desvios quadrticos em torno da mdia = 66 anos2
Varincia e desvio padro
-
HEP5800 DPBergamaschi 76
Varincia e desvio padro
Medidas de tendncia central e de disperso
Varincia = soma dos desvios quadrticos em torno da mdia/nmero de observaes
Varincia = 22,135
66anos=
Desvio padro: a raiz quadrada da varincia , ou seja =
=
2
2S S
Desvio padro = anosanos 63,32,13 2 =
-
HEP5800 DPBergamaschi 77
Medidas de tendncia central e de disperso
Valores individuais:
Varincia populacional: N
XXN
ii
=
=1
2
2)(
Varincia amostral: 1
)(1
2
2
=
=
n
xx
S
n
ii
-
HEP5800 DPBergamaschi 78
Medidas de tendncia central e de dispersoExemplo:
Tipo A: nvel de colesterol 233 291 312 250 246 197 268 224 239 239254 276 234 181 248 252 202 218 212 325
Varincia: 222
2 )100/(37,134219
)05,245325(...)05,245233(mlmgs =++=
Desvio padro mlmgs 100/64,3637,1342 ==
Tipo B: nvel de colesterol 344 185 263 246 224 212 188 250 148 226 175 242 252 153 183 137 202 194
Varincia: 222
2 )100/(747,233619
)3,210213(...)3,210344(mlmgs =++=
Desvio padro mlmgs 100/34,48747,2336 ==
-
HEP5800 DPBergamaschi 79
Medidas de tendncia central e de dispersoValores em distribuio de freqncias
Varincia amostral: 1
)(1
2
2
=
=
n
fxxS
n
iii
Tipo A: Nvel de Colesterol
(mg/100ml) (xi)
fi xifi 2)( xxi ii fxx 2)( 181 1 181 4102,40 4102,40 197 1 197 2308,80 2308,80 202 1 202 1853,30 1853,30 212 1 212 1092,30 1092,30 218 1 218 731,70 731,70 224 1 224 443,10 443,10 233 1 233 145,20 145,20 234 1 234 122,10 122,10 239 2 478 36,60 73,21 246 1 246 0,90 0,90 248 1 248 8,70 8,70 250 1 250 24,50 24,50 252 1 252 48,30 48,30 254 1 254 80,10 80,10 268 1 268 526,70 526,70 276 1 276 957,90 957,90 291 1 291 2111,40 2111,40 312 1 312 4482,30 4482,30 325 1 325 6392,00 6392,00 Total 20 4901 25504,95
22 )100/(37,1342
1995,25504
mlmgsA == ; mlmgs A 100/64,3637,1342 ==
-
HEP5800 DPBergamaschi 80
Medidas de tendncia central e de disperso
Tipo B: Nvel de Colesterol (mg/100ml) (xi) fi xifi 2)( xxi ii xfxx 2)(
137 1 137 5372,89 5372,89 148 1 148 3881,29 3881,29 153 1 153 3283,29 3283,29 169 1 169 1705,69 1705,69 175 1 175 1246,09 1246,09 183 1 183 745,29 745,29 185 1 185 640,09 640,09 188 1 188 497,29 497,29 194 1 194 265,69 265,69 202 1 202 68,89 68,89 212 1 212 2,89 2,89 213 1 213 7,29 7,29 224 1 224 187,69 187,69 226 1 226 246,49 246,49 242 1 242 1004,89 1004,89 246 1 246 1274,49 1274,49 250 1 250 1576,09 1576,09 252 1 252 1738,89 1738,89 263 1 263 2777,29 2777,29 344 1 344 17875,69 17875,69 Total 20 4206 44398,2
22 )100/(747,233619
2,44398mlmgsB == ; mlmgsB 100/34,48747,2336 ==
-
HEP5800 DPBergamaschi 81
Medidas de tendncia central e de disperso
Valores em intervalos de classe
Varincia amostral: 1
)(1
2
2
=
=
n
fxxS
n
iiipm
Nvel de Colesterol (mg/100ml) (xi)
fi xi ponto mdio (xipm)
xipmfi 2)( xxipm iipm fxx 2)(
180|--200 2 190 380 3192,25 6384,5 200|--250 10 225 2250 462,25 4622,5 250|--300 6 275 1650 812,25 4873,5 300|--350 2 325 650 6162,25 12324,5 Total 20 4930 28205,0
mlmgxxxA 100/5,246204930
202325...0155
==
++=
22 )100/(47,148419
0,28205mlmgsA == ; mlmgs A 100/53,3847,1484 ==
-
HEP5800 DPBergamaschi 82
Medidas de tendncia central e de disperso
Tipo B Nvel de Colesterol
(mg/100ml) (xi)
fi xi ponto mdio (xipm)
xipmfi 2)( xxipm iipm fxx 2)(
130|--180 5 155 775 3364 16820 180|--200 4 190 760 529 2116 200|--250 7 225 1575 144 1008 250|--300 3 275 825 3844 11532 300|--350 1 325 325 12544 12544 Total 20 4260 44020
mlmgxxxB 100/0,213204260
201325...5155
==
++=
22 )100/(84,2316
1944020
mlmgsA == ; mlmgs A 100/13,4884,2316 ==
-
HEP5800 DPBergamaschi 83
Medidas de tendncia central e de disperso
Coeficiente de Variao de Pearson (CV):
o quociente entre o desvio padro e a mdia, ou seja 100x
S=CV x
CVtipo A: %0,1510005,24564,36
=x ; CVtipoB: %0,231003,21034,48
=x ;
Questo 13 So fornecidos valores de nvel de triglicrides (mg/dL) de 9 pessoas 166 158 202 166 135 86 150 86 121
Calcule, apresentando o desenvolvimento da frmula:
a) o nvel mdio de triglicrides; b) o nvel mediano de triglicrides; c) o desvio padro do nvel de triglicrides e d) o coeficiente de variao do nvel de triglicrides.
-
HEP5800 DPBergamaschi 84
Medidas de tendncia central e de disperso
Questo 14 A tabela abaixo foi extrada do artigo: Diagnstico de sobrepeso em adolescentes: estudo do desempenho de diferentes critrios para o ndice de Massa Corporal de MONTEIRO POA et al. (Rev. Sade Pblica, 2000;.34(5):506-13). Discuta os resultados obtidos ignorando a coluna do valor de p (este tpico ser abordado na disciplina Bioestatstica II).
-
HEP5800 DPBergamaschi 85
Medidas de tendncia central e de dispersoQuartil Valores da varivel que dividem a distribuio em quatro partes iguais.
25% 25% 25% 25% Q1: deixa abaixo 25% das observaes
25% 75% Q2: deixa abaixo 50% das observaes
50% 50% Q3: deixa abaixo 75% das observaes
75% 25%
Primeiro quartil: ))1(41(
1+
=
nxQ ; Terceiro quartil: ))1(
43(
3+
=
nxQ
onde x o valor da varivel e ))1(41( +n e ))1(
43( +n so ndices que
representam as posies ocupadas por x.
-
HEP5800 DPBergamaschi 86
Medidas de tendncia central e de disperso1.030* 1.310* 2.200* 1.680 2.550 1.050* 1.500* 2.270* 1.715 2.570 1.100* 1.550* 2.275* 1.720 2.600 1.175* 1.600* 2.440* 1.760 2.700 1.185* 1.720* 2.500* 1.930 2.830 1.225* 1.750* 2.560* 2.015 2.950 1.230* 1.770* 2.730* 2.040 3.005 1.262* 1.820* 1.130 2.090 3.160 1.295* 1.890* 1.410 2.200 3.400 1.300* 1.940* 1.575 2.400 3.640
Entre os recm-nascidos que sobreviveram: gxxQ 17201 6))123(
41(
===
+
gxxQ 28303 18))123(43(
===
+
Observe que gxxQ 22002 12))123(21(
===
+
Entre os recm-nascidos que foram a bito gxxQ 12301 7))127(
41(
===
+
gxxQ 22003 21))127(43(
===
+ e gxxQ 16002 14))127(
21(
===
+
-
HEP5800 DPBergamaschi 87
Medidas de tendncia central e de disperso
Supor o exemplo com 22 observaes: n=22
)
435()
423())122(
41(
1 xxxQ ===+
que do caminho entre x5=1715 e x6=1720
gQ 8,1718)17151720(4317151 =+=
)4117())122(
43(
3 xxQ ==+
que do caminho entre x17=2700 e x18=2830
gQ 5,2732)27002830(4127003 =+=
-
HEP5800 DPBergamaschi 88
Medidas de tendncia central e de dispersoPercentil
Valores da varivel que dividem a distribuio em cem partes iguais. Entre os recm-nascidos que sobreviveram Percentil 5:
)511()
100120())123(
1005(
5 xxxP ===+
gP 1186)11301410(5111305 =+=
que 1/5 do caminho entre x1=1130 e x2=1410
Percentil 10:
)522()
100240())123(
10010(
10 xxxP ===+
; gP 1476)14101575(52141010 =+=
Percentil 50:
)12()1001200())123(
10050(
50 xxxP ===+
; gP 220050 =
Percentil 75:
)18()1001800())123(
10075(
75 xxxP ===+
; gP 283075 =
Percentil 90:
)5321()
1002160())123(
10090(
90 xxxP ===+
; gP 3304)31603400(53316090 =+=
-
HEP5800 DPBergamaschi 89
Medidas de tendncia central e de dispersoBox plot e identificao de valores aberrantes (outliers) O Box plot representa graficamente dados de forma resumida em um retngulo onde as linhas da base e do topo so o primeiro e o terceiro quartis, respectivamente. A linha entre estas a mediana. Linhas verticais que iniciam no meio da base e do topo do retngulo, terminam em valores denominados adjacentes inferior e superior (Chambers et al., 1983, pag 60). O valor adjacente superior o maior valor das observaes que menor ou igual a Q3+1,5(Q3-Q1) e o valor adjacente inferior definido como o menor valor que maior ou igual a Q1-1,5(Q3-Q1), sendo a diferena Q3-Q1 denominada intervalo inter-quartil (IIQ). Valores outliers (discrepantes ou aberrantes) so valores que fogem da distribuio dos dados. O box plot alm de apresentar a disperso dos dados torna-se til tambm para identificar a ocorrncia destes valores como sendo os que caem fora dos limites estabelecidos pelos valores adjacentes superior e inferior.
120
140
160
180
200
220
240
260
280
300
320
340
360
380 colesterol
A B
-
HEP5800 DPBergamaschi 90
Tipo A: nvel de colesterol 181 202 218 233 239 246 250 254 276 312 197 212 224 234 239 248 252 268 291 325
Tipo A: n=20;
5,2195,1218)218224(412181
415
421)1(
41 =+=+====
+xxxQ
n
5,2645,10254)254268(432543
4315)21(
43)1(
43 =+=+====
+xxxQ
n
Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45 325 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 332, onde 332 dado por: 332455,15,264 =+ x . 181 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 152, onde 152 dado por: 152455,15,219 = x .
Box plot
-
HEP5800 DPBergamaschi 91
Tipo B n=20
1772175)175183(411751
415
421)1(
41 =+=+====
+xxxQ
n
2453242)242246(432423
4315)21(
43)1(
43 =+=+====
+xxxQ
n
Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68 344 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 347, onde 347 dado por: 347685,1245 =+ x . 137 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 75, onde 75 dado por: 75685,1177 = x .
Box plot
-
HEP5800 DPBergamaschi 92
Box plotTipo A: n=20;
5,2195,1218)218224(412181
415
421)1(
41 =+=+====
+xxxQ
n
5,2645,10254)254268(432543
4315)21(
43)1(
43 =+=+====
+xxxQ
n
Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45 325 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 332, onde 332 dado por: 332455,15,264 =+ x . 181 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 152, onde 152 dado por: 152455,15,219 = x . Tipo B n=20
1772175)175183(411751
415
421)1(
41 =+=+====
+xxxQ
n
2453242)242246(432423
4315)21(
43)1(
43 =+=+====
+xxxQ
n
Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68 344 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 347, onde 347 dado por: 347685,1245 =+ x . 137 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 75, onde 75 dado por: 75685,1177 = x .
-
HEP5800 DPBergamaschi 93
Box plot
Questo 16
Os dados a seguir so de uma pesquisa que investigou as concentraes de minerais no leite materno, no perodo de 1984 a 1985. Foram coletadas amostras de leite materno de 55 mulheres que tiveram seus filhos no Hospital Maternidade Odete Valadares, em Belo Horizonte. As mes foram divididas em perodo de lactao: colostro e leite maduro. clcio (g/mL de leite) grupo colostro
113 181 254 311 334 145 221 256 312 344 163 225 275 313 372 163 231 296 323 375 167 241 303 325 375 437
clcio (g/mL de leite) grupo maduro 159 175 181 188 200 206 213 214 217 231 238 238 242 244 256 259 260 263 264 275 277 279 281 293 302 303 314 344 394
a) Calcule a quantidade mdia de clcio (g/mL de leite) em cada grupo. b) Calcule a quantidade mediana de clcio (g/mL de leite) em cada grupo. c) Desenhe o box plot da concentrao de clcio (g/mL de leite) representando os dois grupos em um s grfico. d) Comente o grfico box plot quanto a disperso dos dados, existncia de valores aberrantes e igualdade de medianas.
-
HEP5800 DPBergamaschi 94
Questo 17O boxplot abaixo foi extrado do artigo: Vigilncia epidemiolgica e avaliao da assistncia s meningites de ESCOSTEGUY CC et al. (Rev. Sade Pblica, 2004;38(5):657-63). Avalie os resultados apresentados
-
HEP5800 DPBergamaschi 95
Noes de correlao
X e Y so variveis aleatrias quantitativas
Y
X
Y
X
X
Y
correlao positiva correlao negativa correlao inexistente
-
HEP5800 DPBergamaschi 96
Noes de correlao
Coeficiente de correlao de Pearson ( ): Mede o grau de associao entre 2 variveis quantitativas X e Y. Definio:
=XY
X Y
onde, XY a covarincia de X e Y (disperso conjunta de X e Y) X o desvio padro de X (disperso de X) Y o desvio padro de Y (disperso de Y)
-
HEP5800 DPBergamaschi 97
estimador (r)
=
2
_
i
2_
i
_
i
_
i
yyxx
yyxxr
Noes de correlao
+1 1
Propriedades
no possui dimenso, isto , no depende da unidade de medida das variveis X e Y
-
HEP5800 DPBergamaschi 98
Grficos de disperso para diferentes valores do coeficiente de correlao (rho).
Noes de correlao
-
HEP5800 DPBergamaschi 99
Noes de correlao
Exemplo:Os dados a seguir so provenientes de um estudo que investiga a composio corporal e fornece o percentual de gordura corporal (%), idade e sexo para 18 adultos com idades entre 23 e 61 anos.Idade % gordura sexo Idade % gordura sexo 23 9,5 M 53 34,7 F 23 27,9 F 53 42,0 F 27 7,8 M 54 29,1 F 27 17,8 M 56 32,5 F 39 31,4 F 57 30,3 F 41 25,9 F 58 33,0 F 45 27,4 M 58 33,8 F 49 25,2 F 60 41,1 F 50 31,1 F 61 34,5 F
M=masculino ; F= femininoFonte: Hand DJ et al., 1994.
-
HEP5800 DPBergamaschi 100
Noes de correlao
Disperso entre % de gordura e idade
i
d
a
d
e
gordura5 10 15 20 25 30 35 40 45
20
30
40
50
60
70
m fm m
ffm
f ff ff
ff f fff
Fonte: Hand DJ et al., 1994.
-
HEP5800 DPBergamaschi 101
Noes de correlao
Disperso entre % de gordura e idade
i
d
a
d
e
gordura5 10 15 20 25 30 35 40 45
20
30
40
50
60
70
m fm m
ffm
f ff ff
ff f fff
Fonte: Hand DJ et al., 1994.
-
HEP5800 DPBergamaschi 102
Noes de correlao
Disperso entre % de gordura e idade
i
d
a
d
e
gordura5 10 15 20 25 30 35 40 45
20
30
40
50
60
70
m fm m
ffm
f ff ff
ff f fff
Fonte: Hand DJ et al., 1994.
-
HEP5800 DPBergamaschi 103
Noes de correlao
Clculo do coeficiente de correlao de Pearson Sexo: masculino
Idade % gordura )( yy )( xx ))(( yyxx 2)( yy 2)( xx 23 9,5 -7,5 -6,13 45,94 56,25 37,52 27 7,8 -3,5 -7,83 27,39 12,25 61,23 27 17,8 -3,5 2,18 -7,61 12,25 4,73 45 27,4 14,5 11,78 170,74 210,25 138,65
y =30,5 x =15,63 Total 236,45 291,00 242,13 Coeficiente de correlao (idade,%gordura) masculino: 89,0
13,24229145,236
==
xr
-
HEP5800 DPBergamaschi 104
Noes de correlao
Sexo: feminino Idade % gordura )( yy )( xx ))(( yyxx 2)( yy 2)( xx 23 27,9 -27,86 -4,42 123,17 776,02 19,55 39 31,4 -11,86 -0,92 10,93 140,59 0,85 41 25,9 -9,86 -6,42 63,30 97,16 41,23 49 25,2 -1,86 -7,12 13,23 3,45 50,71 50 31,1 -0,86 -1,22 1,05 0,73 1,49 53 34,7 2,14 2,38 5,10 4,59 5,66 53 42 2,14 9,68 20,74 4,59 93,67 54 29,1 3,14 -3,22 -10,12 9,88 10,38 56 32,5 5,14 0,18 0,92 26,45 0,03 57 30,3 6,14 -2,02 -12,42 37,73 4,09 58 33 7,14 0,68 4,85 51,02 0,46 58 33,8 7,14 1,48 10,56 51,02 2,19 60 41,1 9,14 8,78 80,26 83,59 77,06 61 34,5 10,14 2,18 22,10 102,88 4,75
y = 50,86 x 32,32 Total 333,64 1389,71 312,12
Coeficiente de correlao (idade,%gordura) feminino: 51,012,31271,1389
64,333==
xr
-
HEP5800 DPBergamaschi 105
Noes de correlao
Abaixo temos o peso (kg) e a altura (cm) de 30 meninas de 11 anos de idade atendidas na escola Heaton Midldlel em Bradford, Inglaterra.
a) Fazer o diagrama de disperso e investigue como a relao entre as variveis.
b) Calcular o coeficiente de correlao de Pearson. Altura (cm)
Peso (kg) Altura (cm) Peso (kg)
Altura (cm)
Peso (kg)
Altura (cm)
Peso (kg)
135 26 133 31 136 28 146 35 146 33 149 34 154 36 143 42 153 55 141 32 151 48 148 32 154 50 164 47 155 36 143 36 139 32 146 37 149 32 140 33 131 25 149 46 141 29 141 28 149 44 147 36 137 34 137 31 152 47 135 30
1275))(( = yyxx ; = 80,1716)( 2xx ; = 17,1718)( 2yy
-
HEP5800 DPBergamaschi 106
Noes de correlao
Os grficos abaixo foram extrados do artigo: Excesso de peso e gordura abdominal para a sndrome metablica em nipo-brasileiros de LERARIO DG et al. (Rev. Sade Pblica, 2002;36(1):4-11). Interprete as figuras apresentadas no artigo.
-
HEP5800 DPBergamaschi 107
Coeficiente de correlao (idade,%gordura) feminino: 51,012,31271,138964,333
==
xr
Coeficiente de correlao considerando homens e mulheres : 0,792
Regresso linear simples estimando a reta de regresso
Admitindo-se y como funo linear de x, ajusta-se a melhor reta ao conjunto de dados.
Equao de reta: bxay += , onde y = valor ajustado (valor mdio predito)
x = valor escolhido de X xbya = ; a denominado intercepto; o valor predito para x=0
x
yxy
s
srb =
; b denominado coeficiente angular (slope). Indica quantas unidades de Y
mudam para a mudana de uma unidade de X.
-
HEP5800 DPBergamaschi 108
Aplicando-se aos dados do exemplo: a = 28,61 b 46,33 ;
548,022,1314,979,0 == xb
Para aumento de 1 ano, o percentual de gordura aumenta 0,55%.
Substituindo-se o valor b em a, obtm-se a=3,221.
Equao ajustada % gordura= 3,22 + 0,55 (idade)
Com base nesta equao possvel traar a reta que passa pelos pontos.
Para x = 30; y = 19,7; para x = 50, y = 30,7
y = 0,55x + 3,22
0
10
20
30
40
50
0 20 40 60idade (anos)
%
g
o
r
d
u
r
a
-
HEP5800 DPBergamaschi 109
OBS: o coeficiente angular depende das unidades de medida de X e Y. Isto deve ser considerado na deciso da importncia do coeficiente angular. O coeficiente angular da equao de Y=f(X) diferente do coeficiente angular de X=f(Y), a menos que os desvios padro de X e Y sejam iguais.
Usos da reta de regresso:
- Predio - utilizar X para predizer Y; quando a correlao for forte, melhor a predio; - Correlao mede o grau de relacionamento linear entre X e Y; - Resumir os dados cada valor de X tem um valor mdio de Y.
Exemplo 13 So apresentados valores da massa do corpo sem gordura (kg) e da taxa de metabolismo (calorias) de 10 pessoas de ambos os sexos
Pessoa Sexo Massa Taxa 1 M 62 1792 2 M 62,9 1666 3 F 36,1 995 4 F 54,6 1425 5 F 48,5 1396 6 F 42 1418 7 M 47,4 1362 8 F 50,6 1502 9 F 42 1256 10 M 48,7 1614
Fonte: Moore et al., 2004 (adaptado)
a) Apresente os dados em um diagrama de disperso com pontos identificando os sexos. Apresente a varivel Y, taxa de metabolismo, como varivel resposta (dependente) e a varivel X, massa do corpo sem gordura, como explicativa (independente);
b) Calcule o coeficiente de correlao entre as variveis sexo e massa; c) Calcule os coeficientes da reta de regresso e desenhe a reta; d) Interprete os coeficientes da reta. e) Com base no grfico de disperso, voc diria que o coeficiente de correlao de Pearson para
o sexo feminino maior, menor ou igual ao do sexo masculino? Justifique.
-
HEP5800 DPBergamaschi 110
Medidas de associao
X e Y so variveis aleatrias quantitativas
Razo de prevalnciasRazo de incidnciasOdds ratioQui quadrado de PearsonCoeficiente de associao de YuleExerccios
-
HEP5800 DPBergamaschi 111
Medidas de associao
Razo de prevalncias
Estudo de prevalncia
n indivduos so observados e classificados segundo duas variveis X e YEx: X- ronco noturno (X1 sim, X0 no) e Y - presena de problema cardaco (Y1 sim, Y0 no)
Varivel Y Varivel X Y1 (sim) Y0 (no) Total (%) X1 (sim) a b n1 (100) X0 (no) c d n0 (100) Total m1 m2 n (100)
p= prevalncia de Y1= m1/n p1= prevalncia de Y1|X1= a/n1 p0= prevalncia de Y1|X0= c/n0
rp= razo de prevalncias= p1/p0
dp=diferena de prevalncias= p1-p0
-
HEP5800 DPBergamaschi 112
Medidas de associao razo de prevalncias
A prevalncia de desnutrio parece ser maior entre as crianas do sexo masculino. Os meninos apresentam uma prevalncia 56% maior do que as meninas.
A prevalncia de desnutrio entre meninos 1,56 vezes (uma vez e meia) a prevalncia de desnutrio entre meninas
Exemplo: So apresentados dados sobre o estado nutricional de 1226 crianas brasileiras de 2 anos de idade, segundo sexo. Estado nutricional (Y) Masculino (X1) Feminino (X0) Total
(Y1) Desnutridas 29 20 49 (Y0) Normais 574 603 1177 Total 603 623 1226
Prevalncia de desnutrio: 040,01226
49= ou 4%
Prevalncia de desnutrio segundo sexo:
Masculino: 05,060329
= ou 5,0%; Feminino: 032,062320
= ou 3,2%
Razo de prevalncias: 498,16032029623
6232060329
==
x
x
Diferena de prevalncias: 0,05-0,032=0,018 ou 1,8%
-
HEP5800 DPBergamaschi 113
Medidas de associao razo de incidncias
Utilizado em estudos de coorte. Neste tipo de estudo, um grupo de pessoas sadias identificada e seguida por um perodo de tempo. Observa-se a ocorrncia de eventos de interesse que acontecem durante este perodo. O objetivo investigar se a incidncia de um determinado evento est relacionada a uma determinada exposio.
Varivel Y Varivel X Y1 Y0 Total
X1 a b n1 (100%) X0 c d n0 (100%) Total m1 m2 n (100%)
Estudo de incidncia
r= incidncia de Y1= m1/n r1= incidncia de Y1 entre os X1= a/n1 r0= incidncia de Y1 entre os X0= c/n0
ri= razo de incidncias= r1/r0 di= diferena de incidncias= r1-r0 incidncia risco r1 r0 r1/r0 r1-r0
ri=rr=razo de riscos=risco relativo=r1/r0
di= ra= risco atribuvel= r1-r0
-
HEP5800 DPBergamaschi 114
Medidas de associao
Estudo de incidncia
Morte em 5 anos por DIC Fumar Sim No
Total
Sim 208 850 1058 No 264 1467 1731 Total 472 2317 2789
r= 472/2789= 0,17 = 17% r1=208/1058= 0,20= 20% r0=264/1731= 0,15=15% rr=0,20/0,15= 1,33 ra= 0,20- 0,15= 0,05= 5%
A incidncia de mortes parece ser maior entre as pessoas que fumam. Os fumantes apresentam uma incidncia 33% maior do que os no fumantes.
A mortalidade entre fumantes 1,33 vezes a mortalidade entre no fumantes.
-
HEP5800 DPBergamaschi 115
Medidas de associao
Razo de odds (odds ratio) - Estudo do tipo caso-controle
Varivel Y Varivel X Y1 (caso) Y0 (controle) Total
X1 a b n1 X0 c d n0 Total m1 (100%) m2 (100%) n
odds a favor de Y1: na categoria X1= (a/n1)(b/n1) na categoria X0= (c/n0)(d/n0)
Razo de odds ou odds ratio:
[(a/n1)(b/n1)][(c/n0)(d/n0)]=( ) ( )cbda
dc
ba
dcba.
.
==
-
HEP5800 DPBergamaschi 116
Medidas de associaoOs dados a seguir so de um estudo sobre cncer de esfago e consumo de lcool.
Condio Consumo mdio de lcool (g/dia) Total 80 e + 0-79 Casos 96 104 200 Controles 109 666 775 Total 205 770 975
Fonte: Tuyns et al.,1977.
Razo de odds (odds ratio) - Estudo do tipo caso-controle
(entre expostos) odds a favor de casos entre consumidores de 80 e + g/dia:
88,010996
205109
:20596
==
(entre no expostos) odds a favor de casos entre consumidores de 0-79g/dia:
16,0666104
770666
:770104
==
odds ratio: 6,510410966696
666104
:10996
==
x
x
A fora de morbidade de cncer de esfago entre consumidores de 80 e + g/dias de bebida alcolica 5,6 vezes a fora de morbidade entre os que consomem de 0 a 79g/dia.
-
HEP5800 DPBergamaschi 117
Medidas de associao
Qui-quadrado de Pearson
Duas variveis qualitativas: X - curso universitrio e Y sexo do aluno
Questo: sexo do indivduo influi na escolha do curso?Situao 1
Curso Masculino Feminino Total n n n
Economia 24 36 60 Administrao 16 24 40
Total 40 60 100
Curso Masculino Feminino Total n proporo n proporo n proporo
Economia 24 0,6 36 0,6 60 0,6 Administrao 16 0,4 24 0,4 40 0,4
Total 40 1 60 1 100 1 As propores de escolha dos cursos no diferem segundo sexo do estudante
-
HEP5800 DPBergamaschi 118
Medidas de associaoQui-quadrado de Pearson
Situao 2
Curso Masculino Feminino Total n n n
Fsica 100 (a) 20 (b) 120 Cincias Sociais 40 (c) 40 (d) 80
Total 140 60 200
Curso Masculino Feminino Total
n proporo n proporo n proporo Fsica 100 0,7 20 0,3 120 (120/200) = 0,6
Cincias Sociais 40 0,3 40 0,7 80 (80/200) = 0,4 Total 140 1 60 1 200 1
A distribuio de alunos em cada curso, segundo sexo no a mesma; sexo e curso podem estar associados.
-
HEP5800 DPBergamaschi 119
Medidas de associao
Se a varivel sexo no fosse associada escolha do curso, quantos indivduos esperaramos em Fsica, entre os homens?
Esperaramos: 6,0140
=
xou x= 0,6 x 140 = 84
Homens-Fsica: n observado=100; o valor esperado seria: 0,6x140 ou 84140200120
=x
12001601140Total
0,4800,7400,340Cincias Sociais
0,61200,3200,7100Fsica
proporonproporonProporon
TotalFemininoMasculinoCurso
Se a varivel sexo no fosse associada escolha do curso, quantos indivduos esperaramos em Cincias Sociais, entre os homens?
Esperaramos: ou x= 0,4 x 140 = 564,0140
=
x
Homens-C Sociais: n observado=40; o valor esperado seria: 0,4x140 ou 5614020080
=x
-
HEP5800 DPBergamaschi 120
Medidas de associao
Se a varivel sexo no fosse associada escolha do curso, quantos indivduos esperaramos em Fsica, entre os mulheres?
Mulheres-Fsica: n observado=20; o valor esperado seria: 0,6x60 ou
12001601140Total
0,4800,7400,340Cincias Sociais
0,61200,3200,7100Fsica
proporonproporonProporon
TotalFemininoMasculinoCurso
Se a varivel sexo no fosse associada escolha do curso, quantos indivduos esperaramos em Cincias Sociais, entre as mulheres?
Esperaramos: ou x= 0,4 x 60 = 244,060
=
x
mulheres-C Sociais: n observado=40; o valor esperado seria: 0,4x60 ou 246020080
=x
6,060
=
xEsperaramos: ou x= 0,6 x 60 = 36
3660200120
=x
-
HEP5800 DPBergamaschi 121
Tabela esperada, sob a condio de independncia
Medidas de associao
12001601140Total
0,4800,7400,340Cincias Sociais
0,61200,3200,7100Fsica
proporonproporonProporon
TotalFemininoMasculinoCurso
12001601140Total
0,4800,7400,340Cincias Sociais
0,61200,3200,7100Fsica
proporonproporonProporon
TotalFemininoMasculinoCurso
Curso Masculino Feminino Total n n n
Fsica 84 36 120 Cincias Sociais 56 24 80
Total 140 60 200
-
HEP5800 DPBergamaschi 122
Valores
observados O
Valores esperados
E
(O-E) (O-E)2
EEO 2)(
100 84 16 256 3,048 40 56 -16 256 4,571 20 36 -16 256 7,11 40 24 16 256 10,667
Qui-quadrado=25,397
Medidas de associao
O Qui-quadrado obtido somando-se a diferena ao quadrado entre as freqncias observadas e as esperadas, dividido pelas freqncias esperadas
22
=
( )O E
E
-
HEP5800 DPBergamaschi 123
Se o Qui-quadrado for igual a zero, ento no existe associao entre as variveis. O Qui-quadrado no mede fora de associao.
Medidas de associao
Coeficiente de associao de Yule (Y)Curso Masculino Feminino Total
N N % Fsica 100 (a) 20 (b) 120
Cincias Sociais 40 (c) 40 (d) 80 Total 140 60 200
Y a d b ca d b c
Y= +
+. .. .
, onde: 1 1
-
HEP5800 DPBergamaschi 124
Frmula equivalente para clculo do Qui-quadrado:
Medidas de associao
2.1..2.1
2211222112
ffffn)ffff(
=
Curso Masculino Feminino Total N N %
Fsica f11 =100 f12 = 20 f1. = 120 Cincias Sociais f21 = 40 f22 = 40 f2. = 80
Total f.1 = 140 f.2 = 60 n = 200
397,256014080120
200)402040100( 22=
=
xxx
xx
-
HEP5800 DPBergamaschi 125
Exemplo:Com o objetivo de investigar a associao entre histria de bronquite na infncia e presena de tosse diurna ou noturna em idades mais velhas, foram estudados 1.319 adolescentes com 14 anos. Destes, 273 apresentaram histria de bronquite at os 5 anos de idade sendo que 26 apresentaram tosse diurna ou noturna aos 14 anos.
Nmero de adolescentes segundo histria de bronquite aos 5 anos e tosse diurna ou noturna aos 14 anos de idade. Local X, ano Y.
Bronquite Tosse Sim No Total Sim 26 44 70 No 247 1002 1249 Total 273 1046 1319
Fonte: Holland WW et al.,1978.
-
HEP5800 DPBergamaschi 126
Bronquite Tosse Sim No Total Sim 26 44 70 No 247 1002 1249 Total 273 1046 1319
Clculo do qui-quadrado de Pearson
Valores observados
O
Valores esperados
E
(O-E) (O-E)2
EEO 2)(
26 14,488 11,512 132,526 9,147 247 258,512 -11,512 132,526 0,513 44 55,512 -11,512 132,526 2,387
1002 990,488 11,512 132,526 0,134
Qui-quadrado= 12,181
Y a d b ca d b c
Y= +
+. .. .
, onde: 1 1
Coeficiente de associao de Yule (Y)
=
+
=
247410022624744100226
xx
xxY + 0,41
-
HEP5800 DPBergamaschi 127
Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo condio de sobrevivncia e peso ao nascer (g).
502327Total
13103No baixo peso (2500 e mais)
371324Baixo peso (
-
HEP5800 DPBergamaschi 128
Defeitos do tubo neural so malformaes congnitas que surgem durante o desenvolvimento fetal. Estes dados so de um estudo conduzido no pas de Gales Reino Unido, para investigar possvel associao entre defeitos do tubo neural e dieta materna. O estudo do tipo caso-controle: mes que tinham tido bebs com defeitos do tubo neural (casos) e suas irms que no tinham tido (controles) foram avaliadas segundo suas dietas e classificadas em boa, razovel e ruim.
Distribuio de recm-nascidos segundo condio caso - com defeitos do tubo neural; controle recm-nascidos que no tinham defeitos do tubo neural e dieta materna.
100367100123100244Total
36,013226,03241,0100Pobre
43,015839,04845,1110Razovel21,07735,04313,934Boa
%n%n%n
TotalControlesCasosDieta
-
HEP5800 DPBergamaschi 129
Considere a dieta boa como categoria de referncia (basal) e calcule:
a) o odds ratio de dieta razovel em relao a dieta boa;b) o odds ratio de dieta pobre em relao a boa;c) o qui-quadrado de Pearson ed) interprete os resultados.
100367100123100244Total
36,013226,03241,0100Pobre
43,015839,04845,1110Razovel21,07735,04313,934Boa
%n%n%n
TotalControlesCasosDieta