bioestatistica1

download bioestatistica1

of 129

Transcript of bioestatistica1

  • HEP5800 DPBergamaschi 1

    HEP 5800 Bioestatstica DATA AULA CONTEDO PROGRAMTICO 02/03 1 Levantamento e apresentao tabular de dados

    04/03 2 Apresentao tabular e grfica

    09/03 3 Apresentao tabular e grfica Exerccios

    11/03 4 Medidas de tendncia central ou de posio

    16/03 5 Medidas de disperso ou de variabilidade Exerccios

    18/03 6 Medidas de correlao, noes de regresso linear simples, estimando a equao da reta - Exerccios

    23/03 7 Medidas de associao

    25/03 8 AVALIAO 06/04 9 Noes de probabilidade; noes de amostragem

    08/04 10 Distribuio binomial

    13/04 11 Distribuio normal, distribuio amostral da mdia

    15/04 12 Teste de hipteses de parmetros populacionais

    20/04 13 Teste de hipteses de uma proporo populacional

    22/04 14 Teste de hipteses de uma mdia populacional

    27/04 15 Exerccios

    29/04 16 Teste de hipteses de associao

    04/05 17 Estimao de parmetros por intervalo de confiana: mdia e proporo

    06/05 18 Exerccios

    11/05 19 AVALIAO

  • HEP5800 DPBergamaschi 2

    Levantamento de dados e apresentao tabular

    Nveis de mensuraoApurao de dados Apresentao tabularExerccios

    Nveis de mensurao (Berqu et al, 1981)

    Escalas

    Nominal

    Ordinal

    Intervalar

    De razes

    Discreta

    Contnua

  • HEP5800 DPBergamaschi 3

    Escala nominal

    Os indivduos so classificados em categorias segundo uma caracterstica.

    Ex: sexo (masculino, feminino), hbito de fumar (fumante, no fumante),sobrepeso (sim, no)causa de bito (C1,C2, C3, C4)

    Nveis de mensurao

  • HEP5800 DPBergamaschi 4

    Escala ordinal

    Os indivduos so classificados em categorias que possuem algum tipo inerente de ordem. Neste caso, uma categoria pode ser "maior" ou "menor" do que outra.

    EX: nvel scio-econmico (A, B, C e D)

    Nveis de mensurao

  • HEP5800 DPBergamaschi 5

    Escala intervalar

    Este nvel de mensurao possui um valor zero arbitrrio.

    Ex: temperatura em graus Celsius e Fahrenheit.

    Como o zero, da escala, arbitrrio, somente faz sentido o clculo da diferena mas no o da razo entre dois valores.

    Exemplo: material 0C 0F |dif0C| |dif 0F| dif0C/dif0F razo0C razo0F Razo0C/razo0F A 20 68 |A-B|=20 |A-B|=36 0,56 A/B=0,50 A/B=0,65 0,77 B 40 104 |B-C|=20 |B-C|=36 0,56 B/C=0,67 B/C=0,74 0,91 C 60 140 |A-C|=40 |A-C|=72 0,56 A/C=0,33 A/C=0,49 0,67

    a temperatura em graus Fahrenheit dada por

    + 32)(

    59 Celsiousgrausematemperaturda

    comprimento cm polegada |difcm| |dif pol| Difcm/difpol Razocm Razopol Razocm/razopol A 20 50,8 |A-B|=15 |A-B|=38,1 0,394 A/B=0,571 A/B=0,571 1 B 35 88,9 |B-C|=5 |B-C|=12,7 0,394 B/C=0,875 B/C=0,875 1 C 40 101,6 |A-C|=20 |A-C|=50,8 0,394 A/C=0,5 A/C=0,5 1

    1 polegada = 2,54 cm

    Nveis de mensurao

  • HEP5800 DPBergamaschi 6

    Escala de razes discreta

    O resultado numrico da mensurao um valor inteiro

    Ex: nmero de refeies em um dia (0, 1, 2, 3,...)

    Escala de razes contnua

    O resultado numrico um valor pertencente ao conjunto dos nmeros reais

    Ex: idade (anos), peso (g), altura (cm), nvel de retinol srico (g/dl), circunferncia da cintura (cm)

    Nveis de mensurao

  • HEP5800 DPBergamaschi 7

    Outra denominao:

    Varivel qualitativa nominal

    qualitativa ordinal

    quantitativa discreta

    quantitativa contnua

    nominal

    ordinal

    intervalar

    razes

    Idoso (sim/no) Criana 1, 4, 15, 24, 32, 40, 51, 56, 59, 61, 63, 70, 74, 80, 86Jovem

    Adulto

    Idoso

    Nveis de mensurao

  • HEP5800 DPBergamaschi 8

    Apurao de dados

    Processo no qual conta-se o nmero de vezes que a varivel assumiu um determinado valor (freqncia de ocorrncia).

    Pode ser manual, mecnica ou eletrnica

    programas estatsticos: Epi info[1], Stata, Excel, SPSS, SAS, R, S-Plus

    Distribuio de freqncias - correspondncia entre categorias (valores) e freqncia de ocorrncia.

    [1] www.cdc.gov/epiinfo/

  • HEP5800 DPBergamaschi 9

    Apurao de dados

    . tab ir

    ir | Freq. Percent Cum.------------+-----------------------------------

    no | 428 88.25 88.25sim | 57 11.75 100.00

    ------------+-----------------------------------

    Total | 485 100.00

    | irsexo | no sim | Total

    -----------+----------------------+----------

    masc | 334 46 | 380 | 87.89 12.11 | 100.00

    -----------+----------------------+----------

    fem | 94 11 | 105 | 89.52 10.48 | 100.00

    -----------+----------------------+----------

    Total | 428 57 | 485 | 88.25 11.75 | 100.00

    . tab sexo ir,row chi

  • HEP5800 DPBergamaschi 10

    Elementos essenciais: ttulo, corpo, cabealho e coluna indicadora.

    Tabela 1 - Ttulo: o que (natureza do fato estudado)?como (variveis)?onde? quando?

    Fonte notas, chamadas

    OBS: nenhuma casela (interseco entre linha e coluna) deve ficar em branco.

    A tabela deve ser uniforme quanto ao nmero de casas decimais e conter os smbolos ou 0 quando o valor numrico nulo e ... quando no se dispe do dado.

    Apresentao tabular

    Varivel n % Total

  • HEP5800 DPBergamaschi 11

    Apresentao tabular

    Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico gravesegundo condio de sobrevivncia, New South Wales, Australia, 1973*.

    Condio do recm-nascido n %

    Sobrevivente 23 46

    No sobrevivente 27 54

    Total 50 100

    Fonte: van Vliet PKJ, Gupta JM. (1973)* ano da publicao do artigo

    Nvel de colesterol (mg / 100ml) n %

    120|--140 1 2,5

    140|--160 2 5,0

    160|--180 2 5,0

    180|--200 6 15,0

    200|--220 6 15,0

    220|--240 6 15,0

    240|--260 10 25,0

    260|--280 3 7,5

    280|--300 1 2,5

    300|--320 1 2,5

    320|--340 1 2,5

    340|--360 1 2,5

    Total 40 100

    Distribuio de homens de meia idade segundo nvel de colesterol (mg/100ml), San Fracisco, EUA, 1961-62

    Como o nvel de colesterol varivel quantitativa contnua, a melhor forma de apresent-la em tabelas utilizando intervalos de valores denominados intervalos de classe .

    Fonte: Western Collaborative Group Study

  • HEP5800 DPBergamaschi 12

    Apresentao tabularExemploX: 5,5,15,20,20,20,21,21,22,22

    Idade Freqncia %

    5|-- 10 2 2010|--15 0 -15|--20 1 1020|--25 7 70Total 10 100

    Intervalos de classe: conjunto de observaes contidas entre dois valores limite (limite inferior e limite superior) Representao: 5 | -- 10 intervalo fechado no limite inferior e aberto no limite

    superior (contm o valor 5 mas no contm o valor 10) 5 -- 10 intervalo aberto nos limites inferior e superior

    (no contm os valores 5 e 10) 5 |-- | 10 intervalo fechado nos limites inferior e superior

    (contm os valores 5 e 10) OBS: Representar o intervalo 0 |-- | 11 meses equivalente a represent-lo como 0 |-- 12 meses

  • HEP5800 DPBergamaschi 13

    Os intervalos de classe devem ser mutuamente exclusivos (um indivduo no pode ser classificado em dois intervalos ao mesmo tempo) e exaustivos (nenhum indivduo pode ficar sem classificao).

    A amplitude do intervalo o tamanho do intervalo de classe. A amplitude do intervalo e o nmero de intervalos dependem basicamente do problema especfico e da literatura existente sobre o assunto.

    O ponto mdio do intervalo calculado somando-se o limite inferior e limite superior, dividindo-se o resultado por dois.

    Perceber que o ponto mdio do intervalo da varivel idade, 5|--10 7,5 [ou seja, (5+10)/2] e o ponto mdio do intervalo 5|--|10 8 [ou seja, (5+11)/2]

    Apresentao tabular

  • HEP5800 DPBergamaschi 14

    Apresentao tabular

    Tabela de dupla entrada ou de contingncia

    N % N % N %

    Baixo peso (

  • HEP5800 DPBergamaschi 15

    Apresentao tabular

    N % N % N %

    Baixo peso (

  • HEP5800 DPBergamaschi 16

    Exerccios

    Classificar quanto natureza, as seguintes variveis: Varivel Tipo (natureza) condio de sade (doente, no doente) tipo de parto (normal, cesrio) Nvel de colesterol srico (mg/100cc) tempo de um procedimento cirrgico (minutos) nmero de praias consideradas poludas Custo do procedimento (reais)

    Questo 1

  • HEP5800 DPBergamaschi 17

    Questo 2

    Exerccios

    Os dados a seguir so de peso (kg) de 80 mulheres. Apresente-os em uma tabela Peso (kg)

    58 65 67 70 72 75 81 81 59 65 68 70 72 75 81 81 59 65 68 71 72 75 81 81 61 65 68 71 73 75 81 81 63 65 68 71 73 76 82 82 63 66 68 71 73 76 82 82 64 66 69 72 73 76 82 82 64 66 69 72 74 76 83 83 64 66 70 72 74 77 84 84 58 67 70 72 75 77 85 85

    Fonte: Osborn JF. Statistical Exercises in Medical Research. John Wiley & Sons Inc., 1979. (adaptado)

  • HEP5800 DPBergamaschi 18

    Exerccios

    Os dados a seguir so relativos ao peso ao nascer (g) de recm nascidos com sndrome de desconforto respiratrio idioptico grave. Algumas crianas foram a bito (*) e outras sobrevieram. Apresente os dados em uma tabela de dupla entrada considerando as variveis peso ao nascer e condio de sobrevivncia.

    1050* 2500* 1890* 1760 2830 1175* 1030* 1940* 1930 1410 1230* 1100* 2200* 2015 1715 1310* 1185* 2270* 2090 1720 1500* 1225* 2440* 2600 2040 1600* 1262* 2560* 2700 2200 1720* 1295* 2730* 2950 2400 1750* 1300* 1130 2550 3160 1770* 1550* 1575 2570 3400 2275* 1820* 1680 3005 3640

    Fonte: Hand DJ et al., 1994.

    Questo 3

  • HEP5800 DPBergamaschi 19

    Os dados a seguir so de altura de uma amostra de 351 mulheres idosas selecionadas aleatoriamente de uma comunidade para um estudo de osteoporose. Faa uma apurao dos dados e represente-os em uma tabela. Interprete os resultados.

    ExercciosQuesto 4

    142 152 154 156 157 158 160 161 163 164 165 169 145 152 154 156 157 158 160 161 163 164 165 169 145 152 154 156 157 158 160 161 163 164 165 169 145 152 154 156 157 158 160 161 163 164 165 169 146 152 155 156 157 158 160 161 163 164 166 169 147 152 155 156 157 158 160 161 163 164 166 169 147 153 155 156 158 158 160 161 163 164 166 169 147 153 155 156 158 158 160 161 163 164 166 170 147 153 155 156 158 159 160 162 163 164 166 170 148 153 155 156 158 159 160 162 163 164 166 170 148 153 155 156 158 159 160 162 163 164 166 170 149 153 155 156 158 159 160 162 163 164 166 170 150 153 155 156 158 159 160 162 163 164 166 170 150 153 155 156 158 159 160 162 163 164 166 170 150 153 155 156 158 159 160 162 163 164 166 170 150 153 155 157 158 159 160 162 163 165 167 170 150 153 155 157 158 159 160 162 163 165 167 170 150 153 155 157 158 159 161 162 163 165 167 170 151 153 155 157 158 159 161 162 163 165 167 171 151 153 155 157 158 159 161 162 163 165 167 171 151 153 155 157 158 159 161 162 163 165 167 171 151 153 155 157 158 159 161 162 163 165 167 173 151 153 155 157 158 159 161 162 163 165 168 173 151 154 155 157 158 159 161 162 163 165 168 173 152 154 155 157 158 159 161 162 163 165 168 174 152 154 156 157 158 160 161 162 163 165 168 176 152 154 156 157 158 160 161 163 163 165 168 177 152 154 156 157 158 160 161 163 164 165 168 178 152 154 156 157 158 160 161 163 164 165 169 178 152 154 156

    Fonte: Hand DJ et al., 1994.

  • HEP5800 DPBergamaschi 20

    Exerccios

    Os dados abaixo so de um estudo de prevalncia de doena cardaca e investigao de fatores de risco associados. Calcular os valores relativos (percentuais). Distribuio de pacientes segundo ronco noturno e doena cardaca

    Ronco noturno Doena cardaca Sim No Total N % N % N %

    No 24 1355 1379 Ocasional 35 603 638

    Quase todas as noites 21 192 213 Sempre 30 224 254 Total 110 2374 2484

    Fonte: Hand DJ et al., 1994.

    Questo 5

  • HEP5800 DPBergamaschi 21

    Exerccios

    Questo 6

    Com base nos dados da tabela abaixo, a) Calcular o percentual de mes com dieta boa, razovel e pobre entre os casos de spina bfida e entre os controles (fixando o 100% no total de casos e de controles); b) Analise e discuta os resultados. Distribuio de recm-nascidos casos (acometidos de spina bfida) e controles segundo dieta da me. Dieta materna Casos Controles Total n % n % n % Boa 34 43 77 Razovel 110 48 158 Pobre 100 32 132 Total 244 123 367

    Fonte: Hand DJ et al., 1994.

  • HEP5800 DPBergamaschi 22

    Exerccios

    Questo 7A tabela abaixo foi extrada do artigo Tendncia secular do peso ao nascer na cidade de So Paulo (1976-1998) deMONTEIRO CA et al. (Rev. Sade Pblica; 2000:34 (6, supl): 26-40).Comente os resultados apresentados.

  • HEP5800 DPBergamaschi 23

    Apresentao grfica

    Diagrama de barrasSetores circulares Diagrama linearHistogramaPolgono de freqncias simplesPolgono de freqncias acumuladasRepresentao de duas variveisEscalas aritmtica e logartmicaExerccios

  • HEP5800 DPBergamaschi 24

    Diagrama de barras representa variveis qualitativas e quantitativa discreta

    Apresentao grfica

    Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996 Estado nutricional n % Nutrido 2061 51,5 Desnutrido 1905 47,6 Sem diagnstico 34 0,9 Total 4000 100 Fonte: adaptado de Soares JF et al., 2002.

    Fonte: adaptado de Soares JF et al., 2002.

    Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996

    0

    500

    1000

    1500

    2000

    2500

    Nutrido Desnutrido Sem diagnstico

    Estado nutricional

    N

    m

    e

    r

    o

  • HEP5800 DPBergamaschi 25

    Caractersticas:Barras separadas e bases de mesmo tamanho.

    Apropriados para representar as variveis qualitativa nominal, ordinal e quantitativa discreta.

    Apresentao grfica

    Diagrama de barras

  • HEP5800 DPBergamaschi 26

    Apresentao grfica

    Excluindo-se os registros com informao ignorada

    0500

    1000

    150020002500

    Nutrido DesnutridoEstado nutricional

    N

    m

    e

    r

    o

    Fonte: adaptado de Soares JF et al., 2002.Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996

    Diagrama de barras

  • HEP5800 DPBergamaschi 27

    Apresentao grfica

    Diagrama de barras

    A representao grfica abaixo est correta?

    1800185019001950200020502100

    Nutrido DesnutridoEstado nutricional

    N

    m

    e

    r

    o

    3966Total1905Desnutrido2061Nutrido

    nEstado nutricional

  • HEP5800 DPBergamaschi 28

    Apresentao grfica

    Diagrama de barras

    Distribuio de famlias segundo nmero de bens* que possuem. Nmero de bens n % 0 146 40,6 1 97 26,9 2 87 24,2 3 26 7,2 4 4 1,1 Total 360 100 * automvel, telefone, TV a cabo e computador

    0

    10

    20

    30

    40

    50

    0

    1

    2

    3

    4

    Nmero de bens

    %

  • HEP5800 DPBergamaschi 29

    Apresentao grfica

    Distribuio de pacientes segundo estado nutricional. IBRANUTRI, maio a novembro, 1996. Estado nutricionala n % Nutrido 2061 52,0 Desnutrido moderado 1407 35,4 Desnutrido grave 498 12,6 Total 3966 100

    a excluindo-se 34 (0,9%) de pacientes sem diagnstico Fonte: adaptado de Soares JF et al., 2002.

    a excluindo-se 34 (0,9%) de pacientes sem diagnstico Fonte: adaptado de Soares JF et al., 2002. Distribuio de pacientes(a) segundo estado nutricional. IBRANUTRI, maio a novembro, 1996.

    52,0%35,4%

    12,6%

    Nutrido Desnutrido moderado Desnutrido grave

    Diagrama de setores circulares -Adequado para representar variveis: qualitativa nominal, ordinal e quantitativa discreta

  • HEP5800 DPBergamaschi 30

    Diagrama linear - representa variveis qualitativas ordinais relativas a tempo. Constitui uma exceo das variveis qualitativas ordinais

    Apresentao grfica

    Coeficientes de mortalidade por cncer de esfago (por 100.000 hab.) segundo sexo.

    Municpio de So Paulo, 1968-1998.

    Fonte: Incidncia de cncer no Municpio de So Paulo, 1997-1998. Registro de Cncer de So Paulo.

    FSP/USP.

    Masculino

    0 2 4 6 8

    10 12 14

    1970 1980 1990 2000 Ano

    C

    o

    e

    f

    i

    c

    i

    e

    n

    t

    e

    (

    1

    0

    0

    .

    0

    0

    0

    h

    a

    b

    )

    Feminino

    0

    0,5

    1

    1,5

    2

    2,5

    3

    1970

    1980

    1990

    2000

    Ano C

    o

    e

    f

    i

    c

    i

    e

    n

    t

    e

    (

    1

    0

    0

    .

    0

    0

    0

    h

    a

    b

    )

  • HEP5800 DPBergamaschi 31

    Apresentao grfica Produo de leite (milhes de toneladas). ndia e Estados Unidos, 1966 2000.

    Ano ndia Estados Unidos 1966 20 58 1970 23 56 1980 29 60 1990 50 70 2000 80 75

    Fonte: State of the World, 2001. W W Norton&Company, N.Y.

    Diagrama linear

    Fonte: State of the World, 2001. W W Norton&Company, N.Y. Produo de leite (milhes de toneladas). ndia e Estados Unidos, 1966 2000.

    0

    20

    40

    60

    80

    100

    1970

    1980

    1990

    2000

    Ano

    m

    i

    l

    h

    e

    s

    d

    e

    t

    o

    n

    e

    l

    a

    d

    a

    s

    ndia

    EUA

  • HEP5800 DPBergamaschi 32

    HistogramaAdequado para representar uma varivel quantitativa contnua

    Intervalos de classe com mesma amplitudeIntervalos de classe com amplitudes diferentes

    Apresentao grfica

  • HEP5800 DPBergamaschi 33

    Apresentao grfica Distribuio de recm-nascidos acometidos de sndrome de desconforto respiratrio grave segundo peso ao nascer (g)

    Peso(g) No % 1000 |-- 1500 13 26 1500 |-- 2000 15 30 2000 |-- 2500 9 18 2500 |-- 3000 9 18 3000 |-- 3500 3 6 3500 |-- 4000 1 2 Total 50 100

    Fonte: van Vliet PKJ et al., 1973.

    Histograma- amplitudes iguais

    Fonte: van Vliet PKJ et al., 1973. Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g).

    0 5

    10 15

    20 25 30

    35

    1000 1500 2000 2500 3000 3500 4000 Peso ao nascer (g)

    %

  • HEP5800 DPBergamaschi 34

    Apresentao grfica Histograma- amplitudes diferentes

    Distribuio de mulheres idosas segundo a altura. Altura (cm) No % 140|--150 12 3,4 150|--155 52 14,8 155|--160 109 31,1 160|--170 156 44,4 170|--180 22 6,3 Total 351 100

    Fonte: Hand DJ et al., 1994. necessrio fazer o ajuste

    Altura (cm) No Amplitude No/amplitude 140|--150 12 10 1,2 150|--155 52 5 10,4 155|--160 109 5 21,8 160|--170 156 10 15,6 170|--180 22 10 2,2 Total 351

  • HEP5800 DPBergamaschi 35

    Apresentao grfica Histograma- amplitudes diferentes Altura (cm) No Amplitude No/amplitude 140|--150 12 10 1,2 150|--155 52 5 10,4 155|--160 109 5 21,8 160|--170 156 10 15,6 170|--180 22 10 2,2 Total 351

    Fonte: Hand DJ et al., 1994. Distribuio de mulheres idosas segundo a altura.

    0

    5

    10

    15

    20

    25

    140 145 150 155 160 165 170 175 180

    altura (cm)

    Mulheres/cm

    Distribuio de mulheres idosas segundo a altura. Altura (cm) No % 140|--150 12 3,4 150|--155 52 14,8 155|--160 109 31,1 160|--170 156 44,4 170|--180 22 6,3 Total 351 100

    Fonte: Hand DJ et al., 1994.

    0

    10

    20

    30

    40

    50

    140 145 150 155 160 165 170 175 180

    Altura (cm)

    %

  • HEP5800 DPBergamaschi 36

    Apresentao grfica

    Polgono de freqncia simples

    Adequado para representar uma varivel quantitativa contnua

    Intervalos de classe com mesma amplitudeIntervalos de classe com amplitudes diferentes

  • HEP5800 DPBergamaschi 37

    Polgono de freqncia simples amplitudes iguais

    Apresentao grfica

    Distribuio de recm-nascidos acometidos de sndrome de desconforto respiratrio grave segundo peso ao nascer (g).

    Peso(g) No % 1000 |-- 1500 13 26 1500 |-- 2000 15 30 2000 |-- 2500 9 18 2500 |-- 3000 9 18 3000 |-- 3500 3 6 3500 |-- 4000 1 2 Total 50 100

    Fonte: Hand DJ et al., 1994.

    02468

    10121416

    0 500 1000 1500 2000 2500 3000 3500 4000 4500

    peso (g)

    Nmero

    Fonte: Hand DJ et al., 1994.

    Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g).

  • HEP5800 DPBergamaschi 38

    Apresentao grfica Polgono de freqncia simples amplitudes diferentes

    Distribuio de mulheres idosas segundo a altura. Altura (cm) no % 140|--150 12 3,4 150|--155 52 14,8 155|--160 109 31,1 160|--170 156 44,4 170|--180 22 6,3 Total 351 100

    Fonte: Hand DJ et al., 1994. Fazendo-se o ajuste: Altura (cm) No Amplitude No/amplitude 140|--150 12 10 1,2 150|--155 52 5 10,4 155|--160 109 5 21,8 160|--170 156 10 15,6 170|--180 22 10 2,2 Total 351

    Fonte: Hand DJ et al., 1994. Distribuio de mulheres idosas segundo a altura (cm).

    0

    5

    10

    15

    20

    25

    130 135 140 145 150 155 160 165 170 175 180 185 190

    Altura (cm)

    n

    m

    e

    r

    o

    d

    e

    p

    e

    s

    s

    o

    a

    s

    /

    c

    m

  • HEP5800 DPBergamaschi 39

    Polgono (ogiva) de freqncias acumuladasApresentao grficaDistribuio de mulheres idosas segundo a altura.

    Altura (cm) No % % acumulado

    140|-145 1 0,29 0,29 145|-150 11 3,13 3,42 150|-155 52 14,81 18,23 155|-160 109 31,05 49,28 160|-165 106 30,20 79,48 165|-170 50 14,25 93,73 170|-175 18 5,13 98,86 175|-180 4 1,14 100 Total 351 100

    Fonte: Hand DJ et al., 1994.

    0

    20

    40

    60

    80

    100

    140 145 150 155 160 165 170 175 180

    altura (cm)

    % acumulado

    Fonte: Hand DJ et al., 1994.Distribuio acumulada de mulheres idosas segundo a altura

    Percentil Valor da varivel

    Medidas estatsticas

    25% 156 cm Q1 primeiro quartil 50% 160 cm Q2 - segundo quartil ou mediana 75% 164 cm Q3 terceiro quartil

  • HEP5800 DPBergamaschi 40

    Apresentao grfica Polgono (ogiva) de freqncias acumuladas

    Fonte: Koga CR, 2004. Avaliao nutricional de escolares de 7 a 10 anos. Dissertao de Mestrado. FSP/USP

    Grfico 2- Distribuio acumulada de escolares de 7 a 10 anos, segundo estatura (cm) e idade. Duas escolas pblicas de So Paulo, 2004.

    0

    10

    20

    30

    40

    50

    60

    70

    80

    90

    100

    110

    120

    130

    140

    150

    160

    estatura (cm)

    f

    r

    e

    q

    n

    c

    i

    a

    a

    c

    u

    m

    u

    l

    a

    d

    a

    (

    %

    )

    7 anos

    8 anos

    9 anos

    10 anos

  • HEP5800 DPBergamaschi 41

    Representao grfica de duas variveis

    Medida do trceps Idade da menarca Pequeno Intermedirio Grande < 12 anos 15 29 36 12 anos e mais 156 197 150

    Fonte: Hand DJ et al., 1994.

    Calculando-se as porcentagens tem-se: Medida do trceps

    Idade (anos)

    Pequeno Intermedirio Grande Total

    n % n % n % n %

  • HEP5800 DPBergamaschi 42

    Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido Sobrevivente No sobrevivente Total Peso(g) no % no % no % 1000 |-- 1500 2 9 11 41 13 26 1500 |-- 2000 6 26 9 33 15 30 2000 |-- 2500 5 22 4 15 9 18 2500 |-- 3000 6 26 3 11 9 18 3000 |-- 3500 3 13 0 - 3 6 3500 |-- 4000 1 4 0 - 1 2 Total 23 100 27 100 50 100

    Fonte: Hand DJ et al., 1994.

    Fonte: Hand DJ et al., 1994. Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.

    0

    5

    10

    15

    20

    25

    30

    35

    40

    45

    Sobrevivente

    No sobrevivente

    Condio do recm nascido

    %

    1000 1500 2000 2500 3000 3500 4000 1000 1500 2000 2500 3000

  • HEP5800 DPBergamaschi 43

    Polgono de freqncias

    Fonte: Hand DJ et al., 1994. Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.

    0 5

    10 15 20 25 30 35 40 45

    500 1000 1500 2000 2500 3000 3500 4000 4500 peso ao nascer (g)

    %

    Sobrevivente

    No sobrevivente

  • HEP5800 DPBergamaschi 44

    Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido. Sobrevivente No sobrevivente Total Peso(g) No % No % No % 1000 |-- 1500 2 15 11 85 13 100 1500 |-- 2000 6 40 9 60 15 100 2000 |-- 2500 5 56 4 44 9 100 2500 |-- 3000 6 67 3 33 9 100 3000 |-- 3500 3 100 0 - 3 100 3500 |-- 4000 1 100 0 - 1 100 Total 23 46 27 54 50 100

    Fonte: Hand DJ et al., 1994.

    Fonte: Hand DJ et al., 1994. Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.

    0

    20

    40

    60

    80

    100

    120

    1000 |--1500

    1500 |--2000

    2000 |--2500

    2500 |--3000

    3000 |--3500

    3500 |--4000

    peso (g)

    % Sobrevivente

    No sobrevivente

  • HEP5800 DPBergamaschi 45

    Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido. Sobrevivente No sobrevivente Total Peso(g) No % No % No % 1000 |-- 1500 2 15 11 85 13 100 1500 |-- 2000 6 40 9 60 15 100 2000 |-- 2500 5 56 4 44 9 100 2500 |-- 3000 6 67 3 33 9 100 3000 |-- 3500 3 100 0 - 3 100 3500 |-- 4000 1 100 0 - 1 100 Total 23 46 27 54 50 100

    Fonte: Hand DJ et al., 1994. Outro grfico possvel:

    Fonte: Hand DJ et al., 1994. Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo peso ao nascer (g) e condio do recm-nascido.

    0

    20

    40

    60

    80

    100

    1000 1500 2000 2500 3000 3500 4000

    peso (g)

    % no sobreviviente sobrevivente

  • HEP5800 DPBergamaschi 46

    Apresentao grfica escalas aritmtica e logartmica

    Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.

    Ano Sobrepeso Obesas 2000 300 100 2002 150 50

    Fonte: dados hipotticos

    Grfico em escala aritmtica

    Fonte: dados hipotticos

    Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.

    0

    100

    200

    300

    400

    2000 2002

    Ano

    N

    m

    e

    r

    o

    Sobrepeso

    Obesa

  • HEP5800 DPBergamaschi 47

    Apresentao grfica escalas aritmtica e logartmica

    Fonte: dados hipotticos

    Nmero de crianas segundo massa corporal. Escola X, 2000 e 2002.

    1

    10

    100

    1000

    2000 2002

    Ano

    N

    m

    e

    r

    o

    Sobrepeso

    Obesa

  • HEP5800 DPBergamaschi 48

    Apresentao grfica escalas aritmtica e logartmica

    Coeficiente de mortalidade pela doena X e Y (100.000hab). Determinada localidade, 1990- 1995.

    Ano Doena X Doena Y

    1990 123,5 28,7

    1991 121,4 22,4

    1992 111,9 17,7

    1993 85,9 13,9

    1994 77,1 14,8

    1995 62,2 10,5

    Fonte: Dados hipotticos

    Fonte: Dados hipotticos

    Coeficiente de mortalidade pela doena X e Y (100.000hab). Determinada localidade, 1990- 1995.

    0

    50

    100

    150

    1990 1991 1992 1993 1994 1995 Ano

    C

    o

    e

    f

    i

    c

    i

    e

    n

    t

    e

    Doena X Doena Y

  • HEP5800 DPBergamaschi 49

    Apresentao grfica escalas aritmtica e logartmicaGrfico em escala logartmica

    Fonte: dados hipotticos

    Coeficiente de mortalidade pela doena X e Y (100.000hab). Determinada localidade, 1990- 1995.

    1

    10

    100

    1000

    1990

    1991

    1992

    1993

    1994

    1995

    Ano

    C

    o

    e

    f

    i

    c

    i

    e

    n

    t

    e

    Doena X Doena Y

    0

    50

    100

    150

    1990 1991 1992 1993 1994 1995 Ano

    C

    o

    e

    f

    i

    c

    i

    e

    n

    t

    e

    Doena X Doena Y

  • HEP5800 DPBergamaschi 50

    Apresentao grfica escalas aritmtica e logartmicaGrfico em escala logartmica

    Fonte: dados hipotticos

    Coeficiente de mortalidade pela doena X e Y (100.000hab). Determinada localidade, 1990- 1995.

    1

    10

    100

    1000

    1990

    1991

    1992

    1993

    1994

    1995

    Ano

    C

    o

    e

    f

    i

    c

    i

    e

    n

    t

    e

    Doena X Doena Y

  • HEP5800 DPBergamaschi 51

    Questo 9 Apresente os dados da tabela em um grfico apropriado. Distribuio de crianas segundo nvel de retinol srico. Cansao, Bahia, 1992.

    Retinol srico (g/dl) No % Aceitvel (20-49) 89 55,3 Baixo (10-19,9) 65 40,4 Deficiente (

  • HEP5800 DPBergamaschi 52

    Apresentao grfica

    Questo 10 Apresente os dados da tabela em:

    a) um histograma. b) um polgono de freqncias.

    Distribuio de homens adultos segundo comprimento do antebrao

    Comprimento (polegadas) No % 16,0 |-- 16,5 4 2,9 16,5 |-- 17,0 3 2,1 17,0 |-- 17,5 12 8,6 17,5 |-- 18,0 11 7,9 18,0 |-- 18,5 21 15,0 18,5 |-- 19,0 25 17,9 19,0 |-- 19,5 23 16,4 19,5 |-- 20,0 19 13,6 20,0 |-- 20,5 10 7,1 20,5 |-- 21,0 10 7,1 21,0 |-- 21,5 2 1,4 Total 140 100

    Fonte: Hand DJ et al., 1994.

  • HEP5800 DPBergamaschi 53

    Apresentao grfica

    Questo 11 Apresente os dados da tabela em um grfico apropriado. Distribuio de homens segundo presena de doena coronariana (CHD) e consumo de caf

    Condio Alto consumo de caf (>=100xcaras/ms)

    Moderado consumo de caf (

  • HEP5800 DPBergamaschi 54

    Questo 12Interprete os grficos dos itens a seguira) Artigo: Diagnstico de sobrepeso em adolescentes: estudo do desempenho de diferentes

    critrios para o ndice de Massa Corporal de MONTEIRO POA et al. (Rev. Sade Pblica, 2000;34(5):506-13).

    Apresentao grfica

  • HEP5800 DPBergamaschi 55

    Apresentao grfica b) Artigo: Mortalidade por desnutrio em idosos, regio Sudeste do Brasil, 1980-1997 de OTERO UB et al. (Rev. Sade Pblica, 2002; 36(2):141-48).

  • HEP5800 DPBergamaschi 56

    d) Artigo: Tendncia secular da anemia na cidade de So Paulo (1984-1996) de MONTEIRO CA et al. (Rev. Sade Pblica, 2000; 34(6, sup):62-72).

  • HEP5800 DPBergamaschi 57

    Medidas de tendncia central e de disperso

    Mdia aritmticaMediana ModaValores mnimo e mximoAmplitude de variaoVarinciaDesvio padroCoeficiente de variao de PearsonQuartisPercentisBox plotExerccios

  • HEP5800 DPBergamaschi 58

    Medidas de tendncia central e de disperso

    Mdia aritmtica

    Valores individuaisValores em distribuio de freqnciaValores em intervalos de classe

  • HEP5800 DPBergamaschi 59

    Medidas de tendncia central e de disperso

    Notao: X varivel

    N tamanho da populao n tamanho da amostra mdia populacional (parmetro, geralmente desconhecido)

    X Estatstica (frmula) x mdia amostral (estimativa, valor calculado na amostra)

  • HEP5800 DPBergamaschi 60

    Mdia aritmtica

    Medidas de tendncia central e de disperso

    Supor a idade (anos) de 5 pessoas: 3, 5, 8, 12, 12

    Mdia = anos85

    1212853=

    =+++ Definio: a soma dos valores de uma varivel, dividida pelo nmero de valores.

    Mdia aritmtica o valor que indica o centro de equilbrio de uma distribuio de freqncias de uma varivel quantitativa

    Desvios em torno da mdia:

    3 8 =-5 anos5 8 =-3 anos8 8 = 0 anos2 8 = 4 anos

    12 8 = 4 anossoma = 0 anos

  • HEP5800 DPBergamaschi 61

    Medidas de tendncia central e de disperso

    s existe para variveis quantitativas e seu valor nico;

    da mesma natureza da varivel considerada (mdia = 8 anos); e

    sofre influncia dos valores aberrantes (3, 5, 8, 12, 42; mdia = 14 anos)

    X: idade (anos) 3, 5, 8, 12, 12

    x1 = 3; x2 = 5; x3=8; x4=12; x5= 12

    xx x x

    n

    x

    n

    n

    ii

    n

    =

    + + +=

    =

    1 2 1...

    Valores individuais

    Mdia aritmtica

  • HEP5800 DPBergamaschi 62

    Medidas de tendncia central e de disperso

    Os dados a seguir so provenientes do grupo Western Collaborative Group Study, Califrnia (1960-61). Foram estudados 3154 homens de meia idade para investigar arelao entre padres de comportamento e risco de doena coronariana.

    Os dados apresentados so de 40 homens para os quais foram medidos os nveis de colesterol (mg por 100ml) e realizada uma categorizao segundo comportamento.

    O comportamento de tipo A caracterizado pela urgncia, agressividade e ambio.

    O de tipo B relaxado, no competitivo e menos preocupado. Tipo A: nvel de colesterol 233 291 312 250 246 197 268 224 239 239 254 276 234 181 248 252 202 218 212 325

    mlmgxA 100/05,24520325212...291233

    =

    ++++=

    Mdia aritmtica

  • HEP5800 DPBergamaschi 63

    Medidas de tendncia central e de dispersoMdia aritmtica

    Tipo B: nvel de colesterol 344 185 263 246 224 212 188 250 148 169 226 175 242 252 153 183 137 202 194 213

    mlmgxB 100/3,21020213169...226344

    =

    ++++=

  • HEP5800 DPBergamaschi 64

    Medidas de tendncia central e de dispersoMdia aritmtica

    Valores em distribuio de freqncias

    grupo A Colesterol (X) fi xifi

    181 1 181 197 1 197 202 1 202 212 1 212 218 1 218 224 1 224 233 1 233 234 1 234 239 2 478 246 1 246 248 1 248 250 1 250 252 1 252 254 1 254 268 1 268 276 1 276 291 1 291 312 1 312 325 1 325 soma 20 4901

    05,24520

    4901==x

    n

    fxx

    k

    i

    ii=

    =1

    mg/100ml

    i representa o i-simo valor da varivel

  • HEP5800 DPBergamaschi 65

    Medidas de tendncia central e de dispersoMdia aritmtica - valores em intervalos de classe

    n

    fxX

    k

    i

    iipm=

    =1

    i representa o i-simo intervaloipmx representa o ponto mdio do intervalo,

    fi a freqncia de indivduos no intervalo i, k o nmero de intervalos e n o nmero de observaes

    concentrao fi ponto mdio (xipm) xipmfi 180,0|--200,0 2 190 380 200,0|--220,0 3 210 630 220,0|--240,0 5 230 1150 240,0|--260,0 5 250 1250 260,0|--280,0 2 270 540 280,0|--300,0 1 290 290 300,0|--320,0 1 310 310 320,0|--340,0 1 330 330

    total 20 4880

    mlmgx 100/0,24420

    4880==

  • HEP5800 DPBergamaschi 66

    Medidas de tendncia central e de disperso

    Mediana (Med) o valor que ocupa a posio central de uma srie de n observaes, quando estas esto ordenadas de forma crescente ou decrescente.

    a) valores individuais Quando nmero de observaes (n) for mpar:

    a mediana o valor da varivel que ocupa o posto n + 1

    2

    Quando o nmero de observaes (n) for par:

    a mediana a mdia aritmtica dos valores da varivel que ocupam os

    postos n2

    e n + 22

  • HEP5800 DPBergamaschi 67

    Medidas de tendncia central e de disperso

    Mediana (Med)

    Exemplo: Tipo A: nvel de colesterol

    233 291 312 250 246 197 268 224 239 239 254 276 234 181 248 252 202 218 212 325

    Ordenando-se os valores:

    181 202 218 233 239 246 250 254 276 312 197 212 224 234 239 248 252 268 291 325

    Mediana = mlmg 100/5,2422

    246239=

    +

  • HEP5800 DPBergamaschi 68

    Medidas de tendncia central e de disperso

    Mediana (Med)

    valores em distribuio de freqncia pontualColesterol (X) fi facumulada

    181 1 1

    197 1 2

    202 1 3

    212 1 4

    218 1 5

    224 1 6

    233 1 7

    234 1 8

    239 2 10

    246 1 11

    248 1

    250 1

    252 1

    254 1

    268 1

    276 1

    291 1

    312 1

    325 1

    Total 20

    Mediana = mlmg 100/5,2422

    246239=

    +

  • HEP5800 DPBergamaschi 69

    Medidas de tendncia central e de disperso Mediana (Med)

    Valores em intervalos de classe

    Nvel de Colesterol (mg/100ml) (xi) fi facumulada 180|--200 2 2 200|--250 10 12 250|--300 6 300|--350 2 Total 20

    Como so 20 observaes, a mediana estar na posio 10 (20/2)Mediana est na classe de 200|-- 250 mg/100ml10 observaes -------50 mg/100ml 8 observaes ------- x

    4010

    508==

    xx

    Mediana = valor inicial do intervalo + 40 = 240 mg/100ml

  • HEP5800 DPBergamaschi 70

    Medidas de tendncia central e de disperso

    Mediana (Med) Valores em intervalos de classe

    anaclassemedi

    oracumanteri

    i ffn

    aLMed

    += 2

    Li o limite inferior da classe que contm a mediana

    a a amplitude da classe que contm a mediana

    oracumanterif a freqncia acumulada at a classe anterior classe que contm a mediana

    anaclassemedif a freqncia da classe que contm a mediana

    mlmgMed 100/2404020010

    2220

    50200 =+=

    +=

  • HEP5800 DPBergamaschi 71

    Medidas de tendncia central e de disperso

    OBS: existe para varivel quantitativa e qualitativa ordinal; da mesma natureza da varivel considerada; torna-se inadequada quando h muitos valores repetidos; no sofre influncia de valores aberrantes;

    EX: 4,3 4,6 5,2 5,2 6,6 7,2 8,4 9,0 10,4 14,0 17,8 Mdia aritmtica: 8,43 pmol/l; Mediana: 7,2 pmol/l

    4,6 5,2 5,2 6,6 7,2 8,4 9,0 10,4 14,0 37,8 Mdia aritmtica: 10,25 pmol/l; Mediana: 7,2 pmol/l

    pode ser calculada mesmo quando os dados esto agrupados em intervalos

    de classe e os extremos de algum intervalo no esteja definido (a no ser que a mediana caia neste intervalo).

    Mediana (Med)

  • HEP5800 DPBergamaschi 72

    Medidas de tendncia central e de disperso

    Moda (Mo)

    o valor da varivel que apresenta freqncia mxima.

    Classe modal: intervalo de classe onde se encontra a moda.

    OBS: pode ser calculada para varivel quantitativa e qualitativa; nem sempre existe ou nica; da mesma natureza da varivel considerada; no caso da varivel quantitativa estar apresentada em intervalos de classes

    muito afetada pela maneira como as classes foram construdas.

  • HEP5800 DPBergamaschi 73

    Distribuio de mulheres idosas segundo a altura. Altura (cm) No % %

    acumulado 140|-145 1 0,29 0,29 145|-150 11 3,13 3,42 150|-155 52 14,81 18,23 155|-160 109 31,05 49,28 160|-165 106 30,20 79,48 165|-170 50 14,25 93,73 170|-175 18 5,13 98,86 175|-180 4 1,14 100 Total 351 100

    Fonte: Hand DJ et al., 1994.

    Moda (Mo)

    Medidas de tendncia central e de disperso

  • HEP5800 DPBergamaschi 74

    Medidas de disperso Valores mnimo e mximo: valores extremos da distribuio Amplitude de variao: a diferena entre os 2 valores extremos da distribuio Idade (grupo 1): 2, 4, 3, 5, 6, 4, 17 amplitude de variao = 17-2 = 15 Idade (grupo 2): 2, 2, 2, 2, 2, 2, 17 amplitude de variao = 15

    Medidas de tendncia central e de disperso

  • HEP5800 DPBergamaschi 75

    Medidas de tendncia central e de disperso

    Supor a idade (anos) de 5 pessoas: 3, 5, 8, 12, 12

    Mdia = anos85

    1212853=

    =+++

    Desvios em torno da mdia: 3 8 =-5 anos 5 8 =-3 anos 8 8 = 0 anos 12 8 = 4 anos 12 8 = 4 anos soma = 0 anos

    Desvios quadrticos em torno da mdia: (3 8)2 =(-5 anos)2 = 25 anos2 (5 8)2 =(-3 anos)2 = 9 anos2 (8 8)2 = (0 anos)2= 0 anos2 (12 8)2= (4 anos)2= 16 anos2 (12 8)2= (4 anos)2 = 16anos2 soma dos desvios quadrticos em torno da mdia = 66 anos2

    Varincia e desvio padro

  • HEP5800 DPBergamaschi 76

    Varincia e desvio padro

    Medidas de tendncia central e de disperso

    Varincia = soma dos desvios quadrticos em torno da mdia/nmero de observaes

    Varincia = 22,135

    66anos=

    Desvio padro: a raiz quadrada da varincia , ou seja =

    =

    2

    2S S

    Desvio padro = anosanos 63,32,13 2 =

  • HEP5800 DPBergamaschi 77

    Medidas de tendncia central e de disperso

    Valores individuais:

    Varincia populacional: N

    XXN

    ii

    =

    =1

    2

    2)(

    Varincia amostral: 1

    )(1

    2

    2

    =

    =

    n

    xx

    S

    n

    ii

  • HEP5800 DPBergamaschi 78

    Medidas de tendncia central e de dispersoExemplo:

    Tipo A: nvel de colesterol 233 291 312 250 246 197 268 224 239 239254 276 234 181 248 252 202 218 212 325

    Varincia: 222

    2 )100/(37,134219

    )05,245325(...)05,245233(mlmgs =++=

    Desvio padro mlmgs 100/64,3637,1342 ==

    Tipo B: nvel de colesterol 344 185 263 246 224 212 188 250 148 226 175 242 252 153 183 137 202 194

    Varincia: 222

    2 )100/(747,233619

    )3,210213(...)3,210344(mlmgs =++=

    Desvio padro mlmgs 100/34,48747,2336 ==

  • HEP5800 DPBergamaschi 79

    Medidas de tendncia central e de dispersoValores em distribuio de freqncias

    Varincia amostral: 1

    )(1

    2

    2

    =

    =

    n

    fxxS

    n

    iii

    Tipo A: Nvel de Colesterol

    (mg/100ml) (xi)

    fi xifi 2)( xxi ii fxx 2)( 181 1 181 4102,40 4102,40 197 1 197 2308,80 2308,80 202 1 202 1853,30 1853,30 212 1 212 1092,30 1092,30 218 1 218 731,70 731,70 224 1 224 443,10 443,10 233 1 233 145,20 145,20 234 1 234 122,10 122,10 239 2 478 36,60 73,21 246 1 246 0,90 0,90 248 1 248 8,70 8,70 250 1 250 24,50 24,50 252 1 252 48,30 48,30 254 1 254 80,10 80,10 268 1 268 526,70 526,70 276 1 276 957,90 957,90 291 1 291 2111,40 2111,40 312 1 312 4482,30 4482,30 325 1 325 6392,00 6392,00 Total 20 4901 25504,95

    22 )100/(37,1342

    1995,25504

    mlmgsA == ; mlmgs A 100/64,3637,1342 ==

  • HEP5800 DPBergamaschi 80

    Medidas de tendncia central e de disperso

    Tipo B: Nvel de Colesterol (mg/100ml) (xi) fi xifi 2)( xxi ii xfxx 2)(

    137 1 137 5372,89 5372,89 148 1 148 3881,29 3881,29 153 1 153 3283,29 3283,29 169 1 169 1705,69 1705,69 175 1 175 1246,09 1246,09 183 1 183 745,29 745,29 185 1 185 640,09 640,09 188 1 188 497,29 497,29 194 1 194 265,69 265,69 202 1 202 68,89 68,89 212 1 212 2,89 2,89 213 1 213 7,29 7,29 224 1 224 187,69 187,69 226 1 226 246,49 246,49 242 1 242 1004,89 1004,89 246 1 246 1274,49 1274,49 250 1 250 1576,09 1576,09 252 1 252 1738,89 1738,89 263 1 263 2777,29 2777,29 344 1 344 17875,69 17875,69 Total 20 4206 44398,2

    22 )100/(747,233619

    2,44398mlmgsB == ; mlmgsB 100/34,48747,2336 ==

  • HEP5800 DPBergamaschi 81

    Medidas de tendncia central e de disperso

    Valores em intervalos de classe

    Varincia amostral: 1

    )(1

    2

    2

    =

    =

    n

    fxxS

    n

    iiipm

    Nvel de Colesterol (mg/100ml) (xi)

    fi xi ponto mdio (xipm)

    xipmfi 2)( xxipm iipm fxx 2)(

    180|--200 2 190 380 3192,25 6384,5 200|--250 10 225 2250 462,25 4622,5 250|--300 6 275 1650 812,25 4873,5 300|--350 2 325 650 6162,25 12324,5 Total 20 4930 28205,0

    mlmgxxxA 100/5,246204930

    202325...0155

    ==

    ++=

    22 )100/(47,148419

    0,28205mlmgsA == ; mlmgs A 100/53,3847,1484 ==

  • HEP5800 DPBergamaschi 82

    Medidas de tendncia central e de disperso

    Tipo B Nvel de Colesterol

    (mg/100ml) (xi)

    fi xi ponto mdio (xipm)

    xipmfi 2)( xxipm iipm fxx 2)(

    130|--180 5 155 775 3364 16820 180|--200 4 190 760 529 2116 200|--250 7 225 1575 144 1008 250|--300 3 275 825 3844 11532 300|--350 1 325 325 12544 12544 Total 20 4260 44020

    mlmgxxxB 100/0,213204260

    201325...5155

    ==

    ++=

    22 )100/(84,2316

    1944020

    mlmgsA == ; mlmgs A 100/13,4884,2316 ==

  • HEP5800 DPBergamaschi 83

    Medidas de tendncia central e de disperso

    Coeficiente de Variao de Pearson (CV):

    o quociente entre o desvio padro e a mdia, ou seja 100x

    S=CV x

    CVtipo A: %0,1510005,24564,36

    =x ; CVtipoB: %0,231003,21034,48

    =x ;

    Questo 13 So fornecidos valores de nvel de triglicrides (mg/dL) de 9 pessoas 166 158 202 166 135 86 150 86 121

    Calcule, apresentando o desenvolvimento da frmula:

    a) o nvel mdio de triglicrides; b) o nvel mediano de triglicrides; c) o desvio padro do nvel de triglicrides e d) o coeficiente de variao do nvel de triglicrides.

  • HEP5800 DPBergamaschi 84

    Medidas de tendncia central e de disperso

    Questo 14 A tabela abaixo foi extrada do artigo: Diagnstico de sobrepeso em adolescentes: estudo do desempenho de diferentes critrios para o ndice de Massa Corporal de MONTEIRO POA et al. (Rev. Sade Pblica, 2000;.34(5):506-13). Discuta os resultados obtidos ignorando a coluna do valor de p (este tpico ser abordado na disciplina Bioestatstica II).

  • HEP5800 DPBergamaschi 85

    Medidas de tendncia central e de dispersoQuartil Valores da varivel que dividem a distribuio em quatro partes iguais.

    25% 25% 25% 25% Q1: deixa abaixo 25% das observaes

    25% 75% Q2: deixa abaixo 50% das observaes

    50% 50% Q3: deixa abaixo 75% das observaes

    75% 25%

    Primeiro quartil: ))1(41(

    1+

    =

    nxQ ; Terceiro quartil: ))1(

    43(

    3+

    =

    nxQ

    onde x o valor da varivel e ))1(41( +n e ))1(

    43( +n so ndices que

    representam as posies ocupadas por x.

  • HEP5800 DPBergamaschi 86

    Medidas de tendncia central e de disperso1.030* 1.310* 2.200* 1.680 2.550 1.050* 1.500* 2.270* 1.715 2.570 1.100* 1.550* 2.275* 1.720 2.600 1.175* 1.600* 2.440* 1.760 2.700 1.185* 1.720* 2.500* 1.930 2.830 1.225* 1.750* 2.560* 2.015 2.950 1.230* 1.770* 2.730* 2.040 3.005 1.262* 1.820* 1.130 2.090 3.160 1.295* 1.890* 1.410 2.200 3.400 1.300* 1.940* 1.575 2.400 3.640

    Entre os recm-nascidos que sobreviveram: gxxQ 17201 6))123(

    41(

    ===

    +

    gxxQ 28303 18))123(43(

    ===

    +

    Observe que gxxQ 22002 12))123(21(

    ===

    +

    Entre os recm-nascidos que foram a bito gxxQ 12301 7))127(

    41(

    ===

    +

    gxxQ 22003 21))127(43(

    ===

    + e gxxQ 16002 14))127(

    21(

    ===

    +

  • HEP5800 DPBergamaschi 87

    Medidas de tendncia central e de disperso

    Supor o exemplo com 22 observaes: n=22

    )

    435()

    423())122(

    41(

    1 xxxQ ===+

    que do caminho entre x5=1715 e x6=1720

    gQ 8,1718)17151720(4317151 =+=

    )4117())122(

    43(

    3 xxQ ==+

    que do caminho entre x17=2700 e x18=2830

    gQ 5,2732)27002830(4127003 =+=

  • HEP5800 DPBergamaschi 88

    Medidas de tendncia central e de dispersoPercentil

    Valores da varivel que dividem a distribuio em cem partes iguais. Entre os recm-nascidos que sobreviveram Percentil 5:

    )511()

    100120())123(

    1005(

    5 xxxP ===+

    gP 1186)11301410(5111305 =+=

    que 1/5 do caminho entre x1=1130 e x2=1410

    Percentil 10:

    )522()

    100240())123(

    10010(

    10 xxxP ===+

    ; gP 1476)14101575(52141010 =+=

    Percentil 50:

    )12()1001200())123(

    10050(

    50 xxxP ===+

    ; gP 220050 =

    Percentil 75:

    )18()1001800())123(

    10075(

    75 xxxP ===+

    ; gP 283075 =

    Percentil 90:

    )5321()

    1002160())123(

    10090(

    90 xxxP ===+

    ; gP 3304)31603400(53316090 =+=

  • HEP5800 DPBergamaschi 89

    Medidas de tendncia central e de dispersoBox plot e identificao de valores aberrantes (outliers) O Box plot representa graficamente dados de forma resumida em um retngulo onde as linhas da base e do topo so o primeiro e o terceiro quartis, respectivamente. A linha entre estas a mediana. Linhas verticais que iniciam no meio da base e do topo do retngulo, terminam em valores denominados adjacentes inferior e superior (Chambers et al., 1983, pag 60). O valor adjacente superior o maior valor das observaes que menor ou igual a Q3+1,5(Q3-Q1) e o valor adjacente inferior definido como o menor valor que maior ou igual a Q1-1,5(Q3-Q1), sendo a diferena Q3-Q1 denominada intervalo inter-quartil (IIQ). Valores outliers (discrepantes ou aberrantes) so valores que fogem da distribuio dos dados. O box plot alm de apresentar a disperso dos dados torna-se til tambm para identificar a ocorrncia destes valores como sendo os que caem fora dos limites estabelecidos pelos valores adjacentes superior e inferior.

    120

    140

    160

    180

    200

    220

    240

    260

    280

    300

    320

    340

    360

    380 colesterol

    A B

  • HEP5800 DPBergamaschi 90

    Tipo A: nvel de colesterol 181 202 218 233 239 246 250 254 276 312 197 212 224 234 239 248 252 268 291 325

    Tipo A: n=20;

    5,2195,1218)218224(412181

    415

    421)1(

    41 =+=+====

    +xxxQ

    n

    5,2645,10254)254268(432543

    4315)21(

    43)1(

    43 =+=+====

    +xxxQ

    n

    Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45 325 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 332, onde 332 dado por: 332455,15,264 =+ x . 181 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 152, onde 152 dado por: 152455,15,219 = x .

    Box plot

  • HEP5800 DPBergamaschi 91

    Tipo B n=20

    1772175)175183(411751

    415

    421)1(

    41 =+=+====

    +xxxQ

    n

    2453242)242246(432423

    4315)21(

    43)1(

    43 =+=+====

    +xxxQ

    n

    Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68 344 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 347, onde 347 dado por: 347685,1245 =+ x . 137 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 75, onde 75 dado por: 75685,1177 = x .

    Box plot

  • HEP5800 DPBergamaschi 92

    Box plotTipo A: n=20;

    5,2195,1218)218224(412181

    415

    421)1(

    41 =+=+====

    +xxxQ

    n

    5,2645,10254)254268(432543

    4315)21(

    43)1(

    43 =+=+====

    +xxxQ

    n

    Intervalo Inter-Quartil (IIQ): Q3-Q1 = 45 325 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 332, onde 332 dado por: 332455,15,264 =+ x . 181 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 152, onde 152 dado por: 152455,15,219 = x . Tipo B n=20

    1772175)175183(411751

    415

    421)1(

    41 =+=+====

    +xxxQ

    n

    2453242)242246(432423

    4315)21(

    43)1(

    43 =+=+====

    +xxxQ

    n

    Intervalo Inter-Quartil (IIQ): Q3-Q1 = 68 344 o valor adjacente superior. Este o maior valor da distribuio, igual ou abaixo de 347, onde 347 dado por: 347685,1245 =+ x . 137 o valor adjacente inferior. o menor valor da distribuio, igual ou acima de 75, onde 75 dado por: 75685,1177 = x .

  • HEP5800 DPBergamaschi 93

    Box plot

    Questo 16

    Os dados a seguir so de uma pesquisa que investigou as concentraes de minerais no leite materno, no perodo de 1984 a 1985. Foram coletadas amostras de leite materno de 55 mulheres que tiveram seus filhos no Hospital Maternidade Odete Valadares, em Belo Horizonte. As mes foram divididas em perodo de lactao: colostro e leite maduro. clcio (g/mL de leite) grupo colostro

    113 181 254 311 334 145 221 256 312 344 163 225 275 313 372 163 231 296 323 375 167 241 303 325 375 437

    clcio (g/mL de leite) grupo maduro 159 175 181 188 200 206 213 214 217 231 238 238 242 244 256 259 260 263 264 275 277 279 281 293 302 303 314 344 394

    a) Calcule a quantidade mdia de clcio (g/mL de leite) em cada grupo. b) Calcule a quantidade mediana de clcio (g/mL de leite) em cada grupo. c) Desenhe o box plot da concentrao de clcio (g/mL de leite) representando os dois grupos em um s grfico. d) Comente o grfico box plot quanto a disperso dos dados, existncia de valores aberrantes e igualdade de medianas.

  • HEP5800 DPBergamaschi 94

    Questo 17O boxplot abaixo foi extrado do artigo: Vigilncia epidemiolgica e avaliao da assistncia s meningites de ESCOSTEGUY CC et al. (Rev. Sade Pblica, 2004;38(5):657-63). Avalie os resultados apresentados

  • HEP5800 DPBergamaschi 95

    Noes de correlao

    X e Y so variveis aleatrias quantitativas

    Y

    X

    Y

    X

    X

    Y

    correlao positiva correlao negativa correlao inexistente

  • HEP5800 DPBergamaschi 96

    Noes de correlao

    Coeficiente de correlao de Pearson ( ): Mede o grau de associao entre 2 variveis quantitativas X e Y. Definio:

    =XY

    X Y

    onde, XY a covarincia de X e Y (disperso conjunta de X e Y) X o desvio padro de X (disperso de X) Y o desvio padro de Y (disperso de Y)

  • HEP5800 DPBergamaschi 97

    estimador (r)

    =

    2

    _

    i

    2_

    i

    _

    i

    _

    i

    yyxx

    yyxxr

    Noes de correlao

    +1 1

    Propriedades

    no possui dimenso, isto , no depende da unidade de medida das variveis X e Y

  • HEP5800 DPBergamaschi 98

    Grficos de disperso para diferentes valores do coeficiente de correlao (rho).

    Noes de correlao

  • HEP5800 DPBergamaschi 99

    Noes de correlao

    Exemplo:Os dados a seguir so provenientes de um estudo que investiga a composio corporal e fornece o percentual de gordura corporal (%), idade e sexo para 18 adultos com idades entre 23 e 61 anos.Idade % gordura sexo Idade % gordura sexo 23 9,5 M 53 34,7 F 23 27,9 F 53 42,0 F 27 7,8 M 54 29,1 F 27 17,8 M 56 32,5 F 39 31,4 F 57 30,3 F 41 25,9 F 58 33,0 F 45 27,4 M 58 33,8 F 49 25,2 F 60 41,1 F 50 31,1 F 61 34,5 F

    M=masculino ; F= femininoFonte: Hand DJ et al., 1994.

  • HEP5800 DPBergamaschi 100

    Noes de correlao

    Disperso entre % de gordura e idade

    i

    d

    a

    d

    e

    gordura5 10 15 20 25 30 35 40 45

    20

    30

    40

    50

    60

    70

    m fm m

    ffm

    f ff ff

    ff f fff

    Fonte: Hand DJ et al., 1994.

  • HEP5800 DPBergamaschi 101

    Noes de correlao

    Disperso entre % de gordura e idade

    i

    d

    a

    d

    e

    gordura5 10 15 20 25 30 35 40 45

    20

    30

    40

    50

    60

    70

    m fm m

    ffm

    f ff ff

    ff f fff

    Fonte: Hand DJ et al., 1994.

  • HEP5800 DPBergamaschi 102

    Noes de correlao

    Disperso entre % de gordura e idade

    i

    d

    a

    d

    e

    gordura5 10 15 20 25 30 35 40 45

    20

    30

    40

    50

    60

    70

    m fm m

    ffm

    f ff ff

    ff f fff

    Fonte: Hand DJ et al., 1994.

  • HEP5800 DPBergamaschi 103

    Noes de correlao

    Clculo do coeficiente de correlao de Pearson Sexo: masculino

    Idade % gordura )( yy )( xx ))(( yyxx 2)( yy 2)( xx 23 9,5 -7,5 -6,13 45,94 56,25 37,52 27 7,8 -3,5 -7,83 27,39 12,25 61,23 27 17,8 -3,5 2,18 -7,61 12,25 4,73 45 27,4 14,5 11,78 170,74 210,25 138,65

    y =30,5 x =15,63 Total 236,45 291,00 242,13 Coeficiente de correlao (idade,%gordura) masculino: 89,0

    13,24229145,236

    ==

    xr

  • HEP5800 DPBergamaschi 104

    Noes de correlao

    Sexo: feminino Idade % gordura )( yy )( xx ))(( yyxx 2)( yy 2)( xx 23 27,9 -27,86 -4,42 123,17 776,02 19,55 39 31,4 -11,86 -0,92 10,93 140,59 0,85 41 25,9 -9,86 -6,42 63,30 97,16 41,23 49 25,2 -1,86 -7,12 13,23 3,45 50,71 50 31,1 -0,86 -1,22 1,05 0,73 1,49 53 34,7 2,14 2,38 5,10 4,59 5,66 53 42 2,14 9,68 20,74 4,59 93,67 54 29,1 3,14 -3,22 -10,12 9,88 10,38 56 32,5 5,14 0,18 0,92 26,45 0,03 57 30,3 6,14 -2,02 -12,42 37,73 4,09 58 33 7,14 0,68 4,85 51,02 0,46 58 33,8 7,14 1,48 10,56 51,02 2,19 60 41,1 9,14 8,78 80,26 83,59 77,06 61 34,5 10,14 2,18 22,10 102,88 4,75

    y = 50,86 x 32,32 Total 333,64 1389,71 312,12

    Coeficiente de correlao (idade,%gordura) feminino: 51,012,31271,1389

    64,333==

    xr

  • HEP5800 DPBergamaschi 105

    Noes de correlao

    Abaixo temos o peso (kg) e a altura (cm) de 30 meninas de 11 anos de idade atendidas na escola Heaton Midldlel em Bradford, Inglaterra.

    a) Fazer o diagrama de disperso e investigue como a relao entre as variveis.

    b) Calcular o coeficiente de correlao de Pearson. Altura (cm)

    Peso (kg) Altura (cm) Peso (kg)

    Altura (cm)

    Peso (kg)

    Altura (cm)

    Peso (kg)

    135 26 133 31 136 28 146 35 146 33 149 34 154 36 143 42 153 55 141 32 151 48 148 32 154 50 164 47 155 36 143 36 139 32 146 37 149 32 140 33 131 25 149 46 141 29 141 28 149 44 147 36 137 34 137 31 152 47 135 30

    1275))(( = yyxx ; = 80,1716)( 2xx ; = 17,1718)( 2yy

  • HEP5800 DPBergamaschi 106

    Noes de correlao

    Os grficos abaixo foram extrados do artigo: Excesso de peso e gordura abdominal para a sndrome metablica em nipo-brasileiros de LERARIO DG et al. (Rev. Sade Pblica, 2002;36(1):4-11). Interprete as figuras apresentadas no artigo.

  • HEP5800 DPBergamaschi 107

    Coeficiente de correlao (idade,%gordura) feminino: 51,012,31271,138964,333

    ==

    xr

    Coeficiente de correlao considerando homens e mulheres : 0,792

    Regresso linear simples estimando a reta de regresso

    Admitindo-se y como funo linear de x, ajusta-se a melhor reta ao conjunto de dados.

    Equao de reta: bxay += , onde y = valor ajustado (valor mdio predito)

    x = valor escolhido de X xbya = ; a denominado intercepto; o valor predito para x=0

    x

    yxy

    s

    srb =

    ; b denominado coeficiente angular (slope). Indica quantas unidades de Y

    mudam para a mudana de uma unidade de X.

  • HEP5800 DPBergamaschi 108

    Aplicando-se aos dados do exemplo: a = 28,61 b 46,33 ;

    548,022,1314,979,0 == xb

    Para aumento de 1 ano, o percentual de gordura aumenta 0,55%.

    Substituindo-se o valor b em a, obtm-se a=3,221.

    Equao ajustada % gordura= 3,22 + 0,55 (idade)

    Com base nesta equao possvel traar a reta que passa pelos pontos.

    Para x = 30; y = 19,7; para x = 50, y = 30,7

    y = 0,55x + 3,22

    0

    10

    20

    30

    40

    50

    0 20 40 60idade (anos)

    %

    g

    o

    r

    d

    u

    r

    a

  • HEP5800 DPBergamaschi 109

    OBS: o coeficiente angular depende das unidades de medida de X e Y. Isto deve ser considerado na deciso da importncia do coeficiente angular. O coeficiente angular da equao de Y=f(X) diferente do coeficiente angular de X=f(Y), a menos que os desvios padro de X e Y sejam iguais.

    Usos da reta de regresso:

    - Predio - utilizar X para predizer Y; quando a correlao for forte, melhor a predio; - Correlao mede o grau de relacionamento linear entre X e Y; - Resumir os dados cada valor de X tem um valor mdio de Y.

    Exemplo 13 So apresentados valores da massa do corpo sem gordura (kg) e da taxa de metabolismo (calorias) de 10 pessoas de ambos os sexos

    Pessoa Sexo Massa Taxa 1 M 62 1792 2 M 62,9 1666 3 F 36,1 995 4 F 54,6 1425 5 F 48,5 1396 6 F 42 1418 7 M 47,4 1362 8 F 50,6 1502 9 F 42 1256 10 M 48,7 1614

    Fonte: Moore et al., 2004 (adaptado)

    a) Apresente os dados em um diagrama de disperso com pontos identificando os sexos. Apresente a varivel Y, taxa de metabolismo, como varivel resposta (dependente) e a varivel X, massa do corpo sem gordura, como explicativa (independente);

    b) Calcule o coeficiente de correlao entre as variveis sexo e massa; c) Calcule os coeficientes da reta de regresso e desenhe a reta; d) Interprete os coeficientes da reta. e) Com base no grfico de disperso, voc diria que o coeficiente de correlao de Pearson para

    o sexo feminino maior, menor ou igual ao do sexo masculino? Justifique.

  • HEP5800 DPBergamaschi 110

    Medidas de associao

    X e Y so variveis aleatrias quantitativas

    Razo de prevalnciasRazo de incidnciasOdds ratioQui quadrado de PearsonCoeficiente de associao de YuleExerccios

  • HEP5800 DPBergamaschi 111

    Medidas de associao

    Razo de prevalncias

    Estudo de prevalncia

    n indivduos so observados e classificados segundo duas variveis X e YEx: X- ronco noturno (X1 sim, X0 no) e Y - presena de problema cardaco (Y1 sim, Y0 no)

    Varivel Y Varivel X Y1 (sim) Y0 (no) Total (%) X1 (sim) a b n1 (100) X0 (no) c d n0 (100) Total m1 m2 n (100)

    p= prevalncia de Y1= m1/n p1= prevalncia de Y1|X1= a/n1 p0= prevalncia de Y1|X0= c/n0

    rp= razo de prevalncias= p1/p0

    dp=diferena de prevalncias= p1-p0

  • HEP5800 DPBergamaschi 112

    Medidas de associao razo de prevalncias

    A prevalncia de desnutrio parece ser maior entre as crianas do sexo masculino. Os meninos apresentam uma prevalncia 56% maior do que as meninas.

    A prevalncia de desnutrio entre meninos 1,56 vezes (uma vez e meia) a prevalncia de desnutrio entre meninas

    Exemplo: So apresentados dados sobre o estado nutricional de 1226 crianas brasileiras de 2 anos de idade, segundo sexo. Estado nutricional (Y) Masculino (X1) Feminino (X0) Total

    (Y1) Desnutridas 29 20 49 (Y0) Normais 574 603 1177 Total 603 623 1226

    Prevalncia de desnutrio: 040,01226

    49= ou 4%

    Prevalncia de desnutrio segundo sexo:

    Masculino: 05,060329

    = ou 5,0%; Feminino: 032,062320

    = ou 3,2%

    Razo de prevalncias: 498,16032029623

    6232060329

    ==

    x

    x

    Diferena de prevalncias: 0,05-0,032=0,018 ou 1,8%

  • HEP5800 DPBergamaschi 113

    Medidas de associao razo de incidncias

    Utilizado em estudos de coorte. Neste tipo de estudo, um grupo de pessoas sadias identificada e seguida por um perodo de tempo. Observa-se a ocorrncia de eventos de interesse que acontecem durante este perodo. O objetivo investigar se a incidncia de um determinado evento est relacionada a uma determinada exposio.

    Varivel Y Varivel X Y1 Y0 Total

    X1 a b n1 (100%) X0 c d n0 (100%) Total m1 m2 n (100%)

    Estudo de incidncia

    r= incidncia de Y1= m1/n r1= incidncia de Y1 entre os X1= a/n1 r0= incidncia de Y1 entre os X0= c/n0

    ri= razo de incidncias= r1/r0 di= diferena de incidncias= r1-r0 incidncia risco r1 r0 r1/r0 r1-r0

    ri=rr=razo de riscos=risco relativo=r1/r0

    di= ra= risco atribuvel= r1-r0

  • HEP5800 DPBergamaschi 114

    Medidas de associao

    Estudo de incidncia

    Morte em 5 anos por DIC Fumar Sim No

    Total

    Sim 208 850 1058 No 264 1467 1731 Total 472 2317 2789

    r= 472/2789= 0,17 = 17% r1=208/1058= 0,20= 20% r0=264/1731= 0,15=15% rr=0,20/0,15= 1,33 ra= 0,20- 0,15= 0,05= 5%

    A incidncia de mortes parece ser maior entre as pessoas que fumam. Os fumantes apresentam uma incidncia 33% maior do que os no fumantes.

    A mortalidade entre fumantes 1,33 vezes a mortalidade entre no fumantes.

  • HEP5800 DPBergamaschi 115

    Medidas de associao

    Razo de odds (odds ratio) - Estudo do tipo caso-controle

    Varivel Y Varivel X Y1 (caso) Y0 (controle) Total

    X1 a b n1 X0 c d n0 Total m1 (100%) m2 (100%) n

    odds a favor de Y1: na categoria X1= (a/n1)(b/n1) na categoria X0= (c/n0)(d/n0)

    Razo de odds ou odds ratio:

    [(a/n1)(b/n1)][(c/n0)(d/n0)]=( ) ( )cbda

    dc

    ba

    dcba.

    .

    ==

  • HEP5800 DPBergamaschi 116

    Medidas de associaoOs dados a seguir so de um estudo sobre cncer de esfago e consumo de lcool.

    Condio Consumo mdio de lcool (g/dia) Total 80 e + 0-79 Casos 96 104 200 Controles 109 666 775 Total 205 770 975

    Fonte: Tuyns et al.,1977.

    Razo de odds (odds ratio) - Estudo do tipo caso-controle

    (entre expostos) odds a favor de casos entre consumidores de 80 e + g/dia:

    88,010996

    205109

    :20596

    ==

    (entre no expostos) odds a favor de casos entre consumidores de 0-79g/dia:

    16,0666104

    770666

    :770104

    ==

    odds ratio: 6,510410966696

    666104

    :10996

    ==

    x

    x

    A fora de morbidade de cncer de esfago entre consumidores de 80 e + g/dias de bebida alcolica 5,6 vezes a fora de morbidade entre os que consomem de 0 a 79g/dia.

  • HEP5800 DPBergamaschi 117

    Medidas de associao

    Qui-quadrado de Pearson

    Duas variveis qualitativas: X - curso universitrio e Y sexo do aluno

    Questo: sexo do indivduo influi na escolha do curso?Situao 1

    Curso Masculino Feminino Total n n n

    Economia 24 36 60 Administrao 16 24 40

    Total 40 60 100

    Curso Masculino Feminino Total n proporo n proporo n proporo

    Economia 24 0,6 36 0,6 60 0,6 Administrao 16 0,4 24 0,4 40 0,4

    Total 40 1 60 1 100 1 As propores de escolha dos cursos no diferem segundo sexo do estudante

  • HEP5800 DPBergamaschi 118

    Medidas de associaoQui-quadrado de Pearson

    Situao 2

    Curso Masculino Feminino Total n n n

    Fsica 100 (a) 20 (b) 120 Cincias Sociais 40 (c) 40 (d) 80

    Total 140 60 200

    Curso Masculino Feminino Total

    n proporo n proporo n proporo Fsica 100 0,7 20 0,3 120 (120/200) = 0,6

    Cincias Sociais 40 0,3 40 0,7 80 (80/200) = 0,4 Total 140 1 60 1 200 1

    A distribuio de alunos em cada curso, segundo sexo no a mesma; sexo e curso podem estar associados.

  • HEP5800 DPBergamaschi 119

    Medidas de associao

    Se a varivel sexo no fosse associada escolha do curso, quantos indivduos esperaramos em Fsica, entre os homens?

    Esperaramos: 6,0140

    =

    xou x= 0,6 x 140 = 84

    Homens-Fsica: n observado=100; o valor esperado seria: 0,6x140 ou 84140200120

    =x

    12001601140Total

    0,4800,7400,340Cincias Sociais

    0,61200,3200,7100Fsica

    proporonproporonProporon

    TotalFemininoMasculinoCurso

    Se a varivel sexo no fosse associada escolha do curso, quantos indivduos esperaramos em Cincias Sociais, entre os homens?

    Esperaramos: ou x= 0,4 x 140 = 564,0140

    =

    x

    Homens-C Sociais: n observado=40; o valor esperado seria: 0,4x140 ou 5614020080

    =x

  • HEP5800 DPBergamaschi 120

    Medidas de associao

    Se a varivel sexo no fosse associada escolha do curso, quantos indivduos esperaramos em Fsica, entre os mulheres?

    Mulheres-Fsica: n observado=20; o valor esperado seria: 0,6x60 ou

    12001601140Total

    0,4800,7400,340Cincias Sociais

    0,61200,3200,7100Fsica

    proporonproporonProporon

    TotalFemininoMasculinoCurso

    Se a varivel sexo no fosse associada escolha do curso, quantos indivduos esperaramos em Cincias Sociais, entre as mulheres?

    Esperaramos: ou x= 0,4 x 60 = 244,060

    =

    x

    mulheres-C Sociais: n observado=40; o valor esperado seria: 0,4x60 ou 246020080

    =x

    6,060

    =

    xEsperaramos: ou x= 0,6 x 60 = 36

    3660200120

    =x

  • HEP5800 DPBergamaschi 121

    Tabela esperada, sob a condio de independncia

    Medidas de associao

    12001601140Total

    0,4800,7400,340Cincias Sociais

    0,61200,3200,7100Fsica

    proporonproporonProporon

    TotalFemininoMasculinoCurso

    12001601140Total

    0,4800,7400,340Cincias Sociais

    0,61200,3200,7100Fsica

    proporonproporonProporon

    TotalFemininoMasculinoCurso

    Curso Masculino Feminino Total n n n

    Fsica 84 36 120 Cincias Sociais 56 24 80

    Total 140 60 200

  • HEP5800 DPBergamaschi 122

    Valores

    observados O

    Valores esperados

    E

    (O-E) (O-E)2

    EEO 2)(

    100 84 16 256 3,048 40 56 -16 256 4,571 20 36 -16 256 7,11 40 24 16 256 10,667

    Qui-quadrado=25,397

    Medidas de associao

    O Qui-quadrado obtido somando-se a diferena ao quadrado entre as freqncias observadas e as esperadas, dividido pelas freqncias esperadas

    22

    =

    ( )O E

    E

  • HEP5800 DPBergamaschi 123

    Se o Qui-quadrado for igual a zero, ento no existe associao entre as variveis. O Qui-quadrado no mede fora de associao.

    Medidas de associao

    Coeficiente de associao de Yule (Y)Curso Masculino Feminino Total

    N N % Fsica 100 (a) 20 (b) 120

    Cincias Sociais 40 (c) 40 (d) 80 Total 140 60 200

    Y a d b ca d b c

    Y= +

    +. .. .

    , onde: 1 1

  • HEP5800 DPBergamaschi 124

    Frmula equivalente para clculo do Qui-quadrado:

    Medidas de associao

    2.1..2.1

    2211222112

    ffffn)ffff(

    =

    Curso Masculino Feminino Total N N %

    Fsica f11 =100 f12 = 20 f1. = 120 Cincias Sociais f21 = 40 f22 = 40 f2. = 80

    Total f.1 = 140 f.2 = 60 n = 200

    397,256014080120

    200)402040100( 22=

    =

    xxx

    xx

  • HEP5800 DPBergamaschi 125

    Exemplo:Com o objetivo de investigar a associao entre histria de bronquite na infncia e presena de tosse diurna ou noturna em idades mais velhas, foram estudados 1.319 adolescentes com 14 anos. Destes, 273 apresentaram histria de bronquite at os 5 anos de idade sendo que 26 apresentaram tosse diurna ou noturna aos 14 anos.

    Nmero de adolescentes segundo histria de bronquite aos 5 anos e tosse diurna ou noturna aos 14 anos de idade. Local X, ano Y.

    Bronquite Tosse Sim No Total Sim 26 44 70 No 247 1002 1249 Total 273 1046 1319

    Fonte: Holland WW et al.,1978.

  • HEP5800 DPBergamaschi 126

    Bronquite Tosse Sim No Total Sim 26 44 70 No 247 1002 1249 Total 273 1046 1319

    Clculo do qui-quadrado de Pearson

    Valores observados

    O

    Valores esperados

    E

    (O-E) (O-E)2

    EEO 2)(

    26 14,488 11,512 132,526 9,147 247 258,512 -11,512 132,526 0,513 44 55,512 -11,512 132,526 2,387

    1002 990,488 11,512 132,526 0,134

    Qui-quadrado= 12,181

    Y a d b ca d b c

    Y= +

    +. .. .

    , onde: 1 1

    Coeficiente de associao de Yule (Y)

    =

    +

    =

    247410022624744100226

    xx

    xxY + 0,41

  • HEP5800 DPBergamaschi 127

    Distribuio de recm-nascidos acometidos de sndrome de desconforto idioptico grave segundo condio de sobrevivncia e peso ao nascer (g).

    502327Total

    13103No baixo peso (2500 e mais)

    371324Baixo peso (

  • HEP5800 DPBergamaschi 128

    Defeitos do tubo neural so malformaes congnitas que surgem durante o desenvolvimento fetal. Estes dados so de um estudo conduzido no pas de Gales Reino Unido, para investigar possvel associao entre defeitos do tubo neural e dieta materna. O estudo do tipo caso-controle: mes que tinham tido bebs com defeitos do tubo neural (casos) e suas irms que no tinham tido (controles) foram avaliadas segundo suas dietas e classificadas em boa, razovel e ruim.

    Distribuio de recm-nascidos segundo condio caso - com defeitos do tubo neural; controle recm-nascidos que no tinham defeitos do tubo neural e dieta materna.

    100367100123100244Total

    36,013226,03241,0100Pobre

    43,015839,04845,1110Razovel21,07735,04313,934Boa

    %n%n%n

    TotalControlesCasosDieta

  • HEP5800 DPBergamaschi 129

    Considere a dieta boa como categoria de referncia (basal) e calcule:

    a) o odds ratio de dieta razovel em relao a dieta boa;b) o odds ratio de dieta pobre em relao a boa;c) o qui-quadrado de Pearson ed) interprete os resultados.

    100367100123100244Total

    36,013226,03241,0100Pobre

    43,015839,04845,1110Razovel21,07735,04313,934Boa

    %n%n%n

    TotalControlesCasosDieta