Bioestadistica 7

39
Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 1 Bioestadística Tema 7: Intervalos de Confianza

Transcript of Bioestadistica 7

Page 1: Bioestadistica 7

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 1

Bioestadística

Tema 7: Intervalos de Confianza

Page 2: Bioestadistica 7

Tema 7: Intervalos de

Confianza2 Bioestadística. U. Málaga.

Estimación• Un estimador es una cantidad numérica calculada sobre una

muestra y que esperamos que sea una buena aproximaciónde cierta cantidad con el mismo significado en la población (parámetro).

• En realidad ya hemos trabajado con estimadores cada vez que hacíamos una práctica con muestras extraídas de una población y suponíamos que las medias, etc… eran próximas de las de la población.

– Para la media de una población:• “El mejor” es la media de la muestra.

– Para la frecuencia relativa de una modalidad de una variable:• “El mejor” es la frecuencia relativa en la muestra.

• Habría que precisar que se entiende por “el mejor estimador”pero eso nos haría extendernos demasiado. Ver libro.

Page 3: Bioestadistica 7

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 3

Page 4: Bioestadistica 7

INTERVALOS DE CONFIANZA

MUESTRA

Estimación

puntual

POBLACIÓN

Queremos estimar

un parámetro:

media (μ) o

proporción (π)

Calculamos: media muestral o

proporción muestral (p)x

Inferimos el valor del

parámetro en la población:

INTERVALO DE CONFIANZA

para una media o

proporciónBioestadística. U. Málaga. Tema 7: Intervalos de Confianza 4

Page 5: Bioestadistica 7

INTERVALOS DE CONFIANZA

MUESTRA

Estimación

puntual

POBLACIÓN¿Porcentaje de

fumadores en la

uma?.

N = 65.000

n = 200 participantes

Fuman 60 ; p = 0.30

x

INTERVALO DE CONFIANZA

AL 95% DE CONFIANZA:

I.C.(95%) : 0.24 – 0.37Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 5

Page 6: Bioestadistica 7

Intervalo de confianza:

• Se denomina estimación confidencial o intervalo de confianza para un nivel de confianza 1-α dado, a un intervalo que ha sido construido de tal manera que con frecuencia 1-α realmente contiene al parámetro.

• Obsérvese que α es la frecuencia de que no contenga al parámetro

Page 7: Bioestadistica 7

NIVEL DE CONFIANZA

POBLACIÓN

MUESTRA

1

IC1

MUESTRA

2

IC2

MUESTRA

3

IC3

… MUESTRA

100

IC100

Un nivel de confianza del 95% significa que si calculásemos 100

intervalos con 100 muestras distintas, 95 de ellos contendrían al

verdadero valor del parámetro

Normalmente:

95%

Ocasionalmente:

90% o 99%Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 7

Page 8: Bioestadistica 7

Verdadero valor del parámetro

Intervalosde confianza de varias muestras (solo teórico)

Intervalo calculado

con LA UNICA

muestra obtenida

Conceptualmente:

Page 9: Bioestadistica 7

Tema 7: Intervalos de

Confianza9 Bioestadística. U. Málaga.

Page 10: Bioestadistica 7

Tema 7: Intervalos de Confianza 10Bioestadística. U. Málaga.

¿Es útil conocer la distribución de un estimador?• Es la clave para hacer inferencia. Ilustrémoslo con un ejemplo que

ya tratamos en el tema anterior (teorema del límite central).

– Si de una variable conocemos μ y σ, sabemos que para muestras

“grandes”, la media muestral es:

• aproximadamente normal,

• con la misma media y,

• desviación típica mucho menor (error típico/estándar)n

EE

Page 11: Bioestadistica 7

INTERVALOS DE CONFIANZA

VAMOS A ESTUDIAR TRES CASOS ESPECIALMENTE IMPORTANTES:

IC para la media para muestras “grandes”

IC para la media con muestras no “grandes”

IC para una proporción

La forma general que tiene un IC al nivel de

confianza 1-α para un parámetro es:

estimador± za/2 ×EE_del_estimador

Page 12: Bioestadistica 7

IC para la media para muestras “grandes”

Si la muestra es grande (n>120), el IC para lamedia a un nivel de confianza 1-α se calcula:

x ± za /2 ×s

n

Media

muestralValor de la N(0,1) que deja a

su derecha una prob. = α/2Error estándar

de la media

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 12

estimador± za/2 ×EEdelestimador

Page 13: Bioestadistica 7

x ± za /2 ×s

n

EJEMPLO1:El valor medio de IMC en varones de 25 a 60 años de unamuestra “representativa” de 4707 españoles fue de 25,97Kg/m2 y su desviación estándar fue 3,59 Kg/m2. Construir elIC al 95% de confianza para la media de IMC en España.

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 13

estimador± za/2 ×EEdelestimador

x = 25.97za /2 = Valor de la N(0,1) que deja a su derecha una probabilidad de α/2

El nivel de confianza es al 95% que equivale a 1-α = 0.95 por lo tanto α=0.05 luego α/2 = 0.025

Tema 7: Contrastes de hipótesis 13Bioestadística. U. Málaga. Zα/2

a/2

Page 14: Bioestadistica 7
Page 15: Bioestadistica 7

x ± za /2 ×s

n

EJEMPLO 1: El valor medio de IMC en varones de 25 a 60 años de una muestra “representativa” de 4707 españoles fue de 25,97 Kg/m2 y su desviación estándar fue 3,59 Kg/m2. Construir el IC al 95% de confianza para la media de IMC en España.

estimador± za/2 ×EEdelestimador

x = 25.97za /2 = 1.96

Tema 7: Contrastes de hipótesis

s=3.59n = 4707

IC(95%) = 25.97±1.96 ×3.59

4707= 25.97± (1.96 ×0.052) = 25.87-26.07

Page 16: Bioestadistica 7

x ± za /2 ×s

n

EJEMPLO 2:El valor medio de IMC en varones de 25 a 60 años de una muestra “representativa” de 4707 españoles fue de 25,97 Kg/m2 y su desviación estándar fue 3,59 Kg/m2. Construir el IC al 90% de confianza para la media de IMC en España.

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 16

estimador± za/2 ×EEdelestimador

x = 25.97za /2 = Valor de la N(0,1) que deja a su derecha una probabilidad de α/2

El nivel de confianza es al 90% que equivale a 1-α = 0.90 por lo tanto α=0.10 luego α/2 = 0.05

Tema 7: Contrastes de hipótesis 16Bioestadística. U. Málaga. Zα/2

a/2

Page 17: Bioestadistica 7
Page 18: Bioestadistica 7

x ± za /2 ×s

n

EJEMPLO 2:El valor medio de IMC en varones de 25 a 60 años de una muestra “representativa” de 4707 españoles fue de 25,97 Kg/m2 y su desviación estándar fue 3,59 Kg/m2. Construir el IC al 90% de confianza para la media de IMC en España.

estimador± za/2 ×EEdelestimador

x = 25.97za /2 = 1.645

Tema 7: Contrastes de hipótesis

s=3.59n = 4707

IC(90%) = 25.97±1.645×3.59

4707= 25.97± (1.645 ×0.052) = 25.88- 26.06

Page 19: Bioestadistica 7

x ± za /2 ×s

n

EJEMPLO 3:El valor medio de IMC en varones de 25 a 60 años de una muestra “representativa” de 4707 españoles fue de 25,97 Kg/m2 y su desviación estándar fue 3,59 Kg/m2. Construir el IC al 99% de confianza para la media de IMC en España.

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 19

estimador± za/2 ×EEdelestimador

x = 25.97za /2 = Valor de la N(0,1) que deja a su derecha una probabilidad de α/2

El nivel de confianza es al 99% que equivale a 1-α = 0.99 por lo tanto α=0.01 luego α/2 = 0.005

Tema 7: Contrastes de hipótesis 19Bioestadística. U. Málaga. Zα/2

a/2

Page 20: Bioestadistica 7
Page 21: Bioestadistica 7

x ± za /2 ×s

n

EJEMPLO 3:El valor medio de IMC en varones de 25 a 60 años de una muestra “representativa” de 4707 españoles fue de 25,97 Kg/m2 y su desviación estándar fue 3,59 Kg/m2. Construir el IC al 99% de confianza para la media de IMC en España.

estimador± za/2 ×EEdelestimador

x = 25.97za /2 = 2.55

Tema 7: Contrastes de hipótesis

s=3.59n = 4707

IC(90%) = 25.97± 2.55×3.59

4707= 25.97± (2.55×0.052) = 25.84-26.10

Page 22: Bioestadistica 7

IC(99%) = 25.84 – 26.10

IC(95%) = 25.87 – 26.07

IC(90%) = 25.88 – 26.06

A mayor nivel de confianza, más amplitud de intervalo

estimador± za/2 ×EEdelestimador

Tema 7: Contrastes de hipótesis

Page 23: Bioestadistica 7

AMPLITUD DEL INTERVALOLos intervalos deben ser “informativos”

n

szx 2/a Semi-

amplitud

Mayor nivel de confianza = más

amplio

Mayor dispersión = más amplio

Mayor muestra = menos amplioBioestadística. U. Málaga. Tema 7: Intervalos de Confianza 23

Page 24: Bioestadistica 7

INTERVALOS DE CONFIANZA

VAMOS A ESTUDIAR TRES CASOS ESPECIALMENTE IMPORTANTES:

IC para la media para muestras “grandes”

IC para la media con muestras no “grandes”

IC para una proporción

La forma general que tiene un IC al nivel de

confianza 1-α para un parámetro es:

estimador± za/2 ×EE_del_estimador

Page 25: Bioestadistica 7

adorEEdelestimzestimador 2/a

IC para la media para muestras “no grandes”

Si la muestra no es grande (n<120 yespecialmente si n<60), el IC para la media a unnivel de confianza 1-α se calcula usando ladistribución t de Student en vez de la N(0,1):

x ± ta /2,n-1 ×s

n

Media

muestralValor de la t de Student con n-1

grados de libertad que deja a su

derecha una prob. = α/2

Error estándar

de la media

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 25

Page 26: Bioestadistica 7

IC para la media para muestras “no grandes”

OBSERVACIÓN IMPORTANTE: Si la muestra esmuy pequeña (n<30) y no sabemos si los datossiguen una distribución normal, hay quecomprobar que los datos provienen de unadistribución normal. Si no siguen una distribuciónnormal hay que aumentar el tamaño de muestrapara poder llegar como mínimo a 30

estimador± za/2 ×EEdelestimador

Page 27: Bioestadistica 7

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 27

Page 28: Bioestadistica 7

EJEMPLO 1:En 31 pacientes con una enfermedad coronaria , la puntuación media de un una variable global que mide el estrés era de 24,3 puntos con una desviación tipica de 5 . Construir el IC al 95% de confianza para la media de estrés.

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 28

estimador± za/2 ×EEdelestimador

x = 24.3

Valor de la t de Student con 30 gl que deja a su derecha una probabilidad de α/2

El nivel de confianza es al 95% que equivale a 1-α = 0.95 por lo tanto α=0.05 luego α/2 = 0.025

Tema 7: Contrastes de hipótesis 28Bioestadística. U. Málaga. tα/2,n-1

a/2

x ± ta /2,n-1 ×s

n

ta /2,n-1 =

Page 29: Bioestadistica 7
Page 30: Bioestadistica 7

EJEMPLO 1:En 31 pacientes con una enfermedad coronaria , la puntuación media de un una variable global que mide el estrés era de 24,3 puntos con una desviación tipica de 5 . Construir el IC al 95% de confianza para la media de estrés.

estimador± za/2 ×EEdelestimador

x = 24.3

2.042

Tema 7: Contrastes de hipótesis

S=5n = 31

IC(95%) = 24.3±2.042 ×5

31= 24.3± (2.042 ×0.90) = 22.5-26.1

ta /2,n-1 =

x ± ta /2,n-1 ×s

n

Page 31: Bioestadistica 7

EJEMPLO 2:En 31 pacientes con una enfermedad coronaria , la puntuación media de un una variable global que mide el estrés era de 24,3 puntos con una desviación tipica de 5 . Construir el IC al 99% de confianza para la media de estrés.

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 31

estimador± za/2 ×EEdelestimador

x = 24.3

Valor de la t de Student con 30 gl que deja a su derecha una probabilidad de α/2

El nivel de confianza es al 99% que equivale a 1-α = 0.99 por lo tanto α=0.01 luego α/2 = 0.005

Tema 7: Contrastes de hipótesis 31Bioestadística. U. Málaga. tα/2,n-1

a/2

x ± ta /2,n-1 ×s

n

ta /2,n-1 =

Page 32: Bioestadistica 7
Page 33: Bioestadistica 7

EJEMPLO 2:En 31 pacientes con una enfermedad coronaria , la puntuación media de un una variable global que mide el estrés era de 24,3 puntos con una desviación tipica de 5 . Construir el IC al 99% de confianza para la media de estrés.

estimador± za/2 ×EEdelestimador

x = 24.3

2.75

Tema 7: Contrastes de hipótesis

S=5n = 31

IC(95%) = 24.3±2.75 ×5

31= 24.3± (2.75 ×0.90) = 21.8- 26.8

ta /2,n-1 =x ± ta /2,n-1 ×

s

n

Page 34: Bioestadistica 7

INTERVALOS DE CONFIANZA

VAMOS A ESTUDIAR TRES CASOS ESPECIALMENTE IMPORTANTES:

IC para la media para muestras “grandes”

IC para la media con muestras no “grandes”

IC para una proporción

La forma general que tiene un IC al nivel de

confianza 1-α para un parámetro es:

estimador± za/2 ×EE_del_estimador

Page 35: Bioestadistica 7

p± za /2 ×p·(1- p)

n

adorEEdelestimzestimador 2/a

IC para una proporción

Se debe cumplir que n·p > 5 y n·(1-p) > 5. Si no se cumple hay que usar técnicas exactas (no las vemos). El IC para una proporción a un nivel de confianza 1-α se calcula:

proporción

muestralValor de la N(0,1) que deja a

su derecha una prob. = α/2Error estándar

de la

proporción

Page 36: Bioestadistica 7

EJEMPLO1:Para estimar el porcentaje de fumadores en la uma seextrajo una muestra de 1000 personas de las cuales 200eran fumadoras. Construir el IC al 95% de confianza parala proporción de fumadores en la uma.

estimador± za/2 ×EEdelestimador

p =200

1000= 0.2

1- p = 0.8

n =1000

36

p± za /2 ×p·(1- p)

n

1.- Tenemos que comprobar que n·p >5 y n·(1-p) > 5

n·p =200 y n·(1-p) = 800 Luego se cumple con creces la condición.

Page 37: Bioestadistica 7

EJEMPLO1:Para estimar el porcentaje de fumadores en la uma seextrajo una muestra de 1000 personas de las cuales 200eran fumadoras. Construir el IC al 95% de confianza parala proporción de fumadores en la uma.

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 37

estimador± za/2 ×EEdelestimador

za /2 = Valor de la N(0,1) que deja a su derecha una probabilidad de α/2

El nivel de confianza es al 95% que equivale a 1-α = 0.95 por lo tanto α=0.05 luego α/2 = 0.025

Tema 7: Contrastes de hipótesis 37Bioestadística. U. Málaga. Zα/2

a/2

p± za /2 ×p·(1- p)

np =

200

1000= 0.2

1- p = 0.8

n =1000

Page 38: Bioestadistica 7
Page 39: Bioestadistica 7

EJEMPLO1:Para estimar el porcentaje de fumadores en la uma se extrajo una muestra de 1000 personas de las cuales 200 eran fumadoras. Construir el IC al 95% de confianza para la proporción de fumadores en la uma.

estimador± za/2 ×EEdelestimador

za /2 = 1.96

Tema 7: Contrastes de hipótesis

IC(95%) = 0.2±1.96 ×0.2·0.8

1000= 0.2± (1.96 ×0.0126) = 0.175- 0.225

p =200

1000= 0.2

1- p = 0.8

n =1000

p± za /2 ×p·(1- p)

n