Bioestadistica 7

Post on 10-Jul-2015

355 views 5 download

Transcript of Bioestadistica 7

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 1

Bioestadística

Tema 7: Intervalos de Confianza

Tema 7: Intervalos de

Confianza2 Bioestadística. U. Málaga.

Estimación• Un estimador es una cantidad numérica calculada sobre una

muestra y que esperamos que sea una buena aproximaciónde cierta cantidad con el mismo significado en la población (parámetro).

• En realidad ya hemos trabajado con estimadores cada vez que hacíamos una práctica con muestras extraídas de una población y suponíamos que las medias, etc… eran próximas de las de la población.

– Para la media de una población:• “El mejor” es la media de la muestra.

– Para la frecuencia relativa de una modalidad de una variable:• “El mejor” es la frecuencia relativa en la muestra.

• Habría que precisar que se entiende por “el mejor estimador”pero eso nos haría extendernos demasiado. Ver libro.

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 3

INTERVALOS DE CONFIANZA

MUESTRA

Estimación

puntual

POBLACIÓN

Queremos estimar

un parámetro:

media (μ) o

proporción (π)

Calculamos: media muestral o

proporción muestral (p)x

Inferimos el valor del

parámetro en la población:

INTERVALO DE CONFIANZA

para una media o

proporciónBioestadística. U. Málaga. Tema 7: Intervalos de Confianza 4

INTERVALOS DE CONFIANZA

MUESTRA

Estimación

puntual

POBLACIÓN¿Porcentaje de

fumadores en la

uma?.

N = 65.000

n = 200 participantes

Fuman 60 ; p = 0.30

x

INTERVALO DE CONFIANZA

AL 95% DE CONFIANZA:

I.C.(95%) : 0.24 – 0.37Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 5

Intervalo de confianza:

• Se denomina estimación confidencial o intervalo de confianza para un nivel de confianza 1-α dado, a un intervalo que ha sido construido de tal manera que con frecuencia 1-α realmente contiene al parámetro.

• Obsérvese que α es la frecuencia de que no contenga al parámetro

NIVEL DE CONFIANZA

POBLACIÓN

MUESTRA

1

IC1

MUESTRA

2

IC2

MUESTRA

3

IC3

… MUESTRA

100

IC100

Un nivel de confianza del 95% significa que si calculásemos 100

intervalos con 100 muestras distintas, 95 de ellos contendrían al

verdadero valor del parámetro

Normalmente:

95%

Ocasionalmente:

90% o 99%Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 7

Verdadero valor del parámetro

Intervalosde confianza de varias muestras (solo teórico)

Intervalo calculado

con LA UNICA

muestra obtenida

Conceptualmente:

Tema 7: Intervalos de

Confianza9 Bioestadística. U. Málaga.

Tema 7: Intervalos de Confianza 10Bioestadística. U. Málaga.

¿Es útil conocer la distribución de un estimador?• Es la clave para hacer inferencia. Ilustrémoslo con un ejemplo que

ya tratamos en el tema anterior (teorema del límite central).

– Si de una variable conocemos μ y σ, sabemos que para muestras

“grandes”, la media muestral es:

• aproximadamente normal,

• con la misma media y,

• desviación típica mucho menor (error típico/estándar)n

EE

INTERVALOS DE CONFIANZA

VAMOS A ESTUDIAR TRES CASOS ESPECIALMENTE IMPORTANTES:

IC para la media para muestras “grandes”

IC para la media con muestras no “grandes”

IC para una proporción

La forma general que tiene un IC al nivel de

confianza 1-α para un parámetro es:

estimador± za/2 ×EE_del_estimador

IC para la media para muestras “grandes”

Si la muestra es grande (n>120), el IC para lamedia a un nivel de confianza 1-α se calcula:

x ± za /2 ×s

n

Media

muestralValor de la N(0,1) que deja a

su derecha una prob. = α/2Error estándar

de la media

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 12

estimador± za/2 ×EEdelestimador

x ± za /2 ×s

n

EJEMPLO1:El valor medio de IMC en varones de 25 a 60 años de unamuestra “representativa” de 4707 españoles fue de 25,97Kg/m2 y su desviación estándar fue 3,59 Kg/m2. Construir elIC al 95% de confianza para la media de IMC en España.

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 13

estimador± za/2 ×EEdelestimador

x = 25.97za /2 = Valor de la N(0,1) que deja a su derecha una probabilidad de α/2

El nivel de confianza es al 95% que equivale a 1-α = 0.95 por lo tanto α=0.05 luego α/2 = 0.025

Tema 7: Contrastes de hipótesis 13Bioestadística. U. Málaga. Zα/2

a/2

x ± za /2 ×s

n

EJEMPLO 1: El valor medio de IMC en varones de 25 a 60 años de una muestra “representativa” de 4707 españoles fue de 25,97 Kg/m2 y su desviación estándar fue 3,59 Kg/m2. Construir el IC al 95% de confianza para la media de IMC en España.

estimador± za/2 ×EEdelestimador

x = 25.97za /2 = 1.96

Tema 7: Contrastes de hipótesis

s=3.59n = 4707

IC(95%) = 25.97±1.96 ×3.59

4707= 25.97± (1.96 ×0.052) = 25.87-26.07

x ± za /2 ×s

n

EJEMPLO 2:El valor medio de IMC en varones de 25 a 60 años de una muestra “representativa” de 4707 españoles fue de 25,97 Kg/m2 y su desviación estándar fue 3,59 Kg/m2. Construir el IC al 90% de confianza para la media de IMC en España.

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 16

estimador± za/2 ×EEdelestimador

x = 25.97za /2 = Valor de la N(0,1) que deja a su derecha una probabilidad de α/2

El nivel de confianza es al 90% que equivale a 1-α = 0.90 por lo tanto α=0.10 luego α/2 = 0.05

Tema 7: Contrastes de hipótesis 16Bioestadística. U. Málaga. Zα/2

a/2

x ± za /2 ×s

n

EJEMPLO 2:El valor medio de IMC en varones de 25 a 60 años de una muestra “representativa” de 4707 españoles fue de 25,97 Kg/m2 y su desviación estándar fue 3,59 Kg/m2. Construir el IC al 90% de confianza para la media de IMC en España.

estimador± za/2 ×EEdelestimador

x = 25.97za /2 = 1.645

Tema 7: Contrastes de hipótesis

s=3.59n = 4707

IC(90%) = 25.97±1.645×3.59

4707= 25.97± (1.645 ×0.052) = 25.88- 26.06

x ± za /2 ×s

n

EJEMPLO 3:El valor medio de IMC en varones de 25 a 60 años de una muestra “representativa” de 4707 españoles fue de 25,97 Kg/m2 y su desviación estándar fue 3,59 Kg/m2. Construir el IC al 99% de confianza para la media de IMC en España.

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 19

estimador± za/2 ×EEdelestimador

x = 25.97za /2 = Valor de la N(0,1) que deja a su derecha una probabilidad de α/2

El nivel de confianza es al 99% que equivale a 1-α = 0.99 por lo tanto α=0.01 luego α/2 = 0.005

Tema 7: Contrastes de hipótesis 19Bioestadística. U. Málaga. Zα/2

a/2

x ± za /2 ×s

n

EJEMPLO 3:El valor medio de IMC en varones de 25 a 60 años de una muestra “representativa” de 4707 españoles fue de 25,97 Kg/m2 y su desviación estándar fue 3,59 Kg/m2. Construir el IC al 99% de confianza para la media de IMC en España.

estimador± za/2 ×EEdelestimador

x = 25.97za /2 = 2.55

Tema 7: Contrastes de hipótesis

s=3.59n = 4707

IC(90%) = 25.97± 2.55×3.59

4707= 25.97± (2.55×0.052) = 25.84-26.10

IC(99%) = 25.84 – 26.10

IC(95%) = 25.87 – 26.07

IC(90%) = 25.88 – 26.06

A mayor nivel de confianza, más amplitud de intervalo

estimador± za/2 ×EEdelestimador

Tema 7: Contrastes de hipótesis

AMPLITUD DEL INTERVALOLos intervalos deben ser “informativos”

n

szx 2/a Semi-

amplitud

Mayor nivel de confianza = más

amplio

Mayor dispersión = más amplio

Mayor muestra = menos amplioBioestadística. U. Málaga. Tema 7: Intervalos de Confianza 23

INTERVALOS DE CONFIANZA

VAMOS A ESTUDIAR TRES CASOS ESPECIALMENTE IMPORTANTES:

IC para la media para muestras “grandes”

IC para la media con muestras no “grandes”

IC para una proporción

La forma general que tiene un IC al nivel de

confianza 1-α para un parámetro es:

estimador± za/2 ×EE_del_estimador

adorEEdelestimzestimador 2/a

IC para la media para muestras “no grandes”

Si la muestra no es grande (n<120 yespecialmente si n<60), el IC para la media a unnivel de confianza 1-α se calcula usando ladistribución t de Student en vez de la N(0,1):

x ± ta /2,n-1 ×s

n

Media

muestralValor de la t de Student con n-1

grados de libertad que deja a su

derecha una prob. = α/2

Error estándar

de la media

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 25

IC para la media para muestras “no grandes”

OBSERVACIÓN IMPORTANTE: Si la muestra esmuy pequeña (n<30) y no sabemos si los datossiguen una distribución normal, hay quecomprobar que los datos provienen de unadistribución normal. Si no siguen una distribuciónnormal hay que aumentar el tamaño de muestrapara poder llegar como mínimo a 30

estimador± za/2 ×EEdelestimador

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 27

EJEMPLO 1:En 31 pacientes con una enfermedad coronaria , la puntuación media de un una variable global que mide el estrés era de 24,3 puntos con una desviación tipica de 5 . Construir el IC al 95% de confianza para la media de estrés.

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 28

estimador± za/2 ×EEdelestimador

x = 24.3

Valor de la t de Student con 30 gl que deja a su derecha una probabilidad de α/2

El nivel de confianza es al 95% que equivale a 1-α = 0.95 por lo tanto α=0.05 luego α/2 = 0.025

Tema 7: Contrastes de hipótesis 28Bioestadística. U. Málaga. tα/2,n-1

a/2

x ± ta /2,n-1 ×s

n

ta /2,n-1 =

EJEMPLO 1:En 31 pacientes con una enfermedad coronaria , la puntuación media de un una variable global que mide el estrés era de 24,3 puntos con una desviación tipica de 5 . Construir el IC al 95% de confianza para la media de estrés.

estimador± za/2 ×EEdelestimador

x = 24.3

2.042

Tema 7: Contrastes de hipótesis

S=5n = 31

IC(95%) = 24.3±2.042 ×5

31= 24.3± (2.042 ×0.90) = 22.5-26.1

ta /2,n-1 =

x ± ta /2,n-1 ×s

n

EJEMPLO 2:En 31 pacientes con una enfermedad coronaria , la puntuación media de un una variable global que mide el estrés era de 24,3 puntos con una desviación tipica de 5 . Construir el IC al 99% de confianza para la media de estrés.

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 31

estimador± za/2 ×EEdelestimador

x = 24.3

Valor de la t de Student con 30 gl que deja a su derecha una probabilidad de α/2

El nivel de confianza es al 99% que equivale a 1-α = 0.99 por lo tanto α=0.01 luego α/2 = 0.005

Tema 7: Contrastes de hipótesis 31Bioestadística. U. Málaga. tα/2,n-1

a/2

x ± ta /2,n-1 ×s

n

ta /2,n-1 =

EJEMPLO 2:En 31 pacientes con una enfermedad coronaria , la puntuación media de un una variable global que mide el estrés era de 24,3 puntos con una desviación tipica de 5 . Construir el IC al 99% de confianza para la media de estrés.

estimador± za/2 ×EEdelestimador

x = 24.3

2.75

Tema 7: Contrastes de hipótesis

S=5n = 31

IC(95%) = 24.3±2.75 ×5

31= 24.3± (2.75 ×0.90) = 21.8- 26.8

ta /2,n-1 =x ± ta /2,n-1 ×

s

n

INTERVALOS DE CONFIANZA

VAMOS A ESTUDIAR TRES CASOS ESPECIALMENTE IMPORTANTES:

IC para la media para muestras “grandes”

IC para la media con muestras no “grandes”

IC para una proporción

La forma general que tiene un IC al nivel de

confianza 1-α para un parámetro es:

estimador± za/2 ×EE_del_estimador

p± za /2 ×p·(1- p)

n

adorEEdelestimzestimador 2/a

IC para una proporción

Se debe cumplir que n·p > 5 y n·(1-p) > 5. Si no se cumple hay que usar técnicas exactas (no las vemos). El IC para una proporción a un nivel de confianza 1-α se calcula:

proporción

muestralValor de la N(0,1) que deja a

su derecha una prob. = α/2Error estándar

de la

proporción

EJEMPLO1:Para estimar el porcentaje de fumadores en la uma seextrajo una muestra de 1000 personas de las cuales 200eran fumadoras. Construir el IC al 95% de confianza parala proporción de fumadores en la uma.

estimador± za/2 ×EEdelestimador

p =200

1000= 0.2

1- p = 0.8

n =1000

36

p± za /2 ×p·(1- p)

n

1.- Tenemos que comprobar que n·p >5 y n·(1-p) > 5

n·p =200 y n·(1-p) = 800 Luego se cumple con creces la condición.

EJEMPLO1:Para estimar el porcentaje de fumadores en la uma seextrajo una muestra de 1000 personas de las cuales 200eran fumadoras. Construir el IC al 95% de confianza parala proporción de fumadores en la uma.

Bioestadística. U. Málaga. Tema 7: Intervalos de Confianza 37

estimador± za/2 ×EEdelestimador

za /2 = Valor de la N(0,1) que deja a su derecha una probabilidad de α/2

El nivel de confianza es al 95% que equivale a 1-α = 0.95 por lo tanto α=0.05 luego α/2 = 0.025

Tema 7: Contrastes de hipótesis 37Bioestadística. U. Málaga. Zα/2

a/2

p± za /2 ×p·(1- p)

np =

200

1000= 0.2

1- p = 0.8

n =1000

EJEMPLO1:Para estimar el porcentaje de fumadores en la uma se extrajo una muestra de 1000 personas de las cuales 200 eran fumadoras. Construir el IC al 95% de confianza para la proporción de fumadores en la uma.

estimador± za/2 ×EEdelestimador

za /2 = 1.96

Tema 7: Contrastes de hipótesis

IC(95%) = 0.2±1.96 ×0.2·0.8

1000= 0.2± (1.96 ×0.0126) = 0.175- 0.225

p =200

1000= 0.2

1- p = 0.8

n =1000

p± za /2 ×p·(1- p)

n