Universidad Técnica de Babahoyo INTRODUCCIÓN A...

27
Universidad Técnica de Babahoyo INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA Ateneo Ruperto P. Bonet Chaple UTB-Julio 2016

Transcript of Universidad Técnica de Babahoyo INTRODUCCIÓN A...

Universidad Técnica de Babahoyo

INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA

Ateneo Ruperto P. Bonet Chaple

UTB-Julio 2016

OBJETIVO

Aplicar las técnicas de Muestreo e Inferencia Estadística

• Determinar el tamaño y la calidad de una muestra

• Estimar proporciones

• Estimar medias

• Estimar varianzas

ESTADÍSTICA INFERENCIAL

Al hacer estadística inferencial debemos enfrentarnos con

dos problemas:

Elección de la Muestra (Muestreo)

Extrapolación de los Resultados al resto de la Población

(Inferencia)

Estimación

Un estimador es una cantidad numérica calculada sobre una muestra y que esperamos que sea una buena aproximación de cierta cantidad con el mismo significado en la población (parámetro). • Estimación Puntual: Obtener un pronóstico numérico único sobre

un parámetro de la distribución.

• Estimación por Intervalos de Confianza: Obtener un margen de variación para un parámetro de la distribución.

𝜽 Población, parámetro

• Proporción P

• Media μ

• Varianza σ2

𝜽 Muestra, estimador

• Proporción p

• Media 𝑋

• Varianza 𝑆2

𝑶𝒃𝒋𝒆𝒕𝒊𝒗𝒐: 𝒎𝒊𝒏 𝜽 − 𝜽

Estimación Puntual

Características deseables: • Consistencia: Cuando el tamaño de la muestra crece

arbitrariamente, el valor estimado se aproxima al parámetro desconocido.

• Carencia de sesgo: El valor medio que se obtiene de la estimación para diferentes muestras debe ser el valor del parámetro.

• Eficiencia: Al estimador, al ser v.a., no puede exigírsele que para

una muestra cualquiera se obtenga como estimación el valor exacto del parámetro. Sin embargo podemos pedirle que su dispersión con respecto al valor central (varianza) sea tan pequeña como sea posible.

• Suficiencia: El estimador debería aprovechar toda la información

existente en la muestra.

Estimación Puntual. Principales Estimadores

Esperanza Matemática:

Estimación Puntual. Principales Estimadores

Varianza:

Estimación por Intervalos de Confianza

Se denomina estimación confidencial o intervalo de confianza para un nivel de confianza 1-α dado, a un intervalo que ha sido construido de tal manera que con frecuencia 1-α realmente contiene al parámetro.

– Obsérvese que la probabilidad de error (no contener al parámetro) es α.

– En el siguiente tema se llamará prob. de error de tipo I o nivel de significación.

– Valores típicos: α=0,10 ; 0,05 ; 0,01

– En general el tamaño del intervalo disminuye con el tamaño muestral y aumenta con 1-α.

– En todo intervalo de confianza hay una noticia buena y otra mala: – La buena: hemos usado una técnica que en % alto de casos acierta.

– La mala: no sabemos si ha acertado en nuestro caso.

Estimación por Intervalos de Confianza

Intervalos de Confianza para la Distribución Normal • Intervalo de Confianza para la Media con Varianza Conocida: No es un

caso práctico ya que es imposible conocer σ2 sin conocer previamente μ. • Intervalo de Confianza para la Media (caso general): Caso con verdadero

interés práctico. Nos permite estimar el intervalo de confianza para μ a partir de los resultados de la muestra.

• Intervalo de Confianza para la Varianza: Otro caso con interés práctico.

Nos permite estimar el intervalo de confianza para σ2 a partir de los resultados de la muestra.

• Intervalo de Confianza para una Proporción: Otro caso de interés práctico. Permite establecer el intervalo de confianza para la proporción a partir de las frecuencias relativas de las observaciones

• Estimación del Tamaño Muestral: Permite decidir el tamaño muestral para

obtener intervalos de confianza para la media y para proporciones con una precisión y significación establecida de antemano.

Intervalo de Confianza para μ con σ2 conocida

Intervalo de Confianza para μ con σ2 conocida

Intervalo de Confianza para μ con σ2 conocida

Se sabe que el peso de los recién nacidos sigue una distribución normal con una desviación típica de 0,75 kg. Si en una muestra aleatoria simple de 100 de ellos se obtiene una media muestral de 3,00 kg y una desviación típica de 0,50 kg. Calcular un intervalo de confianza para la media poblacional que presente una confianza del 95%.

El intervalo de confianza del 95% se calcula teniendo en cuenta que Z se aproxima a la distribución N(0,1). Dicha distribución presenta un 95% de probabilidad de ocurrir entre sus cuantiles Z0,025 = -1,96 y Z0,975 = 1,96.

Intervalo de Confianza para μ con σ2 conocida

Es decir, con una confianza del 95% tenemos que μ = 3 ± 0,147 kg.

Intervalo de Confianza para μ (caso general)

Intervalo de Confianza para μ (caso general)

Se sabe que el peso de los recién nacidos sigue una distribución normal. Si en una muestra aleatoria simple de 100 de ellos se obtiene una media muestral de 3,00 kg y una desviación típica de 0,50 kg. Calcular un intervalo de confianza para la media poblacional que presente una confianza del 95%.

El intervalo de confianza del 95% se calcula teniendo en cuenta que T se aproxima a la distribución tn-1. Dicha distribución presenta un 95% de probabilidad de ocurrir entre sus cuantiles Tn-1;0,025 = -1,98 y Tn-1;0,975 = 1,98.

Intervalo de Confianza para μ (caso general)

Es decir, con una confianza del 95% tenemos que μ = 3 ± 0,1 kg.

Intervalo de Confianza para σ2

Intervalo de Confianza para σ2

Se estudia la altura de los individuos de una ciudad, obteniéndose en una muestra de tamaño 25 los siguientes resultados:

Calcular un intervalo de confianza con α = 0,05 para la varianza σ2 de la altura de los individuos de la ciudad.

𝑆 = 10 ⇒ 𝑆 = 𝑆𝑛

𝑛 − 1= 10

25

24= 10,206

Intervalo de Confianza para σ2

Resumen de Intervalos de Confianza

Intervalos para una Proporción

Intervalos para una Proporción

Se desea estimar el resultado de un referéndum mediante un sondeo.

Para ello se realiza un muestreo aleatorio simple con n = 100

personas y se obtiene que el 35 % votará a favor y el 65 % votará en

contra (suponemos que no hay indecisos para simplificar el problema

a una variable dicotómica). Calcule un intervalo de confianza para el

verdadero resultado de las elecciones con un nivel de significación del

5%.

Solución:

Dada una persona cualquiera, el resultado de su voto es una variable

dicotómica:

𝑿𝒊 ⇝ 𝑩𝒆𝒓 𝒑

Intervalos para una Proporción

El parámetro a estimar en un intervalo de confianza al 95% (α=0,05)

es p.

𝒑 = 𝒑 ± 𝒁𝟏−𝜶 𝟐

𝒑 𝒒

𝒏

𝒑 =𝟑𝟓

𝟏𝟎𝟎= 𝟎, 𝟑𝟓 → 𝒒 = 𝟏 − 𝒑 = 𝟎, 𝟔𝟓

𝒑 = 𝟎, 𝟑𝟓 ± 𝟏, 𝟗𝟔𝟎, 𝟑𝟓 ∗ 𝟎, 𝟔𝟓

𝟏𝟎𝟎

𝒑 = 𝟎, 𝟑𝟓 ± 𝟎, 𝟎𝟗𝟑𝟓

Estimación del Tamaño Muestral

Antes de realizar un estudio de inferencia estadística sobre una variable, lo primero es decidir el número de elementos, n, a elegir en la muestra aleatoria. Para ello consideraremos que el estudio se basará en una variable de distribución normal, y nos interesa obtener para un nivel de significación α dado, una precisión (error) d. Si n es suficientemente grande, la distribución t de Student se aproxima a la distribución normal. Luego, una manera de obtener la precisión buscada consiste en elegir n con los siguientes criterios:

Estimación del Tamaño Muestral

Calcular, para el ejemplo de la altura de los individuos, el tamaño de debería tener una muestra para que se obtuviese un intervalo de confianza para la media poblacional con un nivel de significación α = 0,01 (al 99%) y una precisión d = 1 cm.

¿Qué hemos visto?

Introducción a la Inferencia

Estimación

• Estimación Puntual

• Estimación confidencial

• Intervalo de Confianza para la Media

• Intervalo de Confianza para la Varianza

• Intervalo de Confianza para Proporciones

• Cálculo del Tamaño de Muestras

EJERCICIOS

1-Con un nivel de confianza del 95%, estimar la media poblacional a partir de 15 observaciones muestrales en las que se calculó : media = 8'5 ; varianza = 3 . Con los mismos resultados muestrales, estime el valor de la desviación típica de la población con un margen de error del 1%. 2-Por experiencias anteriores se sabe que las estaturas de los soldados tienen una varianza de 64 cm. a) Con un margen de error del 6%, estime la estatura media partiendo de un grupo de 100 soldados, tomados al azar, sabiendo que proporcionó un promedio de 164 cm. b) Manteniendo el mismo intervalo de confianza calculadso anteriormente, qué tamaño muestral debe fijarse para que el margen de error pase a ser α = 0'02 ?. 3-Para analizar la eficacia de la aplicación de un tratamiento , se someten al mismo a 64 pacientes. Finalizado el período de aplicación se observó que remitió la enfermedad en 50 casos. Con un nivel de confianza del 92%, estime el porcentaje de efectividad del tratamiento objeto de estudio

4-Un estudio sobre la proporción de fumadores

estableció que entre el personal de un Hospital sólo

fumaban entre el

20% y el 35%.

a) ¿ Cuál fue el porcentaje muestral observado ?.

b) Si se realizó el estudio partiendo de una muestra de

40 individuos, ¿ con qué margen de error se trabajó ?.

c) Si el análisis se efectuó con un nivel de confianza del

95%, ¿ cuántos individuos integraron la muestra

seleccionada ?.

5-En una muestra de 13 elementos, obtenidos

aleatoriamente de una población normal e infinita,

sabemos que los

límites del intervalo confidencial de estimación de la

media poblacional, con un nivel de riesgo del 5% son,

respectivamente, 1’28 y 18’72. Calcule :

a) la media de la muestra

b) la desviación típica insesgada de la muestra