Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de...

17
Inferencia Estadística Mg. Stella Figueroa Clase Nº10 1er C. 2019

Transcript of Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de...

Page 1: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

Inferencia Estadística

Mg. Stella Figueroa

Clase Nº10

1er C.2019

Page 2: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

Población: Es el conjunto de todos los elementos o unidadeselementales con características comunes. Cada característica a

estudiar es una variable observada en la población.

Muestra: Es un subconjunto de la población al que

tenemos acceso y sobre el que efectuamos las mediciones.

Población y Muestra- Parámetro y Estimación puntual

Parámetro : Es una característica numérica que describe una variable observada en

la población

Estimación puntual: Es una característica numérica que describe una variable

observada en la muestra

Page 3: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

Muestra aleatoria yMuestreo Aleatorio Simple (M.A.S.)

• En el M.A.S, cada elemento de la población

tiene la misma probabilidad de ser elegido

para formar parte de la muestra.

• El M.A.S, en poblaciones finita, se realiza

“con reemplazamiento”. Este

procedimiento garantiza la independencia de

las observaciones.

• Dada una población donde observamos la variable

aleatoria X, con características numéricas µ y σ2,

una Muestra aleatoria simple de tamaño n, es un

conjunto de n variables aleatorias X1, X2, X3,….Xn

que verifican:

• Ser Independientes entre sí

• Cada Xi tiene idénticas características numéricas

que X, es decir E(Xi)= µ y V(Xi)= σ2

Muestra aleatoria Muestreo Aleatorio Simple

(M.A.S.)

Page 4: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

Muestra

Estos valores numéricos son

estimaciones puntuales

¿Podemos asegurarnos que son buenas estimaciones?

El objetivo de

tomar una

muestra es

obtener

información sobre

los parámetros

no conocidos de

la población

Parámetros

desconocidos

𝑥 𝑠2 𝑝

Inferencia Estadística

Page 5: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

Distribución de frecuencias de las estimaciones de la media poblacional μ

Distribución de frecuencias de las estimaciones de la proporción

poblacional ρ

Estimaciones puntuales y Estadísticos muestrales (o Estimadores)

𝑥

Las estimaciones son

valores numéricos de

la variable media

muestral

Las estimaciones son valores

numéricos de la variable

proporción muestral

El Estadístico o Estimador de la media poblacional o de la proporción poblacional, es la variable

aleatoria media muestral o proporción muestral respectivamente. Su distribución de probabilidad se

conoce como distribución muestral del estadístico respectivo.

Page 6: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

1. Propiedad de insesgadura:

Un estimador 𝜃 es un estimador insesgado del parámetro θ, si E( 𝜃)= θ

Propiedades de los estimadores (o de los estadísticos muestrales)

Es decir, el valor esperado del estimador de un parámetro es ese parámetro

Ejemplos: la media y la varianza muestrales son estimadores insesgados de μ y

σ2 Respectivamente. Demostrarlo2. Propiedad de eficiencia:

Un estimador 𝜃1 es más eficiente que otro estimador 𝜃2

Si es insesgado de θ y la varianza de 𝜃1 es menor que la varianza de 𝜃2

Page 7: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

3. Propiedad de suficiencia:

Un estimador es suficiente si utiliza toda la información de la muestra.

Propiedades de los estimadores (o de los estadísticos muestrales)

La media muestral es un estimador suficiente de µ

4. Propiedad de consistencia:

Un estimador de un parámetro es consistente si converge en

probabilidad a ese parámetro cuando el número de datos de la

muestra es lo suficientemente grande.

La media muestral es un estimador consistente de μ ¿Por qué?

La frecuencia relativa o proporción muestral es un estimador

consistente de qué parámetro? ¿Por qué?

Page 8: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

1 2, ,...., nx x xSean variables aleatorias independientes y distribuidas en

forma normal estandarizada. Entonces la variable

aleatoria 2 2 2 2 2

1 2 3 ..... nx x x x

Tiene distribución Chi-Cuadrado con n grados de libertad.

La media y la varianza de esta distribución es

2 2n n

Es no negativa y asimétrica hacia la derecha.

Distribución de probabilidades del estadístico Chi-Cuadrado

Page 9: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

Distribución muestral del estadístico 𝑺𝟐

2

2

1 2

1n

n S

Si es la varianza de una muestra aleatoria de tamaño n tomada

de una población normal que tiene una varianza 2

Entonces el estadístico se distribuye como

gl=2

gl=3

gl=4gl=5

0 2 Chi2 6 8

2

2 1

1

n

i

i

x x

Sn

2

1n

La distribución muestral de s2 es

la distribución Chi-cuadrado con n-1 gr de

libertad.

Si se extraen todas las muestras posibles de una

población normal y a cada muestra se le calcula

su varianza, se obtendrá la distribución

muestral de varianzas con esta distribución.

Verificarlo!!!

Page 10: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

Uso de la tabla para la Distribución de Chi-Cuadrado

gl=2

gl=3

gl=4gl=5

0 2 Chi2 6 8

P(𝜒22 ≥ 𝜒0,05;2

2 ) =P(𝜒22 ≥ 5,99 ) = 0,05

Page 11: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

Una máquina de llenado opera con una varianza de 0.83 g2. Si se toma una

muestra de 15 unidades, ¿cuál es la probabilidad de tener una varianza

muestral superior a 1,249 g2?

2S

Problema

𝑃(𝑆2 ≥ 1,249) = P𝑛−1 x 𝑆2

𝜎2≥14 x 1,249

0,83=P 𝜒14

2 ≥14 x 1,249

0,83=

=P(𝜒142 ≥ 21,067) = 0,1

Page 12: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

Distribución de probabilidades del estadístico T (de Student)

Si Z~ 𝑁 0,1 y 𝑆2 ~𝜒𝑛−12 son v.a.independientes, entonces t=

𝑍

𝑆2⁄𝑛~𝑇𝑛−1

• Tiene forma de campana, pero su dispersión es mayor

que la curva normal estándar (más aplanada)

• Es simétrica respecto a x = 0, es decir 𝜇 = 0

• No se trata de una única curva. Cada curva está

caracterizada por los grados de libertad (n-1), donde n es

el tamaño de la muestra.

• Para n mayor que 30, la dispersión muestral se aproxima

a la dispersión de la población. Esto hace que la curva se

aproxime a la distribución normal

https://es.wikibooks.org/wiki/Tablas_estad%C3%ADsticas/D

istribuci%C3%B3n_t_de_Student#/media/File:Distribuci%C3%

B3n_T_01.svg

Page 13: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

Uso de la tabla para la Distribución T

0,05;10

0,95;10 0,05;10

1,812 0,05

1,812

P T t P T

t t

Page 14: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

Distribución de probabilidades del estadístico Fisher

Esta distribución

muestral se utiliza para

comparar varianzas

Si X1, X2, . . . , Xn y Y1, Y2 , Y3, . . . , Ym son dos conjuntos de variables aleatorias independientes, con

distribución N(0 , 1). Si 𝑆𝑥2 ~𝜒𝑛−1

2 𝑦 𝑆𝑦2 ~𝜒𝑚−1

2 son variables aleatorias independientes, la variable

aleatoria (cociente de dos v.a.s chi-cuadrado normalizadas), llamado estadístico F= 𝑺𝒙𝟐

𝑺𝒚𝟐 ~𝑭 (n-1, m-1)

Page 15: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

Distribución de Fisher

Ej: Si n1 =n-1 y

n2=m-1 son los

grados de

libertad de cada

muestra,

Para n1= 4

y n2 =6

P(F>4,53)= 0,05

P(F>9,15)=0,01

Page 16: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

Distribución de algunos estimadores o estadísticos muestrales

• De la media muestral con varianza poblacional conocida:

~~

• De la media muestral con varianza poblacional desconocida y n < 30:

• De la media muestral con varianza poblacional desconocida y n ≥30:

Page 17: Introducción a la Inferencia estadística - fi.mdp.edu.ar · 2 2 1 2 1 n nS Si es la varianza de una muestra aleatoria de tamaño n tomada de una población normal que tiene una

Problema

Se sabe que el diámetro de discos de metal de cierta marca, en mm, se

distribuye normalmente con una media de 50 mm y una dispersión de 5 mm.

Una muestra aleatoria de estos discos de tamaño 20, dio un promedio de sus

diámetros de 48 mm. ¿Es un valor posible, de acuerdo a la información dada?

Para saberlo, calcula la probabilidad de que la media muestral de los discos

alcance, al menos, 48 mm.