Unidad 1 presentacion

33
1

description

fasd asdfasdf

Transcript of Unidad 1 presentacion

1

2

Unidad 1 Distribuciones Fundamentales para el Muestreo

1.1 Introducción a la estadística inferencial

1.2 Muestreo: Introducción al muestreo y tipos de muestreo

1.2.1 Muestreo aleatorio simple

1.2.2 Muestreo aleatorio sistemático

1.2.3 Muestreo aleatorio estratificado

1.2.4 Muestreo aleatorio por conglomerado

1.3 Teorema del límite central

Estadística Inferencial I

3

1.4.1 Distribución muestral de la media

1.4.2 Distribución muestral de la diferencia de medias

1.4.3 Distribución muestral de la proporción

1.4.4 Distribución muestral de la diferencia de proporciones

1.4.5 Distribución t-student.

1.4.6 Distribución muestral de la varianza

1.4.7 Distribución muestral de la relación

de varianzas

1.4 Distribuciones fundamentales para el muestreo

ESTADÍSTICA INFERENCIAL

Estadística inferencial es

obtener la información acerca

de una población, partiendo

de la información que contiene

una muestra. el proceso que

se sigue para seleccionar una

muestra se denomina

muestreo. 4

5

Población Muestra

Definición Colección de elementos considerados Parte o porción de la

población seleccionada

para su estudio

Características “Parámetros” “Estadísticos”

Símbolos Tamaño de la población = N Tamaño de la muestra = n

Media de la población = m

Desviación estándar de la población =

s

Desviación estándar de la

muestra = s

MÉTODO DE MUESTREO

Métodos no probabilísticos.- Interviene la opinión del

investigador para obtener cada elemento de la muestra.

Métodos probabilísticos.- Muestra que se selecciona de

modo que cada integrante de la población en estudio

tenga una probabilidad conocida( pero distinta de cero)

de ser incluido en la muestra.

MUESTREO ALEATORIO SIMPLE

MUESTREO ALEATORIO SISTEMÁTICO

MUESTREO ALEATORIO ESTRATIFICADO

MUESTREO ALEATORIO POR CONGLOMERADO

6

7

MUESTREO ALEATORIO SIMPLE se trata de un procedimiento de muestreo (sin

reemplazamiento), en el que se seleccionan n

unidades de las n en la población, de forma que

cualquier posible muestra del mismo tamaño tiene la

misma probabilidad de ser elegidas.

se realizan n selecciones independientes de forma

que en cada selección los individuos que no han sido

elegidos tengan la misma probabilidad de serlo.

el procedimiento habitual consiste en numerar todos

los elementos de la población y se seleccionan

muestras del tamaño deseado utilizando una tabla

de números aleatorios o un programa de ordenador

que proporcione números aleatorios.

ejemplo: un bingo, introduzco los números en una

ánfora y selecciono una muestra al azar.

8

MUESTREO ALEATORIO SISTEMÁTICO

Se ordenan los individuos de la población y se numeran.

- se divide la población en tantos grupos como individuos

se quieren tener en la muestra. se selecciona uno al azar

en el primer grupo y se elige el que ocupa el mismo lugar

en todos los grupos.

-la ventaja principal es que es más sencillo y más barato

que el muestreo aleatorio simple, además, se comporta

igual si no hay patrones o periodicidades en los datos.

-la aparición de patrones desconocidos puede llevar a

importantes errores en la estimación de los parámetros

Ejemplo: se desea establecer una muestra 100

empleados de los 3000 que tiene una empresa, para lo

cual ordeno alfabéticamente a los empleados, divido

3000/100 = 30 y selecciona a uno de cada treinta

empleados

9

MUESTREO POR CONGLOMERADOS

se divide la población en grupos de

acuerdo con su proximidad geográfica

o de otro tipo. (conglomerados).

cada grupo ha de ser heterogéneo y

tener representados todos las

características de la población.

por ejemplo, los conglomerados en un

estudio sobre la situación de las

mujeres en una determinada zona rural

pueden ser los municipios de la zona.

10

MUESTREO ESTRATIFICADO Se divide la población en grupos homogéneos (estratos) de acuerdo con las características a estudiar. Por ejemplo, en un estudio de las características socioeconómicas de una ciudad los estratos pueden ser los barrios de la misma, ya que los barrios suelen presentar características diferenciales. -Se selecciona una muestra aleatoria de cada estrato tratando de que todos los estratos de la población queden representados. -Permite utilizar información a priori sobre la estructura de la población en relación con las variables a estudiar. -Obtiene representantes de todos los estratos de la población. -Diferentes opciones de selección del tamaño de la muestra en los estratos: -El mismo número en cada estrato. -Proporcional. (La más común) -Optima.

11

1.3 Teorema del límite central

12

Teorema del límite central

La distribución de las medias de las muestras tiende a la normalidad independientemente de la forma de la distribución poblacional de la que sean obtenidas. Es la base de las cartas de control X-R.

13

Teorema del límite central

Por lo anterior la dispersión de las medias es menor que para los datos individuales

Para las medias muéstrales, el error estándar de la media se relaciona con la desviación estándar de la población como sigue:

X

Xs

n

s

Aplicación del teorema del límite central

14

15

Teorema del Límite Central La distribución de las medias de las muestras tienden a distribuirse en

forma normal

Por ejemplo los 300 datos (cuyo valor se encuentra entre 1 a 9) pueden estar distribuidos como sigue:

0

10

20

30

40

50

1 2 3 4 5 6 7 8 9

Frec.

Población con media m y desviación estándar s y cualquier distribución.

Seleccionando muestras de tamaño n y calculando la X-media o

promedio en cada una

X-media 1 X-media 2 X-media 3

Conforme el tamaño de muestra se incrementa las muestras se

distribuyen normalmente con media de medias m y desviación estándar

de las medias de las muestras s / n. También

se denomina Error estándar de la media.

Teorema del Límite Central

17

La distribución de las medias de las muestras tienden a distribuirse en forma normal

Tomando de muestras de 10 datos, calculando su promedio y graficando estos promedios se tiene:

0

2

4

6

8

10

3.5 4 4.5 5 5.5 6 6.5

Frec.

Teorema del Límite Central

18

1.4 Distribuciones fundamentales para el muestreo

Es la descripción de una característica particular de un fenómeno a partir de datos numéricos; por ejemplo la estatura de estudiantes, tamaño de plantas, tiempo de reacción de animales a cierto estimulo, edad de la población escolar, cantidad de piezas fabricadas por hora, etc..,.Las técnicas se utilizan en casi todos los aspectos de la vida; se diseñan encuestas para recabar la información previa al día de elecciones y así predecir el resultado de las mismas, se seleccionan al azar consumidores para obtener información con el fin de predecir la diferencia con respecto a ciertos productos etc. 19

1.4 Distribuciones fundamentales para el muestreo

Distribuciones muéstrales

1.4.1 Distribución muestral de la media

1.4.2 Distribución muestral de la diferencia de medias

1.4.3 Distribución muestral de la proporción

1.4.4 Distribución muestral de la diferencia de proporciones

1.4.5 Distribución t-student.

1.4.6 Distribución muestral de la varianza

1.4.7 Distribución muestral de la relación

de varianzas

20

distribución muestral de la media

21

22

se tienen dos poblaciones distintas, la primera con

media 1 y desviación estándar 1, y la segunda con

media 2 y desviación estándar 2. Más aún, se elige una

muestra aleatoria de tamaño n1 de la primera población y

una muestra independiente aleatoria de tamaño n2 de la

segunda población; se calcula la media muestral para

cada muestra y la diferencia entre dichas medias. La

colección de todas esas diferencias se

llama distribución muestral de las diferencias entre

medias o la distribución muestral del estadístico

Distribución Muestral de Diferencia de Medias

Distribución muestral de Proporciones

Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino que queremos investigar la proporción de artículos defectuosos o la proporción de personas con teléfono, etc en la muestra. La distribución muestral de proporciones es la adecuada para dar respuesta a estas situaci ones. Esta distribución se genera de igual manera que la distribución muestral de medias, a excepción de que al extraer las muestras de la población s e calcula el estadístico proporción (p=x/n en donde “ x” es el número de éxitos u observaciones de interés y “ n” el tamaño de la muestra) en lugar de la media de cada muestra que era lo que calculamos antes.

23

DISTRIBUCION DE LA DIFERENCIA DE PROPORCIONES

24

De dos poblaciones se toman dos muestras aleatorias independientes de tamaños n1 30 y n2 30, y en cada una de ellas se observa una característica o cualidad. La proporción muestral de elementos con una característica se define como:

25

26

En probabilidad y estadistica la

distribución-t o distribución t de

Student es una distribución de

probabilidad que surge del problema de

estimar la media de una población

normalmente distribuida cuando el

tamaño de la muestra es pequeña.

A la teoría de pequeñas muestras

también se le llama teoría exacta del

muestreo, ya que también la podemos

utilizar con muestras aleatorias de

tamaño grande.

27

Distribución t-student

Si es una muestra aleatoria de una

Población (X) con distribución normal .

Entonces se distribuye

t-student con n-1 grados de libertad. Se utiliza en vez de la distribución normal cuando sigma es desconocida (que la aproxima con n > 100)

nXXX ,...,, 21

),( 2smn

)/()( nsX m

1)/()( ntnsX m

28

),(

]12/][2/[

]2/)1[()(

2/)1(2

x

xkk

kxf

k

Función de Distribución t-student

K=1 K=10

K=100

29

Función de Distribución t-student

30

Distribución t de Student

La media y la varianza de la distribución t son:

De una muestra aleatoria de n artículos, la probabilidad de que

Caiga entre dos valores especificados es igual al área bajo la distribución de probabilidad t de Student con los valores correspondientes en el eje X, con n-1 grados de libertad

0m

3;2

kk

ks

3;2

kk

ks

ns

xt

/

m

31

Distribución t de Student

Ejemplo:

La resistencia de 15 sellos seleccionados aleatoriamente son: 480, 489, 491, 508, 501, 500, 486, 499, 479, 496, 499, 504, 501, 496, 498

¿Cuál es la probabilidad de que la resistencia promedio de los sellos sea mayor a 500?. La media es 495.13 y la desviación estándar es de 8.467.

t = -2.227 y el área es 0.0214

3;2

kk

ks

227.215/467.8

50013.495

t

El supuesto fundamental es que la población tiene distribución normal con media y varianza . De esta población se obtiene una muestra aleatoria de tamaño n.

La varianza de la muestra se define como:

32

Distribución de la varianza

Sea una población donde se observa la variable aleatoria X . Supongamos que X N ( µ, σ ) Independientes entre si Xi N ( ) µ , σ 1 2 XX X , ,..., n ¾Consideramos una muestra aleatoria simple, m.a.s., de tamaño n, formada por las v.a., , ,..., X1 X2 X n

33