Distribuciones continuas

Post on 12-Jan-2016

20 views 0 download

description

ejemplos

Transcript of Distribuciones continuas

Distribución Normal

Describe el comportamiento de variables continuas que tienen altas frecuencias en los valores centrales y bajas frecuencias en los extremosEsta distribución describe una gran cantidad de fenómenos en distintos campos

Distribución Normal

El valor del promedio se ubica en el centro de la distribución

Presenta condiciones de simetría Las medidas de posición son coincidentes El 95% del área bajo la curva se encuentra a dos

desviaciones estándar El 68% del bajo la curva se encuentra a una desviación

estándar

Se caracteriza unívocamente por 2 parámetros:

=media de la variable aleatoria.

=desviación de la variable aleatoria.

Distribución Normal

Distribución Normal

La función de densidad de probabilidad Normal de esta distribución está dada por:

),(~

2

1)(

2)(

2

1

NX

xexfx

Distribución Normal

La función de probabilidad acumulativa es entonces:

Los valores de esta función se han tabulado para el caso particular en que µ=0 y σ=1 (distribución normal estandar, con notación F(z)).

dtexFxXPx t

2

)(2

1

2

1)()(

Distribución Normal

La distribución normal queda definida por la media y la variancia…

En consecuencia, existe infinito número de distribuciones normales

Necesidad de estandarizar

Distribución Normal y Estandarización

Recordar: La distribución normal es una familia de distribuciones caracterizada por dos parámetros: la media y la desviación estandar.

Distribución Normal Estándar y Estandarización.

Distribución Normal con media 0 y desviación 1.

)1,0(~

),(|~

NX

Z

NX

Distribución Normal y Estandarización

(x-μ)/σ

z

0

z

x-μ

0

0

z

x

μ

Ejemplo de Estudio: Uso de la tabla, z=-1,02

Z 0 -0,01 -0,02 -0,03 -0,04 -0,05 -0,06 -0,07 -0,08 -0,09

-1 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379

-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611

-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867

-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148

-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451

-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776

-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121

-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483

-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859

-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247

0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359

Z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359

0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753

0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141

0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517

0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879

0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224

0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549

0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852

0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133

0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389

1 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621

1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830

-1,02

P(z ≤ -1.02)= F(-1.02)=0.1539

P(z<-1,02)=0,1539

P(z ≥ -1.02)= 1-F(-1.02)= 1 - 0.1539 = 0.8461

P(z<1,13)=0,8708

EjemploP(-1,02<Z<1,13)= P(z<1.13)-P(z<-1.02)

Ejemplo de Estudio: P(-1,02<Z<1,13)= P(z<1.13)-P(z<-1.02)

P(-1,02<Z<1,13)=0,8708 - 0,1539 = 0,7169

Distribución T-Student

Similar a la Distribución Normal

Su utilidad es: Cuando la varianza es desconocida y la

muestra menor de 30 Muestra menor de 30 (normal o

aproximadamente normal) con varianza conocida

Distribución T-Student

El parámetro que la identifica son los grados de libertad

Existen tabulaciones de los valores de la distribución bajo niveles de confianza (significancia) y grados de libertad determinados

Distribución t de Student

-Es simétrica y unimodal, con media en 0

-Es una familia de curvas, en función de los llamados “grados de libertad”. Es decir, hay una distribución t de Student con 1 gl, una distribución t de Student con 2 gl, etc.

-A medida que aumentan los grados de libertad, la distribución tiende más y más a una distribución normal estandarizada.

(Empleo: pruebas de contraste de 2 medias, entre otros)

Si la población no es normal o no se conoce s2, pero el tamaño de la muestra n es mayor o igual que 30 (n 30), se usa la misma fórmula (en el caso de no conocer s2, se usa s2 en la fórmula), debido al Teorema del Límite Central.

Inferencia para muestras pequeñas

Si la población es normal, no se conoce s2, y el tamaño de la muestra es menor que 30 (n < 30), se usa una fórmula equivalente pero con la t-Student en lugar de la normal estándar:

n/t

s

X

Y el intervalo de confianza será:

n

stx

lg .. ,2

Grados de libertad

Es el número de valores que podemos elegir libre-mente en una muestra, y que nos permiten encontrarel valor de un parámetro.

Tenemos n-1 grados de libertad, si n es eltamaño de la muestra.

Una muestra de 23 datos nos daría 22grados de libertad.

Ejemplo

En la planta de Necaxa de la CLFC, el administrador,desea estimar la cantidad de carbón que requiereeste año. Toma una muestra de la demanda durante10 semanas. El promedio de carbón por semana es de 11,400 toneladas con una desviación estándar de700 toneladas.Desea estar 95% seguro de que el consumo mediose encuentre dentro de dicho intervalo.

Solución

n = 10 semanas gl = 9 s = 700

400,11x

En tabla t(5%,9) = 2.262

n

sEE .. 38.221

10

700.. EE

Cuando la población es infinita y se distribuye como una normal y n < 30, el intervalo se determina con:

)/(.., nstx lg

11,400 + 2.262 (221.38) = 11,901 límite superior

11,400 - 2.262 (221.38) = 10,899 límite inferior

Distribución Chi Cuadrada

Es un caso particular de la familia de distribuciones gama

Su utilidad es: Pruebas de asociación entre variables Pruebas de bondad de ajuste (esperado vs

observado)

Distribución Chi Cuadrado

El parámetro que la identifica son los grados de libertad “n”, esto determina la media y la varianza

n

nXE

2

)(2

Existen tabulaciones de las valores de la distribución bajo niveles de confianza (significancia) y grados de libertad determinados

LA DISTRIBUCIÓN JI-CUADRADA

Sean X1, X2,…, Xn observaciones de una muestra de tamaño n de unapoblación normal N (,2). Entonces la distribución muestral del estadístico es:

Donde S2 es la varianza muestral y σ2 es la varianza poblacional

Es de tipo Ji-cuadrada con n-1 grados de libertad

0 c2a/2,n-1 c2

1-a/2,n-1 X

a/2 a/2

2

22 )1(

Sn

En la tabla se puede observar que para un gl = 2 el valor de χt

2 es 9.21

 

gl .05 .01

1 3.84 6.63

2 5.99 9.21

3 7.81 11.34

4 9.49 13.28

5 11.07

15.09

6 12.59

16.81

Distribución chi-cuadrada (χ2)

-Nunca adopta valores menores de 0

-Es asimétrica positiva

-Es en realidad una familia de curvas, en función de los llamados “grados de libertad”. Es decir, hay una distribución chi-cuadrada con 1 gl, una distribución chi-cuadrada con 2 gl, etc. (Nota: Los grados de libertad son siempre números positivos.)

-A medida que aumentan los grados de libertad, la distribución se hace más y más simétrica.

INTERVALO PARA LA VARIANZA DE UNA DISTRIBUCIÓN NORMAL

UMSNH - FIE

De acuerdo a la figura, P(c21-a/2,N-1 X c2

a/2,N-1) = 1-a

Por lo tanto, el intervalo de confianza del 100(1-a)% buscado para la varianza es

0 c2a/2,N-1 c2

1-a/2,N-1 X

a/2 a/22

22 )1(

Sn

2/12

22

2/2

2 )1()1(

SnSn

EjemploEjemplo 7.9 (adaptado). Los siguientes datos representan las edades que tenian al momento de morir

por enfermedad de una muestra de 20 personas de un pueblo:

80 90 85 82 75 58 70 84 87 81 87 61 73 84 85 70 78 95 77 52

Hallar un intervalo de confianza del 95 % para la varianza poblacional de la edad de muerte.

Solución:

En este caso n = 20 y = .05. Luego el intervalo de confianza del 95 % para

2 será de la forma:

,

19(

2

975.

2

s

)19

2

025.

2

s

Así χ20.975=8.9065 y similarmente χ2

0.025 = 32.8523. Luego, el intervalo de confianza del 95 % para la varianza poblacional será (70.6253, 260.507).

Tema 5: Modelos probabilísticos 28Bioestadística. U. Málaga.

Distribución F de Snedecor Tiene dos parámetros

denominados grados de libertad.

Sólo toma valores positivos. Es

asimétrica.

Comparando la varianza de dos poblaciones

21

Antes de comparar la media de dos grupos hay que comparar su variabilidad. Supongamos que se tienen dos poblaciones normales con varianzas desconocidas y 2

2Si de la primera población se toma una muestra de tamaño n1 que tiene una varianza muestral y de la segunda población se toma una muestra, independiente de la primera, de tamaño n2 que tiene una varianza muestral

21s

22s

Se puede mostrar que la razón

22

22

21

21

s

s

se distribuye como una F con n1-1 grados de libertad en el numerador y n2-1 en el denominador.

Caso I Caso II Caso III

Ho : Ho : Ho :

Ha : Ha : Ha :

22

21 2

221 2

221

22

21 2

221

22

21

Prueba Estadística:

22

21

s

sF

con m-1 g.l. en el numerador y n-1 g.l en el denominador

Decisión:

Si Fcal<F entonces se rechaza Ho

Si Fcal<F/2 o Fcal >F1-/2 se rechaza Ho

Si Fcal>F1- entonces se rechaza Ho

Intervalo de confianza para la razón de varianzas

)2/(1

22

21

22

12

2/

22

21 //

F

SSF

SS