Distribuciones continuas
-
Upload
nelly-bardales-echeverria -
Category
Documents
-
view
20 -
download
0
description
Transcript of Distribuciones continuas
Distribución Normal
Describe el comportamiento de variables continuas que tienen altas frecuencias en los valores centrales y bajas frecuencias en los extremosEsta distribución describe una gran cantidad de fenómenos en distintos campos
Distribución Normal
El valor del promedio se ubica en el centro de la distribución
Presenta condiciones de simetría Las medidas de posición son coincidentes El 95% del área bajo la curva se encuentra a dos
desviaciones estándar El 68% del bajo la curva se encuentra a una desviación
estándar
Se caracteriza unívocamente por 2 parámetros:
=media de la variable aleatoria.
=desviación de la variable aleatoria.
Distribución Normal
Distribución Normal
La función de densidad de probabilidad Normal de esta distribución está dada por:
),(~
2
1)(
2)(
2
1
NX
xexfx
Distribución Normal
La función de probabilidad acumulativa es entonces:
Los valores de esta función se han tabulado para el caso particular en que µ=0 y σ=1 (distribución normal estandar, con notación F(z)).
dtexFxXPx t
2
)(2
1
2
1)()(
Distribución Normal
La distribución normal queda definida por la media y la variancia…
En consecuencia, existe infinito número de distribuciones normales
Necesidad de estandarizar
Distribución Normal y Estandarización
Recordar: La distribución normal es una familia de distribuciones caracterizada por dos parámetros: la media y la desviación estandar.
Distribución Normal Estándar y Estandarización.
Distribución Normal con media 0 y desviación 1.
)1,0(~
),(|~
NX
Z
NX
Distribución Normal y Estandarización
(x-μ)/σ
z
0
z
x-μ
0
0
z
x
μ
Ejemplo de Estudio: Uso de la tabla, z=-1,02
Z 0 -0,01 -0,02 -0,03 -0,04 -0,05 -0,06 -0,07 -0,08 -0,09
-1 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
Z 0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
-1,02
P(z ≤ -1.02)= F(-1.02)=0.1539
P(z<-1,02)=0,1539
P(z ≥ -1.02)= 1-F(-1.02)= 1 - 0.1539 = 0.8461
P(z<1,13)=0,8708
EjemploP(-1,02<Z<1,13)= P(z<1.13)-P(z<-1.02)
Ejemplo de Estudio: P(-1,02<Z<1,13)= P(z<1.13)-P(z<-1.02)
P(-1,02<Z<1,13)=0,8708 - 0,1539 = 0,7169
Distribución T-Student
Similar a la Distribución Normal
Su utilidad es: Cuando la varianza es desconocida y la
muestra menor de 30 Muestra menor de 30 (normal o
aproximadamente normal) con varianza conocida
Distribución T-Student
El parámetro que la identifica son los grados de libertad
Existen tabulaciones de los valores de la distribución bajo niveles de confianza (significancia) y grados de libertad determinados
Distribución t de Student
-Es simétrica y unimodal, con media en 0
-Es una familia de curvas, en función de los llamados “grados de libertad”. Es decir, hay una distribución t de Student con 1 gl, una distribución t de Student con 2 gl, etc.
-A medida que aumentan los grados de libertad, la distribución tiende más y más a una distribución normal estandarizada.
(Empleo: pruebas de contraste de 2 medias, entre otros)
Si la población no es normal o no se conoce s2, pero el tamaño de la muestra n es mayor o igual que 30 (n 30), se usa la misma fórmula (en el caso de no conocer s2, se usa s2 en la fórmula), debido al Teorema del Límite Central.
Inferencia para muestras pequeñas
Si la población es normal, no se conoce s2, y el tamaño de la muestra es menor que 30 (n < 30), se usa una fórmula equivalente pero con la t-Student en lugar de la normal estándar:
n/t
s
X
Y el intervalo de confianza será:
n
stx
lg .. ,2
Grados de libertad
Es el número de valores que podemos elegir libre-mente en una muestra, y que nos permiten encontrarel valor de un parámetro.
Tenemos n-1 grados de libertad, si n es eltamaño de la muestra.
Una muestra de 23 datos nos daría 22grados de libertad.
Ejemplo
En la planta de Necaxa de la CLFC, el administrador,desea estimar la cantidad de carbón que requiereeste año. Toma una muestra de la demanda durante10 semanas. El promedio de carbón por semana es de 11,400 toneladas con una desviación estándar de700 toneladas.Desea estar 95% seguro de que el consumo mediose encuentre dentro de dicho intervalo.
Solución
n = 10 semanas gl = 9 s = 700
400,11x
En tabla t(5%,9) = 2.262
n
sEE .. 38.221
10
700.. EE
Cuando la población es infinita y se distribuye como una normal y n < 30, el intervalo se determina con:
)/(.., nstx lg
11,400 + 2.262 (221.38) = 11,901 límite superior
11,400 - 2.262 (221.38) = 10,899 límite inferior
Distribución Chi Cuadrada
Es un caso particular de la familia de distribuciones gama
Su utilidad es: Pruebas de asociación entre variables Pruebas de bondad de ajuste (esperado vs
observado)
Distribución Chi Cuadrado
El parámetro que la identifica son los grados de libertad “n”, esto determina la media y la varianza
n
nXE
2
)(2
Existen tabulaciones de las valores de la distribución bajo niveles de confianza (significancia) y grados de libertad determinados
LA DISTRIBUCIÓN JI-CUADRADA
Sean X1, X2,…, Xn observaciones de una muestra de tamaño n de unapoblación normal N (,2). Entonces la distribución muestral del estadístico es:
Donde S2 es la varianza muestral y σ2 es la varianza poblacional
Es de tipo Ji-cuadrada con n-1 grados de libertad
0 c2a/2,n-1 c2
1-a/2,n-1 X
a/2 a/2
2
22 )1(
Sn
En la tabla se puede observar que para un gl = 2 el valor de χt
2 es 9.21
gl .05 .01
1 3.84 6.63
2 5.99 9.21
3 7.81 11.34
4 9.49 13.28
5 11.07
15.09
6 12.59
16.81
Distribución chi-cuadrada (χ2)
-Nunca adopta valores menores de 0
-Es asimétrica positiva
-Es en realidad una familia de curvas, en función de los llamados “grados de libertad”. Es decir, hay una distribución chi-cuadrada con 1 gl, una distribución chi-cuadrada con 2 gl, etc. (Nota: Los grados de libertad son siempre números positivos.)
-A medida que aumentan los grados de libertad, la distribución se hace más y más simétrica.
INTERVALO PARA LA VARIANZA DE UNA DISTRIBUCIÓN NORMAL
UMSNH - FIE
De acuerdo a la figura, P(c21-a/2,N-1 X c2
a/2,N-1) = 1-a
Por lo tanto, el intervalo de confianza del 100(1-a)% buscado para la varianza es
0 c2a/2,N-1 c2
1-a/2,N-1 X
a/2 a/22
22 )1(
Sn
2/12
22
2/2
2 )1()1(
SnSn
EjemploEjemplo 7.9 (adaptado). Los siguientes datos representan las edades que tenian al momento de morir
por enfermedad de una muestra de 20 personas de un pueblo:
80 90 85 82 75 58 70 84 87 81 87 61 73 84 85 70 78 95 77 52
Hallar un intervalo de confianza del 95 % para la varianza poblacional de la edad de muerte.
Solución:
En este caso n = 20 y = .05. Luego el intervalo de confianza del 95 % para
2 será de la forma:
,
19(
2
975.
2
s
)19
2
025.
2
s
Así χ20.975=8.9065 y similarmente χ2
0.025 = 32.8523. Luego, el intervalo de confianza del 95 % para la varianza poblacional será (70.6253, 260.507).
Tema 5: Modelos probabilísticos 28Bioestadística. U. Málaga.
Distribución F de Snedecor Tiene dos parámetros
denominados grados de libertad.
Sólo toma valores positivos. Es
asimétrica.
Comparando la varianza de dos poblaciones
21
Antes de comparar la media de dos grupos hay que comparar su variabilidad. Supongamos que se tienen dos poblaciones normales con varianzas desconocidas y 2
2Si de la primera población se toma una muestra de tamaño n1 que tiene una varianza muestral y de la segunda población se toma una muestra, independiente de la primera, de tamaño n2 que tiene una varianza muestral
21s
22s
Se puede mostrar que la razón
22
22
21
21
s
s
se distribuye como una F con n1-1 grados de libertad en el numerador y n2-1 en el denominador.
Caso I Caso II Caso III
Ho : Ho : Ho :
Ha : Ha : Ha :
22
21 2
221 2
221
22
21 2
221
22
21
Prueba Estadística:
22
21
s
sF
con m-1 g.l. en el numerador y n-1 g.l en el denominador
Decisión:
Si Fcal<F entonces se rechaza Ho
Si Fcal<F/2 o Fcal >F1-/2 se rechaza Ho
Si Fcal>F1- entonces se rechaza Ho
Intervalo de confianza para la razón de varianzas
)2/(1
22
21
22
12
2/
22
21 //
F
SSF
SS