Estad5.pdf
Transcript of Estad5.pdf
-
Probabilidad y Estadstica
M.A. Vctor Damin Pinilla Morn.
Noviembre 2009
72
Variables aleatorias conjuntas
M. en A. Vctor D. Pinilla Morn Facultad de Ingeniera, UNAM
Resumen
Variables aleatorias conjuntas discretas; funcin de probabilidad conjunta: su definicin y propiedades. Funcin de distribucin acumulativa: su definicin y propiedades. Funciones marginales de probabilidad. Funciones condicionales de probabilidad.
Variables aleatorias conjuntas continuas; funcin de probabilidad
conjunta: su definicin y propiedades. Funcin de distribucin acumulativa: su definicin y propiedades. Funciones marginales de probabilidad. Funciones condicionales de probabilidad.
Valor esperado de una funcin de dos o ms variables.
La curva de regresin.
Variables aleatorias independientes. Covarianza, varianza de una
suma de dos o ms variables. 5.1 Variables aleatorias conjuntas discretas y continuas: Funcin de probabilidad conjunta, su definicin y propiedades. Funciones marginales de probabilidad. Funciones condicionales de probabilidad. El estudio realizado hasta este momento est restringido a espacios muestrales de una sola dimensin en los que se registran resultados de un experimento como valores asumidos por una nica variable aleatoria. Sin embargo habr situaciones donde sea preferible registrar los resultados simultneos de varias variables aleatorias.
Para el caso particular de dos variables aleatorias, stas se denominan variables aleatorias conjuntas. Definicin. Si X y Y son dos variables aleatorias, la distribucin de probabilidad de sus ocurrencias simultneas puede representarse por una funcin F(x,y) para cualquier par de valores (x,y) dentro del rango de las variables aleatorias; a esto se le denomina distribucin de probabilidad conjunta.
-
Probabilidad y Estadstica
M.A. Vctor Damin Pinilla Morn.
Noviembre 2009
73
Propiedades caso continuo.
( )[ ] yxA xyyxxy
xy
ddYXFAYXPc
ddYXFb
YXYXFa
=
),(,)
),()
, 0),()
Propiedades caso discreto.
( )[ ]
=
====
A
x y xy
xy
YXPAYXP
yxPyYxXPc
YXPb
YXPa
),(, A plano elen regin cualquier para
),(),()
1),()
0),()
Probabilidades marginales. Se les llama marginales cuando a partir de una funcin conjunta se margina a una de las variables aleatorias. Es el equivalente a la probabilidad total de las funciones de una sola variable.
Probabilidad condicional. Por otra parte, si se desea encontrar la probabilidad de que la variable aleatoria continua X est entre a y b cuando se sabe que la variable aleatoria Y=y se obtiene:
( )=========
>=======
=
)(),(
)(),()/(
)(),(
)(),()/(
)()()/(
yhYXf
yYPyYxXPyYxXP
xgYXf
xXPyYxXPxXyYP
APABPABP
-
Probabilidad y Estadstica
M.A. Vctor Damin Pinilla Morn.
Noviembre 2009
74
Para el ejercicio anterior determinar las probabilidades marginales de X y Y.
283),2()2(
2815
2869),1()1(
2810
28163),0()0(
),(),()(
0
0
1
0
2
0
2
0
=
=
=
=
===
=+===
=++===
==
yxy
yxy
yxy
y yxyxy
yiPxg
yiPxg
yiPxg
yxPyxPxg
Equivale a sumar horizontalmente en la tabla.
=
=
=
===
=+===
=++===
=
0
0
1
0
2
0
281)2,()2(
2812
2866)1,()1(
2815
28393)0,()0(
),()(
Xxy
xxy
xxy
xxy
xiPyh
xiPyh
xiPyh
yxPyh
Equivale a sumar verticalmente en la tabla
Ejercicio. Dada la funcin:
+
casosotrosy
xyx
yxFxy0
10
105
)32(2
),(
a) Determinar si se trata de una distribucin de probabilidad conjunta.
11010
1064
106
52
23
52
232
52
232
52
5)32(2
1
0
21
0
1
00
0
2
==+=+
=
+=
+
=
+=+
xxdxx
dxyxydydxyx
b) Encuentre la probabilidad ( )[ ]AyxP ,
16013
1609
401
329
452
329
21
52
323
21
83
52
232
52)32(
52
21
0
2
21
0
21
0
21
41
21
0
221
0
21
41
=+=
+
=
+=
+
=
+=+
xx
dxxdxxx
yxydydxYX
c) Obtener la probabilidad marginal para la variable x.
( )
1053
54)(
106
54
232
52
232
5232
52)(
1
0
1
0
2
+=
+=
+
=
+=+=
xxxg
xx
yxydyyxxg
d) Obtener la probabilidad marginal de la variable y.
( ) ( )
1056
52)(
56
52
35232
52)(
1
0
1
0
2
+=
+=
=
+=+=
yyyh
y
yxxdxyxyh
x y(x) 0 10/28 1 15/28 2 3/28
y h(y) 0 15/28 1 12/28 2 1/28
-
Probabilidad y Estadstica
M.A. Vctor Damin Pinilla Morn.
Noviembre 2009
75
Ejemplo. Continuando con el ejemplo de los repuestos: e) Determinar la distribucin condicional de X dado que Y=1 y utilcela para determinar
)10( == YXP
0
2812
)1,2(
21
2812286
2812
)1,1(
21
126
2812286
2812
)1,0(
2812
)1,()1(
)1,()1()1,(
)1(
=
==
===
=====
xy
xy
xy
xyxyxy
P
P
P
XPhXP
YhXP
YXP
X P(X/Y=1) 0 1 2 0
Ejemplo. Suponga que la fraccin X de atletas hombres y la fraccin Y de atletas mujeres que terminan la carrera del maratn puede describirse por la funcin de densidad conjunta.
casosotros
xyxyxy
Fxy
0
018
Encuentre las probabilidades marginales F(XIY), F(YIX) y determine la probabilidad
de que menos de un octavo de las mujeres que se inscribieron para un maratn en particular lo finalicen si se sabe que exactamente un medio de los atletas hombres lo terminaron.
====
==
-
Probabilidad y Estadstica
M.A. Vctor Damin Pinilla Morn.
Noviembre 2009
76
Independencia Estadstica. Si F (x/y) no depende de y entonces:
Definicin: Sean X y Y dos variables aleatorias discretas o continuas con distribucin de probabilidad conjunta Fxy(x/y) y distribuciones marginales g(x) y h(y) respectivamente se dice que las variables aleatorias son independientes estadsticamente si se cumple que: ( ) ( ) ( )yhXgYXf =, Generalizando. Sean X1, X2, X3,... Xn, variables aleatorias discretas o continuas con distribucin de probabilidad conjunta ( )nXXXXf ...,, 321 y con sus respectivas funciones marginales ( ) ( ) ( ) ( )nn XfXfXfXf ...21 . Si las variables aleatorias son mutuamente independientes se cumple que: ( ) ( ) ( ) ( ) ( )nnn XfXfXfXfXXXXf ......,, 21321 = Ejemplo. Retomando el ejemplo de los repuestos:
=++==
=++====
=
=
146
145
143
146)1,1()1,1()1,0()1,()1(
145)2,0()1,0()0,0(),0()0(
)1()0()1,0(143)1,0(
1
0
2
0
i
i
FFFxFh
FFFyFg
hgF
F
Los eventos no son estadsticamente independientes. 5.3 Valor esperado de una funcin de dos o ms variables aleatorias. Valor esperado condicional. Valores esperados y momentos para las funciones bivariadas. Sean X y Y dos variables aleatorias conjuntas, el valor esperado de la funcin se define como:
( )( ) }{( )( )
( )( )
=
dydxyxfyx
yxPyx
YXEYX
x yYX
YX
),(
),(
Generalmente:
-
Probabilidad y Estadstica
M.A. Vctor Damin Pinilla Morn.
Noviembre 2009
77
En forma de funciones:
==
dydxyxfyxg
yxPyxg
yxgEyxx y
),(),(
),(),(
)},({),(
Para el caso r = s = 1, el momento alrededor de la media:
( )( ) }{( )( )
( )( )
=
dydxyxfyx
yxPyx
YXEYX
x yYX
YX
),(
),(
Recibe el nombre de covarianza. Una forma alterna para calcular la covarianza es: ( )( ){ }
{ }{ } { } { }{ }{ }{ } { } { }YEXEXYEXYEXYE
YEXEXYEYXXYE
YXEYXCov
XY
YXYXXY
YXXY
YXXY
YX
==
+=+=
+==
},{
Si la covarianza de X y Y se divide por el producto de las desviaciones estndar de X y Y, el resultado es una cantidad adimensional que recibe el nombre de coeficiente de correlacin.
: coeficiente de correlacin { }
YX
YXCov
,=
Se puede demostrar que el coeficiente de correlacin toma valores entre menos uno y uno; esto significa que el coeficiente de correlacin es slo una medida estandarizada de la asociacin lineal que existe entre las variables aleatorias X y Y en relacin con sus dispersiones. El valor de =0 indica la ausencia de cualquier asociacin lineal, mientras que los valores =-1 y =1 indican relaciones lineales perfectas, negativa y positivamente. Es necesario sealar que debe rechazarse cualquier otra interpretacin del trmino correlacin.
Interpretacin de la covarianza. Tomando dos fenmenos aleatorios: La primera variable aleatoria es el corto, que es la cantidad de dinero que BANXICO retira del circulante para evitar que la inflacin se dispare. En consecuencia, la segunda variable aleatoria es la inflacin.
-
Probabilidad y Estadstica
M.A. Vctor Damin Pinilla Morn.
Noviembre 2009
78
En esta grfica observamos que el corto y la inflacin crecen en la misma direccin. Si calculramos el coeficiente de correlacin, ste tendra signo positivo. En esta grfica aparece una tercera variable aleatoria, el precio del dlar. Se observa que conforme el corto aumenta, se retira dinero circulante y el precio del dlar baja. En este caso, el coeficiente de correlacin entre el corto y el dlar tendr signo negativo.
En suma, cuando las variables cambian en la misma direccin (positiva-positiva o negativa-negativa), el coeficiente de correlacin es de signo positivo. Por el contrario, cuando las variables cambian en direcciones diferentes (positiva-negativa o negativa-positiva), el coeficiente ser de signo negativo. Por otra parte, si: { }
YX
YXCov
,= La nica posibilidad para que 0= es que la covarianza lo sea. Esto implica que, cuando la covarianza es cero, las variables aleatorias son estadsticamente independientes. Esto implica que, conforme
1 , las variables tienen una relacin ms estrecha. Varianza de una suma de dos variables aleatorias.
donde a y b son constantes
Si X y Y son estadsticamente independientes.
Por definicin:
-
Probabilidad y Estadstica
M.A. Vctor Damin Pinilla Morn.
Noviembre 2009
79
Anlisis de regresin. El motivo de estudio de este tipo de anlisis son las asociaciones cuantitativas entre un nmero de variables, en lo particular en la manera de que sea posible ajustar una ecuacin de algn tipo al conjunto de datos dado, con el propsito de obtener una ecuacin emprica de prediccin razonablemente precisa y que proporcione un modelo terico que no est disponible. Las tcnicas de regresin proporcionan medios legtimos a travs de los cuales pueden establecerse asociaciones entre las variables de inters en las cuales la relacin usual no es casual. De manera bsica, la regresin tiene dos significados: uno surge de la distribucin conjunta de probabilidad de dos variables aleatorias; el otro es emprico y nace de la necesidad de ajustar alguna funcin a un conjunto de datos.
Como ejemplo del primer significado, se desea predecir el salario de un profesionista dado el nmero de aos que han transcurrido desde su graduacin. Sea X el nmero de aos y Y el salario anual. Resulta obvio que para un valor dado de x es imposible predecir, de manera exacta, el salario anual de una persona en particular. Sin embargo, es posible predecir el salario promedio de todos aquellos individuos para
los que el nmero de aos x que han transcurrido es el mismo. En otras palabras, para cada valor de x existe una distribucin de ingresos anuales y lo que se busca es la media de esa distribucin, dado x. La grfica de la media condicional { }xYE como una funcin de x recibe el nombre de curva de regresin de Y sobre X. De tal forma, si ( )yxf , es la funcin de densidad conjunta de probabilidades de X y Y, y si ( )xyf es la funcin de densidad condicional de Y dado x, se define la curva de regresin como
( ) ( )
= dyxyfyxYE Ejemplo. Considrese la funcin de densidad conjunta de probabilidad dada por:
( )
-
Probabilidad y Estadstica
M.A. Vctor Damin Pinilla Morn.
Noviembre 2009
80
La curva de regresin ser:
( )2
11
11 xdyx
xYEx
+== K
Corresponde a una lnea recta con pendiente
e interseccin igual a 21
.
El segundo significado de la regresin resulta ms prctico. En l no se tienen los elementos necesarios para determinar la curva de regresin como en el ejemplo anterior. No obstante, dado un conjunto de datos, pude asumirse una forma funcional para la curva de regresin y entonces tratar de ajustar sta a los datos. En estas situaciones, la variable respuesta es una variable aleatoria cuyos valores se observan mediante la seleccin de los valores de las variables de prediccin en un intervalo de inters. Por lo tanto, las variables de prediccin no se consideran como variables aleatorias, sino que stas son un conjunto de valores fijos que representan los puntos de observacin para la variable respuesta. El modelo de regresin propuesto debe ser relativamente sencillo y deber contener pocos parmetros. Un procedimiento muy til para la seleccin inicial cuando se tiene slo una variable de prediccin es graficar la variable respuesta contra la variable de prediccin. Si esta grfica revela una tendencia lineal, deber suponerse un modelo de regresin lineal. Si es evidente alguna curvatura, deber suponerse un modelo cuadrtico o de mayor grado para ajustarse a los datos.
Bibliografa
Canavos, Probabilidad y Estadstica, Edit. Mc Graw Hill, Mxico 1988.
Borras, et. al. Apuntes de Probabilidad
y Estadstica, Facultad de Ingeniera UNAM, Mxico 1985.
Villarreal , Probabilidad y Modelos
Probabilsticos, UAEM, Mxico 1989.
Hines, Montgomery; Probabilidad y Estadstica, Edit. CECSA, 3 edicin, Mxico 1993.
Captura y Edicin: M.A. Mara Torres Hernndez.