Variables aleatorias continuas, TCL yEsperanza Condicional
FaMAF
19 de marzo, 2013
1 / 37
Poisson P(λ)
Número de éxitos en una cantidad grande de ensayosindependientes
I Rango: {0,1,2, . . . } = {0} ∪ NI Función de masa:
P(X = k) = e−λλk
k !.
I Valor esperado:E [X ] = λ.
I Varianza:Var(X ) = λ.
I Fórmula recursiva:pk+1 =
λ
k + 1pk .
2 / 37
Poisson
0 5 10 150
0.1
0.2
0.3
0.4λ=1
0 5 10 150
0.05
0.1
0.15
0.2
0.25
0.3
0.35λ=2
0 5 10 150
0.05
0.1
0.15
0.2λ=5
0 5 10 150
0.05
0.1
0.15
0.2λ=7
0 5 10 150
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
3 / 37
Variables aleatorias continuas
DefiniciónUna variable aleatoria X se dice (absolutamente continua) si existef : R 7→ R con f ≥ 0, tal que
P(X ∈ C) =
∫C
f (x) dx .
Ejemplos:I Uniforme: X ∼ U(a,b)
I Normal: X ∼ N (µ, σ)
I Exponencial: X ∼ E(λ).I Otras: " distribuciones derivadas de la normal": χ2, t-Student.I Otras: Gamma, Beta, Weibull, Cauchy, Laplacian, etc.
4 / 37
Distribución uniforme
DefiniciónX se dice uniformemente distribuida en (a,b) si su función dedensidad está dada por
f (x) =1
b − aI(a,b)(x) =
{1
b−a a < x < b0 c.c.
I Función de distribución acumulada:
F (x) =
0 x ≤ ax−ab−a a < x < b1 x ≥ b
I E [X ] =a + b
2.
I Var(X ) =112
(b − a)2.
5 / 37
Gráficos
f (x) =12I(3,5)(x) F (x) =
0 x ≤ 3x−3
2 3 < x < 51 x ≥ 5
6 / 37
Distribución exponencial
DefiniciónUna v.a. X con función de densidad dada por
fλ(x) = λe−λx , x > 0,
para cierto λ > 0 se dice una v.a. exponencial con parámetro λ.
I E [X ] =1λ
I Var(X ) =1λ2
7 / 37
Función de densidad
0 5 10 15 20 250
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
8 / 37
Propiedades
I Una variable aleatoria con distribución exponencial tiene falta dememoria.
P(X > s + t | X > s) = P(X > t).
I Son las únicas v.a. continuas con falta de memoria.I El análogo en el caso discreto son las v.a. geométricas.I F (x) = 1− exp(−λx)
I Si X ∼ E(λ), entonces c X ∼ E( 1cλ).
9 / 37
Mínimo de exponenciales
Sean X1, X2, . . . , Xn son v.a. independientes con f.d.a. F1, F2, . . . ,Fn, y sea
M = min1≤i≤n
{X1,X2, . . . ,Xn} .
Entonces
1− FM(x) = P(M > x) = (1− F1(x)) · (1− F2(x)) · · · (1− Fn(x)).
Si Xi ∼ E(λi ), entonces
1− FX (x) = e−λ1x · e−λ2x . . . e−λnx = e−(∑
i λi ) x .
M ∼ E(λ1 + λ2 + · · ·+ λn).
10 / 37
Distribución Normal
DefiniciónLa v.a. X se dice normalmente distribuida con media µ y varianza σ2
si su función de densidad de probabilidad está dada por
f (x) =1√2πσ
e−(x−µ)2/2σ2
, x ∈ R.
I µ ∈ R, σ > 0.I Notación: X ∼ N(µ, σ).I Distribución normal estándar: Z ∼ N(0,1).
fZ (x) =1√2π
e−x2/2, x ∈ R.
11 / 37
Variando µ
I Máximo: x = µ
I Valor Máximo:1√2πσ
I1√2π' 0.398
I1√2π 2
' 0.2
12 / 37
Variando σ
13 / 37
La desviación estándar
I P(|X − µ| < σ) ' 68%
I P(|X − µ| < 2σ) ' 95%
I P(|X − µ| < 3σ) ' 99.7%
14 / 37
Distribución Normal estándar
Φ(x) = P(Z ≤ x) =1√2π
∫ x
−∞e−t2/2 dt .
I No existe una fórmula cerrada para Φ(x).I Si X ∼ N(µ, σ), entonces
aX + b ∼ N(aµ+ b, |a|σ).
IX − µσ
∼ Z = N(0,1).
I Si X ∼ N(µ, σ),
P(X ≤ x) = Φ
(X − µσ
).
15 / 37
La función Φ(x)
P(X ≤ 2) = P(Z ≤ 1) = Φ(1).
16 / 37
Valores de Φ(x)
I Para α ∈ (0,1), zα es el número real tal que
P(Z > zα) = α.
I Los valores de Φ(z) están tabulados:
Φ(zα) = P(Z ≤ α) = 1− α
I Φ(−z) = 1−Φ(z), por lo tanto es suficiente tabular para z ≥ 0, oz ≤ 0.
17 / 37
Tabla de Φ(z)
Z ∼ N(0,1)
P(Z ≤ 1.51) = 0.93448
z 0.00 0.01 0.02 0.030 0.5 0.50399 0.50398 0.51197...
1.5 0.93319 0.93448 0.93574 0.93699...
18 / 37
Valores usuales de zα
I α = 0.05I zα = 1.64
P(−1.64 ≤ Z ≤ 1.64) = 0.90
19 / 37
Valores usuales de zα
I α = 0.025I zα = 1.96
P(−1.96 ≤ Z ≤ 1.96) = 0.95
20 / 37
Valores frecuentes de zα
I α = 0.01I zα = 2.33
P(−2.33 ≤ Z ≤ 2.33) = 0.98
21 / 37
Desigualdad de Chebyshev
Lema (Desigualdad de Markov)Si X toma sólo valores no negativos y a > 0, entonces
P(X ≥ a) ≤ E [X ]
a.
Teorema (Desigualdad de Chebyshev)Si X es v.a. con media µ y varianza σ2, entonces para k > 0
P(|X − µ| ≥ kσ) ≤ 1k2 .
22 / 37
Leyes de los grandes números
Si X1, X2, . . . , Xn, . . . son v.a. independientes e idénticamentedistribuidas, con media µ:
I Ley débil de los grandes números:
P(∣∣∣∣X1 + X2 + · · ·+ Xn
n− µ
∣∣∣∣ > ε
)→ 0 n→∞.
I Ley fuerte de los grandes números:Con probabilidad 1 se cumple que:
limn→∞
X1 + X2 + · · ·+ Xn
n= µ.
23 / 37
LGN
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000−40
−20
0
20
40
60
80
100número de caras−número de cecas
N=cantidad de tiradas−1000 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7frecuencia relativa=proporción de caras
N=cantidad de tiradas
24 / 37
Teorema Central del límite
Teorema (Teorema Central del Límite)Sean X1, X2, . . . , variables aleatorias igualmente distribuidas, conmedia µ y varianza σ2. Entonces
limn→∞
P(
X1 + X2 + · · ·+ Xn − nµσ√
n< x
)= Φ(x).
25 / 37
Muestra finita
80 90 100 1100
1
2
3
4
551 intervalos
80 90 100 1100
1
2
3
4
5
6
725 intervalos
80 90 100 1100
2
4
6
8
10
1215 intervalos
80 90 100 1100
2
4
6
8
10
1210 intervalos
26 / 37
Teorema Central del límite
EjemploSupongamos que un programa suma números aproximando cadasumando al entero más próximo. Si todos los errores cometidos sonindependientes entre sí y están distribuidos uniformemente entre -0.5y 0.5 y se suman 1500 números, ¿A lo sumo cuántos númerospueden sumarse juntos para que la magnitud del error total semantenga menor que 10 con probabilidad 0.9?
27 / 37
resolución
Cada error cometido es una variable aleatoria εk con distribuciónU [−0.5,0.5]
E(εk ) = [0.5 + (−0.5)]/2 = 0 Var(εk ) = (0.5− (0.5))2/12 = 1/12
Definamos Sn =∑n
k=1 εk , si deseamos encontrar el n más grandepara el cual
0.9 = P(|Sn| < 10)
Usando el TCL [S1500 − nE(ε)]/√
nVar(ε) ∼ N(0,1) y
P(|Sn| < 10) = P
(−10− nE(ε)√
nVar(ε)≤ Sn − nE(ε)√
nVar(ε)≤ 10− nE(ε)√
nVar(ε)
)
= P
−10√n12
≤ Z ≤ 10√n12
= 1− 2P
Z ≤ −10√n12
28 / 37
resolución
por lo cual
0.9 = 1− 2P
Z ≤ −10√n12
=⇒ P
Z ≤ −10√n12
= 0.05
y −10√n12
= −1.65. Entonces, despejando resulta n = 102121.652 = 440.7.
29 / 37
Teorema Central del límite
EjemploSuponga que se tienen 100 lámparas de un cierto tipo, cuya duraciónpuede modelarse como una variable exponencial de parámetroλ = 0.002. Si la duración de cada lámpara es independiente de laduración de las otras, encuentre la probabilidad de que el promediomuestral T = (1/100)(T1 + · · ·+ T100) se encuentre entre 400 y 550horas.
30 / 37
ResoluciónComo n es 100, podemos suponerlo suficientemente grande yaproximar la distribución del promedio por una normal. Entonces laesperanza y varianza de Sn = T1 + · · ·+ Tn son
E(Sn) = E(T1 + · · ·+ T100) = 100.E(T1) =100
0.002= 50000
Var(Sn) = Var(T1 + · · ·+ T100) = 100.Var(T1) =100
0.0022
P(400 ≤ (1/100)T1+· · ·+T100 ≤ 550) = P(40000 ≤ T1+· · ·+T100 ≤ 55000)
∼ Φ(55000− E(Sn)/√
Var(Sn))− Φ(40000− E(Sn)/√
Var(Sn))
= Φ(55000− 50000/5000)− Φ(40000− 50000/5000)
= Φ(1)− Φ(−2) = 0.8413− 0.0228 = 0.8185
31 / 37
Distribución condicional
I X e Y discretas:
p(x , y) = pX |Y (x | y)pY (y)
pX |Y (x | y) = P(X = x | Y = y) =P(X = x ∩ Y = y)
P(Y = y)=
p(x , y)
pY (y).
P(X ≤ x | Y = y) =∑ai≤x
pX |Y (ai | y)
I X e Y conjuntamente continuas con densidad:
fX |Y (x | y) =f (x , y)
fY (y)=
fY |X (y | x)fX (x)
fY (y).
P(X ≤ x | Y = y) =
∫ x
−∞fX |Y (s | y) ds.
32 / 37
Esperanza condicional
I X e Y conjuntamente discretas se define a la esperanzacondicional de X dado Y = y como
E(X | Y = y) =∑
x
xpX |Y (x | y)
E(X | Y = y) =∑
x
xP(X = x | Y = y) =∑
x
xP(X = x ,Y = y)
P(Y = y)
I X e Y conjuntamente continuas con densidad:
E(X | Y = y) =
∫xfX |Y (x | y)dx =
∫xf (x , y)dx∫f (x , y)dx
33 / 37
Proposición
ProposiciónSea E(X | Y ) la variable aleatoria (función de la variable aleatoria Y )cuyo valor en Y = y es E(X | Y = y). Entonces
E(E(X | Y )) = E(X )
Para el caso X ,Y conjuntamente absolutamente continuo oconjuntamente discreto,
E(X ) =∑
y
E(X | Y = y)P(Y = y)
E(X ) =
∫E(X | Y = y)fY (y)dy
34 / 37
Esperanza condicional
EjemploUna rata está encerrada en el centro de un laberinto con tresposibles salidas a diferentes corredores, A, B, C que llevan al interiordel laberinto donde hay una celda con comida. La rata tiende a elegirla puerta de su derecha (A) la mitad de las veces, mientras que laotra mitad de las veces elige B o C sin distinguirlas. Ahora, si elige lapuerta A tarda 2 minutos en encontrar la celda de la comida, si eligela puerta B tarda 3 minutos, y si elige la puerta C da vueltas dentrodel laberinto por 5 minutos y vuelve al lugar de partida (pero no se dacuenta, es decir cuando elige la puerta del corredor lo hacenuevamente con las probabilidades de inicio). Encuentre laesperanza de T , el tiempo que tarda la rata en encontrar su comida.
35 / 37
Esperanza condicionalI Sea éxito elegir la salida A o B, y sea C̃ la variable aleatoria que
mide la cantidad de veces que se elige la salida C hasta por finelegir A o B. Entonces C̃ es geométrica de parámetro 3/4 (queva desde el cero!!).
I Sea T el tiempo que se tarda en encontrar la salida
T =
{2 + 5C̃ si se elige C̃ veces la puerta C y luego A3 + 5C̃ si se elige C̃ veces la puerta C y luego B
I Sea D la variable que es 1 si se eligió la puerta A y 0 si se eligióla puerta B. Entonces
E(T ) = E(E(T | D)) = E(T | D = 0)P(D = 0)+E(T | D = 1)P(D = 1)
= (2 + 5E(C̃))23
+ (3 + 5E(C̃))13
= 4
36 / 37
Varianza Condicional
DefiniciónX e Y variables aleatorias se define a la varianza condicional de Xdado el valor de Y como
Var(X | Y ) = E [(X − E [X | Y ])2 | Y ]
Esto es, Var(X | Y ) es una función de Y tal que en Y = y es lavarianza de X dado Y = y .
Proposición
Var(X ) = E [Var(X | Y )] + Var(E [X | Y ])
37 / 37
Top Related