01 - Repaso de Probabilidad y Estad-stica Semana 1
-
Upload
dario-torres -
Category
Documents
-
view
71 -
download
7
description
Transcript of 01 - Repaso de Probabilidad y Estad-stica Semana 1
Formato Lectura
LECTURA 1: Repaso de Probabilidad y Estadística
En esta primera parte del curso y a manera de introducción se espera
que el estudiante realice un repaso, con el cual se pueda crear una
visión general de los aspectos básicos de probabilidad,
específicamente en los temas relacionados con variables aleatorias y
distribuciones de probabilidad, las cuales serán base fundamental para
la construcción del conocimiento de modelos estocásticos. De igual
manera se espera que el estudiante por medio de la siguiente lectura
tenga claras las diferencias entre un espacio muestral discreto con sus
respectivas distribuciones y un espacio muestral continuo con sus
respectivas distribuciones.
VARIABLE ALEATORIA Y DISTRIBUCIONES DE PROBABILIDAD
Diferentes ciencias y disciplinas han querido hacer inferencias acerca
de comportamientos en la población y el mundo en general. En el caso
de los inventarios, es importante estar en capacidad de hacer
inferencias del comportamiento de la demanda. Para tener noción de
ese comportamiento, debemos conocer básicamente dos cosas: el
conjunto de valores que puede tomar la demanda y la probabilidad
asociada a cada uno de esos valores. A dicho conjunto de valores se le
conoce como el espacio muestral. De esta manera, se va a definir una
variable aleatoria como la función que asocia un número real
(probabilidad) con cada uno de los valores del espacio muestral.
Un ejemplo de definición de una variable aleatoria (“X”) relacionada
con la demanda sería:
X: Número de unidades a vender en el mes de enero.
La siguiente tabla representa la distribución de probabilidades según el
espacio muestral.
Tabla 1: distribución de probabilidades según el espacio muestral
Espacio Muestral Probabilidad
100 35%
80 55%
60 10% Fuente: elaboración propia
Para definir de manera más fácil las variables aleatorias, se crearon
distribuciones de probabilidad, las cuales pueden describir el
comportamiento de una serie de valores determinados de forma clara y
resumida. Estos permiten calcular de manera más eficiente las
probabilidades asociadas a los diferentes valores y para fines de esta
lectura, se explicarán las tres distribuciones de probabilidad más usadas
en el campo de la administración de inventarios.
Antes de proceder con los tipos de distribuciones se debe aclarar la
diferencia fundamental entre un espacio muestral discreto, un espacio
muestral continuo y el respectivo comportamiento de las variables
aleatorias. Un espacio muestral discreto es aquel que contiene un
número finito de posibilidades o una serie interminable con tantos
elementos como números enteros existen, de acuerdo a lo anterior si en
la distribución se puede contar el conjunto de resultados posibles se le
conoce como variable aleatoria discreta. Un espacio muestral continuo
es aquel que contiene un número infinito de posibilidades igual al
número de puntos en un segmento de línea, es decir que cuando una
variable aleatoria puede tomar valores en una escala continua se le
conoce como variable aleatoria continua, en pocas palabras las
variables aleatorias continuas representan datos medidos, como lo
pueden ser todos los posibles pesos, temperaturas, distancias, etc.,
mientras que las variables aleatorias discretas representan datos
contados, como lo son el número de artículos defectuosos en una
muestra de n artículos, la cantidad de accidentes de autopista en cierto
estado, etc.
Con esta breve explicación, veremos a continuación los diferentes tipos
de distribuciones más utilizadas.
DISTRIBUCIONES DISCRETAS
Distribución Binomial
Está distribución se caracteriza por manejar los conocidos experimentos
de Bernoulli, en donde cada experimento de Bernoulli debe tener las
siguientes propiedades:
El experimento consiste en N pruebas que se repiten.
Cada prueba produce un resultado que se puede clasificar como
éxito o fracaso.
La probabilidad de éxito, que se denota con la letra p,
permanece constante en cada prueba.
Las pruebas que se repiten son independientes.
Entonces, si se hacen N experimentos independientes cuyo resultado en
cada ensayo puede ser únicamente Éxito (con probabilidad p) o
Fracaso (con probabilidad q = 1‐ p), a la Variable Aleatoria X: número
de éxitos en los N ensayos, se le conoce como la Variable Aleatoria
Binomial y su Función de Probabilidad es conocida como la Distribución
Binomial de parámetros N, p:
𝒈𝑿𝑩
= (𝒌; 𝑵, 𝒑) = 𝑷(𝑿𝑩 = 𝒌)
𝒈𝑿𝑩= (𝒌; 𝑵, 𝒑) = (
𝑵𝒌
) (𝒑)𝒌(𝟏 − 𝒑)𝑵−𝒌 , 𝒌 = 𝟏, 𝟐, … , 𝑵
𝑬(𝑿𝑩; 𝑵, 𝒑) = 𝑵𝒑
𝑽𝒂𝒓(𝑿𝑩; 𝑵, 𝒑) = 𝑵𝒑𝒒
Ejemplo:
La probabilidad de que cierta clase de componente sobreviva a una
prueba de choque dada es de ¾. Encuentre la probabilidad de que
sobrevivan exactamente dos de los siguientes cuatro componentes que
se prueben.
Lo primero que debemos suponer es que las pruebas son
independientes y como 𝑝 = 3 4⁄ para cada una de las cuatro
pruebas obtenemos:
𝑉𝑎𝑟 (2; 4; 3 4⁄ ) = (4
2) (
3
4)
2
(1 −3
4)
4−2
= 4!
2! 2!∗
32
44=
27
128= 𝟎. 𝟐𝟏𝟎𝟗
La probabilidad de que sobrevivan exactamente dos de los
siguientes cuatro componentes que se prueben es del 21%.
En algunos casos, nos interesaremos por solucionar problemas donde
conocer 𝑃(𝑋 < 𝑟) o 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) sea necesario. Para solucionar este tipo
de problemas disponemos de las sumas binomiales:
𝑩(𝒓; 𝒏, 𝒑) = ∑ 𝒃(𝒙; 𝒏, 𝒑)
𝒓
𝒙=𝟎
Las cuales pueden ser consultadas en tablas para solucionar los
problemas o con la herramienta de Excel, la cual directamente calcula
la probabilidad introduciendo previamente los datos pertinentes y el
tipo de distribución. Las tablas mencionadas anteriormente pueden ser
consultadas en el libro “Probabilidad y estadística para ingenieros-
Ronald Walpole – 6 Ed.” en la tabla A.1 del apéndice.
Ejemplo:
La probabilidad de que un paciente se recupere de una rara
enfermedad sanguínea es del 0.4 si se sabe que 15 personas contraen
esta enfermedad, ¿cuál es la probabilidad de que (a) sobrevivan al
menos 10, (b) sobrevivan de 3 a 8 y (c) sobrevivan exactamente 5?
X= Número de personas que sobreviven
(a) 𝑃(𝑋 ≥ 10) = 1 − 𝑃(𝑋 < 10) = 1 − ∑ 𝑏(𝑥; 15, 0.4) = 1 − 0.96629𝑥=0
= 𝟎. 𝟎𝟑𝟑𝟖
(b) 𝑃(3 ≤ 𝑋 ≤ 8) = ∑ 𝑏(𝑥; 15,0.4)8𝑥=3
∑ 𝑏(𝑥; 15,0.4)
8
𝑥=0
− ∑ 𝑏(𝑥; 15,0.4)
2
𝑥=0
= 0.9050 − 0.0271 = 𝟎. 𝟖𝟕𝟕𝟗
(c) 𝑃(𝑋 = 5) = 𝑏(5; 15, 0.4) = ∑ 𝑏(𝑥; 15, 0.4)5𝑥=0 − ∑ 𝑏(𝑥; 15, 0.4)4
𝑥=0
= 0.4032 – 0.2173 = 𝟎. 𝟏𝟖𝟓𝟗
Distribución Geométrica
Es aquella en donde sí se realizan sucesivamente experimentos
independientes de Bernoulli de parámetro p, a la variable aleatoria 𝑋𝐺:
“número de ensayos hasta obtener el primer éxito” se le conoce como
una variable aleatoria con Distribución Geométrica de parámetro p.
𝒈𝒙(𝒏) = (𝟏 − 𝒑)𝒏−𝟏𝒑
𝑬(𝑿𝑮; 𝑵, 𝒑) = 𝟏/𝒑
𝑽𝒂𝒓(𝑿𝑮; 𝒑) = (𝟏 − 𝒑)/𝒑𝟐
Gráfica 1: representación gráfica de una variable aleatoria geométrica.
Fuente: elaboración propia
Ejemplo:
Se sabe que cierto proceso de fabricación, en promedio, uno de cada
100 artículos está defectuoso. ¿Cuál es la probabilidad de que el quinto
artículo que se inspecciona sea el primer defectuoso que se encuentra?
Al usar la distribución geométrica con n=5 y p= 0.01, tenemos
𝑔(5; 0.01) = (0.01)(0.99)5−1 = 𝟎. 𝟎𝟎𝟗𝟔
La probabilidad de que el quinto artículo que se inspecciona sea
el primer defectuoso que se encuentra es del 0.96%.
Ejemplo:
En “tiempo ocupado” un conmutador telefónico está muy cerca de su
capacidad, por lo que los usuarios tienen dificultad al hacer sus
llamadas. Puede ser de interés conocer el número de intentos
necesarios a fin de conseguir un enlace telefónico. Suponga que p=
0.05 es la probabilidad de conseguir un enlace durante el tiempo
ocupado. Nos interesa conocer la probabilidad de que se necesiten
cinco intentos para una llamada exitosa.
El uso de la distribución geométrica con n= 5 y p= 0.05 nos da
𝑃(𝑋 = 𝑥) = 𝑔(5: 0.05) = (0.05)(0.95)5−1 = 𝟎. 𝟎𝟒𝟏
La probabilidad de que se necesiten cinco intentos para una
llamada exitosa es del 4.1%.
Distribución Binomial Negativa
La distribución binomial negativa es aquella en donde si pruebas
independientes repetidas pueden tener como resultado un éxito con
probabilidad p y un fracaso con probabilidad q = 1- p, entonces la
distribución de probabilidad de la variable aleatoria X, el número de la
prueba en la que ocurre el k-ésimo éxito, es
𝒃(𝒙; 𝒌, 𝒑) = (𝒙 − 𝟏
𝒌 − 𝟏) 𝒑𝒌𝒒𝒙−𝒌, 𝒙 = 𝒌, 𝒌 + 𝟏, 𝒌 + 𝟐, ….
Ejemplo:
Encuentre la probabilidad de que una persona que lanza tres monedas
obtenga sólo caras o sólo cruces por segunda vez en el quinto
lanzamiento.
Al utilizar la distribución binomial negativa con x= 5, k= 2, y p= ¼,
tenemos:
𝑏 (5; 2,1
4) = (
4
1) (
1
4)
2
(3
4)
3
= 4!
1! 3!∗
33
45=
27
256= 𝟎. 𝟏𝟎𝟓
La probabilidad de que la persona que lanza tres monedas
obtenga sólo caras o sólo cruces por segunda vez en el quinto
lanzamiento es del 10.5%.
Ejemplo:
Los registros de una compañía constructora de pozos, indican que la
probabilidad de que uno de sus pozos nuevos, requiera de reparaciones
en el término de un año es de 0.20. ¿Cuál es la probabilidad de que el
sexto pozo construido por esta compañía en un año dado sea el
segundo en requerir reparaciones en un año?
Al utilizar la distribución binomial negativa con x=6, k= 2, y p= 0.20,
tenemos
𝑏(6; 2, 0.20) = (5
1) (0.20)2(0.80)6−2 =
5!
1! 4!∗ (0.20)2(0.80)4 = 𝟎. 𝟎𝟖𝟏𝟗
La probabilidad de que el sexto pozo construido por la compañía
en un año dado sea el segundo en requerir reparaciones en un
año es del 8.19%.
DISTRIBUCIONES CONTINUAS
Distribución Normal
Otra de las distribuciones de probabilidad más usadas es la distribución
normal. Esta función es denominada la más importante en el campo
estadístico gracias a que su aproximación puede describir la mayoría de
fenómenos de la naturaleza, la industria y la ciencia. Se caracteriza por
su simetría y su forma de campana. Su función de densidad, media,
varianza y gráfica son las siguientes:
Gráfica 2: función de densidad, media, varianza y gráfica de la variable aleatoria normal.
Fuente: tomado el 8 de febrero de 2013 de
http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/distribprobabil/distribnor
mal.htm
Consecuentemente su función de densidad acumulada sería:
𝐹𝑥 = ∫ 𝑓(𝑥) = ∫1
√2𝜋𝜎2
𝑥′
−∞
𝑥′
−∞
𝑒−
(𝑥−𝜇)
2𝜎2 𝑑𝑥
Para facilitar la resolución de problemas se crearon tablas de la función
de densidad acumulada de una distribución de una variable aleatoria
normal con media 0 y varianza 1. Esta distribución se conoce como la
distribución normal estándar y su función acumulada es la siguiente:
𝑍 =𝑋 − 𝜇
𝜎
𝑍 = 𝑉𝑎𝑙𝑜𝑟 𝑡𝑎𝑏𝑢𝑙𝑎𝑑𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 (𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝜎 𝑞𝑢𝑒 𝑠𝑒 𝑎𝑙𝑒𝑗𝑎 𝑑𝑒 𝜇)
Gráfica 3: tabla de la distribución normal estándar
Fuente: tomado el 8 de febrero de 2013 de
http://www.google.com.co/search?q=tabla+de+la+normal&hl=es-
419&tbo=u&biw=1366&bih=673&tbm=isch&source=univ&sa=X&ei=dA8YUdD9GqbX0QGho4D4C
Q&ved=0CCoQsAQ#imgrc=-sMTe-
Aztfi9cM%3A%3B4WbD6AAHuB6blM%3Bhttp%253A%252F%252Fwww.ieszaframagon.com%252Fma
tematicas%252Festadistica%252Fvar_aleatoria%252Ftabla_normal.png%3Bhttp%253A%252F%252F
www.ieszaframagon.com%252Fmatematicas%252Festadistica%252Fvar_aleatoria%252Ftema5_5.
html%3B513%3B681
Estas tablas de distribución normal Z se pueden encontrar fácilmente en
internet o en el libro mencionado anteriormente, “Probabilidad y
estadística para ingenieros- Ronald Walpole – 6 Ed.”
Ejemplo (Ubicación de áreas en la curva de la distribución normal):
Dada una distribución normal estándar, encuentre el área bajo la curva
que yace (a) a la derecha de z = 1.84 y (b) entre z = -1.97 y z = 0.86
(a) El área en la figura (a) a la derecha de z = 1.84 es igual a 1
menos el área en la tabla de la distribución normal para dicho
valor a la izquierda de z = 1.84 , entonces, 1 – (el valor de z=1.84
que según tablas es = 0.9671), tenemos, 1 – 0.9671 = 0.0329
(b) El área en la figura (b) entre z = -1.97 y z = 0.86 es igual al área a
la izquierda de z = 0.86 menos el área a la izquierda de z = -1.97.
De la tabla de la distribución normal, encontramos que para
dichos valores el parea deseada es 0.8051 – 0.0244 = 0.7807.
Ejemplo:
Cierto tipo de batería de almacenamiento dura, en promedio, 3.0 años,
con una desviación estándar de 0.5 años. Suponga que las duraciones
de la batería se distribuyen normalmente, encuentre la probabilidad de
que una batería dada dure menos de 2.3 años.
Primero debemos construir un diagrama como el que se muestra a
continuación, el cual muestra la distribución dada de duraciones
de las baterías y el área de se desea. Para encontrar la 𝑃(𝑋 < 2.3),
necesitamos evaluar el área bajo la curva normal a la izquierda
de 2.3. Esto se logra al encontrar el área a la izquierda del valor de
x correspondiente.
Gráfica 4: representación gráfica de una variable aleatoria normal con media 3 y
desviación estándar 0.5
Fuente: elaboración propia
De aquí encontramos que:
𝑍 = 2.3 − 3
0.5= −1.4
Y luego con el uso de las tablas de la distribución para Z tenemos:
𝑃(𝑋 < 2.3) = 𝑃(𝑍 < −1.4) = 𝟎. 𝟎𝟖𝟎𝟖
La probabilidad de que una batería dada, dure menos de 2.3
años es del 8.08%.
Ejemplo:
Una empresa eléctrica fabrica focos que tienen una duración, antes de
fundirse, que se distribuye normalmente con media igual a 800 horas y
una desviación estándar de 40 horas. Encuentre la probabilidad de que
un foco se funda entre 778 y 834 horas.
Primero debemos graficar la distribución de los focos, como se
muestra a continuación:
Gráfica 4: representación gráfica de una variable aleatoria normal con media 800 y
desviación estándar 40
Fuente: elaboración propia
Los valores Z que corresponden a 𝑋1 = 778 ℎ𝑜𝑟𝑎𝑠 𝑦 𝑋2 = 834 ℎ𝑜𝑟𝑎𝑠
son:
𝑍1 = 778 − 800
40= −𝟎. 𝟓𝟓 𝑦 𝑍2 =
834 − 800
40= 𝟎. 𝟖𝟓
Entonces,
𝑃(778 < 𝑋 < 834) = 𝑃(−0.55 < 𝑍 < 0.85)
= 𝑃(𝑍 < 0.85) − 𝑃(𝑍 < −0.55)
= 0.8023 − 0.2919 = 𝟎. 𝟓𝟏𝟏𝟏
La probabilidad de que un foco se funda entre 778 y 834 horas es
del 51.11%.
Distribución Exponencial
A pesar de que la distribución normal puede ser usada para resolver
varios problemas de cualquier tipo, existen numerosas situaciones que
requieren de otro tipo de distribuciones. La distribución exponencial se
caracteriza por modelar tiempos entre eventos, lo que la hace muy útil
en el campo de la ingeniería. Su función de densidad, media, varianza y
gráfica son las siguientes:
Gráfica 5: Su función de densidad, media, varianza y gráfica de una variable aleatoria
exponencial.
Fuente: tomado el 8 de febrero de 2013 de
http://www.monografias.com/trabajos84/distribucion-exponencial/distribucion-
exponencial.shtml
Recuerde que debido a la relación que tiene la distribución exponencial
con el proceso Poisson, la función de densidad se puede formular en
términos de la tasa λ de la siguiente forma:
𝒇(𝒙) = 𝝀𝒆−𝝀𝒙
Integrando, su función de densidad acumulada en términos de λ sería:
𝑭𝒙 = 𝟏 − 𝒆−𝝀𝒙
Ejemplo:
Suponga que un sistema contiene cierto tipo de componente cuyos
tiempos de falla en años está dado por T. La variable T se modela bien
mediante la distribución exponencial con tiempo medio para la falla β =
5. Si se instalan cinco de estos componentes en diferentes sistemas,
¿Cuál es la probabilidad de que al menos dos aún funcionen al final del
día?
La probabilidad de que un componente dado aún funcione
después de ocho años está dada por:
𝑃(𝑇 > 8) =1
5 ∫ 𝑒
−𝑡
5
∞
8
𝑑𝑡 = 𝑒−8
5 ≅ 𝟎. 𝟐
Represéntese con X el número de componentes que funcionan
después de ocho años. Entonces con el uso de la distribución
binomial tenemos:
𝑃(𝑋 ≥ 2) = ∑ 𝑏(𝑥; 5,0.2)
5
𝑥=2
= 1 − ∑ 𝑏(𝑥; 𝑏, 0.2) = 1 − 0.7373 = 𝟎. 𝟐𝟔𝟐𝟕
1
𝑥=0
La probabilidad de que un componente dado aún funciones
después de 8 años es del 26.2%.
Ejemplo:
Se ha comprobado que el tiempo de vida de cierto tipo de
marcapasos sigue una distribución exponencial con media de 16 años.
¿Cuál es la probabilidad de que a una persona a la que se le ha
implantado este marcapasos se le deba reimplantar otro antes de 20
años?
Recordemos la relación existente entre la distribución de Poisson y
la exponencial, por lo tanto tenemos lo siguiente:
𝑇~𝐸𝑥𝑝 (𝜆 =1
6) → 𝑓(𝑡) = 𝜆𝑒−𝜆𝑡 𝑦 𝐹(𝑡) = 1 − 𝑒−𝜆𝑡
Entonces,
𝑃(𝑇 ≤ 20) = ∫ 𝑓(𝑡)𝑑𝑡 = 𝐹(20) = 1 − 𝑒−20
16 = 0.713520
0
La probabilidad de que a la persona que se le ha implantado un
marcapasos se le deba reimplantar otro antes de 20 años es del
71.3%.