Data, Model and Decisions 数据、模型与决策
description
Transcript of Data, Model and Decisions 数据、模型与决策
Data, Model and Decisions 数据、模型与决策
第3章 随机变量和概率分布
Session Topics
Basic Probability Concepts 基本概率概念 Discrete Random Variable
离散随机变量 Continuous Random Variable
连续随机变量
Sample Spaces
样本空间
收集所有可能出现的结果 :
例如 6 个摔子都出现 1 点
今天老师备课笔记丢了
随机事件
(一)随机试验与事件
随机现象的特点是:在条件不变的情况下,一系列的试验或观测会得到不同的结果,并且在试验或观测前不能预见何种结果将出现。对随机现象的试验或观测称为随机试验,它必须满足以下的性质:
( 1 )每次试验的可能结果不是唯一的;
( 2 )每次试验之前不能确定何种结果会出现;
( 3 )试验可在相同条件下重复进行。
随机事件
在随机试验中,可能出现也可能不出现的结果,称之为随机事件,简称事件。试验的结果可能是一个简单事件,也可能是一个复杂事件。简单事件就是不可以再分解的事件,又称为基本事件。复杂事件是由简单事件组合而成的事件。基本事件还可称为样本点,设试验有 n 个基本事件,分别记为 (i=1,2,… , n) 。集合 Ω={ω1 ,ω2 , … ,
ωn} 称为样本空间, Ω 中的元素就是样本点。i
Events
事件
简单事件( Simple event ) :
从样本空间出现的结果只有一个特征例如:从一副牌中抽出的是一张红桃
联合或混合事件( Joint/Compound event ):涉及同时出现两个或以上特征例如:从一副牌中抽出的是一张红桃
这是一张红桃 Ace
Visualizing Events
事件形象化
关联表
树图
Ace Not Ace Total
Red 2 24 26
Black 2 24 26
Total 4 48 52
Special Events
特殊事件
空事件( Null Event )
非事件、补事件( Complement of Event )
独立与非独立事件 ( Dependent or Independent Events )
Contingency Table
关联表
一副 52 张的牌
Ace Not anAce
Total
Red
Black
Total
2 24
2 24
26
26
4 48 52样本空间
Red Ace
Tree Diagram
树形图
事件可能性Red Cards
Black Cards
Ace
Not an Ace
Ace
Not an Ace
所有牌
(二)概率
1. 概率的定义 概率就是指随机事件发生的可能性,或称为机率,是对随机事件发
生可能性的度量。 进行 n 次重复试验,随机事件 A 发生的次数是 m
次,发生的频率是 m/n ,当试验的次数 n 很大时,如果频率在某一数值 p 附近摆动,而且随着试验次数 n 的不断增加,频率的摆动幅度越来越小,则称 p 为事件 A 发生的概率,记为: P(A)=p 。在古典概型场合 , 即基本事件发生的概率都一样的场合 :
样本点总数
包含的样本点个数A
n
mAP
样本点总数的有利场合数A
2. 概率的基本性质
性质 1 1≥P(A)≥0 。
性质 2 P(Ω)=1 。
性质 3 若事件 A 与事件 B 互不相容,即 AB=Ф ,则 P(A B)=∪P(A)+P(B) 。
推论 1 不可能事件的概率为 0 ,即: P(Ф)=0 。
推论 2 P( )=1-P(A), 表示 A 的对立事件,即它们二者必有一事件发生但又不能同时发生。
A A
3. 事件的独立性
定义 对事件 A 与 B ,若 p(AB)=p(B)p(A) ,则称它们是统计独立的,简称相互独立。
例:已知袋中有 6 只红球 , 4 只白球。从袋中有放回地取两次球 , 每次都取 1 球。设 表示第 i 次取到红球。那么,
因此, ,也就是说, B1,B2 相互独立
。从题目条件看,这一结论是显然的。
iB
1 2
6 3( ) ( )
10 5P B P B 1 2
2 11
36( ) 3100( )3( ) 5
5
P B BP B B
P B
1 2 2 1 1 1 2
3 3( ) ( ) ( ) ( ) ( )
5 5P B B P B B P B P B P B
Computing Joint Probability
计算联合概率
A 和 B 事件的联合概率为:
例如 . P(Red Card 和 Ace) =
CardsofNumberTotal
Acesd
52
Re226
1
P(A and B) =A 和 B 事件联合出现的结果个数
样本空间的总个数
Computing Compound Probability
计算混合概率
A 、 B 的混合事件( A or B ):
样本空间总个数出现的事件结果个数出现或或 BA
BAP )(
例如: P(Red Card or Ace)
CardsNumberofTotal
AcesdCardsdAces
52
Re2Re264
13
7
52
28
Compound Probability Addition Rule
混合概率规则
P(A1 or B1 ) = P(A1) +P(B1) - P(A1 and B1)
对于互斥事件 : P(A or B) = P(A) + P(B)
P(A1 and B1)
P(B2)P(B1)
P(A2 and B2)P(A2 and B1)
事件事件 Total
Total 1
P(A1 and B2) P(A1)A1
A2
B1 B2
P(A2)
条件概率是指一个事件给定下另一事件发生的可能性 :
给定事件 B 发生,事件 A 发生的概率
P(A B) =
例如: P(Red Card 给定是一张 Ace) =
)(
)(
BP
BandAP
2
1
4
2
Aces
AcesdRe
Computing Conditional Probability
计算条件概率
Discrete Random Variable
离散随机变量
随机变量 : 是一次试验的结果的数值性描述 离散随机变量 :
指有限个数值或一系列无穷个数值的随机变量
Discrete Random Variable Example
离散随机变量例
值 概率
0 1/4 = .25
1 2/4 = .50
2 1/4 = .25
事件 : 抛 2 个硬币 . 数是正面的个数
T
T
T T
Discrete Probability Distribution
离散概率分布
列出所有可能的 [ Xi, f (Xi) ]
Xi = 随机变量的值 ( 结果 )
P(Xi) = 取这个值的概率 相互排斥 ( 没有重叠 ) 穷举性 ( 没有漏下 )
0 f(xi) 1 f(xi) = 1
Discrete Random Variable Measures
离散随机变量的度量
数学期望( Expected Value ) 或平均值度量随机变量的中心位置 E E ((x x ) = ) = = = xf xf ((x x ))方差( Variance )
随机变量的取值离均值的变异程度Var(Var(x x ) = ) = 22 = = ((xx - - ))22f f ((x x ))
Important Discrete Probability Distribution
重要的离散概率分布
离散概率分布
Binomial
二项分布Poisson
泊松分布
贝努里试验
有时我们只对试验中某事件 A 是否出现感兴趣,如果 A 发生,我们称“成功”,否则称“失败”。像这样只有两种结果的试验称为贝努里试验。设 A 出现的概率为 p ,我们独立地重复进行 n 次贝努里试验,称为 n 重贝努里试验 .
Binomial Probability Distributions
二项分布
二项试验的性质 试验由一个包括 n 次相同的试验的序列组
成 . 每次试验有两个结果 , 成功和失败 . 成功的概率为 p, 每次试验都相同 . 试验都是独立的 .
二项分布函数二项分布函数
其中其中
f f ((x x ) = ) = nn 次试验中成功 次试验中成功 xx 次的概率次的概率
nn = = 试验次数试验次数
pp = = 每次试验中成功的概率每次试验中成功的概率
Binomial Probability Distributions
二项分布
f xn
x n xp px n x( )
!!( )!
( ) ( )
1f xn
x n xp px n x( )
!!( )!
( ) ( )
1
EXCEL 函数
BINOMDIST(number_s, trials, probability_s, cumulative)
二项分布示例
Poisson Distribution
泊松分布
泊松试验的性质: 任意两个相等长度的区间发生一次的概率
相等 . 任意区间发生或不发生与其他区间发生与
否独立 .
Poisson Probability Distribution Function
泊松概率分布函数
泊松概率分布函数:
其中 f (x ) = 在一个区间发生 x 次的概率
= 在一个区间发生次数的数学期望 e = 2.71828
f xex
x( )
!
f x
ex
x( )
!
Excel 函数
POISSON (x, mean, cumulative)
泊松分布 ( = 12)
The Normal Distribution
正态分布
钟形 对称 均值 , 中位数,众数相等 随机变量无限取值
X
f(X)
The Mathematical Model
数学模型
f(X) = 随机变量 X 的分布密度函数 = 3.14159; e = 2.71828 = 总体标准方差X = 随机变量取值 (-∞< X < +∞ ) = 总体均值
f(x) =e
-(x- )2
2
2
2
2
Many Normal Distributions
许多正态分布
变动参数 和 , 我们得到许多不同的正态分布
The Standardized Normal Distribution
标准正态分布
标准正态分布表 = 0 and = 1
Z = 0.12
Z .00 .01
0.0 .0000.0040 .0080
.0398 .0438
0.2 .0793 .0832 .0871
0.3 .0179 .0217 .0255
.0478.02
0.1 .0478
Probabilities
Standardizing Example
标准化例
12010
526 ..XZ
Z = 0
Z = 1
.12
正态分布 标准正态分布
X = 5
= 10
6.2
Example:P(2.9 < X < 7.1) = .1664举例计算 P(2.9 < X < 7.1)
0
= 1
-.21 Z.21
正态分布
.1664
.0832.0832
标准正态分布
5
= 10
2.9 7.1 X
2110
592.
.xz
21
10
517.
.xz
Finding Z Values for Known Probabilities
已知概率找 Z 值
Z .00 0.2
0.0 .0000 .0040 .0080
0.1 .0398 .0438 .0478
0.2 .0793 .0832 .0871
.1179 .1255
Z = 0
= 1
.31
.1217.01
0.3
标准正态分布表
.1217
Z = 0
= 1
.31X = 5
= 10
?
正态分布 标准正态分布
.1217 .1217
X 8.1 Z= 5 + (0.31)(10) =
Finding X Values for Known Probabilities
已知概率找 X 值
EXCEL 的正态分布函数
1 .正态分布函数
2 .绘制正态分布图形
1 .正态分布函数
( 1 )正态分布函数。
( 2 )标准正态分布函数。
( 3 )正态分布函数的反函数。
( 4 )标准正态分布函数的反函数。NORMDI
ST返回给定平均值和标准偏差的正态分布的
累积函数。NORMDIST(x,mean,standar
d_dev,cumulative)
NORMINV
返回给定平均值和标准偏差的正态分布的累积函数的逆函数。
NORMINV(probability,mean,standard_dev)
NORMSDIST
返回标准正态分布的累积函数,该分布的平均值为 0,标准偏差为 1。 NORMSDIST(z)
NORMSINV
返回标准正态分布累积函数的逆函数。该分布的平均值为 0,标准偏差为 1。 NORMSINV(probability)
2 .绘制正态分布图形
( 1 )建立正态分布基本数据。
( 2 )绘制正态分布图形。
“序列”对话框
数据填充编辑 /填充 /序列
结果显示( 4~117 行隐藏)
图 4-10 “ 数据系列格式”对话框
正态分布图绘制结果
返回本节
Exponential Distributions
指数分布
e = 2.71828
P arrival time < X( ) 1 - e - x
= 到达的均值X = 连续随机变量
f(X)
X
= 0.5
= 2.0
The Uniform Probability Distribution
均匀分布
随机变量在一个区间内均匀分布,对应的概率与区间的长度成正比例
均匀分别密度函数 f (x) = 1/(b - a) for a < x <
b = 0 elsewhere
数学期望 E(x) = (a + b)/2方差 Var(x) = (b - a)2/12
概率分布曲线
The End of Session 9