Data, Model and Decisions 数据、模型与决策

Data, Model and Decisions 数据、模型与决策

第３章随机变量和概率分布

Session Topics

Basic Probability Concepts 基本概率概念 Discrete Random Variable

离散随机变量 Continuous Random Variable

连续随机变量

Sample Spaces

样本空间

收集所有可能出现的结果：

例如 6 个摔子都出现 1 点

今天老师备课笔记丢了

随机事件

（一）随机试验与事件

随机现象的特点是：在条件不变的情况下，一系列的试验或观测会得到不同的结果，并且在试验或观测前不能预见何种结果将出现。对随机现象的试验或观测称为随机试验，它必须满足以下的性质：

（ 1 ）每次试验的可能结果不是唯一的；

（ 2 ）每次试验之前不能确定何种结果会出现；

（ 3 ）试验可在相同条件下重复进行。

随机事件

在随机试验中，可能出现也可能不出现的结果，称之为随机事件，简称事件。试验的结果可能是一个简单事件，也可能是一个复杂事件。简单事件就是不可以再分解的事件，又称为基本事件。复杂事件是由简单事件组合而成的事件。基本事件还可称为样本点，设试验有 n 个基本事件，分别记为 (i=1,2,… ， n) 。集合 Ω={ω1 ,ω2 , … ,

ωn} 称为样本空间， Ω 中的元素就是样本点。i

Events

事件

简单事件（ Simple event ） :

从样本空间出现的结果只有一个特征例如：从一副牌中抽出的是一张红桃

联合或混合事件（ Joint/Compound event ）：涉及同时出现两个或以上特征例如：从一副牌中抽出的是一张红桃

这是一张红桃 Ace

Visualizing Events

事件形象化

关联表

树图

Ace Not Ace Total

Red 2 24 26

Black 2 24 26

Total 4 48 52

Special Events

特殊事件

空事件（ Null Event ）

非事件、补事件（ Complement of Event ）

独立与非独立事件（ Dependent or Independent Events ）

Contingency Table

关联表

一副 52 张的牌

Ace Not anAce

Total

Red

Black

Total

2 24

2 24

26

26

4 48 52样本空间

Red Ace

Tree Diagram

树形图

事件可能性Red Cards

Black Cards

Ace

Not an Ace

Ace

Not an Ace

所有牌

（二）概率

1. 概率的定义概率就是指随机事件发生的可能性，或称为机率，是对随机事件发

生可能性的度量。进行 n 次重复试验，随机事件 A 发生的次数是 m

次，发生的频率是 m/n ，当试验的次数 n 很大时，如果频率在某一数值 p 附近摆动，而且随着试验次数 n 的不断增加，频率的摆动幅度越来越小，则称 p 为事件 A 发生的概率，记为： P(A)=p 。在古典概型场合 , 即基本事件发生的概率都一样的场合 :

样本点总数

包含的样本点个数A

n

mAP

样本点总数的有利场合数A

2. 概率的基本性质

性质 1 1≥P(A)≥0 。

性质 2 P(Ω)=1 。

性质 3 若事件 A 与事件 B 互不相容，即 AB=Ф ，则 P(A B)=∪P(A)+P(B) 。

推论 1 不可能事件的概率为 0 ，即： P(Ф)=0 。

推论 2 P( )=1-P(A), 表示 A 的对立事件，即它们二者必有一事件发生但又不能同时发生。

A A

3. 事件的独立性

定义对事件 A 与 B ，若 p(AB)=p(B)p(A) ，则称它们是统计独立的，简称相互独立。

例：已知袋中有 6 只红球 , 4 只白球。从袋中有放回地取两次球 , 每次都取 1 球。设表示第 i 次取到红球。那么，

因此，，也就是说， B1,B2 相互独立

。从题目条件看，这一结论是显然的。

iB

1 2

6 3( ) ( )

10 5P B P B 1 2

2 11

36( ) 3100( )3( ) 5

5

P B BP B B

P B

1 2 2 1 1 1 2

3 3( ) ( ) ( ) ( ) ( )

5 5P B B P B B P B P B P B

Computing Joint Probability

计算联合概率

A 和 B 事件的联合概率为：

例如 . P(Red Card 和 Ace) =

CardsofNumberTotal

Acesd

52

Re226

1

P(A and B) =A 和 B 事件联合出现的结果个数

样本空间的总个数

Computing Compound Probability

计算混合概率

A 、 B 的混合事件（ A or B ）:

样本空间总个数出现的事件结果个数出现或或 BA

BAP )(

例如： P(Red Card or Ace)

CardsNumberofTotal

AcesdCardsdAces

52

Re2Re264

13

7

52

28

Compound Probability Addition Rule

混合概率规则

P(A1 or B1 ) = P(A1) +P(B1) - P(A1 and B1)

对于互斥事件 : P(A or B) = P(A) + P(B)

P(A1 and B1)

P(B2)P(B1)

P(A2 and B2)P(A2 and B1)

事件事件 Total

Total 1

P(A1 and B2) P(A1)A1

A2

B1 B2

P(A2)

条件概率是指一个事件给定下另一事件发生的可能性 :

给定事件 B 发生，事件 A 发生的概率

P(A B) =

例如： P(Red Card 给定是一张 Ace) =

)(

)(

BP

BandAP

2

1

4

2

Aces

AcesdRe

Computing Conditional Probability

计算条件概率

Discrete Random Variable

离散随机变量

随机变量 : 是一次试验的结果的数值性描述离散随机变量 :

指有限个数值或一系列无穷个数值的随机变量

Discrete Random Variable Example

离散随机变量例

值概率

0 1/4 = .25

1 2/4 = .50

2 1/4 = .25

事件 : 抛 2 个硬币 . 数是正面的个数

T

T

T T

Discrete Probability Distribution

离散概率分布

列出所有可能的 [ Xi, f (Xi) ]

Xi = 随机变量的值 ( 结果 )

P(Xi) = 取这个值的概率相互排斥 ( 没有重叠 ) 穷举性 ( 没有漏下 )

0 f(xi) 1 f(xi) = 1

Discrete Random Variable Measures

离散随机变量的度量

数学期望（ Expected Value ）或平均值度量随机变量的中心位置 E E ((x x ) = ) = = = xf xf ((x x ))方差（ Variance ）

随机变量的取值离均值的变异程度Var(Var(x x ) = ) = 22 = = ((xx - - ))22f f ((x x ))

Important Discrete Probability Distribution

重要的离散概率分布

离散概率分布

Binomial

二项分布Poisson

泊松分布

贝努里试验

有时我们只对试验中某事件 A 是否出现感兴趣，如果 A 发生，我们称“成功”，否则称“失败”。像这样只有两种结果的试验称为贝努里试验。设 A 出现的概率为 p ，我们独立地重复进行 n 次贝努里试验，称为 n 重贝努里试验 .

Binomial Probability Distributions

二项分布

二项试验的性质试验由一个包括 n 次相同的试验的序列组

成 . 每次试验有两个结果 , 成功和失败 . 成功的概率为 p, 每次试验都相同 . 试验都是独立的 .

二项分布函数二项分布函数

其中其中

f f ((x x ) = ) = nn 次试验中成功次试验中成功 xx 次的概率次的概率

nn = = 试验次数试验次数

pp = = 每次试验中成功的概率每次试验中成功的概率

Binomial Probability Distributions

二项分布

f xn

x n xp px n x( )

!!( )!

( ) ( )

1f xn

x n xp px n x( )

!!( )!

( ) ( )

1

EXCEL 函数

BINOMDIST(number_s, trials, probability_s, cumulative)

二项分布示例

Poisson Distribution

泊松分布

泊松试验的性质：任意两个相等长度的区间发生一次的概率

相等 . 任意区间发生或不发生与其他区间发生与

否独立 .

Poisson Probability Distribution Function

泊松概率分布函数

泊松概率分布函数：

其中 f (x ) = 在一个区间发生 x 次的概率

= 在一个区间发生次数的数学期望 e = 2.71828

f xex

x( )

!

f x

ex

x( )

!

Excel 函数

POISSON (x, mean, cumulative)

泊松分布 ( = 12)

The Normal Distribution

正态分布

钟形对称均值 , 中位数，众数相等随机变量无限取值

X

f(X)

The Mathematical Model

数学模型

f(X) = 随机变量 X 的分布密度函数 = 3.14159; e = 2.71828 = 总体标准方差X = 随机变量取值 (-∞< X < ＋∞ ) = 总体均值

f(x) =e

-(x- )2

2

2

2

2

Many Normal Distributions

许多正态分布

变动参数和 , 我们得到许多不同的正态分布

The Standardized Normal Distribution

标准正态分布

标准正态分布表 = 0 and = 1

Z = 0.12

Z .00 .01

0.0 .0000.0040 .0080

.0398 .0438

0.2 .0793 .0832 .0871

0.3 .0179 .0217 .0255

.0478.02

0.1 .0478

Probabilities

Standardizing Example

标准化例

12010

526 ..XZ

Z = 0

Z = 1

.12

正态分布标准正态分布

X = 5

= 10

6.2

Example:P(2.9 < X < 7.1) = .1664举例计算 P(2.9 < X < 7.1)

0

= 1

-.21 Z.21

正态分布

.1664

.0832.0832

标准正态分布

5

= 10

2.9 7.1 X

2110

592.

.xz

21

10

517.

.xz

Finding Z Values for Known Probabilities

已知概率找 Z 值

Z .00 0.2

0.0 .0000 .0040 .0080

0.1 .0398 .0438 .0478

0.2 .0793 .0832 .0871

.1179 .1255

Z = 0

= 1

.31

.1217.01

0.3

标准正态分布表

.1217

Z = 0

= 1

.31X = 5

= 10

?

正态分布标准正态分布

.1217 .1217

X 8.1 Z= 5 + (0.31)(10) =

Finding X Values for Known Probabilities

已知概率找 X 值

EXCEL 的正态分布函数

1 ．正态分布函数

2 ．绘制正态分布图形

1 ．正态分布函数

（ 1 ）正态分布函数。

（ 2 ）标准正态分布函数。

（ 3 ）正态分布函数的反函数。

（ 4 ）标准正态分布函数的反函数。NORMDI

ST返回给定平均值和标准偏差的正态分布的

累积函数。NORMDIST(x,mean,standar

d_dev,cumulative)

NORMINV

返回给定平均值和标准偏差的正态分布的累积函数的逆函数。

NORMINV(probability,mean,standard_dev)

NORMSDIST

返回标准正态分布的累积函数，该分布的平均值为 0，标准偏差为 1。 NORMSDIST(z)

NORMSINV

返回标准正态分布累积函数的逆函数。该分布的平均值为 0，标准偏差为 1。 NORMSINV(probability)

2 ．绘制正态分布图形

（ 1 ）建立正态分布基本数据。

（ 2 ）绘制正态分布图形。

“序列”对话框

数据填充编辑 /填充 /序列

结果显示（ 4~117 行隐藏）

图 4-10 “ 数据系列格式”对话框

正态分布图绘制结果

返回本节

Exponential Distributions

指数分布

e = 2.71828

P arrival time < X( ) 1 - e - x

= 到达的均值X = 连续随机变量

f(X)

X

= 0.5

= 2.0

The Uniform Probability Distribution

均匀分布

随机变量在一个区间内均匀分布，对应的概率与区间的长度成正比例

均匀分别密度函数 f (x) = 1/(b - a) for a < x <

b = 0 elsewhere

数学期望 E(x) = (a + b)/2方差 Var(x) = (b - a)2/12

概率分布曲线

The End of Session 9

Data, Model and Decisions 数据、模型与决策

Documents

Transcript of Data, Model and Decisions 数据、模型与决策