Data, Model and Decisions 数据、模型与决策

50
Data, Model and Decisions 数数 数数数 数数 数数数数数数数数数

description

Data, Model and Decisions 数据、模型与决策. 第3章 随机变量和概率分布. Session Topics. Basic Probability Concepts 基本概率概念 Discrete Random Variable 离散随机变量 Continuous Random Variable 连续随机变量. Sample Spaces 样本空间. 收集所有可能出现的结果 : 例如 6 个摔子都出现 1 点 今天老师备课笔记丢了. 随机事件. (一)随机试验与事件 - PowerPoint PPT Presentation

Transcript of Data, Model and Decisions 数据、模型与决策

Page 1: Data, Model and Decisions  数据、模型与决策

Data, Model and Decisions 数据、模型与决策

第3章 随机变量和概率分布

Page 2: Data, Model and Decisions  数据、模型与决策

Session Topics

Basic Probability Concepts 基本概率概念 Discrete Random Variable

离散随机变量 Continuous Random Variable

连续随机变量

Page 3: Data, Model and Decisions  数据、模型与决策

Sample Spaces

样本空间

收集所有可能出现的结果 :

例如 6 个摔子都出现 1 点

今天老师备课笔记丢了

Page 4: Data, Model and Decisions  数据、模型与决策

随机事件

(一)随机试验与事件

随机现象的特点是:在条件不变的情况下,一系列的试验或观测会得到不同的结果,并且在试验或观测前不能预见何种结果将出现。对随机现象的试验或观测称为随机试验,它必须满足以下的性质:

( 1 )每次试验的可能结果不是唯一的;

( 2 )每次试验之前不能确定何种结果会出现;

( 3 )试验可在相同条件下重复进行。

Page 5: Data, Model and Decisions  数据、模型与决策

随机事件

在随机试验中,可能出现也可能不出现的结果,称之为随机事件,简称事件。试验的结果可能是一个简单事件,也可能是一个复杂事件。简单事件就是不可以再分解的事件,又称为基本事件。复杂事件是由简单事件组合而成的事件。基本事件还可称为样本点,设试验有 n 个基本事件,分别记为 (i=1,2,… , n) 。集合 Ω={ω1 ,ω2 , … ,

ωn} 称为样本空间, Ω 中的元素就是样本点。i

Page 6: Data, Model and Decisions  数据、模型与决策

Events

事件

简单事件( Simple event ) :

从样本空间出现的结果只有一个特征例如:从一副牌中抽出的是一张红桃

联合或混合事件( Joint/Compound event ):涉及同时出现两个或以上特征例如:从一副牌中抽出的是一张红桃

这是一张红桃 Ace

Page 7: Data, Model and Decisions  数据、模型与决策

Visualizing Events

事件形象化

关联表

树图

Ace Not Ace Total

Red 2 24 26

Black 2 24 26

Total 4 48 52

Page 8: Data, Model and Decisions  数据、模型与决策

Special Events

特殊事件

空事件( Null Event )

非事件、补事件( Complement of Event )

独立与非独立事件 ( Dependent or Independent Events )

Page 9: Data, Model and Decisions  数据、模型与决策

Contingency Table

关联表

一副 52 张的牌

Ace Not anAce

Total

Red

Black

Total

2 24

2 24

26

26

4 48 52样本空间

Red Ace

Page 10: Data, Model and Decisions  数据、模型与决策

Tree Diagram

树形图

事件可能性Red Cards

Black Cards

Ace

Not an Ace

Ace

Not an Ace

所有牌

Page 11: Data, Model and Decisions  数据、模型与决策

(二)概率

1. 概率的定义 概率就是指随机事件发生的可能性,或称为机率,是对随机事件发

生可能性的度量。 进行 n 次重复试验,随机事件 A 发生的次数是 m

次,发生的频率是 m/n ,当试验的次数 n 很大时,如果频率在某一数值 p 附近摆动,而且随着试验次数 n 的不断增加,频率的摆动幅度越来越小,则称 p 为事件 A 发生的概率,记为: P(A)=p 。在古典概型场合 , 即基本事件发生的概率都一样的场合 :

样本点总数

包含的样本点个数A

n

mAP

样本点总数的有利场合数A

Page 12: Data, Model and Decisions  数据、模型与决策

2. 概率的基本性质

性质 1 1≥P(A)≥0 。

性质 2 P(Ω)=1 。

性质 3 若事件 A 与事件 B 互不相容,即 AB=Ф ,则 P(A B)=∪P(A)+P(B) 。

推论 1 不可能事件的概率为 0 ,即: P(Ф)=0 。

推论 2 P( )=1-P(A), 表示 A 的对立事件,即它们二者必有一事件发生但又不能同时发生。

A A

Page 13: Data, Model and Decisions  数据、模型与决策

3. 事件的独立性

定义 对事件 A 与 B ,若 p(AB)=p(B)p(A) ,则称它们是统计独立的,简称相互独立。

例:已知袋中有 6 只红球 , 4 只白球。从袋中有放回地取两次球 , 每次都取 1 球。设 表示第 i 次取到红球。那么,

因此, ,也就是说, B1,B2 相互独立

。从题目条件看,这一结论是显然的。

iB

1 2

6 3( ) ( )

10 5P B P B 1 2

2 11

36( ) 3100( )3( ) 5

5

P B BP B B

P B

1 2 2 1 1 1 2

3 3( ) ( ) ( ) ( ) ( )

5 5P B B P B B P B P B P B

Page 14: Data, Model and Decisions  数据、模型与决策

Computing Joint Probability

计算联合概率

A 和 B 事件的联合概率为:

例如 . P(Red Card 和 Ace) =

CardsofNumberTotal

Acesd

52

Re226

1

P(A and B) =A 和 B 事件联合出现的结果个数

样本空间的总个数

Page 15: Data, Model and Decisions  数据、模型与决策

Computing Compound Probability

计算混合概率

A 、 B 的混合事件( A or B ):

样本空间总个数出现的事件结果个数出现或或 BA

BAP )(

例如: P(Red Card or Ace)

CardsNumberofTotal

AcesdCardsdAces

52

Re2Re264

13

7

52

28

Page 16: Data, Model and Decisions  数据、模型与决策

Compound Probability Addition Rule

混合概率规则

P(A1 or B1 ) = P(A1) +P(B1) - P(A1 and B1)

对于互斥事件 : P(A or B) = P(A) + P(B)

P(A1 and B1)

P(B2)P(B1)

P(A2 and B2)P(A2 and B1)

事件事件 Total

Total 1

P(A1 and B2) P(A1)A1

A2

B1 B2

P(A2)

Page 17: Data, Model and Decisions  数据、模型与决策

条件概率是指一个事件给定下另一事件发生的可能性 :

给定事件 B 发生,事件 A 发生的概率

P(A B) =

例如: P(Red Card 给定是一张 Ace) =

)(

)(

BP

BandAP

2

1

4

2

Aces

AcesdRe

Computing Conditional Probability

计算条件概率

Page 18: Data, Model and Decisions  数据、模型与决策

Discrete Random Variable

离散随机变量

随机变量 : 是一次试验的结果的数值性描述 离散随机变量 :

指有限个数值或一系列无穷个数值的随机变量

Page 19: Data, Model and Decisions  数据、模型与决策

Discrete Random Variable Example

离散随机变量例

值 概率

0 1/4 = .25

1 2/4 = .50

2 1/4 = .25

事件 : 抛 2 个硬币 . 数是正面的个数

T

T

T T

Page 20: Data, Model and Decisions  数据、模型与决策

Discrete Probability Distribution

离散概率分布

列出所有可能的 [ Xi, f (Xi) ]

Xi = 随机变量的值 ( 结果 )

P(Xi) = 取这个值的概率 相互排斥 ( 没有重叠 ) 穷举性 ( 没有漏下 )

0 f(xi) 1 f(xi) = 1

Page 21: Data, Model and Decisions  数据、模型与决策

Discrete Random Variable Measures

离散随机变量的度量

数学期望( Expected Value ) 或平均值度量随机变量的中心位置 E E ((x x ) = ) = = = xf xf ((x x ))方差( Variance )

随机变量的取值离均值的变异程度Var(Var(x x ) = ) = 22 = = ((xx - - ))22f f ((x x ))

Page 22: Data, Model and Decisions  数据、模型与决策

Important Discrete Probability Distribution

重要的离散概率分布

离散概率分布

Binomial

二项分布Poisson

泊松分布

Page 23: Data, Model and Decisions  数据、模型与决策

贝努里试验

有时我们只对试验中某事件 A 是否出现感兴趣,如果 A 发生,我们称“成功”,否则称“失败”。像这样只有两种结果的试验称为贝努里试验。设 A 出现的概率为 p ,我们独立地重复进行 n 次贝努里试验,称为 n 重贝努里试验 .

Page 24: Data, Model and Decisions  数据、模型与决策

Binomial Probability Distributions

二项分布

二项试验的性质 试验由一个包括 n 次相同的试验的序列组

成 . 每次试验有两个结果 , 成功和失败 . 成功的概率为 p, 每次试验都相同 . 试验都是独立的 .

Page 25: Data, Model and Decisions  数据、模型与决策

二项分布函数二项分布函数

其中其中

f f ((x x ) = ) = nn 次试验中成功 次试验中成功 xx 次的概率次的概率

nn = = 试验次数试验次数

pp = = 每次试验中成功的概率每次试验中成功的概率

Binomial Probability Distributions

二项分布

f xn

x n xp px n x( )

!!( )!

( ) ( )

1f xn

x n xp px n x( )

!!( )!

( ) ( )

1

Page 26: Data, Model and Decisions  数据、模型与决策

EXCEL 函数

BINOMDIST(number_s, trials, probability_s, cumulative)

Page 27: Data, Model and Decisions  数据、模型与决策

二项分布示例

Page 28: Data, Model and Decisions  数据、模型与决策

Poisson Distribution

泊松分布

泊松试验的性质: 任意两个相等长度的区间发生一次的概率

相等 . 任意区间发生或不发生与其他区间发生与

否独立 .

Page 29: Data, Model and Decisions  数据、模型与决策

Poisson Probability Distribution Function

泊松概率分布函数

泊松概率分布函数:

其中 f (x ) = 在一个区间发生 x 次的概率

= 在一个区间发生次数的数学期望 e = 2.71828

f xex

x( )

!

f x

ex

x( )

!

Page 30: Data, Model and Decisions  数据、模型与决策

Excel 函数

POISSON (x, mean, cumulative)

Page 31: Data, Model and Decisions  数据、模型与决策

泊松分布 ( = 12)

Page 32: Data, Model and Decisions  数据、模型与决策

The Normal Distribution

正态分布

钟形 对称 均值 , 中位数,众数相等 随机变量无限取值

X

f(X)

Page 33: Data, Model and Decisions  数据、模型与决策

The Mathematical Model

数学模型

f(X) = 随机变量 X 的分布密度函数 = 3.14159; e = 2.71828 = 总体标准方差X = 随机变量取值 (-∞< X < +∞ ) = 总体均值

f(x) =e

-(x- )2

2

2

2

2

Page 34: Data, Model and Decisions  数据、模型与决策

Many Normal Distributions

许多正态分布

变动参数 和 , 我们得到许多不同的正态分布

Page 35: Data, Model and Decisions  数据、模型与决策

The Standardized Normal Distribution

标准正态分布

标准正态分布表 = 0 and = 1

Z = 0.12

Z .00 .01

0.0 .0000.0040 .0080

.0398 .0438

0.2 .0793 .0832 .0871

0.3 .0179 .0217 .0255

.0478.02

0.1 .0478

Probabilities

Page 36: Data, Model and Decisions  数据、模型与决策

Standardizing Example

标准化例

12010

526 ..XZ

Z = 0

Z = 1

.12

正态分布 标准正态分布

X = 5

= 10

6.2

Page 37: Data, Model and Decisions  数据、模型与决策

Example:P(2.9 < X < 7.1) = .1664举例计算 P(2.9 < X < 7.1)

0

= 1

-.21 Z.21

正态分布

.1664

.0832.0832

标准正态分布

5

= 10

2.9 7.1 X

2110

592.

.xz

21

10

517.

.xz

Page 38: Data, Model and Decisions  数据、模型与决策

Finding Z Values for Known Probabilities

已知概率找 Z 值

Z .00 0.2

0.0 .0000 .0040 .0080

0.1 .0398 .0438 .0478

0.2 .0793 .0832 .0871

.1179 .1255

Z = 0

= 1

.31

.1217.01

0.3

标准正态分布表

.1217

Page 39: Data, Model and Decisions  数据、模型与决策

Z = 0

= 1

.31X = 5

= 10

?

正态分布 标准正态分布

.1217 .1217

X 8.1 Z= 5 + (0.31)(10) =

Finding X Values for Known Probabilities

已知概率找 X 值

Page 40: Data, Model and Decisions  数据、模型与决策

EXCEL 的正态分布函数

1 .正态分布函数

2 .绘制正态分布图形

Page 41: Data, Model and Decisions  数据、模型与决策

1 .正态分布函数

( 1 )正态分布函数。

( 2 )标准正态分布函数。

( 3 )正态分布函数的反函数。

( 4 )标准正态分布函数的反函数。NORMDI

ST返回给定平均值和标准偏差的正态分布的

累积函数。NORMDIST(x,mean,standar

d_dev,cumulative)

NORMINV

返回给定平均值和标准偏差的正态分布的累积函数的逆函数。

NORMINV(probability,mean,standard_dev)

NORMSDIST

返回标准正态分布的累积函数,该分布的平均值为 0,标准偏差为 1。 NORMSDIST(z)

NORMSINV

返回标准正态分布累积函数的逆函数。该分布的平均值为 0,标准偏差为 1。 NORMSINV(probability)

Page 42: Data, Model and Decisions  数据、模型与决策

2 .绘制正态分布图形

( 1 )建立正态分布基本数据。

( 2 )绘制正态分布图形。

Page 43: Data, Model and Decisions  数据、模型与决策

“序列”对话框

数据填充编辑 /填充 /序列

Page 44: Data, Model and Decisions  数据、模型与决策

结果显示( 4~117 行隐藏)

Page 45: Data, Model and Decisions  数据、模型与决策

图 4-10 “ 数据系列格式”对话框

Page 46: Data, Model and Decisions  数据、模型与决策

正态分布图绘制结果

返回本节

Page 47: Data, Model and Decisions  数据、模型与决策

Exponential Distributions

指数分布

e = 2.71828

P arrival time < X( ) 1 - e - x

= 到达的均值X = 连续随机变量

f(X)

X

= 0.5

= 2.0

Page 48: Data, Model and Decisions  数据、模型与决策

The Uniform Probability Distribution

均匀分布

随机变量在一个区间内均匀分布,对应的概率与区间的长度成正比例

均匀分别密度函数 f (x) = 1/(b - a) for a < x <

b = 0 elsewhere

数学期望 E(x) = (a + b)/2方差 Var(x) = (b - a)2/12

Page 49: Data, Model and Decisions  数据、模型与决策

概率分布曲线

Page 50: Data, Model and Decisions  数据、模型与决策

The End of Session 9