jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值...

70
概概 1 概 概概 概概概概__________ 概概概概______________ 概概概概____________ 概概_____________________ 概概概概_________________ 概概概概 24-0901 概概概概 概概 概概 2 概概概概 概概概概 1 概概 ), Matlab 概 2 Matlab 概 概 一; 3 Matlab 概 概 概概概概概概概概 ;,,,。 概概概概 1. 概概概概概概a) b) 概概概概 概概 Matlab 概 概 Matlab 概 概概概概 概概概概 概 概概概概概概概概概概 、、、、 概概概概 概概概概概概概 体、、、、、、Matlab 概概 概概概概 概概概概概概 、、、、、 概概概概 概概概概概 、体、、 概概 概概概概概概 一: (30 概概) 概概概概 MATLAB 概概概概概概概概概概概概概概概 概概 1 概概

Transcript of jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值...

Page 1: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 1

《概率论与数理统计》课程教案主讲教师__________ 所在单位______________

授课班级____________ 专业_____________________ 撰写时间_________________

教案编号 24-0901 教案内容 概率统计数值实验 学时 2

教学目标基本要求

(1)掌握离散型随机变量和连续型随机变量各种常见分布随机数的生成算法,能借助 Matlab 软件产生各种分布的随机数函数;

(2)能借助 Matlab 软件求解一些简单的应用概率问题的数值模拟解;(3)能借助 Matlab 软件完成有关随机变量的分布拟合和参数估计的求解。本内容可在实验室边讲边练;亦可在课堂上讲方法,课后学生自行练习,以平

时作业处理,但不作考试要求。

能力要求1. 培养能力要求:

a) 掌握概率论和数理统计中的基本概念和性质并能够运用到复杂工程问题的适当表述之中;

b) 能够针对工程应用系统或过程的特点选择合适的概率分布来描述随机现象的统计规律性;

教学重点常见分布随机数的生成算法;应用 Matlab 软件作简单概率问题的随机模拟思想与方

法;应用 Matlab 软件求解随机变量分布参数及分布拟合检验的过程。教学难点 常见分布随机数函数的生成思想。教学方法 提问、讲授、启发、讨论、实验工具仪器 多媒体教具、教材、教案、教学课件、考勤表、平时成绩登记表、Matlab 软件教学安排 考勤、复习相关知识点、新课内容概述、组织教学、布置作业、课后小结教学过程 教学组织、具体教学内容及教学方法、手段、时间分配及其它说明 备 注第一部分:古典概型实验(30 分钟)

内容介绍 将 第 一 章

Page 2: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

2 西安电子科技大学

MATLAB 常用的及与随机数产生相关的函数

实验 1:计算超几何分布

实验 2:频率稳定性实验

实验 3:利用频率估计自然对数底 e

实验 4:蒲丰投针实验,利用频率估计圆周率

实验 5:生日悖论实验

利用 MATLAB 软件的图形可视功能将概率统计的内容用图形表示出来,以加深对概

率的理解

MATLAB 常用的及与随机数产生相关的函数

factorial(n) :阶乘,n!,可通过阶乘来计算排列组合数

1.rand(m,n):生成 m×n 的随机矩阵,每个元素都在(0,1)间,生成

方式为均匀分布。

2.randn(m,n):生成 m×n 的随机矩阵,每个元素都在(0,1)间,生成

知 识 点 串

接起来

Page 3: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 3

方式为正态分布

3.randperm(m):生成一个 1~m 的随机整数排列

4.perms(1:n):生成一个 1~n 的全排列,共 n!个

5.取整函数系列:

(1)fix(x):截尾法取整;

(2)floor(x):退一法取整(不超过 x 的最大整数);向负方向舍入

(3)ceil(x):进一法取整(= floor(x)+1); 向正方向舍入

(4)round(x):四舍五入法取整。

6.unique(a):合并 a 中相同的项

7.prod(x):向量 x 的所有分量元素的积

示例:

>> rand(1) %生成一个(0,1)间的随机数 ans = 0.8147

Page 4: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

4 西安电子科技大学

>> rand(2,2) %生成一个 2×2 阶(0,1)间的随机数矩阵ans = 0.9134 0.0975

0.6324 0.2785

>> randperm(5) %生成一个 1~5 的随机整数排列ans = 4 1 5 2 3

>> a=[1 2 4 2 3 3 2];

unique(a)

ans = 1 2 3 4

实验 1:计算超几何分布的结果

设有 N 件产品,其中 D 件次品,今从中任取 n 件

问其中恰有 k(kD)件次品的概率是多少?

(令N=10,D=3,n=4,k=2)

解:编辑组合函数 zuhe.m文件 function y=Com(n,r)

y=factorial(n)/(factorial(r)*factorial(n-r))

Page 5: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 5

计算如下: >> N=10; D=3; n=4; k=2;

p=Com(3,2)*Com(10-3,4-2)/Com(10,4)=0.3

实验 2 频率稳定性实验

随机投掷均匀硬币,观察国徽朝上与国徽朝下的频率

解 >> n= 3000~100000000;m=0;

for i=1:n

t=randperm(2); %生成一个 1~2 的随机整数排列

x=t-1; %生成一个 0~1 的随机整数排列

y=x(1); %取 x 排列的第一个值 if y==0;

m=m+1;

end

end

p1=m/n

p2=1-p1

Page 6: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

6 西安电子科技大学

可见当n→∞时,f n ( A )=P(A)

实验 3 用频率估计自然对数e

某班有 n 个人,每人各有一支枪,这些枪外形一样。某次夜间紧急集

合,若每人随机地取走一支枪,求没有一个人拿到自己枪的概率?

解:记事件 Ai 为第 i 个人拿到自已枪,事件Ai为第 i 个人没拿到自己枪,易知:

P (A i )=1n;P (A i )=

n−1n,(i=1,2 ,⋯ ,n)

又记 p0 为没有一个人拿到自己枪的概率。

p0=P ( A1 A2⋯ An )=1−P (¿ i=1¿n A i)

Page 7: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 7

由乘法公式可知

P (A i A j )=P ( A i )× P (A j|A i )=1

n (n−1 )(1≤ i< j≤ n )

P (A i A j A k )=P ( Ak )×P (A i A j|A k )=1

n (n−1 )(n−2)(1≤ i< j<k ≤n)

… …

P (A1 A2 A3⋯ An )=1n!

于是

∑i=1

n

P ( Ai )=1 , ∑1≤i< j ≤ n

n

P ( A i A j )=Cn

2

n (n−1 )

∑1≤i< j< k≤ n

n

P (A i A j Ak )=Cn

3

n (n−1 ) (n−2 ),⋯

P (A1 A2 A3⋯ An )=1n!

所以

p0=1−P (¿ i=1¿n A i )=1−[1− Cn2

n (n−1 )+

Cn3

n (n−1 ) (n−2 )+⋯+

(−1 )n+1

n! ]=∑k=0

n (−1)k

k !

特别地,当 n较大时, p0≈e−1 。

因此,可随机模拟出没有人拿到自己枪的频率,根据频率的稳定性,近似当做

概率,然后去估计自然对数 e。并考虑估计精度与人数是否有关系,为什么。算法如

Page 8: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

8 西安电子科技大学

下:

1、产生 n 个随机数的随机序列;

2、检验随机列与自然列是否至少有一个配对;

3、对没有一个配对的序列进行累积 t;

4、重复 1、2、3步 m 次;

5、估计e=mt

具体程序及相关结果如下页图

注:自然常数 e≈2.7183

>> m=40000;

n=50;

t=0;

for j=1:m

k=0;

sui=randperm(n);

for i=1:n

if sui(i)==i

k=k+1;

else

k=k;

Page 9: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 9

end

end

if k==0

t=t+1;

else

t=t;

end

end

e=m/t

e = 2.7313

Page 10: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

10 西安电子科技大学

实验 4:蒲丰(Buffon)投针实验,用频率估计值

在画有许多间距为 d 的等距平行线的白纸上,随机投掷一根长为

l(ld)的均匀直针,求针与平行线相交的概率,并计算的近似值

解:设针与平行线的夹角为(0),针的中心与最近直线的距离为 x(0xd/

2)。针与平行线相交的充要条件是 x(l/2)sin ,这里 x(0xd/2 并且 0。

建立直角坐标系,上述条件在坐标系下将是曲线所围成的曲边梯形区域,总的区域即

x 和所有可能取值构成的矩形区域,且所有可能取值是机会均等的,符合几何概

型,则所求概率为

p= g的面积G的面积

=∫0

π l2

sin α dα

π d2

= 2lπd≈ mn

故可得的近似计算公式 π ≈ 2nlmd ,其中 n 为随机试验次数,m 为针与平行线相交的

次数。

Page 11: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 11

解 >> clear,clf

n=10000000;l=0.5;m=0;d=1;

for i=1:n

x=(l/2)*sin(rand(1)*pi); y=rand(1)*d/2;

if x>=y

m=m+1;

end

end

p1=m/n

pai=2*n*l/(m*d)

Page 12: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

12 西安电子科技大学

Page 13: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 13

实验 5 生日悖论实验

在 100 个人的团体中,不考虑年龄差异,研究是否有两个以上的人生

日相同。假设每人的生日在一年 365天中的任意一天是等可能的,那

么随机找 n 个人(不超过 365人)。

(1)求这 n 个人生日各不相同的概率是多少?从而求这 n 个人中至少

有两个人生日相同这一随机事件发生的概率是多少?

(2)近似计算在 30名学生的一个班中至少有两个人生日相同的概率

是多少

解: (1)

>> clear,clf

Page 14: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

14 西安电子科技大学

for n=1:100

p0(n)=prod(365:-1:365-n+1)/365^n;

p1(n)=1-p0(n);

end

p1=ones(1,100)-p0;

n=1:100;

plot(n,p0,n,p1,'--')

xlabel('人数'),ylabel('概率')

legend('生日各不相同的概率','至少两人生日相同的概率')

axis([0 100 -0.1 1.199]),grid on

0 10 20 30 40 50 60 70 80 90 100

0

0.2

0.4

0.6

0.8

1

人数

概率

生日各不相同的概率至少两人生日相同的概率

p1(30)=0.7063, p1(60)= 0.9941

Page 15: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 15

(2) 在 30名学生中至少两人生日相同的概率为 70.63%。

下面进行计算机仿真。

随机产生 30 个正整数,代表一个班 30名学生的生日,然后观察是否

有两人以上生日相同。当 30 个人中有两人生日相同时,输出“1”,否

则输出“0”。如此重复观察 100 次,计算出这一事件发生的频率 f100

>> clear,clf

n=0;

for m=1:100 %做 100 次随机试验 y=0;

x=1+fix(365*rand(1,30)); %产生 30 个随机数

for i=1:29 %用二重循环寻找 30 个随机数 中是否有相同数 for j=i+1:30

if x(i)==x(j)

y=1;break;

end

end

end

Page 16: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

16 西安电子科技大学

n=n+y; %累计有两人生日相同的试验次数 end

f=n/m %计算频率

第二部分:随机变量及其分布(50 分钟)

内容介绍1. MATLAB 中概率分布函数2. 二项分布实验3. 泊松分布实验4. 二项分布与泊松分布关系实验5. 连续型随机变量分布实验6. 随机变量的均值与方差7. 逆累积分布函数实验8. 中心极限定理实验1. MATLAB 中概率分布函数MATLAB 为常见自然概率分布提供了下列 5类函数

① 概率密度函数(pdf),求随机变量 X 在 x 点处的概率密度值 ②累积分布函数(cdf),求随机变量 X 在 x 点处的分布函数值 ③逆累积分布函数(inv),求随机变量 X 在概率点处的分布函数反

函数值

Page 17: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 17

④ 均值与方差计算函数(stat),求给定分布的随机变量 X 的数学期望 E(X)和方差 var(X)

⑤ 随机数生成函数(rnd),模拟生成指定分布的样本数据(调用格式:x=分布 rnd(分布参数),如 x=normrnd(0,1))

常见的分布类型名如下

具体函数的命名规则是: 函数名=分布类型名称+函数类型名称(pdf、cdf、inv、stat、rnd)

例如,normpdf、normcdf、norminv、normstat 和 normrnd 分别是正态分布的概率密度、累积分布、逆累积分布、数字特征和随机数生成函数。关于这 5类函数的语法,请详见有关书籍

快捷的学习可借助 MATLAB 的系统帮助,通过指令 doc获得具体函数的详细信息,语法是 doc <函数名>

2. 二项分布实验已知 Y~b(20, 0.3)求 Y 分布率的值,并划出图形

Page 18: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

18 西安电子科技大学

在 Matlab 中输入以下命令: binopdf(10,20,0.2) x=0:1:20; y=binopdf(x,20,0.2) plot(x,y,’r.’)

5 10 15 20

0.05

0.1

0.15

0.2

结果:ans = 0.0020y =0.0115 0.0576 0.1369 0.2054 0.2182 0.1746 0.1091 0.0545 0.0222 0.0074 0.0020 0.0005 0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000

已知 Y~b(20, 0.3)求 Y 分布函数的值,画出函数图像在 Matlab 中输入以下命令:

binocdf(10,20,0.2) x=0:1:20; y=binocdf(x,20,0.2) ezplot('binocdf(t,20,0.3)',[0,20])

结果:ans = 0.9994y = 0.0115 0.0692 0.2061 0.4114 0.6296 0.8042 0.9133 0.9679 0.9900 0.9974 0.9994 0.9999 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

Page 19: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 19

到某服务机构办事总是要排队等待的。设等待时间 T 是服从指数分布的随机变量(单位:分钟),概率密度为

f (t )={ 110e−t10 t>0

0 t<0

设某人一个月内要到此办事 10 次,若等待时间超过 15 分钟,他就离去。求: (1)恰好有两次离去的概率; (2)最多有两次离去的概率; (3)至少有两次离去的概率; (4)离去的次数占多数的概率。解 首先求任一次离去的概率,依题意设 10 次中离去的次数为 X,则 X~b(10, p)

>> p=1-expcdf(15,10) %任一次离去的概率 p1=binopdf(2,10,p) %恰有两次离去的概率 q=binopdf([0:2],10,p);p2=sum(q) %最多有两次离去的概率 q=binopdf([0:1],10,p);p3=1-sum(q) %最少有两次离去的概率

Page 20: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

20 西安电子科技大学

q=binopdf([0:5],10,p);p4=1-sum(q) %离去的次数占多数的概率 p = 0.2231 p1 = 0.2972 p2 = 0.6073 p3 = 0.6899 p4 = 0.0112

3. 泊松分布实验假设电话交换台每小时接到的呼叫次数 X服从参数=3 的泊松分布,求

(1) 每小时恰有 4 次呼叫的概率 (2) 一小时内呼叫不超过 5 次的概率 (3) 画出分布律图像

P (X=4 )= λ4

4 !e− λ= 34

4 !e−3

P (X ≤5 )=∑k=0

5

P ¿¿

在 Matlab 中输入以下命令:(1)p1= poisspdf(4,3)(2)p2= poisscdf(5,3)(3)x=0:1:20;y=poisspdf(x,3);plot(x,y)

4. 二项分布与泊松分布关系实验

Page 21: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 21

二项分布与泊松分布的关系例 7:X~b(200,0.02),Y 服从参数为 4 的泊松分布,划出分布率图像

x=0:20; y1=binopdf(x,200,0.02); y2=poisspdf(x,4); plot(x,y1,’r.’,x,y2,’b.’)

泊松定理 (用泊松分布来逼近二项分布的定理)

设 λ>0 是一个常数,n 是任意正整数,设 npn=λ,则对于任意固定的非负整数 k,有limn→∞ (nk) pnk (1−pn)n−k= λ

k e−λ

k !

例 9 某种重大疾病的医疗险种,每份每年需交保险费 100 元,若在这一年中,投保人得了这种疾病,则每份可以得到索赔额 10000 元,假设该地区这种疾病的患病率为 0.0002,现该险种共有 10000份保单,问:(1)保险公司亏本的概率是多少?

(2)保险公司获利不少于 80万元的概率是多少?

解 设 X 表示这一年中发生索赔的份数,依题意, X 的统计规律可用二项分布

Page 22: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

22 西安电子科技大学

X B(10000,0.0002)来描述。由二项分布与泊松分布的近似计算关系有Cnk pk (1− p)n−k≈ (np )k

k !e−np(0<np<10)

X 近似服从参数为 2 的泊松分布。 当索赔份数超过 100份时,则保险公司发生亏本,亏本的概率为

p1=P (X>100 )=1−P (X ≤100 )=1−∑K=0

100 2kk!e−2

当索赔份数不超过 20份时,则保险公司获利就不少于 80万元,其概率为p2=P (X<20 )=¿∑

K=0

19 2kk !e−2

>> [p]=poisspdf([0:100],2);%计算 101 个泊松分布概率值

或 [p]=binopdf([0:100],10000,0.0002); %按二项分布计算 p1=1-sum(p) %求出保险公司亏本的概率 p1 = 0.0000

>> [p]=poisspdf([0:19],2);%计算出 20 个泊松分布概率值

或 [p]=binopdf([0:19],10000,0.0002); %按二项分布计算

p2=sum(p) %求出保险公司获利不少于 80万元的概率 p2 = 1.0000

5. 连续型随机变量分布实验离散均匀分布的概率密度函数和累积分布函数 unidpdf(X,N) unidcdf(X,N)

随机变量 X 在 1 到 N 上的 N 各自然数之间等可能取值在 Matlab 中输入以下命令:

x=1:1:10; y=unidpdf(x,10)

Page 23: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 23

结果:y = 0.1000 0.1000 0.1000 0.1000 0.1000

0.1000 0.1000 0.1000 0.1000 0.1000

在 Matlab 中输入以下命令: x=0:1:10; y=unidcdf(x,10)

结果:y = 0 0.1000 0.2000 0.3000 0.4000 0.5000 0.6000 0.7000 0.8000 0.9000

1.0000

连续均匀分布 密度函数:f=unifpdf(x,a,b)

分布函数:f=unifcdf(x,a,b)

例: 画出均匀分布 U(2,5)的概率密度函数和分布函数的图形.

在 Matlab 中输入以下命令: x=0:0.01:7; y=unifpdf(x,2,5); z=unifcdf(x,2,5); plot(x,y,x,z)

(2) 指数分布 密度函数:f=exppdf(x,)

分布函数:F=expcdf(x,)

例: 画出指数分布 E(1)的概率密度函数和分布函数的图形. 求 P(0<X<5) P(0<X<20).

Page 24: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

24 西安电子科技大学

在 Matlab 中输入以下命令: x=0:0.1:5; y=exppdf(x,2); z=expcdf(x,2); plot(x,y,x,z) result1=expcdf(5,2)-expcdf(0,2) result2=expcdf(20,2)-expcdf(0,2)

结果:result1 = 0.91791500137610

result2 = 0.99995460007024

(3) 正态分布 密度函数:f=normpdf(x,,)

分布函数:F=normcdf(x,,)

例: 画出正态分布 N(1,4)的概率密度函数和分布函数的图形. 求 P(1<X<6).

在 Matlab 中输入以下命令: x=-5:0.1:6; y=normpdf(x,1,2); z=normcdf(x,1,2); plot(x,y,x,z) result=normcdf(6,1,2)-normcdf(1,1,2)

Page 25: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 25

结果:Result =0.4938

例 11:在同一坐标下,画下列正态分布的密度函数图像(1) μ=3, σ=0.5, 0.7, 1, 1.5, 2(2) σ=0.5, μ=1,2,3,4

(1)命令:x=-6:0.1:6;y1=normpdf(x,3,0.5);y2=normpdf(x,3,0.7);y3=normpdf(x,3,1);y4=normpdf(x,3,1.5);y5=normpdf(x,3,2); plot(x,y1,'.',x,y2,'+',x,y3,'*',x,y4,'d',x,y5)

Page 26: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

26 西安电子科技大学

例 观察正态分布参数对密度曲线的影响。解:>> clear

mu1=2.5;mu2=3;sigma1=0.5;sigma2=0.6;x=(mu2-4*sigma2):0.01:(mu2+4*sigma2);

y1=normpdf(x,mu1,sigma1); %考察均值的影响y2=normpdf(x,mu2,sigma1);

y3=normpdf(x,mu1,sigma1); %考察方差的影响y4=normpdf(x,mu1,sigma2);

Page 27: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 27

subplot(1,2,1) %考察结果的可视化plot(x,y1,'-g',x,y2,'-b')xlabel('\fontsize{12}μ1<μ2,σ1=σ2' )legend('μ1','μ2')subplot(1,2,2)plot(x,y3,'-g',x,y4,'-b')xlabel('\fontsize{12}μ1=μ2,σ1<σ2' )legend('σ1','σ2')

0 2 4 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

μ1<μ2,σ1=σ2

μ1μ2

0 2 4 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

μ1=μ2,σ1<σ2

σ1σ2

计算正态分布的累积概率值例,设 X~N(4,32), P{3<X<6}, P{X>3}

调用函数 normcdf(x,μ,σ)

返回函数值F ( x )=∫−∞

x

f (t)dt

解:>> p1=normcdf(6,4,3)-normcdf(3,4,3)

p1 = 0.3781>> p2=1-normcdf(3,4,3)

p2 = 0.6306

例 正态分布参数 μ 和 σ 对变量 x 取值规律的约束——3σ准则。解:>> clear,clf %(标准)正态分布密度曲线下的面积X=linspace(-5,5,100);

Page 28: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

28 西安电子科技大学

Y=normpdf(X,0,1);yy=normpdf([-3,-2,-1,0,1,2,3],0,1);plot(X,Y,'k-',[0,0],[0,yy(4)],'c-.')hold onplot([-2,-2],[0,yy(2)],'m:',[2,2],[0,yy(6)],'m:',[-2,-0.5],[yy(6),yy(6)],'m:',[0.5,2],[yy(6),yy(6)],'m:')plot([-1,-1],[0,yy(3)],'g:',[1,1],[0,yy(5)],'g:',[-1,-0.5],[yy(5), yy(5)],'g:',[0.5,1],[yy(5),yy(5)],'g:')plot([-3,-3],[0,yy(1)],'b:',[3,3],[0,yy(7)],'b:',[-3,-0.5],[yy(7),yy(7)],'b:',[0.5,3],[yy(7),yy(7)],'b:')hold offtext(-0.5,yy(6)+0.005,'\fontsize{14}95.44%')text(-0.5,yy(5)+0.005,'\fontsize{14}68.26%')text(-0.5,yy(7)+0.005,'\fontsize{14}99.74%')text(-3.2,-0.03,'\fontsize{10}μ-3σ')text(-2.2,-0.03,'\fontsize{10}μ-2σ')text(-1.2,-0.03,'\fontsize{10}μ-σ')text(-0.05,-0.03,'\fontsize{10}μ')text(0.8,-0.03,'\fontsize{10}μ+σ')text(1.8,-0.03,'\fontsize{10}μ+2σ')text(2.8,-0.03,'\fontsize{10}μ+3σ')

-5 -4 -3 -2 -1 0 1 2 3 4 50

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

95.44%

68.26%

99.74%

μ-3σ μ-2σ μ-σ μ μ+σ μ+2σ μ+3σ

6. 随机变量的数学期望和方差对于任意的分布,可用 Matlab 中的函数和运算编程实现

Page 29: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 29

对于给定的分布,只需给出分布的参数,即可调用 stat族函数,得出数学期望和方差,调用格式[E,D]=分布+stat(参数)

例:求二项分布参数 n=100,p=0.2 的数学期望和方差:解:>>n=100;

>>p=0.2; >>[E,D]=binostat(n,p);

结果显示:E= 20

D= 16

例 绘制正态分布的密度函数、分布函数曲线,并求均值与方差解:>> clearmu=2.5;sigma=0.6;x=(mu-4*sigma):0.005:(mu+4*sigma);y=normpdf(x,mu,sigma);f=normcdf(x,mu,sigma);plot(x,y,'-g',x,f,':b')[M,V]=normstat(mu,sigma)legend('pdf','cdf',-1)

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 50

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

pdfcdf

Page 30: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

30 西安电子科技大学

从图中可以看出,正态密度曲线是关于 x=μ 对称的钟形曲线(两侧在 μ±σ 处各有一个拐点),正态累积分布曲线当 x=μ 时 F(x)=0.5。M=2.5000V=0.3600

7. 逆累积分布函数逆累积分布函数就是返回给定概率条件下的自变量的临界值,实际上是分布函数的逆函数。

icdf(Inverse Cumulative Distribution Function)

即:在分布函数 F(x)=p 中已知 p 求其相对应的 x 的值 调用:在分布函数名后加 inv

如:X=norminv(p,mu,sgm)

也有 2)X=icdf(‘name’,p,A1,A2,A3), 其 中 name 为 相 应 的 函 数名,如‘normal’;p 为给定的概率值;

A1,A2,A3 为相应的参数例、计算标准正态分布 N(0,1)概率值 0.1,0.3,0.5,0.7,0.9,所对应的 x 的值命令:y=0.1:0.2:0.9;x=norminv(y,0,1)

结果:x=-1.2816 -0.5244 0 0.5244 1.2816

检验:y1=normcdf(x,0,1);

y1=0.1000 0.3000 0.5000 0.7000 0.9000

例、计算二项分布 b(10,0.5)概率值 0.1,0.3,0.5,0.7,0.9,所对应的 x 的值命令:p=0.1:0.2:0.9;x=binoinv(p,10,0.5)

Page 31: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 31

结果:x=3 4 5 6 7

检验:y1=binocdf(x,10,0.5);

结果:y1=0.1719 0.3770 0.6230 0.8281 0.9453

在离散分布情形下,icdf 返回使 cdf(x)p 的第一个值 x

上例中,对 p=0.1,对应 cdf(x)0.1 的第一个值为 3,故返回值为 3

B(10,0.5)的分布函数图像

7.逆累积分布函数-上分位点定义:上 α 分位点:设随机变量 X 的分布函数为:F(x),如果实数xα满足 P(X>xα)= α ,则称xα为上 α 分位点例 14、计算自由度为 8 的卡方分布的上 α 分位点,其中 α=0.1,0.05,0.025

命令:x=[0.1,0.05,0.025];y=chi2inv(1-x,8)

结果:y=13.3616 15.5073 17.5345

Page 32: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

32 西安电子科技大学

例 标准正态分布 α 分位数的概念图示。解 >> %α 分位数示意图(标准正态分布,α=0.05)clear,clfdata=normrnd(0,1,300,1);xalpha1=norminv(0.05,0,1);xalpha2=norminv(0.95,0,1);xalpha3=norminv(0.025,0,1);xalpha4=norminv(0.975,0,1);subplot(3,1,1)capaplot(data,[-inf,xalpha1]);axis([-3,3,0,0.45])subplot(3,1,2)capaplot(data,[xalpha2,inf]);axis([-3,3,0,0.45])subplot(3,1,3)capaplot(data,[-inf,xalpha3]);axis([-3,3,0,0.45])hold oncapaplot(data,[xalpha4,inf]);axis([-3,3,0,0.45])hold offxalpha1 xalpha2 xalpha3 xalpha4

-3 -2 -1 0 1 2 30

0.2

0.4

Probability Between Limits = 0.063571

-3 -2 -1 0 1 2 30

0.2

0.4

Probability Between Limits = 0.058995

-3 -2 -1 0 1 2 30

0.2

0.4

Probability Between Limits = 0.031504

xalpha1 = -1.6449xalpha2 = 1.6449xalpha3 = -1.9600 xalpha4 = 1.9600

8. 中心极限定理例 1 利用随机数样本验证中心极限定理

Page 33: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 33

独立同分布的随机变量的和的极限分布服从正态分布,通过产生容量为 n 的 poiss 分布和 exp 分布的样本,研究其和的渐近分布。

算法如下: ① 产生容量为 n 的独立同分布的随机数样本,得其均值和标准差; ② 将随机数样本和标准化; ③ 重复①、②; ④ 验证所得标准化的随机数样本和是否服从标准正态分布

>> clearn=2000;means=0;s=0;y=[];lamda=4;a=lamda;for i=1:n

r=poissrnd(a,n,1);%可换成 r=exprnd(a,n,1); means=mean(r);%计算样本均值 s=std(r);%计算样本标准差 y(i)=sqrt(n).*(means-a)./sqrt(s);end

normplot(y);%分布的正态性检验title('poiss 分布,中心极限定理')

Page 34: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

34 西安电子科技大学

-5 -4 -3 -2 -1 0 1 2 3 4 5

0.0010.0030.010.020.050.10

0.25

0.50

0.75

0.900.950.980.99

0.9970.999

Data

Pro

babi

lity

poiss分布,中心极限定理

-6 -4 -2 0 2 4 6 8

0.0010.0030.010.020.050.10

0.25

0.50

0.75

0.900.950.980.99

0.9970.999

Data

Pro

babi

lity

exp分布,中心极限定理

棣莫弗-拉普拉斯定理的应用Galton钉板模型和二项分布

Galton钉板试验是由英国生物统计学家和人类学家 Galton 设计的。故而得名。

通过模拟 Calton钉板试验,观察和体会二项分布概率分布列的意义、形象地理解 De Moivre -Laplace 中心极限定理。

Page 35: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 35

模拟 Galton钉板试验的步骤: (1) 确定钉子的位置:将钉子的横、纵坐标存储在两个矩阵 X 和 Y 中。 (2) 在 Galton钉板试验中,小球每碰到钉子下落时都具有两种可能性,设向右的概率为 p,向左的概率为 q=1-p,这里 p=0.5,表示向左向右的机会是相同的。模 拟 过 程如下:首先产 生 一 均 匀 随 机 数 u ,这只需调用 随 机 数 发 生器指令rand(m,n)。rand(m,n)指令:用来产生 m×n 个(0,1)区间中的随机数,并将这些随机数存于一个m×n 矩阵中,每次调用 rand(m,n)的结果都会不同。如果想保持结果一致,可与rand(‘seed’,s)配合使用,这里 s 是一个正整数,例如>> rand('seed',1),u=rand(1,6)

u = 0.5129 0.4605 0.3504 0.0950 0.4337 0.7092

而且再次运行该指令时结果保持不变。除非重设种子 seed 的值,如>> rand('seed',2),u=rand(1,6)

u = 0.0258 0.9210 0.7008 0.1901 0.8673 0.4185

这样结果才会产生变化。将[0,1]区间分成两段,区间[0,p)和[p,1]。如果随机数 u属于[0,p),让小球向右落下;若 u属于[p,1] ,让小球向左落下。将这一过程重复 n 次,并用直线连接小球落下时所经过的点,这样就模拟了小球从顶端随机地落人某一格子的过程。 (3) 模拟小球堆积的形状。输入扔球次数 m(例如m=50、100、500等等),计算落在第 i 个格子的小球数在总球数 m 中所占的比例,这样当模拟结束时,就得到了频率用频率反映小球的堆积形状(4)用如下动画指令制作动画: movien(n):创建动画矩阵;制作动画矩阵数据; Getframe:拷贝动画矩阵;

Page 36: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

36 西安电子科技大学

movie(Mat, m):播放动画矩阵 m 次。 M文件如下:解:>> clear,clf,m=100;n=5;y0=2;%设置参数ballnum=zeros(1,n+1);p=0.5;q=1-p;

for i=n+1:-1:1 %创建钉子的坐标 x,y

x(i,1)=0.5*(n-i+1); y(i,1)=(n-i+1)+y0; for j=2:ix(i,j)=x(i,1)+(j-1)*1; y(i,j)=y(i,1); endend

mm=moviein(m); %动画开始,模拟小球下落路径for i=1:m

s=rand(1,n); %产生 n 个随机数 xi=x(1,1);yi=y(1,1);k=1;l=1; %小球遇到第一个钉子 for j=1:n

plot(x(1:n,:),y(1:n,:),‘o’,x(n+1,:),y(n+1,:),‘.-’),%画钉子的位置axis([-2 n+2 0 y0+n+1]),hold on

k=k+1; %小球下落一格 if s(j)>p

l=l+0;%小球左移 else

l=l+1;%小球右移 end

xt=x(k,l);yt=y(k,l);%小球下落点的坐标 h=plot([xi,xt],[yi,yt]);axis([-2 n+2 0 y0+n+1]) %画小球运动轨迹 xi=xt;yi=yt; end

ballnum(l)=ballnum(l)+1; %计数 ballnum1=3*ballnum./m;

Page 37: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 37

bar([0:n],ballnum1),axis([-2 n+2 0 y0+n+1]) %画各格子的频率 mm(i)=getframe; %存储动画数据 hold offend

movie(mm,1) %播放动画一次

-2 -1 0 1 2 3 4 5 6 70

1

2

3

4

5

6

7

8

-2 -1 0 1 2 3 4 5 6 70

1

2

3

4

5

6

7

8

Page 38: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

38 西安电子科技大学

-2 -1 0 1 2 3 4 5 6 70

1

2

3

4

5

6

7

8

-2 -1 0 1 2 3 4 5 6 70

1

2

3

4

5

6

7

8

-2 -1 0 1 2 3 4 5 6 70

1

2

3

4

5

6

7

8

Page 39: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 39

-2 -1 0 1 2 3 4 5 6 70

1

2

3

4

5

6

7

8

-2 -1 0 1 2 3 4 5 6 70

1

2

3

4

5

6

7

8

……

第三部分: 数理统计

数理统计1. Matlab 统计工具箱中常见的统计命令2. 直方图和箱线图实验3. 抽样分布实验4. 参数估计和假设检验实验Matlab 统计工具箱中常见的统计命令

Page 40: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

40 西安电子科技大学

1、基本统计量对于随机变量 x,计算其基本统计量的命令如下:

均值:mean(x) 标准差:std(x)

中位数:median(x) 方差:var(x)

偏度:skewness(x) 峰度:kurtosis(x)

2、频数直方图的描绘A、给出数组 data 的频数表的命令为: [N,X]=hist(data,k)

此命令将区间[min(data),max(data)]分为 k 个小区间(缺省为 10),返回数组 data落在每一个小区间的频数 N 和每一个小区间的中点 X。

B、描绘数组 data 的频数直方图的命令为: hist(data,k)

3、参数估计 A、对于正态总体,点估计和区间估计可同时由以下命令获得: [muhat,sigmahat,muci,sigmaci]=normfit(x,alpha)

此命令在显著性水平 alpha下估计 x 的参数(alpha缺省值为 5%),返回值 muhat 是均值的点估计值,sigmahat 是标准差的点估计值,muci

是均值的区间估计,sigmaci 是标准差的区间估计。 B、对其他分布总体,两种处理办法:一是取容量充分大的样本,按中心极限定理,它近似服从正态分布,仍可用上面估计公式计算;二是使用特定分布总体的估计命令,常用的命令如:

[muhat,muci]=expfit(x,alpha) [lambdahat, lambdaci]=poissfit(x,alpha) [phat, pci]=weibfit(x,alpha)

4、正态总体假设检验 A、单总体均值的 z 检验: [h,sig,ci]=ztest(x,m,sigma,alpha,tail)

Page 41: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 41

检验数据 x 关于总体均值的某一假设是否成立,其中 sigma 为已知方差,alpha 为显著性水平,究竟检验什么假设取决于 tail 的取值:

tail=0,检验假设“x 的均值等于m”

tail=1,检验假设“x 的均值大于m”

tail=-1,检验假设“x 的均值小于m”

tail 的缺省值为 0, alpha 的缺省值为 5%。 返回值 h 为一个布尔值,h=1 表示可拒绝原假设, h=0 表示不可拒绝原假设,sig 为假设成立的概率,ci 为均值的 1- alpha 置信区间。

B、单总体均值的 t 检验: [h,sig,ci]=ttest(x,m,alpha,tail)

C、双总体均值的 t 检验: [h,sig,ci]=ttest2(x,y,alpha,tail)

5、非参数检验:总体分布的检验 Matlab 统计工具箱提供了两个对总体分布进行检验的命令: A、 h=normplot(x)

此命令显示数据矩阵 x 的正态概率图,如果数据来自于正态分布,则图形显示出直线形态,而其他概率分布函数显示出曲线形态。

B、h=weibplot(x)

此命令显示数据矩阵 x 的 Weibull 概率图,如果数据来自于 Weibull 分布,则图形显示出直线形态,而其他概率分布函数显示出曲线形态。

例 1 在同一坐标轴上画 box 图,并对两个班的成绩进行初步的分析比较。两个教学班各 30名同学,在数学课程上,A班用新教学方法组织教学,B班用传统方法组织教学,现得期末考试成绩如下。

Page 42: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

42 西安电子科技大学

A :8

2,92,77,62,70,36,80,100,74,64,63,56,72,78,68,65,72.70,5

8,92,79,92,65,56,85,73,61,71,42,89

B:57,67,64,54,77,65,71,58,59,69,67,84,63,95,81,46,49,

60, 64,66,74,55,58,63,65,68,76,72,48,72

解 >> clear

x=[82,92,77,62,70,36,80,100,74,64,63,56,72,78,68,65,72,70,58,92,79,92,65,56,85,73,61,71,42,89,57,67,64,54,77,65,7158,59,69,67,84,63,95,81,46,49,60,64,66,74,55,58,63,65,68,76,72,48,72]; boxplot(x')

40

50

60

70

80

90

100

1 2

从图中直观地看出,两个班成绩的分布是正态(对称)的,A班成绩较为分散(方差大),B班成绩则较集中(方差小)。A班成绩明显高于 B班(均值比较.并且 A班 25%低分段上限接近 B班中值线,A班中值线接近 B班 25%高分段下限)。A班的平均成绩约为 70 分(中值),B班约为 65 分(中值)。A班有一名同学的成绩过低(离群),而 B班成绩优秀的只有一人(离群)。需要注意的是,从图中我们不能得出新教学方法一定优于传统教学方法的结论,因

Page 43: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 43

为我们并不知道两个班级原有的数学基础是怎样的。例 2 用模拟试验的方法直观地验证教材§6.3抽样分布定理一的结论。 假定变量X ~ N (60 ,52),用随机数生成的方法模拟对 的 500 次简单随机抽样,每个样本的容量为 16。利用这 500×16 个样本数据直观地验证样本均值 的抽样分布为均值等于 60、方差等于 25/16 的正态分布,即

X ~ N (60 ,1. 252)

解 >> %1、用随机数生成的方法模拟简单随机抽样x=[];%生成一个存放样本数据的空表(维数可变的动态矩阵)for byk=1:500 %循环控制,循环执行下面的指令 500 次,本例中相当于 500 次抽样xx=normrnd(60,5,16,1);%生成一个来自 N(60,25)的容量为 16 的样本(列向量)x=[x,xx]; %将样本数据逐列存入数表 x,可从 matlab 的变量浏览器(workspace)中观察这个数表end

%2、计算每个样本的样本均值(1~500)xmean=mean(x);%可从变量浏览器中观察这 500 个数据

%3、绘制 500 个样本均值数据的直方图 k=ceil(1.87*(length(x)-1)^(2/5));%确定分组数

h=histfit(xmean,k);%绘制附正态参考曲线的数据直方图set(h(1),'FaceColor','c','EdgeColor','w')%修饰,设置直方图线条颜色与填充色

%4、用这 500 个样本均值数据验证样本均值的均值和方差M=mean(xmean) %求(1~500)样本的样本均值的均值V=var(xmean)%求(1~500)样本的样本均值的方差

Page 44: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

44 西安电子科技大学

Page 45: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 45

例 3 观察:用 binornd 模拟 5000 次投球过程,观察小球堆积的情况。>> clear;clf, n=5;p=0.5;m=5000;x=[0:1:n]rand('seed',3)

R=binornd(n,p,1,m);%模拟服从二项分布的随机数,相当于模拟 投球m 次for I=1:n+1 %开始计数 k=[ ];

k=find(R==(I-1));%find 是一个有用的指令,本语句的作用是找出 R 中等于(I-1)元素下标,并赋予向量 k 中 h(I)=length(k)/m;%计算落于编号(I-1)的格子中的小球频率

end

bar(x,h),axis([-1 6 0 1])%画频率图title('\fontsize{18}\fontname{华文新魏}5000 次投球小球堆积的频率图')

Page 46: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

46 西安电子科技大学

Page 47: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 47

>> f=binopdf(x,n,p), bar(x,f), axis([-1 6 0 1])

title('\fontsize{18}\fontname{华文新魏}B(5,0.5)理论分布图')

3. 抽样分布三、MATLAB也为常用的三大统计分布提供了相应的 pdf、cdf、inv、stat、rnd类函数,具体分布类型函数名称如下: 分布类型 MATLAB名称

2 分布 chi2

t 分布 tF 分布 f非中心2 分布 ncx2

非中心 t 分布 nct

非中心 F 分布 ncf

Page 48: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

48 西安电子科技大学

例 4 2 分布的密度函数曲线解: >> %绘制不同自由度的卡方分布概率密度曲线

clear,clfX=linspace(0,20,100);

Y1=chi2pdf(X,1);%自由度等于 1

Y2=chi2pdf(X,3);%自由度等于 3

Y3=chi2pdf(X,6);%自由度等于 6

plot(X,Y1,'-g',X,Y2,'-b',X,Y3,'-k')

title('\fontsize{18}\fontname{华文新魏}不同自由度的{\chi}^2 分布概率密度曲线的比较')

text(0.6,0.6,'\fontsize{12}df:n=1')text(2.6,0.2,'\fontsize{12}df:n=3')text(8.6,0.09,'\fontsize{12}df:n=6')legend('df:n=1','df:n=3','df:n=6')

例 5 t 分布的密度函数曲线。

Page 49: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 49

解:>> %绘制 t 分布概率密度曲线clear,clfX=linspace(-4,4,100);Y0=normpdf(X,0,1);%标准正态分布Y1=tpdf(X,45);%自由度为 45Y2=tpdf(X,4);%自由度为 4Y3=tpdf(X,2);%自由度为 2YY0=normpdf(0,0,1);plot(X,Y0,'.b',X,Y1,'-c',X,Y2,'-m',X,Y3,'-k',[0,0],[0,YY0],':r')title('\fontsize{18}\fontname{华文新魏}不同自由度的 t 分布概率密度曲线')legend('N(0,1)','df:n=45','df:n=4','df:n=2')

例 6 F 分布的密度函数曲线。解:>> %绘制 F 分布概率密度曲线clear,clfX=linspace(0,6,100);

Y=fpdf(X,10,5);%自由度为 10,5

plot(X,Y)text(1.5,0.55,'\fontsize{14}df:n1=10,n2=5')

Page 50: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

50 西安电子科技大学

0 1 2 3 4 5 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7

df:n1=10,n2=5

例 7 自由度对 F 分布的密度函数曲线的影响。解:>>clear,clf

X=linspace(0,6,100);

Y11=fpdf(X,100,10);%自由度为 100,10

Y12=fpdf(X,5,10);%自由度为 5,10

Y21=fpdf(X,10,100);%自由度为 10,100

Y22=fpdf(X,10,5);%自由度为 10,5

subplot(2,1,1)plot(X,Y11,X,Y12)legend('df:n1=100,n2=10','df:n1=5,n2=10')

title('\fontsize{18}\fontname{华文新魏}不同自由度的 F 分布概率密度曲线')

subplot(2,1,2)plot(X,Y21,X,Y22)legend('df:n1=10,n2=100','df:n1=10,n2=5')

Page 51: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 51

例 8 机械零件的可靠度计算问题。设计一个拉杆,其所受外力均值为 20000N,标准差为 2000N,拉杆半径 D 均值为20mm,标准差为 0.5mm,材料强度 δ 均值为 412MPa,标准差为 15.6MPa,计算其可靠度。

问题分析:

拉杆应力表达式:S=4 Pπd2 ,其中拉力 P 和尺寸公差 d 是影响 S 的独立正态分布

随机变量,其均值和标准差皆已知:μP=20000N,σ P=2000N;μd=20mm,σd=0.5mm

拉杆材料强度(许用应力)δ 亦是服从正态分布的随机变量,均值和标准差皆已知:

μδ=412MPa,σ δ=15. 6MPa

Page 52: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

52 西安电子科技大学

根据材料力学中的应力强度理论进行分析计算(过程略),得可靠度的结果为:0.9999999约等于 1。

通过多次蒙特卡洛试验,统计可靠零件个数,求出其占总零件数的比值,即为可靠度。

>> N=100000;St=0;P_mean=20000;P_sigma=2000;D_mean=20;D_sigma=0.5;Q_mean=412*10^6;Q_sigma=15.6*10^6;for i=1:N p=P_mean+P_sigma*randn(1); d=D_mean+D_sigma*randn(1); q=Q_mean+Q_sigma*randn(1); s=(4*p)/(pi*d^2); if s<=q St=St+1; end

Page 53: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 53

endSt_p=St/N;

fprintf('可靠度为:%f\n',St_p) 可靠度为:1.000000

2. 参数估计和假设检验例 9 一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障。故障是完全随机的,并假定生产任一零件时出现故障机会均相同,工作人员是通过检查零件来确定工序是否出现故障的。现积累有 100 次故障纪录,故障出现时该刀具完成的零件数如下:

459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 49 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851

试观察该刀具出现故障时完成的零件数属于哪种分布?>> %数据输入x1=[459 362 624 542 509 584 433 748 815 505];x2=[612 452 434 982 640 742 565 706 593 680];x3=[926 653 164 487 734 608 428 1153 593 844];x4=[527 552 513 781 474 388 824 538 862 659];x5=[775 859 755 49 697 515 628 954 771 609];x6=[402 960 885 610 292 837 473 677 358 638];x7=[699 634 555 570 84 416 606 1062 484 120];x8=[447 654 564 339 280 246 687 539 790 581];x9=[621 724 531 512 577 496 468 499 544 645];x10=[764 558 378 765 666 763 217 715 310 851];x=[x1 x2 x3 x4 x5 x6 x7 x8 x9 x10];

%作频数直方图hist(x,10)[N,X]=hist(x,10)

%分布的正态性检验normplot(x)

Page 54: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

54 西安电子科技大学

N = 3 3 7 14 24 22 14 8 3 2X = 1.0e+003 * 0.1042 0.2146 0.3250 0.4354 0.5458 0.6562 0.7666 0.8770 0.9874 1.0978

>> %参数估计[muhat,sigmahat,muci,sigmaci]=normfit(x)muhat = 594

Page 55: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 55

sigmahat = 204.1301muci = 553.4962 634.5038sigmaci = 179.2276 237.1329

刀具寿命服从正态分布,均值估计值为 594,方差估计值为 204.1301,均值的95% 置 信 区 间 为 [553.4962 , 634.5038] , 方 差 的 95% 置 信 区 间 为[179.2276,237.1329]

%假设检验[h,sig,ci]=ttest(x,594)%已知刀具寿命服从正态分布,方差未知的情况下,检验寿命均值是否等于 594。h = 0sig = 1ci = 553.4962 634.5038

检验结果:布尔变量 h=0,表示不可拒绝原假设,说明假设寿命均值等于 594 是合理的。 95%置信区间为[553.4962,634.5038]完全包括 594,估计精度较高。sig = 1远超过 0.05,不可拒绝原假设所以可以认为刀具平均寿命为 594(件)

第四部分:随机变量分布的关联与生成

四、随机变量分布的关联与生成1. 随机变量的取值范畴、分布函数及几何特征2. RV 分布的关联及随机模拟生成算法原理1. RV 的取值范畴、分布函数及几何特征

连续型和离散型随机变量概率分布的取值范围和几何特征表 1 连续型分布函数(密度函数)的形态与取值范畴分类表

Page 56: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

56 西安电子科技大学

ba, f x 对 称 ,

= ,a b 或 =R

( )f x 偏态, a,

对应的分 布类名

babaSbaU

,;,,,

2

,

,

,

,

,

U a b

S a b

N

t n

Cauchy b

Laplace b

2

2

2n

1 1 2

, , , ,

, , ,

, ,

, ,

m b Pareto m

Weibull m b LN

Rayleigh b JN

E n

E b F n n

对应分布密

度 xf 的几

何形态 o a b

f x

ox

f x

b bxx

f x f x

o

表 2 离散型随机变量分布及其取值个数分类表

的可

能取值

个数

对应的分布律 kP

K的物理内涵

有限

1-

-

1 11

1 21 2

=1

~B 1, , , 1- , 0, 1

~B n,p , , 0,1, ,

1 ( , ) 1!~ , , , ,

! !

1~

1 1, , ,

k k

k n k

r rr

i i

k k krr

r

i

p P k p q q p k

nP k p q k n

k

n B n p B pnB n p P k k p p p

k k

k i r k n

r B n p n p

当 时, 即二点分布 ,

非零整数

当 时, 即B

1次 B试验中事件 A出现的次数

n次 B试验中事件 A出现的次数 n次 B试验中事件 iA分别取 ki次

数 i=1,2 …, ,r; 1i

r

ik n

这里 B 试验指伯努利试验表 2 离散型随机变量分布及其取值个数分类表(续表)

Page 57: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 57

的可

能取值

个数

对应的分布律 kP

K的物理内涵

可列

1

-

-

~ ,P , 1 , 1, 2,

~ ,

-1, 1- , , 1,

-1

1 ascal 1

~ , 0, 0,1,2,!

k

r k r

k

G p k q p q p k

Pascal r p

kP k p q q p k r r

r

r P p G p

Poisson P k e kk

又称负二项分布

当 时, , 即 几何分布

任意次 B试验中事件 A首次

出现的试验次数

任意次 B试验中,事件 A首

次出现 r次时的实验次数

在给定时间区间内到达某区

域的随机质点数

2. RV 分布的关联及随机模拟生成算法原理给出各种分布之间相互生成的关系随机变量 RV 各种分布的关联关系图

由正态分布 可生成的一些概率分布

Page 58: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

58 西安电子科技大学

Page 59: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 59

(4)若 1 2 n, . .X X X i i d, , 且 i ~ 0,1X N , 作2

1

n

iiX

,则 n2~

其中

2

-1-2

222

1 xn

n exn

xf

, 0x ,n为正整数

(5)若 1 ~ 0,1X N , 22 ~X n ,且相互独立,作

1

2

=/

XX n

,则 ~t n

其中

+1-2 2

+12= 1+

/2

nnxf xnn n

,n正整数

(6)若 ~n t n, =1,2,n 则有

2- 2

-1lim =2n

tx

nF x e dt ∫

即 n 的极限分布为标准正态分布

(7)若

21+1

2= exp -C xf x C

, >-1 ,则称 ~G , 广义 Gauss分布,

其中

12

1 32

3 1+2=

11+ 1+2

C

1

1+

23 1= 1+ 1+2 2

C

为伽马函数。

当 =0 时 G , 即为 20,N 分布,当 =1 时 G , 成为 Laplace分布,

当 -1 时, G , 趋于均匀分布

Page 60: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

60 西安电子科技大学

(8)若 1 2, , , , ,i i d ,且 ~ii F x , =iE , 2=iVar ,作

=1

-=

n

ii

n

n

n

则 有 -

2- 21lim =

2

x

n

t

nF x e dt ∫ , 特 殊 地 ~U a,bi += =2ia bE

2= - 12iVar b a ,则仍有如上结论。

(9) ~PX ,当 9 时取 -Z k

则有近似式 =1-P X k z ,

为 Laplace函数

(10) 1 2~ ,F n n ,则有

-12

2- 21lim =

2

x

nn

tF x e dt

∫ .

表 3 U(0, 1)及其常见分布与抽样公式

表 3 U(0, 1)及其常见分布与抽样公式(续表)

Page 61: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 61

常见连续型 RV 随机数抽样公式关联图

表 4 正态分布与各有关分布的关联关系表

几种常见分布及与相关分布的关系

Page 62: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

62 西安电子科技大学

-1 -= - exp -

mm x bmf x x b

, x b , 0b ,m为正整数

当 =1m 时, 1, ,bWeib 即双参数指数分布 1 ,E b

当 =2m 时, 2, ,bWeib 成为极值分布 ,Max b

,

-1 -= xf x x e

, 0x , >0

当 =1 时, 11, =E

当 =n 正整数时, , = nn E

当 =2n ,

1=2

时, 21, =2 2n n

, ; ,a b

-1 -1+ -1

1= - -- ,

f x x a b xb a B

, a x b , >0 , >0

当 =0a , =1b 时有 ~ , ,即 -1-11= 1-,

f x x xB

, 0,1x

当 1 时有 (1,1; , ) ( , )a b a b

当12

或21

时, ( ) 分布即成为三角分布 S

, ; , :a b

Page 63: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

概率论与数理统计课程教案 63

若 2X~ m , 2~Y n 且 X 与 Y 相互独立,则有

= ~ ,2 2

X m nX Y

若 1 2 +, , , , . .m m nX X X X i i d 且 2~ 0,jX N , 则 有

+2 2

=1 =1

= ~ ,2 2

m m n

j jj j

m nX X

课后作业 1. 利用实验 3 求自然对数底 e,精确到 2.71828,并给出得到该精确值时的实验次数2. 求 15 个人中至少两人生日相同的概率3. 已知二项分布 Xb(15,0.2)

求: (1) 分布率和分布函数值,并画出曲线 (2) 求该分布的数学期望和方差 (3) 计算分布函数值为 0.1,0.4,0.7 时对应的 x 值 (4) 验证 50 个该分布的随机样本的和的标准化变量服从标准正态分布4. 对于正态分布: (1)给出 N(2,9)的密度曲线和分布函数曲线 (2)在同一图上划出均值为 2,标准差为 0.5,0.7,1,2 的密度曲线 (3)已知=0.05,求 N(0,1)的上分位点.

5. 画出例 4、例 5 和例 6 中2 分布的图形

Page 64: jpkc.xidian.edu.cnjpkc.xidian.edu.cn/.../soft/teaching/plan24-0901.docx · Web view的近似值 解:设针与平行线的夹角为 (0),针的中心与最近直线的距离为

64 西安电子科技大学

自由度为 1,3,5,7,100

课后小结 以下几个方面应该给出更为准确清晰的讲解: