統計学 11/13 (月)
description
Transcript of 統計学 11/13 (月)
1
統計学11/13 (月)
担当:鈴木智也
2
講義の全体構成
第1部 記述統計:データの特性を記述第2部 確率論:推測統計への橋渡し
確率論入門確率変数と確率分布 主な確率分布 ←ここ!
☆ 中間試験はここまで第3部 推測統計:データから全体像を推
測
3
主な確率分布
• 二項分布(離散型)これが基本型。
• ポアソン分布(離散型)二項分布から導出できる。
• 正規分布(連続型)これも二項分布から導出できる。
4
二項分布とは
☆ 結果が二通り(例: S か F )しかない実験• 結果が S となる確率を p で表す。• 結果が F となる確率は、 q ( =1 - p )であ
る。• この実験を n 回行い、結果が S となる回数
を X とする。⇒X は確率変数であり、その分布は二項分布
( n, p )に従う。
5
二項分布:例題
• 実験:じゃんけん• その結果 S =勝つ
F =勝たない(負け、あいこ)• 勝つ確率: p = 1/3 勝たない確率: q=2/3
Q :3回のじゃんけんで 1 回勝つ確率は?(n=3 、 x=1)
6
二項分布:例題の答え• ケース A :一回目に勝つ場合の確率 ( 1/3 ) × ( 2/3 ) × ( 2/3 ) = ( 1/3 ) ×
( 2/3 ) 2
• ケース B :二回目に勝つ場合の確率( 2/3 ) × ( 1/3 ) × ( 2/3 ) = ( 1/3 ) × ( 2/
3 ) 2
• ケース C :三回目に勝つ場合の確率( 2/3 ) × ( 2/3 ) × ( 1/3 ) = ( 1/3 ) × ( 2/
3 ) 2
注: A 、 B 、 C は互いに排反。⇒ 3回中1回だけ勝つ確率は、 3× ( 1/3 ) × ( 2/3 ) 2
。
7
二項分布の公式
• X = xj という値を取る確率は
P(xj)=nCx px qn-x =for j=1,…,n.
• nCx は、 n 個のものから x 個のものを選び出す公式であり、 nCx = n!/{x!(n-x)!} 。
• 注: n! は n の階乗であり、n!=n×(n-1) ×(n-2) ×…×2×1 である。
8
二項分布:期待値と分散
確率変数 X が二項分布に従う場合、• 期待値: E(X)=np
• 分散: V(X)=npq=np(1-p)
(証明は略)例:3回のじゃんけんで勝つ回数の期待
値は1回。
9
二項分布からポアソン分布へ☆ 次のような例を考えよう。• 不動産業界で大型契約が成立する確率
は低い。→ p=0.001 ( =0.1% )とする。
• 1000 人の顧客と商談を行った( n=1000 )ときに、 5 件の大型契約を成功させる確率はいくらか?
⇒ 理論上は、ポアソン分布で計算できる。P(X=5) =1000C5 0.0015 0.99995
。
10
二項分布からポアソン分布へ②
• しかし、現実には計算が煩雑すぎる。( 1000C5 がいくつになるか試算してみよ。)
• この例のように、 n→∞ 、 p→0 の場合、 np→m (定数)
なら、二項分布はポアソン分布で近似する。
注:“ A→B” は「 A の値が B に近づく」と読む。
11
ポアソン分布の公式
二項分布において、 n→∞ 、 p→0 の場合、 X = xj の確率は
P(xj)=(mxe-m)/x!
で近似的に計算できる。
(注)なお、 e は指数であり、 m= np である 。
12
ポアソン分布:期待値と分散
• 確率変数 X がポアソン分布に従う場合、• 期待値: E(X)=m
• 分散: V(X)=m
証明:二項分布の場合、期待値が np であることから、ポアソン分布での期待値は m となる。分散も同様に証明できる。
13
正規分布
• 連続型の確率分布で中心となるのが「正規分布( Normal Distribution) である。
• 正規分布は、期待値 μ を挟んで左右対称で、釣鐘型(教科書 P.163 の図)。
☆ 特徴:期待値 μ と分散 σ2 が分れば、正規分布の形状は把握できる。
14
標準正規分布
• 確率変数 X が、期待値 μ で分散 σ2 の正規分布に従うとする。X ~ N ( μ , σ2 )
• このとき、 X は次のように「標準化」できる。Z= ( X - μ ) /σ ~ N ( 0 , 1 )
• 期待値 0 で分散が 1 の正規分布を「標準正規分布」(←この分布は頻出)と呼ぶ。
15
標準正規分布 N ( 0 , 1 )の性質
• どのような正規分布であっても、前頁の式によって、 N ( 0 , 1 )に変換できる。
⇒ N ( 0 , 1 )の性質を調べればよい。• Z ~ N ( 0 , 1 )のとき、確率変数 Z が
z という値を取る確率を P で表すと、P(-1.96 < z < 1.96) = 0.95P(z >1.96) =0.025, P(z<-1.96) =0.025
であることが知られている。
16
正規分布と二項分布の関係
☆ 二項分布 Bi ( n,p )で• n→∞, p→0 のとき、二項分布は
ポアソン分布で近似できる。
• n→∞ で、 p が小さくないとき、二項分布は
正規分布で近似できる。
17
第 3 部にむけて
第3部で習う重要なことがらは、「t‐検定」であり、それを理論的に支えるのが「中心極限定理」と「t‐分布」である。
① 中心極限定理で「正規分布」を使う。② また、その正規分布は「標準正規分布」
に変換された後、t‐分布で近似される。