統計の基礎第9回
確率の基礎/二項分布6月 17 日
• 確率の考え方を理解し、確率を求める方法を習得する。
確率の基礎【目標】
1.はじめに(確率の把握)(1) 日常的確率の理解(2) 確率の把握(3) 統計と確率2.確率の諸用語(1) 用語(2) ベン図3.確率の公式(1) 公理(2) 定理(3) ベイズの定理
【構成】
1.はじめに(確率の把握)(1) 日常的確率の理解
• 相対度数で判断 ・・・コイン、サイコロの例から
• 全体で 100%
• 「 100p %」の表記
(2) 確率の把握 ①理論的確率
• 事象の頻度の計測 ・・・限度あり
• 標本空間の全事象を数え上げそれぞれが等しく起こるとする
「同様に確からしい」を根拠とする
② 実験的確率 ( 体験的確率 )
• 結果としての比率 ・・・・毎回異なる
• 実験を無限に繰り返した場合に近づく値→確率
• 日常的には困難 大規模調査・実験の繰返し 近年では大量の情報収集
③ 主観的確率• ヒューリスティックな判断 カン、期待
例えばギャンブラーの判断
※ 確率は直感的には分からない• 説明しても、説明者と同じ理解構造になら
ないと通じない
• 一旦、理解したと思っても、しばしば分からなくなる
※ 確率は直感では分らない
・ベースレート問題• 40歳の女性が乳がんにかかる確率は
1%。• 乳がん患者が、 X 線検査で陽性になる確
率は90%である。• 乳がんではなかったとして、それでも検査
結果が陽性になる確率は9%である。• あなたの検査結果が陽性と出た場合、実
際に乳がんである確率は?
・現在像の誤解• 対等な個別事象を識別できない ( 理論的判断も容易でない )
モンティホール問題 3人の囚人問題
モンティホール問題• 3つのドア、後に車、ヤギ、ヤギ• あなたは1つのドアを選択• 後を知っている司会者が残りのドアのう
ちヤギのドアを開く• あなたは選択を変えるか
3人の囚人問題• 王様の結婚により、 3 人の死刑囚のうち一人
に恩赦、無作為に選出・・・ 1/3
• 囚人が、看守から他の囚人のうち恩赦にならない者の名前を聞く。
• 恩赦にならないのは、 他の一人の囚人か自分・・・・・ 1/2 ?
・条件設定の曖昧さ• 二人とも女の子の確率 無条件 上は女 1人は女
・ヒューリスティックな判断 _1
具体的な内容の選択 どちらの災害がより起きそうか• a. 「 1000 人が津波で死亡する東海大地震」
• b. 「 1000 人が死亡する日本国内での大地震」
・ヒューリスティクな判断 _2( 人間的で必ずしも合理的でない ) な
判断をしがち
• 負け続けのギャンブラー 今後こそは• 勝ち続けのギャンブラー 今度も• 宝くじの購入 (?)
・ビッグ・データの危うさ
DNAの一致による犯人断定• 一致は 10万人に一人• 犯人に間違いないと考えてよいか
• この都市の人口は 100万人
※ 検討の歴史は古くない・・・不確実性を計測する発想は新しい
• ギリシャ・ローマでは発展しなかった
• カルターノ「偶然のゲームに関する書」 16世紀
• カール・ピアソン 19世紀
(3) 統計と確率
• 統計は確率の問題であり、 かなり外れることもある
2.確率の諸用語(1) 用語
• 事象 偶然性を伴う実験の結果 例えば、コイン投げの結果
• 根元事象 それ以上細分できない単一の事象
• 複合事象 2 回のコイン投げなど
• 標本空間 事象を検討する場
• 全体集合 起こりうるすべての結果 ( 事象 ) の集合 { }• 部分集合
• 排反 同時に起こらない事象 ( の集合 )
• 余事象 A’⇒ A∪A’全体集合• 和事象 ∪ cup• 積事象 ∩ cap ( 同時確率 )• 空事象 φ A∪A’
3.確率の公式(1) 公理
①0 Pr(A) 1≦ ≦ 範囲 0~ 1
②Pr(Ω)=1 総和 排反事象の総和=1
③A∩B =φ ⇒ Pr(A∪B )=Pr(A )+Pr(B ) 生起確率=根元事象の総和
(2) 定理①加法 Pr(A∪B )= Pr(A )+ Pr(B )-Pr(A∩B )②条件付き確率 Pr(B│A )= Pr(A∩B )/Pr(A )③乗法• Pr(A∩B )= Pr(B│A )* Pr(A )
• ツリーダイアグラム 枝分かれした事象の確率を乗法で求めていく
(3) ベイズの定理• ある事象が起こった時の 特定の原因が起こった ( 起こっている )確率
• Pr(A│B )= Pr(A )* Pr(B│A ) /Pr(B )
3つの確率が分かっている場合に最後の確率をみつけだす
• 40歳の女性が乳がんにかかる確率は1%。• 乳がん患者が、 X 線検査で陽性になる確率は90%
である。• 乳がんではなかったとして、それでも検査結果が陽
性になる確率は9%である。• あなたの検査結果が陽性と出た場合、実際に乳がん
である確率は?
• A ;健康者、 'A ; 患者• B ; 陽性、 'B ;陰性
• P(A)=健康者比率 =99 %• P(B│A)=健康者陽性比率 = 9%• P(B)=陽性比率=健康者比率 ×健康者陽性
比率+患者比率 × 患者陽性比率 = 99 % × 9 %+ (1- 99%)×90%
• 陽性者健康比率= P(A│B)=P(A) ・ P(B│A)/P(B)=(99 % × 9% )/( 99 % × 9 % + (1 -99%)×90%)=90.8 %
二項分布
【目標】• ベルヌーイ試行の確率について考えるとと
もに、 Excel でのシミュレーションを理解する。
【構成】1.ベルヌーイ試行2.ツリー図から確率を考える3.順列組合せから確率を求める4. Excel による確率計算とシミュレーション
1.ベルヌーイ試行• 結果が二種類のみの試行 ( これを繰り返す試行 )
例 コイントスの表・裏 サイコロで奇数・偶数 サイコロで2以下・3以上 紅白玉の抜出しで紅・白
一般に特定の結果が起こる確率をpとし、他の結果の確率をq=1-pとする。 説明上、片方の結果を「成功」、他方を「不成功」と表現する。
2.ツリー図から確率を考える• 試行毎に枝分かれするツリーを描く• 確率の検討は、根元事象を数え上げるこ
とが基本。
• 各枝端に達する確率は p^i*q^(n-i)
3.順列組合せから確率を求める
• 一定回数の試行を何度も繰り返した場合で、成功がi回の場合の確率
→成功がi回となる枝を数える
• 繰返し回数n個の数からi個取り出す 組合せの数に相当
• 階乗 n!
• 順列 n個の数の並べ方 n!
• n個の内i個だけの数の並べ方 →後部のn-i個の枝別れを落す n!/(n-i)!
• i個の組合せ→i個の並べ方 i!
• n個のうちi個の組合せ方 n!/((n-i)!*i!)
• 求める確率 n!/((n-i)!*i!)*p^i*q^(n-i)
• この確率の分布 → 二項分布 Excel_File (binomdist.xlsx)
4. Excel による確率計算とシミュレーション
→ Excel_file 二項分布シミュレーショ(ex091_1.xlsx)• 確率計算・・・理論確率 n!/((n-i)!*i!)*p^i*q^(n-i) に値を入れ ヒストグラムを作成する • n!/((n-i)!*i!) → BINOMDIST( 成功数、試行回数、成功確率、形式 ) 形式 0; 確率密度、 1;累積確率
シミュレーション・・・実験確率• 成功の場合1、不成功の場合0を出す 乱数 RAND() [0.1) の値 F9キーで再計算 確率pで成功 INT(RAND()+p)
• 一定回数並べ成功の回数を数える SUM()
• 一定回数の試行を多数回繰返し成功回数の出現頻度を数える
COUNTIF()
• ヒストグラムを描く
• 試行の繰返し回数をできるだけ増やす
【提出課題】 6月 17 日出題• 一定回数のベルヌーイ試行を繰り返すシミュレーションを行い、成功回数のヒストグラムを描く。
【時間末レポート】 6月 17 日
• サイコロを振り、出た目を二乗した得点が当たる試行を繰り返した場合に期待される平均値を求めてください。
• ( 計算過程も明記すること。 )