第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top >...

20
| サイトマップ | サイトトップへ 医学統計学 ログアウト TOP > 医学統計学講座 > 4株式会社サンテック 統計解析室室長 足立 堅一 先生 第4回: 統計的仮説検定 ~~~~~~ CONTENTS ~~~~~~ 印刷される場合には、こちら PDF版)をご利用下さい。 PDFファイルをご覧になるには「推奨動作環境」をご覧ください。 4.1 検定が必要とされるsituationの解剖とその顕在化 4.2 仮説検定と帰無仮説 サイコロの例 4.3 仮説検定 t 検定の例 4.4 架空的人類♂♀t 検定 掲載内容のご使用は診断薬.NET「利用規約/著作権」に準じ 私的使用の範囲外でのご使用は事前に承諾が必要です。 | ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権| Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

Transcript of 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top >...

Page 1: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第4回

株式会社サンテック 統計解析室室長

足立 堅一 先生

第4回: 統計的仮説検定

~~~~~~ CONTENTS ~~~~~~

印刷される場合には、こちら (PDF版)をご利用下さい。 PDFファイルをご覧になるには「推奨動作環境」をご覧ください。

4.1 検定が必要とされるsituationの解剖とその顕在化

4.2 仮説検定と帰無仮説 ― サイコロの例

4.3 仮説検定 ― t 検定の例

4.4 架空的人類♂♀と t 検定

※掲載内容のご使用は診断薬.NET「利用規約/著作権」に準じ 私的使用の範囲外でのご使用は事前に承諾が必要です。

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

Page 2: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第4回

第4回:統計的仮説検定株式会社サンテック 統計解析室室長

足立 堅一先生

NEXT

世間では「統計学と言えば(仮説)検定」と考えている者が多数というかmajorityであろう。たしかに検定は大きな柱ではあるが、検定がその役割や機能を発揮するには前提があることがほとんど忘れ去られていることは重大な問題である。 前提とは、データがbias(例:第1回での♀はバレーボールの選手、♂は競馬の騎手)なく獲得されたことである。これを「素材と料理人の包丁さばき」に比喩した説明を見たことがあるが良い比喩だと思う。素材が腐っていては包丁さばきの出番などない。腐ってはいないが、採取したキノコ

に毒キノコ(bias)が混入している危険性があれば非常事態であり、料理どころではない。寿司ネタなどの場合には、新鮮で質の良い素材を入手する力量・技術が当然注目されるが、試験の

designにおいてもその力量・技術がもっと注目されるべきである。これは、第1回の「1.6 統計学の役割」で既に概念的な理解ができたと思うが、計画段階での熟慮の必要性であり、それについてはもう少し後の回で基本的な解説をする。

4.1 検定が必要とされるsituationの解剖とその顕在化

一般的教科書と異なり根本的なことから考察しよう。 その理由は後述する2種の過誤 α β の内、どうしても後者 β が忘れ去られてしまう原因がここにあると思うからである。

例題1 ここに理想的な正しいサイコロがある。 6回振った結果、いずれも「偶数の目」が出た。どのように解釈すべきか?

例題2 ここに理想的な正しいサイコロに意図的に「偶数の目」が出やすいように仕掛けをした。6回振った結果、「偶数の目が3回」・「奇数の目が3回」が出た。どのように解釈すべきか?

このように真実・真相が判明しているsituationでは、どんなにおかしな、希有な結果が発生してもそれは偶然に起因するので、判断は不要である。つまり、前者ではどうあれ「サイコロがおかしくない」し、後者では「サイコロがおかしい」。 こうしたsituationが現実の世界に本当に存在するかと問われれば確かに断定できる自信は筆者にもないが、まさにプラトン流の観念論だが頭の中で考えることはできる。1つだけ観念論の成立する現実的に想定可能な例を挙げておこう。

例題3 同一母集団からの患者を2群に分けて、全く同一なアスピリンを全く同じ

Page 3: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

regimen・状況で投与して効果が大きく異なる場合、どのように解釈すべきか?

我々が判断を必要とするのは真相・真実を知らないcaseであり、だからして実験・研究するのだと考えれば霧が晴れて、明快でスッキリする。典型的には次の例題のような例である。

例題4 ここに外見からは正しそうなサイコロがある。メーカー名も不明で偽造品の危険性もあるが、真相は不明である。 6回振った結果、いずれも「偶数の目」が出た。 6回振った結果、「偶数の目が3回」・「奇数の目が3回」が出た。

どのように解釈すべきか? あなたならどうする?

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

Page 4: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

例題1 解答

「理想的な」サイコロであるので、当然ながら、偶然そういう珍しいことが発生しただけである。 つまり、サイコロがおかしいのではない。

Page 5: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

例題2 解答

「おかしな」サイコロであるので、当然ながら、偶然そういうことが発生しただけである。 つまり、「サイコロがおかしい」のは間違いない。

Page 6: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

例題3 解答

全く同一なアスピリンである限り、アスピリンの薬効、厳密にはingredient(成分)そのものが同一であることは疑う余地がない。 もっとも、こんな試験は実施する理由が皆無であり、決して実施することはない。

Page 7: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

例題4 解答

ではおかしいと判断しよう。後でやはり意図的に仕掛けがされたインチキサイコロと判明すれば、判断は正しいことになる。しかし、後で素性の知れたお墨付きのメーカー品であったら判断違いとなる。真実は「正しい」のに「正しくない」と判断し

てしまう過誤(第1種の過誤α)である。 また、サイコロを信じておかしくないとしても、今度は逆のことが起こり、インチキサイコロと判明すれば、判断は間違いになる。これは、真実は「正しくない」のに「正し

い」と判断してしまう過誤(第2種の過誤β)である。このように、いずれの選択をしようと過誤の危険性から脱却できない。 でも同様であるので各自考えること

Page 8: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第4回

第4回:統計的仮説検定株式会社サンテック 統計解析室室長

足立 堅一先生

BACK NEXT

4.2 仮説検定と帰無仮説 ― サイコロの例

例題4に対して次のように対処するのが統計的仮説検定である。

(1) 理想的で正しいサイコロでの偶数の目の出る確率は1/2である。 問題とするサイコロもとりあえず理想的で正しいサイコロと仮定してみる。 すなわち、問題とするサイコロで偶数(丁)の目の出る確率 π (偶数)=1/2と仮定し、こ

れを帰無仮説 H0(null hypothesis)と呼ぶ。つまり、

帰無仮説 H0 : 問題のサイコロのπ(偶数) = 1/2

(2) 理想的サイコロを6回振るときの「偶数の目が0、1、2、3、4、5、6回」という確率分布は計算できる(これは正しいサイコロを6回振るときの偶数の目が0、1、2、3、4、5、6回の確率の関する母集団ともみなせる)。 参考までに、当該確率分布とその考え方を表4-1と図4-1に示す。

表4-1 :サイコロを4回振って4回連続して

丁になる確率の計算 [表の解説] 図4-1 :サイコロが正しい場合に6回

振ったときに丁の目が出る回数とその確率

[図の解説]

(3) 問題とするサイコロで観測された現象・事象をこの確率分布に基づき、その現象の発生が希有であるかどうかを照合する。

◆一定の水準を超えてその確率 p が低い場合には、帰無仮説 H0 を棄却

(reject)して対立仮説 H1 (alternative hypothesis)を採択する。 この例の場合には

H1 : 問題のサイコロのπ(偶数) ≠ 1/2(accept) する。

◆逆に、その確率が有意水準を上回っていれば、帰無仮説を採択する(消極的に採

択する。棄却しない)。

Page 9: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

例題5 例題4について、表4-1、図4-1を見て、仮説検定を行うこと

どの程度偶数の目が連続すれば、我々はおかしいと思うのだろうか、そしてそのことと α =

0.05 との関係はどうなっているかを考えるのも有益であると思う。

例題6 上記の計算と考察をせよ

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

Page 10: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

【 表4-1 サイコロを4回振って4回連続して丁になる 確率の計算 について 】

組み合わせは、(丁:4/4)、(丁:3/4)、(丁:2/4)、(丁:1/4)および

(丁:0/4)の5種類である。 (丁:4/4)は、4回振って4回とも丁が出ることと定義する。 それぞれの組み合わせに関する確率は、当該組み合わせの個数を表から

数えて求めた。例えば、(丁:3/4)は、*1の箇所が4個なので、4/16とな

る。表から、(丁:4/4)の確率は1/16、(半:4/4)の確率も同様に1/16になる。

Page 11: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

【 図4-1 サイコロが正しい場合に6回振ったときに 丁の目が出る回数とその確率 】

図の横軸は6回中の丁の目の数で、縦軸はそれぞれの確率である。3/6を中心にして左右対称に減少している。 斜線で帰無仮説の棄却域を示した(α≦0.05の有意水準で両側検定の場合)。反対に、その内側が採択域になる。

Page 12: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

【 一定の水準 】

有意水準(α、level of significance)と呼ぶ。 慣例的に α = 0.05、 0.01 が用いられる。

Page 13: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

例題5 解答

例題4 ではその確率 p = 0.0156(片側)< α = 0.05 であるから、おかしいと判断する。 ではその確率 p = 0.0156 + 0.0938 + 0.2344 + 0.3125 = 0.6563(片側)> α = 0.05 だからおかしくないと判断する。 の計算は2項分布から算出した。計算は面倒なので、関心ある者だけで良い。

SASは関数装備、エクセルにもあるので使える者はtryせよ。

Page 14: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

例題6 解答

偶数の目が2回連続して出る確率=(1/2)×(1/2)=0.25、 〃 3回連続して出る確率=(1/2)×(1/2)×(1/2)=0.125、 〃 4回連続して出る確率=(1/2)×(1/2)×(1/2)×(1/2)=0.0625、 〃 5回連続して出る確率=(1/2)×(1/2)×(1/2)×(1/2)×(1/2) =0.03125 という訳で、5回連続した場合に棄却される。 直観的にも納得できそうな線ではなかろうか各自はどう思うだろうか。

Page 15: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第4回

第4回:統計的仮説検定株式会社サンテック 統計解析室室長

足立 堅一先生

BACK NEXT

4.3 仮説検定 ― t 検定の例

考え方は前と同様であるが、ここでは2群について差の検定をするお馴染みのcaseについて、

第2回例題4の架空的人類の成人 ♂ ♀のcaseを例に、 t 検定の考え方を解説する。

(1) 架空的人類の成人 ♂ ♀の母集団の平均身長をそれぞれ μA ・ μB とする。

問題とするこれら身長をとりあえず等しいとしてみる。すなわち、

帰無仮説 H0: μA = μB、 つまり差 δ =μB = 0

(2) μA=μBの状況で、例数を nA ・ nB として現在得られたデータの平均身長 mA ・ mBにおけ

る差 d = mA - mB がどの程度の確率で得られるかは計算可能である。この確率 p が

有意水準αより小さいか大きいかで帰無仮説を棄却/採択を決める。 つまり、 両群の母集団は正規分布(正規分布については第2回の2.7を参照)に従い、分散σ2が両

群で共通と仮定し、 δ = μA - μB = 0 つまり同一母集団から nA ・ nB例を抽出するとき、

・・・ (1)

SA = Σ( x i - mA)2

SB = Σ( y i - mB)2

の t の値からその確率 p が求まる(数表またはSAS・エクセルなどには関数装備)。 このように p は高等な理論で誘導できるが、ここでは無限繰り返しの発想(思考実験)で乗り切ろう。丁寧な説明を加えれば、

(3) nA ・ nB 例を無作為抽出してその度に 式(1) により t を計算し、それをplotする。

このとき、差δ = μA - μB = 0 なので t の値は分子は 0 に近く、 t も 0 の近傍を揺れ、

+-に 0 から外れた極端な値は出ないことが想像できることに注目する。

(4) この(3)の操作を無数に繰り返すと、1つの分布ができる。これが t 分布であり、その形状

は図4-2のようになることが知られている。 nA + nB - 2(自由度)によって急峻さが違って

いることにも注意する。

図4-2 帰無仮説下での各種自由度の t 分布 [図の解説]

Page 16: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

ボタンをクリックすると画像が変わります。

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

Page 17: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

【 自由度 】

標本の標準偏差の2乗から母集団の分散σ2乗を推定するときは、標本の標準偏差の2乗として「変動/例数」を用いては過小評価になること、 「変動/(例数-1)」で丁度良いことを t 検定の創案者であるGossetが発見

したという。これを後年Fisherが「自由度」という概念を導入して説明したという。 「自由度」という用語の説明としては、

「n例からの標本平均とその偏差には、偏差の総和が0になるという制約があるために、n-1個の偏差を与えると残りの1個は自動的に決まるので、この場合、自由度はnでなくてn-1になる」

というような類のものが多い。これは本質的というよりは機械的な説明でしかないと思われる。いずれにせよ、初心者には難解な概念である。

Page 18: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

【 図4-2 帰無仮説下での各種自由度の t 分布 】

横軸は出力値、縦軸は相対頻度である。 自由度 dƒを1、2、5、10、∞としたときの t 分布を示す。 帰無仮説下なのでピーク時の横軸の値は0である。ピークが低いものから

高いものへ順番にdƒが1、2、5、10、∞となる。∞では、正規分布になる。

また、dƒが小さいほど裾が長く、その分だけピークが低い。

Page 19: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

| サイトマップ |

サイトトップへ

医学統計学

ログアウト TOP > 医学統計学講座 > 第4回

第4回:統計的仮説検定株式会社サンテック 統計解析室室長

足立 堅一先生

BACK

4.4 架空的人類♂♀と t 検定

最後に架空人類 ♂ ♀で t 検定の実習をしておこう。

例題7 次の左半分のデータに関して式(1)に従ってt値を計算せよ

♀ x i :

158.3 164.2 164.5 164.8 171.2 155.8 162.8 165.0 167.2 171.6

♂ y i :

163.6 168.5 168.9 169.0 171.1 165.8 167.0 169.7 175.9 176.0

参考までに、このデータはμA=165、 μB=170、 σ=5 の母集団から 抽出した標本である。

| ご利用にあたって | 個人情報の取り扱い | 推奨動作環境 | 著作権|

Copyright©2009 NIPPON KAYAKU CO.,LTD All right reserved.

Page 20: 第4回: 統計的仮説検定 · 2016-05-18 · 医学統計学 ログアウト top > 医学統計学講座 > 第4回 第4回:統計的仮説検定 株式会社サンテック

例題7 解答

♀の平均 mA=164.6、 SA=Σ(x i-mA)2=83.46、 nA=5

♂の平均 mB=168.2、 SB=Σ(y i-mB)2=30.79、 nB=5

t=(-)1.51 → p=0.1683 → nA+nB-2=8なので、

自由度8・α=0.05の t 分布表の値 2.306 を得る。 1.51<2.306 → 有意でない: t=2.306のとき α=0.05 ついでに、右半分も足した10例では、 t=2.4975 → p=0.0224 → 自由度nA+nB-2=18なので、

自由度18・α=0.05の t 分布表の値 2.101 を得る。 2.4975>2.101 → 有意