多様化するコージェネ活用 - ECCJ「家庭の省エネエキスパート検定」,「ビルの省エネ エキスパート検定」10月に全国一斉検定を実施 …8
6 検定論¤œ定論2015.pdf · 2015-06-02 · 1 第6 章 検定論...
Transcript of 6 検定論¤œ定論2015.pdf · 2015-06-02 · 1 第6 章 検定論...
1
第 6 章 検定論
この章では調査および実験研究での仮説を、標本を用いて検証する統計的方法について
述べる。この方法は検定法とよばれ、統計モデルや母集団分布の母数についての仮説の成
否を統計的に判定する方法の総称である。この場合の仮説は経験上の理論値、現象の傾向、
遺伝法則に見られるような確率法則、独立性などである。まず、検定法の考え方を述べ、
次にその定式化を与える。正規分布の平均や分散の検定、相関係数、および漸近的検定法
を議論する。母数の信頼区間と検定法の考え方の関関係、検定の過誤を考慮に入れた標本
数設定について考える。現象理論の検証としての適合検定を、遺伝モデルを用いて説明す
る。カテゴリカル変量の連関分析に対して、独立性検定を述べる。
6.1 統計的検定法の考え方
仮説検定は、標本を用いて仮説(帰無仮説)H0 と対立仮説 H1 の二者択一を行う統計的
方法である。その概要を掴むために次の例を考える。
[例 6.1] あるサイコロが正確かどうかを調べることを考える。表 6.1 はサイコロを 100 回投
げた実験結果である。この場合、反復して実験を行い、もし特定の目が他より多く観察さ
れ、または少なく観察されれば、そのサイコロの正確さについて疑いをもつ。この検定の
帰無仮説と対立仮説は次のようにするのが自然である。
H0: サイコロは正確である。すなわち
P(i の目が出る) = 1/6 (i =1,2,3,4,5,6).
H1: サイコロは不正確である。すなわち、少なくとも1つの目に対して
P(i の目が出る) ≠1/6.
この例で、サイコロを n 回反復し、i の目が出る回数を ni とするとき、観測結果に偏りが
あると確率的に判断されれば、帰無仮説を棄却し(reject)、そのような偏りの傾向が見られ
なければ、帰無仮説を採択する(accept)ことになる。この例はカイ自乗検定の節で再度取り
扱う。
表 6.1. サイコロ投げ実験
サイコロの目 1 2 3 4 5 6 計
出現回数 10 15 20 24 21 10 100
□
また、次の例は通常見られる典型的な例である。
[例 6.2] 過去数年間、同じ内容の統計学試験を行った結果、その平均は 70 点で、標準偏差
は 6.5 点であった。今年は 20 人の学生が、統計学の試験を受け、その標本平均は 75 点で
あった。このクラスの学生は、過去の学生に対して成績が良いか否かを考える。この場合
2
の仮説は
H0: 平均μ=70, H1: μ≠70 (6.1)
である。また、今年は試験前に、成績向上を狙って特別補習を行っているとすれば、対立
仮説は
H1: μ>70 (6.2)
とするのが妥当である。 □
上の例から分かるように、統計的検定では仮説と対立仮説を事前に立てることが重要で、
そのためには対象とする現象を十分吟味する必要がある。検定で二者択一の判断基準とし
て、データ情報を縮約する統計量を用いる。例 6.1では後に述べるカイ自乗統計量(chi square
statistic)、例 6.2 では標本平均、あるいは t 統計量(t-statistic)を用いて検定を行う。このよう
に、検定に用いる統計量を検定統計量(test statistic)という。仮説検定の理解を助けるために、
例 6.2 を考える。学生が均一で、試験成績が正規母集団 N(μ,σ2)に従うとする。標本平均
をX_
とするとき、
Z =
Xn (6.3)
の分布は標準正規分布である。この場合、仮説H0: μ= 70の下でσ= 6.5, n =20,観測値X_
= 75
である。ただし、過去の受験学生が多数のために、σを未知母数とせずに既知母数σ= 6.5
として考える。このとき、統計量(6.3)の値は
z0 = 20 (75 -70)/6.5 =3.440
であり、
Pr(Z > z0) = Pr(Z > 3.440) = 0.0003
を得る。これは仮説 H0 の下で極めてまれな観測結果であると考えられ、仮説は棄却するこ
とが妥当である。上の確率を有意確率または p 値という。仮説検定の定式化については次
の節で述べる。
問 6.1. 例 6.1 で 1 の目は 10 回出現している。帰無仮説 H0 の下で、1 の目が 10 以下になる
確率を中心極限定理により近似計算し、この結果が稀なものであるかどうか検討せよ。
問 6.2. 例 6.2 で分散が未知とする。標本平均 75x 、不偏分散が 512 u であった。t 統計
量を用いて仮説 H0: μ= 70 を検討せよ。
6.2 検定の定式化
ある母集団からの標本 X1,X2,…,Xn に対して、母集団に関する仮説 H0 を対立仮説 H1に対
して検定するための統計量を T(X1,X2,…,Xn)とする。表記上の簡略化のために、検定統計量
は単に T で示す。仮説検定は、事前に決定した領域 W に観測値 T が入るとき仮説 H0 を棄
却し、その他のとき仮説 H0 を採択する判断法である。この領域 W を検定の棄却域(critical
region)という。検定では次の二種類の過誤(error)が必ず存在する。1つは仮説 H0 が正しい
3
とき、H0 を棄却する場合の過誤で、これを第1種の過誤という。この過誤確率は
α= P(T∈W| H0) (6.4)
である。他の過誤は H0 が正しくないとき(対立仮説 H1 が正しい)、H0 を採択する過誤で
あり、これを第2種の過誤という。この過誤確率は
β= P(T∈Ω−W| H1) (6.5)
である。ここに、Ωは T の標本空間である。これらの過誤を同時に小さくできれば良いが、
確率記号(6.4), (6.5)内の事象は互いに余事象の関係にあり、一方の領域を小さくすれば、他
方の領域は大きくなる。仮説検定では予め決定した第1種の過誤確率αの下での、仮説と
対立仮説の二者択一の判断方式であり、この確率αを有意水準(level of significance)という。
有意水準αの下で第2種の過誤確率を最も小さくするように棄却域を決定できれば、検定
は最良である。有意水準の決定は任意であるが、通常はα=0.05 またはα=0.01 が習慣的に
良く用いられる。
例 6.2 で仮説(6.1)の検定を考える。有意水準を 0.05 とするとき、予め検定の棄却域を定
める必要がある。検定統計量は(6.3)であるから、極端に絶対値|Z|が大きいときに帰無仮説
を棄却することは、直感的に考えて妥当である。従って、この場合の棄却域を
W: |Z| > 1.96 (6.7)
とすれば、第1種の過誤確率は 0.05 となる。観測値は
z0 = 3.440 W
であるから、帰無仮説は棄却されることになる。このような場合に、有意水準 0.05(5%)で
検定結果は統計的に有意(statistically significant)という。また、対立仮説が(6.2)であれば、
極端に大きな統計量の値が観測されたときに、帰無仮説を棄却することが妥当で、棄却域
は
W’: Z > 1.64 (6.8)
である。ここで対立仮説の立て方は、現象や状況によることを銘記すべきである。前者の
ような検定を両側検定 (two-sided test)、後者を片側検定 (one-sided test)という。ここでは、
直感的に棄却域を構成したが、数学的にも上の棄却域は良好である。
例 6.2 のときは H0: μ=70, H1: μ≠70 である。このとき、H0 は母数の特定の値で定義さ
れていて、このような仮説を単純仮説(simple hypothesis)という。他方、H1 は母数の複数の
値で定義されている。このような仮説を複合仮説(composite hypothesis)という。取り扱う母
数がベクトルの場合も同様に考える。
次に検定での過誤を考える。第 2 種の過誤確率βに対して、
1-β = 1-P(T∈Ω-W| H1) =P(T∈W| H1) (6.9)
は対立仮説 H1 が真のときに、この仮説を採択する確率であり、これを検出力(power)とい
う。例 6.2 では、検出力は平均μの関数であり
1-β = P(T∈W| μ) (6.10)
4
と表記することができる。上の定式化で分かるように、検定法を構成することは、帰無仮
説の棄却域 W を決定することと同等である。棄却域の決定は任意であるが、2 つの仮説の
採択における過誤確率は小さいことが良好な棄却域の選択である。先に述べたように、こ
れら 2 つの確率を同時に小さくすることは出来ない。すなわち、一方の確率を小さくすれ
ば、他方は大きくなる傾向を持っている。このことから、検定では有意水準を一定にした
下で、検出力が出来るだけ大きくなる二者択一方式が良好な検定法を与える。このことに
ついては、別の節で考える。例 6.2 の仮説(6.1)の検定では、棄却域は W={|Z| > 1.96}とし
た。このときの検出力は
1-β = P(|Z| > 1.96| μ)
=
96.1
5.6
20 )70(z
dzz (6.11)
で与えられる(図 6.1 参照)。ここにφ(x)は標準正規分布の密度関数である。ここで、検出
力は平均μと標本数 n の 関数となる。
図 6.1 検出力関数のグラフ
問 6.3. 例 6.1 で対立仮説を H1: μ>70 とした場合の棄却域と検出力関数を求めよ。また、
検出力関数のグラフを描け。また、実質的な差を 5 点としたとき、H1: μ=75 の検出力を
求めよ。
検出力
0
0.25
0.5
0.75
1
60 70 80
平均
検出力
検出力
5
6.3 正規分布に関する基本的検定法
(i) 正規分布 N(μ,σ2), 分散σ2 が既知の場合の H0:μ=μ0 の検定
標本 X1,X2,…,Xn が得られたとき、統計量 Z (6.3)は H0 の下で標準正規分布に従う。対立仮
説 H1:μ≠μ0 のとき、有意水準αに対して棄却域は
W: |Z| > q(α/2) (6.12)
で与えられる。ここに、棄却限界点(critical point) q(α/2)は P(|Z| > q(α/2)) = αを満たす上
側 50α%点である。従って、有意水準α=0.05 に対して棄却域は(6.7)である。また、有意
水準α=0.01 に対しては、|Z| >2.58 が棄却域である。対立仮説 H1:μ>μ0 のときは
W: Z > q(α) (6.13)
が棄却域である。同様に対立仮説 H1:μ <μ0 のときは
W: Z <-q(α) (6.14)
が棄却域になる。
問 6.4. 例 6.2 を有意水準 0.05 で検定せよ。
注意 6.1. 大標本のときの近似的な検定は、この方法が基本である。標本 X1,X2,…,Xn が平均
μ、分散σ2 の分布(母集団)から得られたとき、標本数が十分大きいとき、標本平均X―
は
平均μ、分散σ2/n の正規分布に漸近的に従う(中心極限定理)。従って
Z =
Xn (6.15)
の分布は漸近的に標準正規分布である。また、分散σ2 が未知のときは、不偏分散を U2 に
対し
t = U
Xn (6.16)
は近似的に標準正規分布に従い、このことを用いれば、平均に関する検定が行える。上の
不偏分散を標本分散 S2 で置き換えても近似的には同様である。
(ii) 正規分布 N(μ,σ2), 分散σ2 が未知の場合の H0:μ=μ0 の検定
標本 X1,X2,…,Xn に対して、定統計量は
t = U
Xn (6.17)
であり、自由度 n-1 の t 分布に従う。有意水準αのとき、対立仮説 H1:μ≠μ0 に対する棄
却域は
W: | t| > t(n-1,α/2) (6.18)
である。ここで t(n-1,α/2)は自由度 n-1 の t 分布の上側 100α/2%点である。対立仮説 H1:μ
>μ0 のときは、棄却域は
W: t > t(n-1,α)
6
であり、また対立仮説 H1:μ<μ0 のときは、
W: t < - t(n-1,α)
となる。
[例 6.4] マウス 10 匹に特殊な栄養剤を混ぜた飼料を与えて飼育したところ、生後1ヶ月の
体重増加が次のデータのようになった。
19, 18, 21, 22, 24, 15, 23, 20, 18, 28 (g)
マウスを通常の飼料のみで飼育した場合の発育は、1ヶ月で 20g とされている。このとき、
栄養剤の効果があったかどうかを検定する。体重増加量は正規分布とすると仮定し、仮説
H0:μ=20 と対立仮説 H1:μ>20 に対して検定を行う。データから統計量
5.13 ,8.20 2 ux
が得られる。検定統計量は t 統計量であり、
t0 = 10 (20.8-20)/3.676 = 0.688
を得る。t 統計量の上側 5%点は t(9,0.05) =1.833 で、帰無仮説は棄却されない。栄養剤の効
果は無いと判断される。
問 6.5. 例 6.2 のデータが次のように与えられている。H0: 平均μ=70, H1: μ≠70 を有意
水準 0.05 で検定せよ。ただし、データは正規分布すると仮定する。
95 63 90 35 88 60 73 55 81 100
93 88 67 90 75 72 70 50 43 75
第 5 章 6 節の回帰モデルで母数αとβの推定量 と は不偏推定量で、それぞれの分散が
(5.12)と(5.13)に従う正規分布に従う。誤差分散2 の推定量を
2
ˆˆ2
12
n
xyU
n
i ii
とするとき、次の2つの統計量は 5 章で取り上げたように自由度 2n の t 分布に従う。
,
1
ˆ
1
2
21
n
i i xx
x
nU
t
(6.19a)
n
i i xxU
t
1
2
21
ˆ (6.19b)
統計量(6.19b)を用いて、 0: H の検定を次のように行う。帰無仮説の下で統計量
n
i i xxU
t
1
2
11
は自由度 2n の t 分布に従う。有意水準 0.05 の両側検定 H1: 0 での棄却域は
7
025.0,2 ntt である。対立仮説H1: 0 での片側検定では棄却域は 05.0,2 ntt 、
対立仮説 H1: 0 での片側検定では棄却域は 05.0,2 ntt になる。例 5.16 の β を
有意水準 0.05 で両側検定する。棄却域は 101.2025.0,18 tt であり、統計量の値は
435.2t であるから、帰無仮説は棄却され、回帰係数は 0 であると判断される。
問 6.6. 第 5 章 6 節の例 5.16 で仮説 H0: 0 を対立仮説 H1: 0 に対して、有意水準
0.05 で検定せよ。
問 6.7. 次のデータは高血圧の男性 10 名に対して、薬剤投与前と後に測定したデータであ
る。データの差が正規分布するとして、血圧の低下があるかどうかの検定をせよ。
被験者 1 2 3 4 5 6 7 8 9 10
投与前 165, 174, 155, 180, 168, 150, 160, 170, 185, 158
投与後 160, 165, 150, 165, 170, 155, 150, 155, 145, 155
mmHg
(iii) 分散に関する検定 H0: σ2=σ0
2
この検定に関する対立仮説は一般には H1:σ2≠σ0
2 である。次の統計量は仮説 H0 の下で
自由度 n-1 のカイ自乗分布に従う。
χ2 =(n-1)U
2/σ0
2 (6.20)
対立仮説の下での、上の統計量の平均は
E(χ2|σ2
)=(n-1)σ2/σ0
2
であり、統計量(6.20)はσの値に依って大きい値か、または小さい値を取る傾向が出る。従
って、有意水準αに対して、その棄却域は
χ2 >χ2
(n-1,α/2), χ2 <χ2
(n-1,1-α/2) (6.21)
で与えられる。ここに、χ2(n-1,α/2)とχ2
(n-1,1-α/2)はそれぞれ自由度 n-1 のカイ自乗分布
の上側 50α%点および 100(1-α/2)点である。
[例 6.5] 例 6.2 で今年の試験結果から、標本標準偏差が u = 7.3 と得られた場合、仮説 H0: σ
=6.5 の検定を行う。(6.20)から
χ02 = 19×7.3
2/6.5
2= 23.965
を得る。有意水準 0.05 として、棄却限界点は
χ2(19,0.025) = 32.85, χ2
(19,0.975) = 8.907
であり、仮説は棄却されない。 □
問 6.8. 問 6.3 で H0: σ=6.5 を有意水準 0.05 で検定せよ。
6.4. 最強力検定
前節で述べたように検定の棄却域は有意水準(第1種の過誤確率)を一定にした下で、
8
第2種の過誤確率を出来るだけ小さくするように設定することが最良である。本節では、
最良の検定法を考える。
[例 6.6] 確率変数のXの密度関数が、仮説と対立仮説に対して次のように仮定されている。
3(x – 1)2/4 + 1/4 (0≦x≦2),
H0: f(x|H0) =
0 (その他)
-3(x – 1)2/4 + 3/4 (0≦x≦2),
H1: f(x|H1) =
0 (その他)
図 6.2. 密度関数の比較
このとき、無作為に抽出した1つの値 x を用いて検定することを考える。有意水準αとす
るとき、上の図から棄却域は
x
x
dxHxf
1
1
0 )(
を満たす x0 に対して
W: 1-x0≦x≦1 + x0
で与える場合が、最良であることが分かる。その場合の検出力は
PW(α) =
x
xW
xdx
xdxHxf
1
1
2
124
1
4
13)(
で計算される。 □
問 6.9. 確率変数 X が正規分布 2,N に従うとき、H0: 0 , H0: 0 の検定を 1
つの値 x で行う。有意水準 αに対して次の2つの棄却域を考える。
W1: )(0 qX , W2: )2/(,)2/( 00 qXqX ,
帰無仮説と対立仮説の密度関数
0
0.2
0.4
0.6
0.8
1
0 0.5 1 1.5 2
H0
H1
9
検出力を比較することにより、どちらの検定法が良好であるか判断せよ。
上の例で示したことを、理論的に述べる。
定義 6.1. 母数θをもつ分布(母集団)に関する仮説 H0:θ=θ0 と対立仮説 H1:θ=θ1 の
検定での有意水準αの棄却域 W0 が、同じ有意水準の任意の棄却域 W に対して
P(W0 |θ1) ≧P(W |θ1) (6.22)
を満たすとき、棄却域 W0 による検定は最強力検定(the most powerful test)という。ここに、
確率 P( |θ)は母数をθとしたときの確率(測度)とする。 □
次の定理は最強力検定を求める方法である。証明を略して上げる。
定理 6.1. (ネイマン=ピアソンの補題) 母数θをもつ母集団からの標本 x1,x2,…,xn に対し
て、その同時密度関数または確率関数を、f(x1,x2,…,xn|θ)とする。仮説 H0:θ=θ0 と対立
仮説 H1:θ=θ1 の検定で
W0 = {(x1,x2,…,xn)| f(x1,x2,…,xn|θ1)/f(x1,x2,…,xn|θ0)≧k} (6.23)
P(W0|θ0) = α (6.24)
を満たすように、定数 k を決めるとき、棄却域 W0 は最強力検定を与える。 □
上の定理は標本の同時密度を比較することによって、最強力検定を構成している。すなわ
ち、対立仮説 H1:θ=θ1 の下での標本密度あるいは確率が、仮説 H0:θ=θ0 の下でのものに
比較して、k 倍大きい標本領域を棄却域にすることが有意水準を一定とした検定の中で最
良であることを主張している。この定理を例 6.6 に適用すると、この例の棄却域が最強力
検定を与える。
[例 6.7] 正規母集団 N(μ,σ2)で分散は既知とする。いま、仮説 H0:μ=μ0, H1:μ=μ1 (>μ0)
の検定を考える。無作為標本 x1,x2,…,xn の同時密度関数は N(μ,σ2)の下で、次のように与
えられる。
f(x1,x2,…,xn|μ) = C×
n
i ix1
2
2
12exp
ここに、C は定数である。正の定数 k に対して、
log f(x1,x2,…,xn|μ1) -log f(x1,x2,…,xn|μ0) ≧ log k
を満たす領域を棄却域にすればよい。この式から
knxn
i
i log1
2
2
0
2
1
1221
を得る。この式を解いて
2
2
0
2
1
01
2
1 2log'
nkk
n
xx
n
i
i
が得られる。このことから、最強力検定は、標本平均を用いて
W = {x-
| x-
≧ k’}
10
を満たすように決定すれば良いことが分かる。仮説 H0:μ=μ0 のとき、標本平均X_
は N(μ0,
σ2/n)に従い、一定の有意水準αに対して k’は対立仮説に無関係である。但し、この結果に
用いている仮定はμ1 >μ0 である。このような検定を一様最強力検定という。このことか
ら、6.3(i)で与えた片側検定における棄却域(6.13)と(6.14)は一様最強力検定である。一方、
対立仮説 H1:μ≠μ0 の下では一様最強力検定は存在しない。従って、6.3(i)の両側検定にお
ける棄却域(6.12)は一様最強力検定ではない。しかし、棄却域(6,12)もある基準で良好な検
定を与える(一様最強力不偏検定)。 □
[例 6.8] 例 6.2 の仮説 H0: 平均μ=70, H1: μ>70 に対して与えた棄却域 z > 1.64 は有意
水準 0.05 での最強力検定である。ここに、検定統計量は Z= 20 (X_
-70)/6.5 である。 □
一般に最強力検定を構成することは難しいが、t 分布、χ2 分布あるいは2項分布等は標本
数が大きいときに、正規分布に近づき、前に述べた棄却域は漸近的に一様最強力あるいは
一様最強力不偏検定を与える良好な検定法である。
6.5. 漸近的な検定法
同一の母集団または分布からの無作為(独立)標本 X1, X2,…,Xn の和は、漸近的に正規分
布に従う。この中心極限定理の性質が母数に関する検定で重要となる。
(i) 特定事象の確率に関する検定
ある事象の発生に関して、独立試行を n 回反復する場合を考える。この場合の観測変量
は、X =0 (発生しない)、X =1 (発生する)であり、p= Pr(X =1)とする。反復回数 n が
十分大きいとき、確率 p は標本平均X----
で推定され、漸近的に正規分布 N(p,p(1-p)/n)に従う。
従って、帰無仮説 H0: p=p0 の検定では、
00
0
1 pp
pXnZ
が、仮説の下で標準正規分布に従うことを利用する。前節の正規分布の平均に関する検定
法を参考にすれば良い。
[例 6.9] ある疾患の患者群に薬剤 A を投与するとき、確率 p0= 0.5 より大きい確率で、効果
が期待できるとされている。このことを検定するために、100 人の患者に一定期間投与後、
65 人に良好な結果が認められた。このとき、仮説 H0: p=0.5, H1: p > 0.5 の検定を有意水準
0.05 で行う。この検定では
n = 100, 65.0ˆ pX
であり、
0.3
5.05.0
5.065.0100
Z
を得る。この場合の検定は片側であり、標準正規分布の上側 5%点 q(0.05) = 1.64 と比較し
て、仮説を棄却する。
11
問 6.8. ある疾患に対する効果が確率 0.80 以上とされる薬剤と患者 100 人に投与し、75 人
に効果が認められた。帰無仮説 H0: p = 0.8 として、H1: p< 0.8 に対して有意水準 0.05 で検
定せよ。
問 6.10. 例 6.1 で H0: P(1 の目が出る) = 1/6 を H1: P(1 の目が出る) ≠ 1/6 に対して有意水準
0.05 で検定せよ。
問 6.11. 例 6.1 で 4 の目は出現しやすいかどうか、有意水準 0.05 で検定せよ。
(ii) 相関係数の検定
相関係数ρをもつ二変量正規分布からの無作為標本(x1,y1), (x2,y2),…, (xn,yn)を得た場合の
相関係数の最尤推定値は標本相関係数 r である。仮説 H0: ρ = 0 の検定は、仮説の下で
21
2
r
rnt
が自由度 n-2 の t 分布に従うことを利用する。
[例 6.10] 男子学生 36 人を抽出し、身長と体重の標本相関係数を求めたところ、r= 0.722
であった。有意水準 0.05 で身長と体重の相関性の検定をする。検定する仮説は H0: ρ = 0;
H1: ρ > 0 である。このときの t 統計量は自由度 34 で、
085.6722.01
722.0236
2
t (6.25)
を得る。棄却限界点は、上側 5%点 t(34,0.05) = 1.691 である。従って
t = 6.085> t(34,0.05) = 1.691
から、帰無仮説は棄却される。
問 6.12. 次のデータは平均歯周ポケットの深さ(mm)と BMI のデータである。相関があるか
どうかの検定を行え。
被験者 1 2 3 4 5 6 7 8 9 10
ポケット 1.74, 1.86, 1.84, 1.79, 2.05, 2.71, 1.60, 2.88, 3.35, 2.11
BMI 24.4, 21.0, 28.2, 25.8, 23.2, 29.4, 25.8, 23.7, 26.3, 22.1
ٱ
推定論で述べたように、相関係数ρの二変量正規分布からの標本(X1,Y1),(X2,Y2),…,(Xn,Yn)
に基づく標本相関係数 r に対して、フィッシャーの Z 変換を行うとき
Z = 21 log(1+r)/(1-r)
の分布は N(21 log(1+ρ)/(1-ρ),1/(n-3))で近似できる。このことを用いて、相関係数ρに関す
る検定が正規分布の検定として行える。この場合の仮説は H0: ρ = ρ0 (≠0)として適用でき
る点は上の場合と異なり、標本数が大きい場合の漸近的検定法である。この方法を上の例
に適用する。Z 変換は
722.01722.01
21 logz 0.912
12
であり、この値を標準化すると
912.0236 5. 3167 (6.26)
である。この場合の棄却限界点は 1.645 であり、例と同じように帰無仮説は棄却される。
問 6.13. 次のデータは男子学生の胸囲と座高のデータである。相関係数に関する仮説 H0:
ρ = 0.6 を H1: ρ > 0.6 に対して有意水準 0.05 で検定せよ。
表 6.1. 男子学生の身長(cm)と体重のデータ(kg)
学生 1 2 3 4 5 6 7 8 9 10
X 164.2 177.5 169.0 172.2 171.4 169.9 168.7 172.1 169.6 166.6
Y 59.3 73.0 60.4 59.7 65.7 58.6 54.4 60.5 62.0 62.2
学生 11 12 13 14 15 16 17 18 19 20
X 168.8 171.9 171.8 174.4 172.7 174.6 172.0 166.8 163.2 164.5
Y 54.6 64.6 61.6 60.1 63.4 65.9 63.8 62.5 49.3 51.1
学生 21 22 23 24 25 26 27 28 29 30
X 174.5 169.9 175.2 171.1 166.4 158.8 168.1 173.4 156.5 180.7
Y 60.3 54.2 62.9 67.7 50.2 52.4 65.6 60.3 48.8 76.9
6.6. 検出力に基づく標本数の決定
例 6.9 では仮説 H0: p=0.5, H1: p > 0.5 の検定を行ったが、医学的な差δを予め決めて、
H0: p=0.5、H1: p = 0.5+δの検定での検出力が一定値以上になるように標本数を考える場
合がある。ここでは、δ=0.1, 検出力 0.80 として、そのために必要な標本数を考える。検
定統計量は
5.0
5.0ˆ
5.05.0
5.0ˆ
pnpnZ
であり、この統計量は帰無仮説 H0 のとき標準分布に従い、棄却域は
Z > 1.64
で与えられる。対立仮説 H1: p = 0.6 が真の場合に、Z は漸近的に平均 5/n , 分散 24/25
の正規分布に従うことが分かる。従って、検出力は
V =
24
64.15
24
555
nnZ
の確率として計算される。ここに、V は対立仮説の下で標準正規分布に従う。上側確率 0.80
の点は-0.84 であるから、
84.0
24
64.155
n
を標本数 n について解けば n = 380 を得る。これは意味のある差を検出力 0.8 で検出するた
めの最低の標本数である。このように、意味のある差に関する検出力を保証する標本数を
13
決定することは有用である。
問 6.14. 薬剤の市販後第三相臨床試験では、有意水準と共に検出力を考えて、標本数が決
定される。ある疾病に対する現行薬の効果が確率 0.60 とするとき、新薬の効果に対して確
率 0.60+δ において δ=0.05 の場合の検出力を 0.80 とするように標本数を設定すると仮定
する。この場合の最低の標本数を求めよ。
6.7. 正規分布の二標本検定
2 つの正規母集団 N(μ1,σ12)と N(μ2,σ2
2)からの無作為標本を、それぞれ X1,X2,…,Xm;
Y1,Y2,…,Yn とする。このとき、平均値の差の検定を考える。ここで言う2母集団とは、男
女のように属性による分け方と実験に措ける処理群と対照群のように人工的に 2 母集団の
構成する場合がある。
[例 6.11] 高血圧患者 20 人を無作為に2群に分け、処置群には薬剤 A を、また対照群には
プラセボを一定期間投与して、次の拡張期血圧データを得た。
処置群(A): 98.0, 98.5, 100.2, 103.0, 98.5, 107.8, 80.2, 81.5, 90.6, 91.2;
対照群(P): 105.2, 91.8, 102.9, 108.5, 113.2, 91.5, 92.6, 95.9, 103.4, 104.6. (mmHg)
このデータから、この 2 群での平均値に差があるかどうかの検定を行う。この場合の仮説
は H0: μ1=μ2, H1: μ1<μ2 である。 □
上の例のような検定では、2 母集団の分散が等しい場合と異なる場合では取り扱いが異な
る。まず、母集団分散についての検定法を与える。
(i) 等分散性の検定
この場合の仮説は H0: σ12=σ2
2, H1: σ1
2≠σ22 である。2 つの標本からの不偏分散をそ
れぞれ U12, U2
2 とするとき、その分散比(F 統計量)
F = U12/U2
2 (6.25)
は、仮説 H0: σ12=σ2
2 の下で自由度対(m-1,n-1)の F 分布に従う。このときの棄却域は、有
意水準αに対して
W: F >F(m-1,n-1,α/2), F < F(m-1,n-1,1-α/2) (6.26)
で与えられる。ここに、F(m-1,n-1,α/2)と F(m-1,n-1,1-α/2)は自由度対(m-1,n-1)の F 分布の
上側確率α/2 と 1-α/2 である点である。F 分布表で棄却限界点を求めるときは、
F(m-1,n-1,1-α/2) =1/F(n-1,m-1,α/2)
が成立することを利用する。これは、(6.25)で
1/F = U22/U1
2
であり、1/F が自由度対(n-1,m-1)の F 分布に従うことに基づく。
例 6.11 で等分散性の検定を行う。不偏分散はそれぞれ
u12 = 80.38, u2
2= 57.39
で与えられ、F 統計量の値は
14
F0 = u12/u2
2 = 1.401
である。有意水準をα=0.05 として、
F(9,9,0.025) = 4.025992, F(9,9,0.975) = 0.248386
を得る。従って、等分散性は採択される。
(ii) 等分散性の下での平均値差の検定 H0: μ1=μ2
2 つの標本の標本平均をそれぞれ YX , で示すとき、t 統計量
)(
)2(
11 2
2
2
1nm
nmmn
UnUm
YXt
(6.27)
は帰無仮説の下で自由度 m+n-2 の t 分布に従う。このことを用いて、仮説の検定ができる。
対立仮説としては H0: μ1≠μ2, H0’:μ1>μ2, H0”:μ1<μ2 が考えられる。
例 6.11 の 2 群比較を行う。この場合の t 統計量の値は、t0 = -1.619 である。有意水準 0.05
での棄却限界点は t(18,0.05) =1.734 であり、帰無仮説は棄却されない。この結果から、薬
剤 A による有意な効果が認められない。
(iii) 等分散性が認められない場合の平均値差の検定 H0: μ1=μ2
この場合の検定統計量は
nUmU
YXt
//*
2
2
2
1
(6.28)
を用いる。この統計量は帰無仮説の場合に t 分布に従わず、次の自由度をもつ t 分布で近
似される。この方法をウェルチの方法という。
自由度 =
11
2
22
nW
mV
WVに最も近い自然数
ここで、
n
UW
m
UV
2
2
2
1 ,
である。
問 6.15. ある年齢層から無作為に抽出された男性 5 人と女性 6 人の血清コレステロール値
を測定し、次のデータを得た。データが正規分布しているものとして、平均値に関する男
女間の差の検定を行え。また、平均値の差の 95%信頼区間を作り、検定結果と比較せよ。
男性: 167, 208, 225, 200, 182;
女性: 222, 168, 198, 186, 150, 180 (mg/l)
6.8. 漸近的二標本検定
平均と分散が(μ1,σ12)と(μ2,σ2
2)である 2 つの母集団からの無作為標本を、それぞれ
X1,X2,…,Xm; Y1,Y2,…,Yn とする。このとき、平均値の差 21 の検定を考える。この場合
の検定統計量は2
2
2
1 であれば(6.27)と同じ統計量
15
)(
)2(
11 2
2
2
1nm
nmmn
UnUm
YXZ
を用い、2
2
2
1 ならば(6.28)と同じ統計量
nUmU
YXZ
//*
2
2
2
1
を用いて検定を行う。これらは t 分布に従わないが、標本数 n と m が大きい時は帰無仮説
の下で漸近的に標準正規分布する。このことを利用して検定を行う。
表 6.2. 大分県のヒトT細胞白血病ウイルスI型献血データ(1989 年)
年齢群 男性 女性
献血者数 感染者数 相対度数 献血者数 感染者数 相対度数
[15,19] 14264 191 0.0134 15977 140 0.0088
[20,29] 13426 219 0.0163 11098 136 0.0123
[30,39] 15179 446 0.0294 5079 147 0.0289
[40,49] 11863 370 0.0312 5501 221 0.0402
[50,65] 7477 298 0.0399 4356 244 0.0560
合計 62209 1524 0.0245 41017 1106 0.0270
年齢 50 歳から 65 歳[50,60]での男女間の感染者比率の検定を行う。男女の感染者比率を
それぞれ πMと πFで示すとき、ヒトT細胞白血病ウイルスI型は母乳を通しての母子感染
と男女間の性感染によって感染する。男性から女性への性感染率が高く、帰無仮説と対立
仮説はそれぞれ H0: πM= πF, H1: πM < πFである。上の記号に合わせて、X と Y でそれぞ
れ男性と女性の感染状態とする。すなわち、抽出された任意の人が感染しているとき 1、
非感染のとき 0 とする。この記号の下で
4356,7477 nm , 0560.0,0399.0 YX
429.284)1()1( 2
1 XXmUm , 276.230)1()1( 2
2 YYnUn
であり、
042.4Z
を得る。有意水準を 0.05 とするときの棄却域は
96.1Z
であるから、帰無仮説は棄却され、検定結果は有意である。このときの p 値は 8.01×10−5
である。
問 6.16. 各年齢群で男女の感染比率を有意水準 0.05 で比較せよ。
問 6.17. ある疾患の患者 50 名を無作為に 25 名ずつ A 群と B 群に割り付け、新薬と現行薬
の効果について比較する。A 群には新薬、B 群には現行薬を一定期間投与しその有効性を
16
観察する。それぞれの群での有効確率をそれぞれ pA, pB とする。また、それぞれの群での
有効である人数を nA, nB で表す。
(1) 有効確率の推定値をそれぞれ25
ˆ,25
ˆ BB
AA
np
np とするとき、 BA pp ˆˆ の漸近分布を
求めよ。
(2) (1)を用いて、pA-pB の 95%信頼区間を求めよ。
(3) 実験結果で、A と B 群でそれぞれ、18 名と 12 名が有効であった。このとき、新薬が
現行薬より効果があるかどうかの検定を行え。
6.8. 信頼区間と検定の棄却域
正規母集団 N(μ,σ2)から標本数 n の標本を抽出したとき、標本平均と不偏分散をそれぞ
れ、X----
, U2 で示す。このとき、平均の 100(1−α)%信頼区間は
X----
- t(n-1,α/2)n
U <μ < X----
+ t(n-1,α/2)n
U (6.28)
で与えられる。ここで、仮説 H0: μ =μ0 の検定を考えると、その棄却域は
X----
>μ0 + t(n-1,α/2)n
U , X----
< μ0 - t(n-1,α/2)n
U (6.29)
で与えられる。(6.28)と(6.29)から仮説が棄却されることと、μ =μ0
が信頼区間(6.28)に入らないことが同値であることが分かる。すなわち、(6.29)は
μ0 < X----
- t(n-1,α/2)n
U , μ0 > X----
+ t(n-1,α/2)n
U
と同値である。一般に、母数θの 100(1-α)%信頼区間に、仮説 H0 の値θ =θ0 が含まれな
い場合に仮説は有意水準αで棄却されることになる。前章で述べたように母数を最尤推定
する場合に、その推定値の漸近分布は正規分布である。標本数が十分大きいときは、この
結果を用いて母数の信頼区間が作られる。統計解析ソフトを用いると、信頼区間が自動的
に出力されるが、その基礎理論は最尤推定量の漸近正規性である。
6.9. χ2 検定(母数が既知の理論モデルの検証)
1回の試行で注目する事象 A が起こる確率を p1、その余事象 Aの起こる確率を p2 とす
る。この試行を n 回反復し、A が n1 回出現したときの p1 の推定値は
n
np 1
1ˆ (6.30)
である。この推定量は中心極限定理により、漸近的に N(p1,p1p2/n)に従う。ここに、p1 + p2 =1
である。このことを用いると、
17
2
2
22
1
2
11
11
2
11
21
2
112
)1(
/ˆ
np
npn
np
npn
pp
pnnn
pp
ppnX
(6.31)
は自由度1のχ2 分布に従う。この統計量をχ2 統計量という。一般に次のように拡張され
る。一回の実験で事象 Ai が起こる確率を pi (i=1,2,…,I)、n 回の反復実験で Ai が起こる回数
を ni とする。このとき、
I
i i
ii
np
npnX
1
2
2 (6.32)
は漸近的に自由度 I-1 のχ2 分布に従う。この統計量は理論モデルの検証のために用いられ
る。但し、χ2 統計量を用いる場合は ni または npi が5以上とされ、この条件を満たさな
い場合はカテゴリを適当に合併する必要がある。このような検定を理論モデルの適合度検
定という。
[例 6.12] メンデルの遺伝法則の検証
白粉花は因子型とその表現形が次の表のようになっている。
表 6.3. 白粉花の遺伝法則
因子型 (赤、赤) (赤、白) (白、白)
表現形 赤 桃色 白
このことから、理論上は桃色の花を交配させた種を栽培すれば、赤、桃色、白の花が 1:2:1
の割合で出現する。120 株を栽培した結果と理論値は次の表で示される。
表 6.4. 白粉花の理論値と観測データと
色 赤 桃色 白
度数 26 66 28
理論値 30 60 30
このとき、χ2 統計量は次のように計算される。
X2 = (26 – 30)
2/30 + (66 – 60)
2/60 + (28 – 30)
2/30 = 1.267
自由度 2 のχ2 分布の棄却限界点はχ2(2,0.05) = 5.991 であるから、検定は有意ではなく、
理論モデルは採択される。ٱ
モデルの適合度検定には、次の尤度比検定統計量も良く用いられる。
I
i i
i
inp
nnR
1
2 log2 (6.33)
この統計量は標本数が大きいとき、統計量 X2 の漸近分布に等しくなる。従って、漸近分布
は自由度 I-1 のχ2 分布である。この統計量は情報量に関係があるので、後の章で説明をす
る。
問 6.18. 例 6.12 を R2 で検定せよ。
18
6.10. χ2 検定(母数が未知の理論モデルの検証)
6.8 節と同じように一回の実験で事象 Ai が起こる確率を pi (i=1,2,…,I)、n 回の反復実験で
Ai が起こる回数を ni とする。上では確率 pi (i=1,2,…,I)は既知であったが、一般には未知で
ある場合が多く、いくつかの母数 θa (a=1,2,…,k)の関数である。すなわち、pi (θ1,θ2,…,θk)
(i=1,2,…,I)である。ただし、k < I とする。母数の最尤推定量を a (a=1,2,…,k)とするとき、
確率の最尤推定量は kip ˆ,...,ˆ,ˆ 21 (i=1,2,…,I)で与えられる。このとき、統計量
I
i ki
kii
np
npnX
1 21
2
212
)ˆ,...,ˆ,ˆ(
)ˆ,...,ˆ,ˆ(
は、標本数 n が大きければ理論モデルが正しいときに自由度 1 kI のカイ自乗分布に従
う。このことを利用して、理論モデルの検証を行う。
[例 6.13] 血液型データに基づいて、ハーディ・ワインバーグの理論を検証する。表 6.5
はアメリカ人の血液型のデータである。
表 6.5. アメリカ人の血液データ
A 型 B 型 AB 型 O 型
389 95 52 463
このデータから、血液型 A, B, O 配偶子頻度の最尤推定値 6728.0ˆ,076.0ˆ,251.0ˆ rqp
を得る。この場合のカイ 2 乗統計量の値は
180.7
19.452
19.452463
16.38
16.3852
99.107
99.10795
66.400
66.4003892222
2
X
で、棄却限界点はχ2(1,0.05) = 3.841 であるから、同じ集団内で長期に亘り任意婚が行われ
た場合のモデルは棄却される。母数は見かけ上で 3 個あるが、p+q+r=1 のために 2 個と考
える。従って、統計量の自由度は、 1214 である。おそらく、多民族国家のために、
多民族の血液データが混合している証拠であると考えられる。
問 6.19. 次のデータはイギリス、ドイツ、フランス人の血液データである。それぞれ A, B,
O の配偶子頻度を推定し、同一集団内での血液型遺伝モデルが成立するかどうか有意水準
0.05 で検定せよ。
表 6.5. イギリス人の血液データ
A 型 B 型 AB 型 O 型
348 98 39 514
19
表 6.6. ドイツ人の血液データ
A 型 B 型 AB 型 O 型
444 126 46 384
表 6.7. フランス人の血液データ
A 型 B 型 AB 型 O 型
438 106 25 431
問 6.20. 次のデータはオラウータンとヒヒの血液データである。同一集団内での血液型遺
伝モデルが成立するかどうか、有意水準 0.05 で適合検定をせよ。
表 6.8. オラウータンの血液データ
A 型 B 型 AB 型 O 型
34 12 14 0
表 6.9. ヒヒの血液データ
A 型 B 型 AB 型 O 型
144 294 246 0
6.11. 独立性検定
変量 X と Y がそれぞれ、カテゴリ{C1,C2,…,CI}と{D1,D2,…,DJ}を値として取るとき、
pij = P(X = Ci,Y = Dj) (i=1,2,…,I; j=1,2,…,J)
pi+ = P(X = Ci) =
J
j
ijp1
(i=1,2,…,I)
p+j = P(X = Dj) =
I
i
ijp1
(j=1,2,…,J)
とする。この場合、変量 X と Y が独立であれば
H0: pij = pi+p+j (i=1,2,…,I; j=1,2,…,J)
が成立する。2変量間の連関関係を調べる為には、前節で述べた統計量 R2 あるいは X
2 を
修正して用いる。前節では母数(確率)は与えたが、この場合は推定する必要がある。N
を実験回数、nij を X = Ci,Y = Dj である観測度数とするとき、仮説 H0 のとき pij は(ni+/N)(n+j/N)
で推定される。ここに
ni+ =
J
j
ijn1
(i=1,2,…,I); ni+ =
J
j
ijn1
(i=1,2,…,I);
である。用いる検定統計量は
20
N
np
N
np
nNn
nnNn
ppN
ppNn
pN
pNnX
j
ji
i
I
i
J
j ji
jiij
I
i
J
j ji
jiijI
i
J
j ij
ijij
ˆ ,ˆ
ˆˆ
ˆˆ
ˆ
ˆ
1 1
2
1 1
2
1 1
2
2
(6.33)
となる。この統計量は帰無仮説の下で、自由度(I-1)(J-1)のχ2 分布に従う。
[例 6.14] ある疾患に関する 50 歳以上の男性患者 339 名に対して、喫煙と気管支炎の連関
関係を調べるために、次のデータを得た。この結果を用いて、連関関係の有無を有意水準
0.05 で検定する。
表 6.10. 気管支炎データ
気管支炎
あり なし 計
喫煙 あり 43 162 205
なし 13 121 134
計 56 283 339
検定統計量の値は X2 = 6.674 で、χ2 分布の自由度は 1 である。このときの棄却限界点は
χ2(1,0.05) =3.841 であり、独立性の仮説は棄却される。□
独立性検定の尤度比検定統計量は
I
i
J
j ji
ij
ijnn
NnnR
1 1
2 log2 (6.34)
になる。
問 6.21. 例 6.14 を R2 で検定せよ。
6.12. フィッシャーの正確検定
前節では各カテゴリ(セル)の観測度数が十分大きな場合の漸近的検定法を考えた。こ
こでは、観測度数が大きくない場合(希薄データ)の検定法を与える。
[例 6.15] 現行薬と新薬の効果を調べるために、患者20人を10名ずつの2群に分けて調
査し、次のデータを得た。
21
表 6.11. 薬効比較データ
効果(Y)
薬剤(X) あり なし 計
現行薬 3 7 10
新薬 5 5 10
計 8 12 20
このデータは希薄であり、χ2 統計量の漸近性が成立しない。このようなとき、変量の独
立性の下で確率を直接に計算し、検定する方法が考えられる。□
この節では、2×2 分割表の独立性解析について考える。仮説 H0: pij = pi+p+j (i=1,2,…,I;
j=1,2,…,J)のとき、母数 pi+と p+j は連関の情報を持たず、連関の解析には必要でない母数で
ある。このような母数を局外母数(nuisance parameter)という。母数 pi+と p+j はの十分統計量
は、それぞれ周辺度数 ni+と n+j であり、これらを与えた下で、データ n11, n12, n21, n22 の条
件付き分布を求めて仮説の検定を考えればよい。この条件付き分布は、n1+, n2+, n+1, n+2 を
与えているので、n11 の条件付き分布と同値であり、
PHG(n11) =
1
21
2
11
1
n
N
n
n
n
n
(6.35)
になる。ここに、記号
k
jは j 個の異なるものから k を選ぶ場合の数を表し、
2121 nnnnN とする。これは超幾何分布である。
この場合の検定手順は次の通りである。
(i) 独立性の検定:対立仮説 H1: pij ≠ pi+p+j (i=1,2,…,I; j=1,2,…,J)の場合
(1) 有意水準αを定め
P(n11≦n0) ≦α/2
を満たす最大の整数 n0 を決定する。
(2) データの n11 に対して、
n11≦n0 または n11≧n1+-n0
であれば、仮説を棄却する。
(ii) 効果の検定:対立仮説 H1: p11/p1+ < p21/p2+の場合
22
この場合の検定は片側であり、手順は次のように与えられる。
(1) 有意水準αを定め
P(n11≦n0) ≦α
を満たす最大の整数 n0 を決定する。
(2) データの n11 に対して、
n11≦n0
であれば、仮説を棄却する。
例 6.14 のデータを対立仮説:新薬が現行薬より有効であるとして、有意水準 0.05 で検
定する。この場合は上の(ii)の片側検定に相当し、n0= 1 を得る。データでは n11= 3 である
から、帰無仮説は棄却されない。すなわち、新薬が有効であるとする積極的な根拠はない
ことになる。
問 6.22. 次のデータは喫煙に関する男女 10 人ずつの結果である。喫煙に性差があるかどう
か検定せよ。
表 6.12. 喫煙データ
喫煙 あり なし 合計
男 9 1 10
女 2 8 10
合計 11 9 20