読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf ·...

26
2 2003 12 5 可能な限りわかりやすく,かつ詳しく 読めばわからずにはいられない ( ) ( )

Transcript of 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf ·...

Page 1: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

読めば必ずわかる分散分析の基礎

第 2版 2003年 12月 5日

小野 滋

'

&

$

%

この解説書は,分散分析の基礎について,

可能な限りわかりやすく,かつ詳しく

説明することを目的としています。

簡潔さは犠牲にし,長くてくどいかわりに,

読めばわからずにはいられない

説明を目指したいと思います。

なお,説明中に用いる記号は,後藤ほか (編)「心理学マニュアル要因計画法」(北大路

書房)に準じています。

Page 2: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

2 目次

目次

第 I部 はじめに 3

1 予備知識 3

2 なぜ分散には 2種類あるのか? 6

3 平方和,自由度,平均平方 11

4 なぜ分散分析が必要か? 12

第 II部 基礎編 14

5 構造モデル 15

6 分散分析の前提 16

7 分散分析の発想 17

8 平方和の分解 19

9 平均平方の算出 21

10 平均平方の意義 22

11 F検定 25

12 まとめ: 1要因の分散分析 26

Page 3: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

3

第 I部

はじめに

1 予備知識'

&

$

%

この解説書では,全くの初学者を念頭において,できるかぎり易しい説明を試みます。

それでも,説明の都合上,データ解析と実験研究について,ある程度の知識が必要です。

そこで,読み進めるのにどうしても必要だと思われる予備知識を,17項目にまとめて

みました。以下のリストに目を通して,もし理解できない箇所があったら,その箇所を

復習してから,先に進んで下さい。

■量的データの記述

1.1 量的データの全体的な大きさをあらわす指標として,平均が用いられることが多い。データ

x1, x2, . . . , xn の平均 x(「エックス・バー」)は,

x =1n

n∑

i=1

xi

として求められる。

1.2 量的データのばらつきをあらわす指標として,分散と標準偏差(SDともいう)が用いられる

ことが多い。データ x1, x2, . . . , xn の分散 s2 は,

s2 =1n

n∑

i=1

(xi − x)2

として求められる。また標準偏差 sは,

s =√

s2

として求められる。

■母集団と標本

2.1 ある変量について,分析者が関心を持っている値の全体を,母集団と呼ぶ。

2.2 いっぽう,手元にあるデータの集まりを,標本 と呼ぶ。標本のなかに含まれている値の数

を,標本のサイズと呼ぶ。

2.3 標本はいわば,母集団から取り出した (抽出した) 値の集まりである,と考えることができ

る。標本の性質をもとに,母集団の性質を推測するためには,標本は次の 2つの性質を備え

ていなければならない:

Page 4: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

4 1 予備知識

不偏性 : 母集団から偏りなく抽出されていること

独立性 : 個々のデータが,互いに影響を及ぼしていないこと

これらの性質を備えている標本のことを,無作為標本と呼ぶ。

■確率分布

3.1 とりうる実現値にそれぞれ確率が割りふられている変数のことを,確率変数という。また,

それぞれの実現値に確率が割りふられているようすのことを,確率分布という。

3.2 重要な確率分布のひとつに,正規分布がある。平均 0,分散 1の正規分布を,とくに標準正

規分布と呼ぶ。

■母集団特性の推定

サイズ nの無作為標本から,母集団の性質について推定するとき,

4.1 母平均 µ (「ミュー」)の推定のためには,標本平均 xを用いるとよい。

4.2 母分散 σ2 (「シグマの二乗」)の推定のためには,標本分散 s2 を少し大きめに修正した不偏

分散

u2 =1

n− 1

n∑

i=1

(xi − x)2

を用いるとよい。

■仮説検定

5.1 仮説検定と呼ばれる手法は,次の 4つの段階からなる。

1. 帰無仮説(H0)を設定する。

2. 検定統計量を定める。

3. 決められた有意水準のもとでの棄却域を定める。

4. 標本から検定統計量の値を求め,棄却域と比較して,帰無仮説の棄却の有無を決定する。

5.2 有意水準は,「帰無仮説が真のとき,誤って帰無仮説を棄却してしまう」確率をあらわして

いる。5%ないし 1%がよく用いられる。

■実験研究の基礎概念

6.1 実験とは,いくつかの変数の値を研究者が操作し,それが別の変数にどう影響するか,を調

べる研究のことである。

6.2 したがって実験研究では,変数は次の 3つのどれかに分類されることになる。

従属変数 測定される変数。“原因-結果” という文脈でいえば,結果の側。

独立変数 研究者が操作する変数。要因,処理,説明変数,などともいう。

剰余変数 従属変数に影響を与えるかもしれないのに,研究者が操作していない変数。

6.3 独立変数のとる値は,いくつかに限られるのがふつうである。このとき,それぞれの値を水

準という。

Page 5: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

5

6.4 独立変数が複数ある実験の場合,水準と水準の組み合わせのことをセルという。

6.5 あるセルのなかにある測定値の数のことを,繰り返し数と呼ぶ。

6.6 心理学での実験研究においては,独立変数 (要因)の操作のしかたを,つぎの 2種類におお

まかにわけることができる。

被験者間要因 : 要因の各水準ごとに,異なる被験者が用意される場合

被験者内要因 : 各被験者が,その要因のすべての水準の下で実験を行う場合

Page 6: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

6 2 なぜ分散には 2種類あるのか?

2 なぜ分散には 2種類あるのか?'

&

$

%

予備知識 4.2として挙げた「不偏分散」については,多くの人が納得のいかない思いを

するようです。なぜ,本来の分散 (標本分散)のほかに,不偏分散が必要なのでしょうか?

この 2つはどのように使いわければ良いのでしょうか?

そこで,以下に 3通りの説明 (梅,竹,松)を用意しました。先に進むほど,突っ込ん

だ議論になります。

すくなくとも,梅コースの内容については,きちんと理解してください。竹コース・松

コースは,読み飛ばしてもかまいません。

2.1 梅コース

データ x1, x2, · · · , xn について,全体的な大きさをあらわす指標としては,平均

平均 x =1n

n∑

i=1

x

がよく用いられる。

また,値のばらつきをあらわす指標としては

標本分散 s2 =1n

n∑

i=1

(x− x)2

不偏分散 u2 =1

n− 1

n∑

i=1

(x− x)2

の 2種類がよくもちいられる。

データについて述べる際,標本分散 s2(ないし標本標準偏差 s)を用いるべきか,それとも不偏分

散 u2(ないし不偏標準偏差 u)を用いるべきかは,記述の目的によって決まる問題である。

• 手元のデータそのものについての要約に重点がある場合には,標本分散を• 母集団についての推測に重点がある場合には,不偏分散を

用いるのが理にかなっている。もっとも,どちらを使ってもおかしくないケースも多い。

Page 7: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

2.2 竹コース 7

2.2 竹コース

手元にあるデータ x1, x2, · · · , xn が,ある母集団からの無作為標本だとみなせる場合について考

える。母集団のなかには無限個の (ないし,非常に多くの)値が含まれていると考えられるが,それ

ら無限個の値にも,平均や分散があると考えることができるだろう。ここで,母平均 (母集団の平

均)を µ,母分散 (母集団の分散)を σ2 と表記することにする。

では,手元にあるデータから,母集団の性質を推測する方法について考えてみよう。

■母平均の推定量 まず,母平均 µを推定するためには,標本のどのような性質に着目すればよい

だろうか。いろいろな考え方がありうるが,一般的にいって,標本平均 xに着目するやり方が,一

番優れていることがわかっている。そこで,母平均 µの推定のためには,標本平均 xを用いる。

■母分散の推定量 ところが,母分散 σ2 の推定という問題は,さほど簡単ではない。標本の分散

s2 は,一般的にいって,σ2 よりも少し小さめの値になってしまう。なぜか?

もともと分散とは,「それぞれの値と平均との距離 (偏差)の二乗の平均」をあらわすものである。

だから,σ2 の推定量としては,本来は 1n

∑(xi − µ)2 がふさわしいのである。

しかし現実には,母平均 µの値はわからないので,標本平均 xで代用せざるを得ない。ところ

が 1n

∑(xi − x)2 は,本来の推定量 1

n

∑(xi − µ)2 よりも,少し小さめになってしまう。なぜなら,

いま任意の値 cについて∑

(xi − c)2 を求めることにすると,その値が一番小さくなるのは,cが

xに一致するときだからである。

そこで,s2 を少し大きめに修正したものを,σ2 の推定量にすればいい,という考え方が登場す

る。この修正された分散を「不偏分散」と呼んでいる。ここで,

不偏分散 u2 =1

n− 1

n∑

i=1

(xi − x)2

であるということがわかっている (2.3参照)。母分散 σ2 の推定のためには,この不偏分散 s2 を用

いる。なお,不偏分散と区別するために,本来の分散を「標本分散」と呼ぶことがある。

Page 8: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

8 2 なぜ分散には 2種類あるのか?

2.3 松コース

では,なぜ不偏分散 u2 の分子は n − 1なのだろうか?どうしても気になってしかたがないあな

たのために,徹底的な説明をお送りしよう。

2.3.1 確率変数と期待値

まず,期待値という概念を導入する。少し抽象的な話になるので,ゆっくり読み進めてほしい。

数学の世界では,取りうる値 (実現値)に確率が割り振られているような変数のことを,確率変数

と呼んでいる。ある確率変数 Y について,その確率分布の平均を,Y の期待値 E(Y )と呼ぶ。

たとえば,「サイコロを振ったときに出る目」という変数 X は,実現値 (1, 2, 3, 4, 5, 6)に確率が

割り振られているので (すべて 1/6),確率変数だということができる。その期待値 E(X) は,サ

イコロを無限回振って手にはいる,無限個の目 (1, 1, 1, . . . , 2, 2, 2, . . . , 6, 6, 6)の平均値,すなわち

3.5である。

■ある変量の期待値 いま手元に,ある変量についての n個のデータ x1, x2, · · · , xn があるとしよ

う。これらのデータは,いわば X という謎のサイコロを n回振って手に入れた値だ,とみなすこ

とができる。つまり,変量 X は,確率変数だとみなすことができるわけである。

その期待値 E(X)とは,「データサイズ nが無限大にまで大きくなったときに,そこから得られ

る平均」のことである。手元のデータがなんらかの母集団の無作為標本であるならば,「無限大の

大きさの標本」とは,すなわち母集団のことになる。だから,これは母平均 µをあらわしている。

すなわち,E(X) = µ (1)

■ある変量のばらつきの期待値 つぎに,変量 X のあるひとつのデータと,その母平均 µとのず

れの大きさについて考えてみたい。そのためには,ずれの絶対値 |X − µ|ついて考えればよいだろう。しかし,絶対値は数学的に扱いが面倒なので,そのかわりに,ずれの二乗 (X − µ)2 について

考えることにする。

その期待値 E[(X − µ)2]とは,「無限大のサイズの標本について,すべてのデータからそれぞれ

の (X − µ)2 を求めた,その平均」のことである。さきにみたように,「無限大の大きさの標本」は

Page 9: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

2.3 松コース 9

母集団に相当するから,結局これは母分散 σ2 のことである。すなわち,

E[(X − µ)2] = σ2 (2)

■データの平均の期待値 では,上の n個のデータから求める統計量,たとえば平均 X について

考えてみよう。この値は,その値が確率的に決まるという意味で,いわば X という謎のサイコロ

を 1回振って手に入れた値だ,とみなすことができる。つまり,標本平均 X もまた,確率変数だ

とみなすことができる。

その期待値 E(X)とは,「もし標本抽出を無限回繰り返し,標本平均が無限個手に入ったら,そ

れらの平均はなにか」を意味する。当然それは,母平均 µに一致する。すなわち,

E(X) = µ (3)

である。

ところでこの式は,「標本平均 X は母平均 µの不偏推定量 (偏りのない推定量)だ」ということ

に対応している。このように,

「標本から得られる統計量○○は,母集団の特性××の不偏推定量だ」ということを,

E(○○) = ××とあらわすことができる。

■データの平均のばらつきの期待値 さて,標本平均 X は,母平均 µからさほど遠くない推定を

与えてくれることもあれば,大きく外してしまうこともあるだろう。そのばらつきの程度につい

て考えてみたい。そのためには,推定のずれの絶対値 |X − µ| の期待値について考えればよいだろう。しかし,絶対値は数学的に扱いが面倒なので,そのかわりに,推定のずれの二乗の期待値

E[(X − µ)2]について考えることにしよう。

証明は省くが,次の式が成り立つことがわかっている。

E[(X − µ)2] =σ2

n(4)

この式は,「母平均 µを,標本平均 X を用いて推定するとき,その推定のずれは,母集団の値のば

らつき σ2 が大きいときに大きく,標本サイズ nが大きいときに小さい」という,ごくあたりまえ

の事柄に対応している。

Page 10: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

10 2 なぜ分散には 2種類あるのか?

2.3.2 なぜ n− 1か

では,いよいよ本題に戻ろう。まず, u2 の分子の部分を変形する。∑

(xi − x)2

=∑

[(xi − µ) + (µ− x)]2

=∑

(xi − µ)2 + 2∑

(xi − µ)(µ− x) +∑

(x− µ)2

=∑

(xi − µ)2 − 2(x− µ)∑

(xi − µ) + n(x− µ)2

=∑

(xi − µ)2 − 2(x− µ)(∑

xi − nµ) + n(x− µ)2

=∑

(xi − µ)2 − 2(x− µ)(nx− nµ) + n(x− µ)2

=∑

(xi − µ)2 − 2n(x− µ)2 + n(x− µ)2

=∑

(xi − µ)2 − n(x− µ)2

第 1項∑

(xi − µ)2 の期待値は,

E[∑

(xi − µ)2] =E[(x1 − µ)2] + E[(x2 − µ)2] + · · ·+ E[(xn − µ)2]

=σ2 + σ2 + · · ·+ σ2 ←式 (2)

=nσ2

第 2項 n(x− µ)2 の期待値は,

E[n(x− µ)2] =n× E[(x− µ)2]

=n× σ2

n←式 (4)

=σ2

従って

E[∑

(xi − x)2]

= nσ2 − σ2 = (n− 1)σ2

E

[1

n− 1

∑(xi − x)2

]= σ2

であり,不偏分散 u2 が母分散 σ2 の不偏推定量であることがわかる。

Page 11: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

11

3 平方和,自由度,平均平方

今後の説明の都合上,いくつかの用語を紹介しておく。

■平方和 2種類の分散

標本分散 s2 =1n

n∑

i=1

(xi − x)2

不偏分散 u2 =1

n− 1

n∑

i=1

(xi − x)2

は,分子∑

(x− x)2 が共通している。この部分は,偏差の平方 (二乗のこと)の合計なので,偏差

平方和と呼んだり,単に平方和(SSと略記する)と呼んだりする。変動と呼ぶこともある。

■自由度 いっぽう,不偏分散の分子の部分 n−1を,この平方和の自由度(df と略記する)と呼ぶ。

自由度とは,自由に値をとることができる変数の数を指す用語である。たとえば,3つの変数

X1, X2, X3 があるとしよう。これらの変数の値について,平均と平方和を求める式は,

平均 X =X1 + X2 + X3

3平方和 SS = (X1 − X)2 + (X2 − X)2 + (X3 − X)2

となる。さて,平方和の式の右辺には,3つの変数が登場するが,X が決まっているとすると,自

由に動ける変数は 2つしかない (もし X = 10, X1 = 9, X2 = 10ならば,X3 の値は 11に決まっ

てしまう)。このことを指して,この平方和の自由度は 2である,と言う。

■平均平方 平方和を自由度で割ったもののことを,平均平方と呼ぶ (MS と略記する)。従って,

2章で示したのは,「標本の平均平方は母分散の不偏推定量である」ということであった,といいか

えることができる。

Page 12: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

12 4 なぜ分散分析が必要か?

4 なぜ分散分析が必要か?

4.1 水準が 3つ以上のときに必要だ

たとえば,次のような問題について考えてみよう。

例題 1 (後藤ほか編, p.30)

生徒の学習形態のちがいが,課題の達成に影響するかどうかを調べるために,あらか

じめ学力の等しい生徒をランダムにわけて,3つのグループを構成した。グループ 1で

は一斉指導,グループ 2では体験学習,グループ 3では仲間による討議学習をおこなっ

た。授業終了後,課題の到達度テストを実施したところ,次の得点 (略) が得られた。3

つの学習形態のあいだに差はあるか。

この例題について検討する際には,2つの路線がある。

■多重比較 ひとつの路線は,この問題を,次の 3つの問題と,それに対応する帰無仮説 (H0)に

分割する考え方である。

• 一斉指導と体験学習のあいだで,得点のちがいはあるか? (H0 : µ1 = µ2)

• 体験学習と討議学習のあいだで,得点のちがいはあるか? (H0 : µ2 = µ3)

• 一斉指導と討議学習のあいだで,得点のちがいはあるか? (H0 : µ1 = µ3)

これらの帰無仮説 (H0)のそれぞれについて,仮説検定の手法を用いて検討すればよい。

この路線はわかりやすいし,アイデアそれ自体はまちがっていない。しかし,この路線に沿っ

て,単純に t検定を繰り返すのは,統計学的にみて,深刻な誤りである (コラム参照)。このような

場合には,多重比較と呼ばれる手法を用いなければならない。

■分散分析 もうひとつの路線は,

• 3種類の学習形態の間に,得点のちがいはあるか? (H0 : µ1 = µ2 = µ3)

という問題ひとつだけについて,仮説検定の手法を用いて検討することである。これを可能にして

くれるのが分散分析である。

たいていの場合,多重比較よりも分散分析のほうが簡単だし,結果も解釈しやすい。

Page 13: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

4.2 要因が 2つ以上あるときに必要だ 13

■分散分析から多重比較へ 分散分析路線の欠点は,仮に「3つの学習形態の間に 得点のちがい

がある」という結果が得られたとしても,それではどれとどれの間にちがいがあるのかはわからな

い,という点である。

そこで,まず分散分析をおこない,「3つの学習形態の間に得点のちがいがあるか」という点を

調べ,ちがいがあることがわかったら,こんどは多重比較によって,「どれとどれの間にちがいが

あるか」を調べる,という方法が広く用いられている。このとき,後半の多重比較のことを,とく

に下位検定と呼ぶ。

4.2 要因が 2つ以上あるときに必要だ

この例題では,要因がひとつしかない。しかし,実験研究では,複数個の要因を同時に制御する

ことも多い。そのような場合には,分散分析の考え方がどうしても必要になる。

コラム:なぜ検定を単純に繰り返してはいけないのか

有意水準 5%で検定をおこなうとする。いま帰無仮説H0 が真であるとすると,誤ってH0 を棄却

する確率 (タイプ I エラーの確率)は 0.05である。さて,ひとつの論文のあちこちで,いろいろな

問題について別々のデータ解析がおこなわれているとする。検定が 3回おこなわれているとしよ

う。いま,検討されている 3つの H0 がすべて真であるときに,「論文のなかのどこか 1箇所以上

でタイプ I エラーを犯す確率」は, 1− 0.953 = 0.14と,意外に高くなる。10回のときには,実に

0.40である。

さらに,異なる検定が同じデータに基づいている場合には,より深刻な問題が生じる。たとえ

ば,A, B, Cの 3群間で,A vs. B, B vs. C, C vs. Aの 3つの t検定をおこなったとしよう。いま,

A の標本平均が,運悪く真の平均よりもずっと高かったとすると,その場合,A vs. Bの t検定で

も,A vs. Cの t検定でも,H0 が棄却されやすくなる。従って,検討されている 3つのH0 がすべ

て真であるときに,「どこか 1箇所以上でタイプ I エラーを犯す確率」は,1− 0.953 = 0.14より

も高くなり,予想がつかなくなる。

このように,単純に検定を繰り返すと,

• 全体を通じたタイプ I エラーの確率が高くなる。

• データが独立でない場合,タイプ I エラーの確率がわからなくなる。

このような場合には,多重比較のための特別な検定手法を用いなければならない。

Page 14: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

14

第 II部

基礎編

それではいよいよ,分散分析の考え方についての説明をはじめよう。次の例題を用いて説明する

ことにする。

例題 1 (後藤ほか編, p.30)

生徒の学習形態のちがいが,課題の達成に影響するかどうかを調べるために,あらかじめ学力の

等しい生徒をランダムにわけて,3つのグループを構成した。グループ 1では一斉指導,グループ

2では体験学習,グループ 3では仲間による討議学習をおこなった。授業終了後,課題の到達度テ

ストを実施したところ,次の得点が得られた。3つの学習形態のあいだに差はあるか。

学習形態 一斉指導 体験学習 討議学習5 8 74 4 66 3 83 3 93 7 107 9 96 8 85 7 93 3 75 4 8

平均 4.7 5.6 8.1 全平均 6.1

サイズ 10 10 10

実際の数値を書いているとわかりにくいので,説明文中では下の記号を用いることにする。

要因 A 水準 A1 水準 A2 水準 A3

x11 x12 x13

x21 x22 x23

x31 x32 x33

......

...xn1 xn2 xn3

平均 T1 T2 T3 全平均 Gサイズ n n n

Page 15: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

15

5 構造モデル

まず,例題 1の特徴を確認しておこう。独立変数(要因)はひとつ,3水準,水準間にデータの対

応がない (いわゆる被験者間要因)。各水準での標本サイズ (繰り返し数)は等しい。

例題 1のデータについて,「一斉指導群 1番さんの得点 (5)は,一斉指導を受けた被験者が本来

示す得点 (µ1)に,なんらかの影響 (ε11)が加わったものだ」というふうに考えてみよう。ここでい

う “なんらかの影響” とは,学習形態とは無関係な要因すべて,つまり,(この被験者の努力といっ

た)剰余変数がもたらす影響や,測定の誤差,偶然に生じる値のばらつきなどが含まれる。これを

ひとことで,誤差と呼ぶことにする。

一斉指導群 1番さんの得点 (5) = 一斉指導群の母平均 (µ1) +誤差 (ε11)

一斉指導群 2番さんの得点 (4) = 一斉指導群の母平均 (µ1) +誤差 (ε21)...

体験学習群 1番さんの得点 (8) = 体験学習群の母平均 (µ2) +誤差 (ε12)...

討議学習群 1番さんの得点 (7) = 討議学習群の母平均 (µ3) +誤差 (ε13)...

もっと簡潔に表現してみよう。水準 j(j = {1, 2, 3})の母平均を µj とすると,水準 j の i番目の測

定値 Xij は Xij = µj + εij とあらわすことができる。

さて,各水準の母平均 µ1, µ2, µ3 の平均を µ とあらわすことにし,µ1 = µ + τ1, µ2 = µ + τ2,

µ3 = µ + τ3 とする。ここで µは,すべての得点の母平均,つまり,学習形態によるちがいを除去

した得点の母平均をあらわしている。また τ1, τ2, τ3 は,3種類の学習形態が持っている,得点への

(プラスないしマイナスの)効果をあらわしている。すると,上の式は次のように書き直すことがで

きる。

全体の母平均を µ,水準 j の効果を τj とする。水準 j の i番目の測定値 Xij は

Xij = µ + τj + εij

この数式を,分散分析の構造モデルという。

Page 16: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

16 6 分散分析の前提

6 分散分析の前提

さて,分散分析では,誤差 εij が平均 0の正規分布に従い,その分散は等しい,と仮定する。

いいかえれば,

• {x11, x21, · · · , xn1}は,平均 µ + τ1 の正規分布に従う

• {x12, x22, · · · , xn2}は,平均 µ + τ2 の正規分布に従う

• {x13, x23, · · · , xn3}は,平均 µ + τ3 の正規分布に従う

• この 3つの正規分布の分散は等しい

と仮定する。

この仮定は,データの性質としては

• 各水準の内側でのデータの分布が,正規分布に近いこと (正規性)

• 各水準の内側でのデータの分散が,だいたい同じであること (等分散性)

に対応する。

例題 1のデータについてみると

• 3枚のヒストグラムは,どれもおおまかにいって,左右対称な山形であり,

• 3群の標準偏差は 1.35, 2.29, 1.14であり,あまり大きな差はない。

したがって,誤差についての仮定には無理がなさそうだ。

Page 17: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

17

7 分散分析の発想

■分散の分析とは? さて,いま知りたいのは,ガソリンによって燃費に差があるかどうかである。

仮説検定の枠組みに従えば,帰無仮説 H0 : τ1 = τ2 = τ3 を棄却できるかどうか,を検討すること

になる。

この問題について検討するためには,τ1, τ2, τ3 のそれぞれについて推定値を求め,その差を調べ

ればいいのではないか? . . .という方向に話を進めないのが,分散分析の面白いところである。分散

分析では,τ1, τ2, τ3 そのものについての推定をおこなうのではなくて,この 3つの効果の分散を推

定しようとする。これが「分散分析」という名前の由来である。

ここで,構造モデルの各項の分散について,呼び名と表記を決めておこう。

• Xij の分散,すなわち母集団全体の分散 (全分散)を,σ2Total と表記する。

• τj の分散 (つまり {τ1, τ2, τ3}の分散)を,要因分散と呼ぶ。σ2A と表記する

∗1。

• εij の分散を,誤差分散と呼ぶ。σ2Error と表記する。

測定値 全平均 要因の効果 誤差Xij = µ + τj + εij

↓ ↓ ↓全分散 要因分散 誤差分散σ2

Total σ2A σ2

Error

さて,

• もし学習形態によって得点に差がないならば,τ1 = τ2 = τ3 = 0なので,σ2A = 0である。

• もし学習形態によって得点に差があるならば,τ1, τ2, τ3 がなんであれ,σ2A 6= 0である。

だから,τ1, τ2, τ3 についての推定をおこなわなくても,要因分散 σ2A が 0かどうかを判断すれば,

用が足りるのである。

■要因分散についての検討とは? ところが,σ2Aの大きさについての検討は,一筋縄ではいかない。

まず,構造モデルの各項について,標本から推定する方法を考えてみると

• 全平均 µの推定量は G

∗1 後藤ほか (編)では σ2Treat と表記している。なお,σ2

A =n∑

τj

3− 1と定義しておく。

Page 18: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

18 7 分散分析の発想

• 各水準の効果 τj の推定量は (Tj − G)

• 誤差 εij の推定量は (xij − Tj)

以上の推定量を用いて,手元のデータに構造モデルをあてはめると

xij = G + (Tj − G) + (xij − Tj)

となる。母集団 Xij = µ + τj + εij

⇑ 推定 ⇑ 推定 ⇑ 推定標本 xij = G + (Tj − G) + (xij − Tj)

ところで,

(a) 測定値 xij の平均平方 (平方和を自由度で割ったもの)は,全分散 σ2Total の不偏推定量とな

る (3章参照)。

ならば,

(b) (Tj − G)の平均平方は,要因分散 σ2A の不偏推定量となるのではないか?

(c) (xij − Tj)の平均平方は,誤差分散 σ2Error の不偏推定量になるのではないか?

母集団 Xij = µ+ τj +8 εij

↓ ↓ ↓σ2

Total σ2A σ2

Error

⇑ 推定 (a) ⇑ 推定?(b) ⇑ 推定?(c)MSTotal MSA MSError

↑ ↑ ↑標本 xij = G+ (Tj − G) + (xij − Tj)

先に結論を紹介しておくと,(c)は正しいが,(b)は正しくない。しかし,この発想じたいは優れ

ているので,このまま話を先に進めてみよう。

Page 19: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

19

8 平方和の分解

まず,各項の平方和を求めてみよう。

全体の平方和 SSTotal =3∑

j=1

n∑

i=1

(xij − G)2

要因の平方和 SSA =3∑

j=1

n∑

i=1

{(Tj − G)− 0}2 = n

3∑

j=1

(Tj − G)2

誤差の平方和 SSError =3∑

j=1

n∑

i=1

{(xij − Tj)− 0}2 =3∑

j=1

n∑

i=1

(xij − Tj)2

ここで,SSTotal = SSA + SSError

という関係が成り立っている (コラム参照)。つまり,ここでおこなっているのは,測定値の平方和

を分解する作業なのである。

例題 1の場合。わかりやすいように,全平均 Gを左辺に移項している。

(得点−全平均) (水準の平均−全平均) (得点−水準の平均)(xij − G) = (Tj − G) + (xij − Tj)(5− 6.1) = (4.7− 6.1) + (5− 4.7)(4− 6.1) = (4.7− 6.1) + (4− 4.7)

......

...(8− 6.1) = (5.6− 6.1) + (8− 5.6)(4− 6.1) = (5.6− 6.1) + (4− 5.6)

......

...(7− 6.1) = (8.1− 6.1) + (7− 8.1)(6− 6.1) = (8.1− 6.1) + (6− 8.1)

......

...⇓ ⇓ ⇓

二乗して合計 二乗して合計 二乗して合計SSTotal = 145.47 SSA = 62.07 SSError = 83.4

ここで行ったのは,得点のばらつき 145.47を,学習形態に由来するばらつき 62.07と,それ以外

のばらつき 83.4とに分解する作業であった,ということができる。

Page 20: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

20 8 平方和の分解

コラム: なぜ平方和は分解できるのか

構造モデルxij = G + (Tj − G) + (xij − Ti)

の Gを左辺に移項してxij − G = (Tj − G) + (xij − Ti)

両辺を 2乗して

(xij − G)2 = (Tj − G)2 + (xij − Ti)2 + 2(Tj − G)(xij − Ti)

合計して∑

j

i

(xij − G)2 =∑

j

n(Tj − G)2 +∑

j

i

(xij − Tj)2 +∑

j

i

2(Tj − G)(xij − Tj)

第三項は∑

j

i

2(Tj − G)(xij − Ti) = 2∑

j

{(Tj − G)∑

i

(xij − Ti)}

= 2∑

j

{(Tj − G)× 0}

= 0

従って,∑

j

i

(xij − G)2 =∑

j

n(Tj − G)2 +∑

j

i

(xij − Tj)2

SSTotal = SSA + SSError

であることがわかる。

なお,構造モデルがもっと複雑なものになっても,上記と同じように,全体の平方和を各項

の平方和の和に分解することができる。

Page 21: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

21

9 平均平方の算出

次に,それぞれの平方和が持つ自由度について考えておこう。自由度とは,自由に動くことがで

きる値の数なので (3章参照),

• 全体の平方和 SSTotal の自由度 =(値の個数 −1) = 3n− 1

• 要因の平方和 SSA の自由度 =(Tj の個数 −1) = 3− 1

• 誤差の平方和 SSError の自由度 =水準数× (水準内の値の個数-1) = 3(n− 1)

となる。ここで(3n− 1) = (3− 1) + 3(n− 1)

であり,自由度もまた,平方和と同じように分解されている。

それでは,各項の平均平方 (平方和を自由度で割った値)を求めよう。

全体の平均平方 MSTotal = SSTotal/(3n− 1)

要因の平均平方 MSA = SSA/(3− 1)

誤差の平均平方 MSError = SSError/3(n− 1)

例題 1の場合:

(得点−全平均) (水準の平均−全平均) (得点−水準の平均)(xij − G) = (Tj − G) + (xij − Tj)

⇓ ⇓ ⇓二乗して合計 二乗して合計 二乗して合計

SSTotal = 145.47 SSA = 62.07 SSError = 83.4⇓ ⇓ ⇓

自由度は 自由度は 自由度は3n− 1 = 29 3− 1 = 2 3(n− 1) = 27

⇓ ⇓ ⇓わり算して わり算して わり算して

MSTotal = 5.02 MSA = 31.03 MSError = 3.08

Page 22: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

22 10 平均平方の意義

10 平均平方の意義¾

½

»

¼

この章も,少し面倒な内容を含んでいるので,3通りの説明 (梅,竹,松)を用意しまし

た。先に進むほど,突っ込んだ議論になります。すくなくとも,梅コースの内容について

は,きちんと理解してください。竹コース・松コースは,読み飛ばしてもかまいません。

10.1 梅コース

さて,いま私たちが目指しているのは,要因分散 σ2A が 0かどうかの判断である。そのためには,

MSA だけを調べていては不十分である。なぜなら,誤差分散 σ2Error が大きいときにも,MSA は

大きくなってしまうからである。

そこで,MSA をMSError で割った量

F = MSA/MSError

を調べる。

例題 1の場合は,F = 31.03/3.08 = 10.04

F 値は,要因分散 σ2A が 0のときに 1に近くなり,σ2

A が 0でないとき (すなわち,要因の水準

によって差があるとき)には 1よりも大きな値になる。

Page 23: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

10.2 竹コース 23

10.2 竹コース

以上の内容を,別の角度から説明しよう。

図 1は,例題 1のデータを縦に並べ,プロットしたものである。図の上・中・下が,3種類の

学習形態に対応している。黒丸は測定値を,中央の縦の点線は全平均 Gを,太線は各水準の平均

T1, T2, T3 を示している。MSTotal は黒丸のばらつき,MSA は太線のばらつき,MSError は黒丸

から太線までの垂線の長さのばらつきに相当する。

この図をみるだけで,被験者の属する群によって黒丸の位置が異なっていること,したがって要

因の効果がみられることが,直感的にわかるだろう。

では,もしデータが図 2のようであったらどうだろうか。この図の太線は,図 1の太線とまった

く同じである。しかしこの図の黒丸の布置をみても,要因の効果がみられるとはとても思えない。

なぜなら,測定値のばらつきが大きいからである。たしかに,太線にもばらつきはみられるもの

の,それは単に測定値のばらつきのせいではないか,つまり,もうすこし測定値を増やせば,太線

のかたちは簡単に変わってしまうのではないか—という気がするだろう。

このように,要因の効果があるかどうか (σA 6= 0 かどうか) の判断は,誤差 eij のばらつき

と 比べて 水準の平均 Tj のばらつきが大きいかどうか,に基づいておこなわれるべきである。そ

図 1: 例題 1のデータ 図 2: もしこんなデータなら. . .

Page 24: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

24 10 平均平方の意義

こで,「水準の平均のばらつき MSA が,誤差 eij のばらつき MSError の何倍あるか」,つまり

F = MSA/MSError を求めるのである。もし要因の効果がなければ,MSA とMSError は同程

度となり,F は 1に近くなるだろう。もし要因の効果があるのなら,F はもっと大きな値になる

だろう。

10.3 松コース®

­

©

ª以下の説明は,2章の松コース (2.3)を読了した人向けに書かれています。

3章で述べたように,データの平方和を自由度で割ると,母分散の不偏推定量が手にはいる。こ

れを期待値という概念を用いてあらわせば,

E(MSTotal) = σ2Total

さて,要因の平均平方MSA の期待値は

E(MSA) = σ2Error + nσ2

A

となる∗2。つまり,MSA は σ2A の不偏推定量ではなく,σ2

A と σ2Error の両方を反映する統計量な

のである。

いっぽう,誤差の平均平方MSError の期待値は

E(MSError) = σ2Error

であり∗3,MSError は誤差分散 σ2Error の不偏推定量である。

さて,

• もし要因の効果がないならば (H0 が真ならば),MSA とMSError とは,ともに σ2Error の

不偏推定量だから,近い値になるはずである。

• いっぽう,要因の効果があるならば (H0 が偽ならば),それがどのような効果であれ,MSA

は大きくなるはずである。

そこで,F = MSA/MSError を検定統計量として,H0 : σ2A = 0についての仮説検定をおこなう

わけである。(σ2A の大きさの推定や,τ1, τ2, τ3 の推定には,もはや関心が持たれていないことに注

目してほしい。)

∗2 高校までの数学で導出できる。お試しあれ。∗3 同上。

Page 25: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

25

11 F検定

それでは,F を検定統計量として,要因の効果の有無についての仮説検定をおこなうことにし

よう。

予備知識 5.1に挙げたように,仮説検定は 4つの段階からなる。

■1. 帰無仮説 (H0)を設定する 帰無仮説は:

H0 : 要因の効果はない (τ1 = τ2 = τ3 = 0, σ2A = 0)

■2. 検定統計量を定める すでに説明したように,検定統計量としては F を用いる。

■3. 決められた有意水準のもとでの棄却域を定める さて,誤差の正規性と等分散性という仮定

が成り立っているときに限り (6章参照),F には以下の性質がある。帰無仮説が真である場合に

は,F は「自由度 (要因の自由度,誤差の自由度) の F 分布」と呼ばれる確率分布に従う。いっぽ

う,帰無仮説が偽の場合には,F は大きくなる。

そこで,F 分布の右 α%の範囲を,有意水準 α%の棄却域と定めることにする。

例題 1では: 自由度 (2, 27)の F 分布を用いる。1%棄却域は F > 5.49である。

■4.棄却の有無を決定する F 値が棄却域に含まれていた場合は,帰無仮説は棄却される。

例題 1では: F = 10.04は棄却域に含まれているので,棄却域は 1%有意水準で棄却さ

れる。従って,学習形態という要因の効果が認められたと判断される。

ここで,F 値の大きさは効果の大きさをあらわしているわけではない,という点に注意してほし

い。前章でみたように,F は効果の大きさ (σ2Total)をあらわす指標ではない。

Page 26: 読めば必ずわかる 分散分析の基礎 第2版elsur.jpn.org/resource/anova.pdf · であるということがわかっている(2.3 参照) ...

26 12 まとめ: 1要因の分散分析

12 まとめ: 1要因の分散分析

どのようなデータであれ,分散分析を用いたデータ分析は,6つの段階からなっている。

1. データの構造についてよく考え,構造モデルを構築する。

2. 誤差の分布についての仮定が,データにあてはまっているかどうか検討する。

3. 平方和を分解し,各項の平均平方を求める。

4. 検討したい要因について,F を求め,帰無仮説の棄却の有無を判断する。

5. それがなにを意味しているのか考えるために,グラフに戻ったり,下位検定に進んだりする。

この解説書では,このうち 1-5の段階について,いわゆる被験者間 1要因計画の実験データを例

に挙げて,詳しく検討してきた。

ここまでの内容をまとめておこう。1要因 (k 水準,水準間にデータの対応なし) の実験の結果,

測定値 xij を得た。ただし,iは各水準内での測定値の番号 (1 ∼ nk),j は水準の番号 (1 ∼ k)と

する (下表)。要因 A 水準 A1 水準 A2 · · · 水準 Ak

x11 x12 · · · x1k

x21 x22 · · · x2k

x31 x32 · · · x3k

...... · · · ...

xn11 xn22 · · · xnkk

平均 T1 T2 · · · Tk 全平均Gサイズ n1 n2 · · · nk

このとき,誤差の正規性と等分散性という仮定の下で,分散分析をおこなうことができる。

分散分析の計算過程は,下のような書式の表にまとめることが多い。これを分散分析表という。

1要因 (水準間にデータの対応なし)の分散分析表変動因 平方和 (SS) 自由度 (df ) 平均平方 (MS) F

要因 (A)k∑

j=1

nj(Tj − G)2 k − 1SSA

k − 1MSA

MSError

誤差 (Error)k∑

j=1

nj∑

i=1

(xij − Tj)2k∑

j=1

(nj − 1)SSError∑kj=1(nj − 1)

全体k∑

j=1

nj∑

i=1

(xij − G)2k∑

j=1

nj − 1

つづく . . .かも