有意性と効果量について しっかり考えてみよう

84
有意性と効果量について しっかり考えてみよう 浦野 研 (北海学園大学) email: [email protected] / twitter: @uranoken 外国語教育メディア学会第53全国研究大会 2013.08.07. 本日の資料はこちら http://bit.ly/let2013ws 1

description

外国語教育メディア学会第53回 全国研究大会ワークショップ 2013.08.07.

Transcript of 有意性と効果量について しっかり考えてみよう

Page 1: 有意性と効果量について しっかり考えてみよう

有意性と効果量についてしっかり考えてみよう

浦野 研 (北海学園大学)email: [email protected] / twitter: @uranoken

外国語教育メディア学会第53回 全国研究大会2013.08.07.

本日の資料はこちらhttp://bit.ly/let2013ws

1

Page 2: 有意性と効果量について しっかり考えてみよう

本日の資料はウェブで公開しています。

http://bit.ly/let2013ws

Or...

2

Page 3: 有意性と効果量について しっかり考えてみよう

おことわり

3

Page 4: 有意性と効果量について しっかり考えてみよう

•僕は数学が苦手です

•でもがんばります

•数式が少しだけ出てきます

•数学が苦手な方もがんばりましょう

4

Page 5: 有意性と効果量について しっかり考えてみよう

さて本題

5

Page 6: 有意性と効果量について しっかり考えてみよう

目 標

•効果量と有意性について、その関係と違いを理解すること

•効果量の種類と数値の意味について(なんとなく)把握すること

•効果量を計算できるようになること

6

Page 7: 有意性と効果量について しっかり考えてみよう

手を挙げて教えてください

•効果量を学会発表や論文で報告したことがある人

•統計ソフトで η2, ω2 などの数値を見たことがある人

•「え?効果量?なにそれ?」な人

7

Page 8: 有意性と効果量について しっかり考えてみよう

有意性と効果量

8

Page 9: 有意性と効果量について しっかり考えてみよう

0!

2!

4!

6!

8!

10!

0! 2! 4! 6! 8! 10!0!

3!

6!

9!

12!

15!

0! 3! 6! 9! 12! 15!

Figure 1. (N = 10) Figure 2. (N = 119)

r = .627 r = .184

p = .052 p = .045

>有意でない|有意

9

Page 10: 有意性と効果量について しっかり考えてみよう

「(統計的)有意」とは

•標本(サンプル)から母集団を推定する

•標本で観察される差・関係が、母集団には存在しない確率、つまり偶然の結果である確率(p 値)を計算する

•p 値が基準値(臨界値)以下であれば「有意」である(偶然でない)と判断する

10

Page 11: 有意性と効果量について しっかり考えてみよう

母集団と標本

母集団 標 本推定

データ解析

Σ, F, t, p...

11

Page 12: 有意性と効果量について しっかり考えてみよう

標本誤差

•ある標本で得られた代表値(e.g., 平均)と母集団の代表値との差

12

Page 13: 有意性と効果量について しっかり考えてみよう

母集団μ = 15.3

標本AM = 14.7

標本BM = 15.9

標本CM = 15.2

標本DM = 15.4

標本EM = 15.1

13

Page 14: 有意性と効果量について しっかり考えてみよう

標本誤差

•標本のサイズが大きければ大きいほど、標本誤差は小さくなる

•つまり推定の精度が高くなる

14

Page 15: 有意性と効果量について しっかり考えてみよう

相関係数(r)と臨界値*

N 3 4 5 10 20 30

臨界値(α = .05)

0.997 0.950 0.878 0.632 0.444 0.361

N 40 50 100 200 500 1000

臨界値(α = .05)

0.312 0.279 0.197 0.139 0.088 0.062

*これより大きい数値だったら偶然でないとみなす

15

Page 16: 有意性と効果量について しっかり考えてみよう

相関係数(r)の意味

(吉田, 1998, p. 75)

16

Page 17: 有意性と効果量について しっかり考えてみよう

0!

2!

4!

6!

8!

10!

0! 2! 4! 6! 8! 10!0!

3!

6!

9!

12!

15!

0! 3! 6! 9! 12! 15!

Figure 1. (N = 10) Figure 2. (N = 119)

r = .627 r = .184

p = .052 p = .045

もう一度見てみよう

17

Page 18: 有意性と効果量について しっかり考えてみよう

有意性検定と標本サイズ有意な差(または、有意な相関)が得られやすい研究をするためのきわめて有効な方法があります。それは、とにかく多くのデータを集めることです。なぜならば...統計的検定の結果はデータ数が多いほど有意になりやすいからです。そのため、データ数を増やしさえすれば、きわめて小さな差でも “(統計的には)有意である”

という結果になる可能性が高まります。例えば、N = 1000 の場合には、r = 0.062 というきわめて小さな相関係数(すなわち、非常に弱い関係)でも有意になります...。このように、統計的推定には、“データ数という、研究者が任意に決められる要因によって結果が左右されてしまう” という根本的な問題があります。(吉田,

1998, p. 232; 下線は浦野による)18

Page 19: 有意性と効果量について しっかり考えてみよう

どうする?

19

Page 20: 有意性と効果量について しっかり考えてみよう

•差や関係を表す、標本サイズに依存しない指標がほしい

•それが効果量

•実は相関係数 r も効果量の指標です(後述)

20

Page 21: 有意性と効果量について しっかり考えてみよう

効果量の種類

21

Page 22: 有意性と効果量について しっかり考えてみよう

大きく分けて2つ

•差の大きさを表す指標(d 族)

•関係の強さを表す指標(r 族)

22

Page 23: 有意性と効果量について しっかり考えてみよう

差の大きさを表す指標

23

Page 24: 有意性と効果量について しっかり考えてみよう

とあるテストの結果52 79

59 55

61 61

76 89

45 51

68 71

63 63

69 41

43 41

51 83

36 93

51 47

39 37

71 52

26 41

70 57

38 64

58 76

48 43

28 90

54 58

58 38

38 38

42 43

47 58

78 60

68 48

40 45

50 24

68 36

Group A Group B

どちらの方ができがよい?24

Page 25: 有意性と効果量について しっかり考えてみよう

平均点

Group A Group B

52.1 57.1

Group B の方が優秀?

<

25

Page 26: 有意性と効果量について しっかり考えてみよう

ちょっと待って!

26

Page 27: 有意性と効果量について しっかり考えてみよう

もう少し見てみよう

27

Page 28: 有意性と効果量について しっかり考えてみよう

分布を見てみよう

結構重なってる

0"

1"

2"

3"

4"

5"

6"

7"

8"

9"

0,10" 11,20" 21,30" 31,40" 41,50" 51,60" 61,70" 71,80" 81,90" 91,100"

Group"A"

Group"B"

28

Page 29: 有意性と効果量について しっかり考えてみよう

重なりの多さ、少なさ

(吉田, 1998, p. 173)29

Page 30: 有意性と効果量について しっかり考えてみよう

重なりの多さ、少なさ

差は同じ(吉田, 1998, p. 173)

30

Page 31: 有意性と効果量について しっかり考えてみよう

重なりの多さ、少なさ

重なりの量が違う31

Page 32: 有意性と効果量について しっかり考えてみよう

言えそうなこと

重なりが少ない方が差が大きそう

32

Page 33: 有意性と効果量について しっかり考えてみよう

もう一度見てみよう

0"

1"

2"

3"

4"

5"

6"

7"

8"

9"

0,10" 11,20" 21,30" 31,40" 41,50" 51,60" 61,70" 71,80" 81,90" 91,100"

Group"A"

Group"B"

この重なりは多いの?少ないの?33

Page 34: 有意性と効果量について しっかり考えてみよう

指標が欲しい

34

Page 35: 有意性と効果量について しっかり考えてみよう

効果量Cohen’s d

35

Page 36: 有意性と効果量について しっかり考えてみよう

Cohen’s d

pooledSD

XXd

21 −=

← 平均の差

← 標準偏差  (分布の広がり)

36

Page 37: 有意性と効果量について しっかり考えてみよう

計算してみよう

M SD

Group A 52.1 15.3

Group B 57.1 16.7

pooledSD

XXd

21 −=

| 52.1-57.1|= (15.3 + 16.7) / 2*

*n が異なるとき、SDpooled の計算はもう少し複雑になります37

Page 38: 有意性と効果量について しっかり考えてみよう

計算してみよう

pooledSD

XXd

21 −= = 0.31

5.0= 16.03

M SD

Group A 52.1 15.3

Group B 57.1 16.7

38

Page 39: 有意性と効果量について しっかり考えてみよう

効果量 d と分布の重なり

d 0.0 0.1 0.2 0.3 0.4 0.5 0.6

重なり(%) 100 92.3 85.7 78.7 72.6 67 61.8

d 0.7 0.8 0.9 1.0 1.1 1.2 1.3

重なり(%) 57.0 52.6 48.4 44.6 41.1 37.8 34.7

39

Page 40: 有意性と効果量について しっかり考えてみよう

再びこのグラフ

0"

1"

2"

3"

4"

5"

6"

7"

8"

9"

0,10" 11,20" 21,30" 31,40" 41,50" 51,60" 61,70" 71,80" 81,90" 91,100"

Group"A"

Group"B"

d = 0.31、つまり重なりは8割ほど40

Page 41: 有意性と効果量について しっかり考えてみよう

つまり

41

Page 42: 有意性と効果量について しっかり考えてみよう

Group AとGroup Bは平均点に5点差があるけど全体の8割は重なっている

42

Page 43: 有意性と効果量について しっかり考えてみよう

効果量 d と重なりの関係

43

Page 44: 有意性と効果量について しっかり考えてみよう

d 値が大きくなるには

pooledSD

XXd

21 −=

← 小さい方が良い

← 大きい方が良い

44

Page 45: 有意性と効果量について しっかり考えてみよう

効果量の解釈

45

Page 46: 有意性と効果量について しっかり考えてみよう

Cohen (1969)

•small: d = 0.2, overlap: 85.7%

•e.g., 15歳と16歳の女子の身長差

•medium: d = 0.5, overlap: 67.0%

•e.g., 14歳と18歳の女子の身長差

•large: d = 0.8, overlap: 52.6%

•e.g., 大学新入生とPhD取得者のIQ差

46

Page 47: 有意性と効果量について しっかり考えてみよう

ただし

47

Page 48: 有意性と効果量について しっかり考えてみよう

•このような指標はあくまで目安

•実際の解釈は研究者自身の責任で

48

Page 49: 有意性と効果量について しっかり考えてみよう

効果量と有意性

49

Page 50: 有意性と効果量について しっかり考えてみよう

重なりの多さはわかったけど、この差は偶然?

50

Page 51: 有意性と効果量について しっかり考えてみよう

観察された差が偶然である可能性(確率)を計算しよう

51

Page 52: 有意性と効果量について しっかり考えてみよう

t 検定

52

Page 53: 有意性と効果量について しっかり考えてみよう

← 平均の差

← 標準偏差2の和

1

22

21

21

+

−=

nSDSD

XXt

↑ 標本サイズ(被験者数)

t 検定

53

Page 54: 有意性と効果量について しっかり考えてみよう

これさっき見た?

54

Page 55: 有意性と効果量について しっかり考えてみよう

Cohen’s d

pooledSD

XXd

21 −=

← 平均の差

← 標準偏差(分布の広がり)

これに n を足すと t っぽい!

55

Page 56: 有意性と効果量について しっかり考えてみよう

pooledSD

XXd

21 −=

1

22

21

21

+

−=

nSDSD

XXt

56

Page 57: 有意性と効果量について しっかり考えてみよう

t 値が大きくなるには

← 大きい方が良い

← 小さい方が良い

1

22

21

21

+

−=

nSDSD

XXt

↑ 大きいほうが良い

57

Page 58: 有意性と効果量について しっかり考えてみよう

t の臨界値*

n 1 2 3 4 5

臨界値両側検定5%

12.71 4.30 3.18 2.78 2.57

n 10 20 50 100 200

臨界値両側検定5%

2.23 2.09 2.01 1.98 1.97

*これより大きい数値だったら偶然でないとみなす

58

Page 59: 有意性と効果量について しっかり考えてみよう

計算してみよう

M SD

Group A 52.1 15.3

Group B 57.1 16.7

1

22

21

21

+

−=

nSDSD

XXt

*n が異なるときの計算はもう少し複雑になります

*

| 52.1-57.1|= √(15.32 + 16.72) / (30 - 1)

59

Page 60: 有意性と効果量について しっかり考えてみよう

計算してみよう

M SD

Group A 52.1 15.3

Group B 57.1 16.7

5= 4.21

1

22

21

21

+

−=

nSDSD

XXt

*n が異なるときの計算はもう少し複雑になります

*

= 1.18

60

Page 61: 有意性と効果量について しっかり考えてみよう

t の臨界値

n 1 2 3 4 5

臨界値両側検定5%

12.71 4.30 3.18 2.78 2.57

n 10 20 50 100 200

臨界値両側検定5%

2.23 2.09 2.01 1.98 1.97

t = 1.18 は有意でない61

Page 62: 有意性と効果量について しっかり考えてみよう

ここまでのまとめ

62

Page 63: 有意性と効果量について しっかり考えてみよう

•効果量 Cohen’s d

•2つのグループ間の差を標準化したもの

•t 検定

•効果量に標本誤差の影響を加味して、その差が偶然観察される確率を示したもの

•検定統計量 = 効果の大きさ x 標本の大きさ

(南風原, 2002, p. 163)

63

Page 64: 有意性と効果量について しっかり考えてみよう

•Cohen’s d の仲間:

•Hedges’ g

•分母に母集団の標準偏差を使う

•Glass’ ⊿

•分母に統制群の標準偏差を使う

64

Page 65: 有意性と効果量について しっかり考えてみよう

関係の強さを表す指標

65

Page 66: 有意性と効果量について しっかり考えてみよう

•変数間の関係の大きさを表す

•最大: 1.0

•最小: 0

•ピアソンの積率相関係数 r

•r2 (分散説明率)

66

Page 67: 有意性と効果量について しっかり考えてみよう

(大久保・岡田, 2012, p. 72)

r と r2 の関係

67

Page 68: 有意性と効果量について しっかり考えてみよう

分散分析の場合

68

Page 69: 有意性と効果量について しっかり考えてみよう

分散分析の場合

調べたい要因の分散η2 = 総分散

SSA

= SST

69

Page 70: 有意性と効果量について しっかり考えてみよう

SS df MS F p η2

A 847.609 2 423.805 0.955 .389 .022

Error 37259.655 84 443.567

Total 38107.264

one-way ANOVA

MacR に付属のデータを使って MacR で計算

/ =

/ =

70

Page 71: 有意性と効果量について しっかり考えてみよう

SS df MS F p η2

A 847.609 2 423.805 0.955 .389 .022

Error 37259.655 84 443.567

Total 38107.264

one-way ANOVA

/ =

↑ 標本サイズが大きいと F 値が大きくなる

71

Page 72: 有意性と効果量について しっかり考えてみよう

SS df MS F p η2

A 847.609 2 423.805 0.955 .389 .022

Error 37259.655 84 443.567

Total 38107.264

one-way ANOVA

+

=

η2 = SSA / SST = 847.609 / 38107.264 = .022

72

Page 73: 有意性と効果量について しっかり考えてみよう

効果量の解釈

73

Page 74: 有意性と効果量について しっかり考えてみよう

水本・竹内 (2008)

•small: η2 = .01

•medium: η2 = .06

•large: η2 = .14

•このような指標はあくまで目安

•実際の解釈は研究者自身の責任で

ただし

74

Page 75: 有意性と効果量について しっかり考えてみよう

ここまでのまとめ

75

Page 76: 有意性と効果量について しっかり考えてみよう

•r 族の効果量

•変数間の関係の強さを数値で示したもの

•最大で 1.0、最小で 0

•分散分析で使う η2 は r2 と似た感じ

•F と η2 の違いは標本サイズを考慮するかどうか

•検定統計量 = 効果の大きさ x 標本の大きさ

(南風原, 2002, p. 163)

76

Page 77: 有意性と効果量について しっかり考えてみよう

•η2 の仲間:

•partial η2

•分母に SSA + SSE を使う

•ω2

•母分散推定のためのバイアスを取り除いたもの

77

Page 78: 有意性と効果量について しっかり考えてみよう

さて

78

Page 79: 有意性と効果量について しっかり考えてみよう

計算してみましょうか

79

Page 80: 有意性と効果量について しっかり考えてみよう

効果量の計算のシートhttp://www.mizumot.com/stats/effectsize.xls

80

Page 81: 有意性と効果量について しっかり考えてみよう

Language Education & Technology, 46, 41–60 (2009)

81

Page 82: 有意性と効果量について しっかり考えてみよう

Cohen’s d を計算してみよう

82

Page 83: 有意性と効果量について しっかり考えてみよう

Language Education & Technology, 42, 111–118 (2005)

83

Page 84: 有意性と効果量について しっかり考えてみよう

η2 を計算してみよう

Fin84