13.01.20.第1回DARM勉強会資料#2

16
R RStudio ののの Analysis Of Variance (ANOVA) - between group design - DARM ののの #1 2013.01.20 ののののののののののの のののののの のの のの

description

分散分析 (群間比較デザイン)の報告ガイドライン https://sites.google.com/site/studygroup13csrm/

Transcript of 13.01.20.第1回DARM勉強会資料#2

Page 1: 13.01.20.第1回DARM勉強会資料#2

R ・ RStudioの導入Analysis Of Variance (ANOVA)

- between group design -

DARM 勉 強 会 #1 2013.01.20

広島大学総合科学研究科博士課程後期2年竹林 由武

Page 2: 13.01.20.第1回DARM勉強会資料#2

R ・ RStudioの導入

Reporting Guideline(Klockars, 2008)

Klockars, A. J. (2008). Analysis of variance: between groups design. In G. R., Hancock & R. O. Mueller (Eds.), The Reviewer’s Guide to Quantitative Methods in the Social Sciences. (pp. 2-13) New York: Routledge.

群間比較デザインの分散分析を行った論文を書くときには,次の 17 項目を守るべし !!

Page 3: 13.01.20.第1回DARM勉強会資料#2

R ・ RStudioの導入

Reporting Guideline(Klockars, 2008)

a) 参加者が処理される方法の違いに基づく群設定 (Fixed treatment variables)

質的な違いに基づく場合  (e.g., 読書プロンプトの種類など )順序変数の程度に基づく場合 (e.g., 介入の期間,介入の強度など )

b) 個人差変数の水準 (Levels of an individual difference variable)

ランダムブロックデザインの場合,群は,処理方法の違いに加えて,個人差変数の水準も異なる (e.g, 読書能力の水準 )

c) ランダム変数の水準  (Levels of a random variable)実験の目的が、ランダム要因の水準を越えた処理変数の一般化にある場合,群はそのランダム要因の水準に基づいて異なる(e.g., 特定の研究された本,素材を提示する先生 )

1. 各独立変数が,研究の目的,仮説,理論,文献レビューと 関連する独立した群となるように定義されている

独立変数の種類

Page 4: 13.01.20.第1回DARM勉強会資料#2

R ・ RStudioの導入

Reporting Guideline(Klockars, 2008)

a) 群は,変数の理論的なエッセンスを明確に捉えるべし

b) 群は,表面的妥当性を備えてなければならない

c) 関心のある独立変数と群設定に用いた操作の明白な関連性が

読者に理解できるようにすべし

d) 処理が連続的な変数の水準による場合は,極端なレベルへの特別な

注意に基づいて選択がなされるようにすべし

e) 水準数は水準と結果間に予測される関数関係に基づいて選択すべし

f) 関心が関連 > 群間差である場合は回帰ベースの分析を検討すべし

1. 各独立変数が,研究の目的,仮説,理論,文献レビューと 関連する独立した群となるように定義されている

Page 5: 13.01.20.第1回DARM勉強会資料#2

R ・ RStudioの導入

Reporting Guideline(Klockars, 2008)

a) 有意差検定の検出力は,処理変数の水準数が多い場合に減少する。

※ 多くの水準が同様に中程度の効果をもつ場合に顕著

b) 群が複数の点で異なる場合に交絡効果が生じる。

水準の組み合わせが複雑である実験では,群間差を真に生み出している 有効成分が不明確になる。

(e.g., 介入期間の長さ ? プロンプトの種類 ? 介入期間による差 ?)

1. 各独立変数が,研究の目的,仮説,理論,文献レビューと 関連する独立した群となるように定義されている

群構成に共通する欠点

Page 6: 13.01.20.第1回DARM勉強会資料#2

R ・ RStudioの導入

Reporting Guideline(Klockars, 2008)

2. 研究計画に2つ以上の独立変数を同時含むことの説明がなされている

a) 検証する理論と対応づけて全ての独立変数を記述すべし。※理論と関係ないものは独立変数に含むべからず。

b) 予測される主効果と相互作用の双方を記述すべし。

c) 主効果の一般化の必要性に応じて,ランダム要因を独立変数に含む正当性

を説明すべし

d) 要因計画は,解釈が複雑になるコストを認識すべし

e) 交互作用が有意じゃない場合,検出力を考慮すべし

f) 非直行データをどのように扱ったか記述すべし

直交データ=独立変数間に相関なし

非直行データ=独立変数間に相関あり

Page 7: 13.01.20.第1回DARM勉強会資料#2

R ・ RStudioの導入

Reporting Guideline(Klockars, 2008)

3. 全ての共変量は,研究目的と関係する正当性が示されている

a) 共変量を含める理論的な根拠を示すべし※理論と関係ないものは独立変数に含むべからず。

b) 共変量は, ANOVA の検定力を増加させるが,タイプ I エラーが増加する

場合もあるので注意

c) 複数の共変量や事後的に選択された共変量は使用すべきじゃない

d) 共変量のスコアは処理群の関数であってはならない

※ランダム割り付けをする前に得られているべき

e) アウトカムと同時に共変量が得られる実験では,処理のために共変量のス

コアが変わる可能性があるので,共変量の使用は妥当ではない

f) ANCOVA を実施する際には,前提条件を考慮し,考察すべし。

Page 8: 13.01.20.第1回DARM勉強会資料#2

R ・ RStudioの導入

ANCOVAの前提条件a) 共変量とアウトカムが線形

b) 条件間の残差分散が等質

c) 条件間で回帰係数が等質

※ 回帰係数の同質性なし = 共変量と処理の交互作用がある  前提条件を検討すると新たな発見に繋がる可能性もある

40 50 60 70 80

10

12

14

16

18

20

covariate

DV

40 50 60 70 80

10

12

14

16

18

20

covariate

DV

Page 9: 13.01.20.第1回DARM勉強会資料#2

R ・ RStudioの導入

Reporting Guideline(Klockars, 2008)

4. アウトカムメジャーの妥当性が,研究目的と関係して正当性   されている

a) アウトカムメジャー = 仮説的な従属変数の具現化

b) 十分な構成概念妥当性が必要

c) 指標と概念が明確に対応していることが理解できるようにすべし

d) その指標を用いることを支持する関連文献を記載すべし

e) アウトカムメジャーの全体の平均と分散は,潜在的な群間差を検出できる

ものでなければならない

Page 10: 13.01.20.第1回DARM勉強会資料#2

R ・ RStudioの導入

Reporting Guideline(Klockars, 2008)

5. 参加者数,参加者のソース,包括 /除外基準が説明されている

a) 年齢,リクルート方法,参加を得るために誘導 (e.g., course credit) ,除外

基準

b) デモグラフィックデータ

c) 参加拒否 or ドロップアウトした人数

d) 参加者数の説明は,事前のサンプルサイズの決定方法を通じて行うべし

e) サンプルサイズと検出力には直接的な関係があるので,参加者数は結果を

考察する際に考慮すべし

f) 統計的に有意だと予測した差が有意じゃなかった場合には, post hoc の

検定力分析をすべし

g) 極端に大規模なサンプルを用いた場合にもその理由を十分に説明すべし

Page 11: 13.01.20.第1回DARM勉強会資料#2

R ・ RStudioの導入

Reporting Guideline(Klockars, 2008)

6 . 独立変数の性質,使用した有意水準,参加者の割り付け方法 を含み,研究デザインが詳細に説明されている。

a) 読者が従属変数のバリエーションと自由度を予測できるように

b) 研究が真にランダム割り付けによる実験計画であったか

c) 反復測定、準実験、 前実験計画か

d) 処理群数,要因数,各要因の水準数

e) 各要因が fixed かランダムかを明記せよ

f) ランダム要因を含む場合は,適切な処遇効果の誤差項やランダム要因の存

在によって影響をうける交互作用を示せ

g) 実験デザインをサマライズするのに役立つ専門用語を提供すべし

h) 参加者数を示せ  ( 特定のセルに含まれる人数,集団内の人数 )

i) サマリーを提供すべし、のちのセクションで使用される要因の短縮名など

Page 12: 13.01.20.第1回DARM勉強会資料#2

R ・ RStudioの導入

Reporting Guideline(Klockars, 2008)

6 . 独立変数の性質,使用した有意水準,参加者の割り付け方法 を含み,研究デザインが詳細に説明されている。

a) 複数の主効果や交互作用が検討される要因計画の実験では,タイプ1エ

ラー率を各 familyごとに α で個別に統制するか、より保守的な方法で統

制するか

b) 多重比較について記述

※多重比較はタイプ 1 エラーを統制するのに適してることも書くと良い

c) 片側検定を適用するいかなる検定も守るべき

d) 片側検定の適用する場合,潜在的な存在を無視することを正当化する予測

される方向性と拮抗する潜在的なすべての結果のささい性を示すべし

Page 13: 13.01.20.第1回DARM勉強会資料#2

R ・ RStudioの導入

Reporting Guideline(Klockars, 2008)

7 . 有意差検定の背景にある前提やアウトカムメジャーの  心理統計学的性質,共変量が議論されている

a) ANOVAの適用が分析の前提に照らし合して適切か吟味

※前提条件を完全に満たすことは不可能とは言えないまでも困難

※ ANOVA は相対的に、前提の違反については頑健(特にサンプルサイズの等価

性 )

b) 前提を違反していた上で ANOVA を適用する際には,その正当性を示せ

Page 14: 13.01.20.第1回DARM勉強会資料#2

R ・ RStudioの導入

Reporting Guideline(Klockars, 2008)

7 . 有意差検定の背景にある前提やアウトカムメジャーの  心理統計学的性質,共変量が議論されている

a) アウトカムメジャーが間隔尺度以上

 ※順序尺度を間隔尺度のように扱って ANOVA を行っても良いという意見もある

b) 正規分布

誤差分散が正規分布している

 ※違反してもタイプ I エラーにはほとんど影響がない

c) 誤差分散がランダムで独立

残差の期待値が互いに無関係 ( ランダムサンプリングできてるか )

d) 等分散性

  群内の誤差分散は全ての群において同じになる

   ※群間でサンプルサイズが等しい時には,結果にほとんど影響を与えない

Page 15: 13.01.20.第1回DARM勉強会資料#2

R ・ RStudioの導入

Reporting Guideline(Klockars, 2008)

8. 用いられた多重比較の手続きが示されており,研究目的と関連している。

a) 多重比較は,タイプ I エラーを統制する

b) 多重比較の種類は,研究目的に基づいて選択すべし

1) 理論ドライブな対比

  Bonferroni

2) 全ての組み合わせの比較

Turkey

3) 各群と統制群の比較

Dunnett’s

4)平均から見出されたパターンに基づく比較

Scheffe ※ 要因の主効果が有意であることが前提

 

Page 16: 13.01.20.第1回DARM勉強会資料#2

R ・ RStudioの導入

Reporting Guideline(Klockars, 2008)

9. 全ての誤差項が研究デザインの特徴を反映している

a) 誤差項 =F 比の分母

b) 比較的不適切な誤差項が報告されることが多い

※特にランダム要因を含む実験の際に

c) ランダム要因,固定変量とランダム要因の交互作用

の全ての誤差項を記述すべし

d) 誤差項の自由度も記述すべし