統計分析セビテ Rによるヅヺソ 分析ボドャ゠ラ Data Analysis … · rコマンダーは、エクセルのような分かりやすいメニューを提供する補助ソフトです。
エクセルで統計分析3 回帰分析のやり方
-
Upload
hiroshi-shimizu -
Category
Education
-
view
11.296 -
download
0
description
Transcript of エクセルで統計分析3 回帰分析のやり方
エクセルで統計分析3 HADによる回帰分析・分散分析
清水裕士
広島大学大学院総合科学研究科
HADとは
• 清水が作ったExcelで動くフリーソフト
– 心理統計分析のほとんどが実行可能
– http://norimune.net/had
• 無償・無登録で利用可能です。
• HADの基本的な使い方
– http://slidesha.re/RsVBp7
• こちらのスライドシェアを先に御覧ください
多変量解析
• 2つのカテゴリから選ぶ – 回帰分析:因果関係を推測する分析 – 因子分析:次元圧縮やカテゴリ分けの分析
• 該当するオプションボタンを押すと、モデリングスペースが開く
下は回帰分析のモデリングスペース
多変量解析の使用方法
• 使用変数のところに変数を指定 – これはほかの分析と同じ
– その後、モデリングスペースでモデルを指定したり、分析オプションを選択して、「分析実行」ボタンを押す
– 「オプション」ボタンを押すと、各分析のより詳細な設定を変更することができる
• 詳しくはWebで。
– 清水のブログでも解説しています • HADのページ • http://norimune.net/?=800
回帰分析グループ
• モデリングシートの「回帰分析」を押す – 回帰分析用のモデリングスペースが開く
– 主に変数の因果関係を検討する分析法の集まり
• 「回帰分析」の中のサブカテゴリ – 回帰分析:回帰分析、ロジスティック、判別分析
– 分散分析:5要因までの分散分析と多重比較
– 媒介分析:3変数の媒介関係を分析
– 多変量:多変量回帰分析や正準相関分析
回帰分析のモデリングスペース
回帰分析
回帰分析
• 分析のタイプを選択 – 重回帰分析
– 判別分析・・・従属変数がカテゴリ変数
– 多変量回帰分析・・・従属変数が多変量
• 変数の投入方法 – 階層的投入(デフォルト)・・・5ステップまで可能
– ステップワイズ法・・・変数を有意確率が低い順に投入していく方法
モデルの指定
• 「目的変数を投入」ボタン – 選択したセルを目的変数に指定する
• 「主効果を全投入」ボタン – 目的変数に指定した変数以外を主効果に投入 – Shiftキーを押しながら押すと、選択した変数のみ
• 「交互作用を全投入」ボタン – 目的変数に指定した以外の変数の主効果と交互作用を
すべて投入 – Shiftキーを押しながら押すと、選択した変数のみの交互
作用項を投入(主効果はすべて投入)
交互作用項の単純効果検定
• スライス変数を指定
– スライス変数・・・群分けをする変数
• 高群・低群に分ける変数のこと
– 3要因の交互作用の単純効果を検討可能
• スライス変数に指定できるのは2変数まで
• それぞれ別のセルに変数名を入力する
• 「スライスに」投入ボタンを押す
– 選択したセルにある変数をスライス変数に投入
こんな感じ • 目的変数:idt • 説明変数:talkとperと、その交互作用項 • スライス変数:per
分析実行
• 「分析実行」ボタンを押す – もしモデリングにエラーがあれば、分析が止まる
• 出力 – Step・・・分析結果をステップごとに出力
• 階層的重回帰の場合は入力ステップ
• 「各ステップを出力しない」を押すと、出力されない
– HRA・・・階層的重回帰分析の結果をまとめたもの
– Slice・・・単純効果検定の結果
回帰分析の出力 talk talk
-1SD +1SDper_-1SD 3.127 3.187per_+1SD 3.181 4.172 **
2
2.5
3
3.5
4
4.5
-1SD +1SD
idt
talk
per_-1SD
per_+1SD
回帰分析の設定
• 2値データの説明変数をカテゴリ変数として扱う – 2値データをスライス変数に指定するとき、±1SDで
スライスせず、2値のそれぞれの値の場合の単純効果を推定します。
– これをチェックすると、分散分析と同じ結果になります。
• 交互作用項がある場合、主効果を中心化 – 交互作用項は主効果の変数の積で計算しますが、そ
のまま計算すると多重共線性が問題となります。
– そこで、これをチェックすると交互作用項がある場合、主効果をすべて中心化します。
ステップワイズ法
• ステップワイズ法をチェック
– モデリングスペースが変わる
ステップワイズ法のモデル指定
• 変数の入力は1行で – モデルのところにだけ入力する – 「主効果を全投入」や「交互作用を全投入」を押すと便利。
• 強制投入 – 必ず投入する変数を指定 – その変数もモデルに入れておく
• 出力 – 変数の投入ごとに結果を出力
– 「各ステップを出力しない」をチェックすると最後のモデルだけが出力される
判別分析
判別分析
• 従属変数がカテゴリカルデータの場合 – カテゴリへの所属を予測する
• 回帰分析のオプションから選択 – 判別分析を選択する
• 判別分析も、重回帰と同様のことができる – 階層的投入orステップワイズ
– 交互作用と単純効果の検定
回帰分析のオプション
多変量回帰分析
多変量回帰分析
• 従属変数が多変量の場合
– 複数の従属変数への影響を予測する
• 回帰分析のオプションから選択
– 多変量回帰分析を選択する
多変量を選択
• 多変量回帰分析のモデリングスペース
モデルの指定
• 目的変数
– 複数の目的変数を選択可
– 複数のセルを選択して、「目的変数を投入」
• 説明変数
– 主効果・交互作用を投入可
– ただし、単純効果の検定は不可
モデルの指定
• 以下のように投入
分析実行
• 出力はこんな感じ
モデル適合 ※PillaiとはPillaiのトレースを意味しています
変数名 R2 Pillai F値 df1 df2 p値
全体 .241 .245 13.469 6 578 .000
説明変数の多変量検定
変数名 β 偏η 2 F値 df1 df2 p値
skill skill .221 .060 6.179 3 288 .000con con .423 .191 22.614 3 288 .000
正準相関分析
• 同時に正準相関分析結果も出力 正準相関分析
正準相関 尤度 χ 2値 自由度 p値
成分1 .477 0.759 80.039 6 .000成分2 .135 0.982 5.337 2 .069
正準係数
目的変数 成分1 成分2idt .485 .893talk .762 -.542per -.214 .161
説明変数 成分1 成分2skill .429 .961con 1.776 -.920
分散分析
分散分析
• モデリングスペースの「分散分析」を押す
モデルの指定
• 目的変数 – 従属変数を指定 – 参加者内要因(Within)がある場合、参加者内要因を構成する変
数すべてを指定する
• モデル – 説明変数を主効果・交互作用ともに指定(共変量含む) – 「交互作用を全投入」ボタンを押すととりあえず全部入る
• 共変量 – 共変量を指定。共変量もモデルに指定しておく。
• 反復要因 – 参加者内要因の水準数を入力する(後述)
1要因参加者間要因
• 目的変数:x4・・・$マークはここでは気にしない • 要因:a・・・参加者間要因
2要因参加者間要因
• 目的変数:x4・・・$マークはここでは気にしない • 要因:aとcと、その交互作用・・・すべて参加者間要因
一要因参加者内要因
• 目的変数:x1~x4・・・$マークのあとに要因名をつける • 要因:b・・・$のあとの名前が参加者内要因名となる
2要因以上の参加者内要因
• 参加者内要因の構造 – 入れ後になるように読み込む
• 反復測定要因の水準数 – $マークの後に入力した順番に数字を指定
• 2以上の数値をセルごとに入力
– 上の例だと、b1が2水準、b2も2水準なので、2,2と書く • 参加者内要因が1つの場合は、水準数を書く必要はない
要因b1
要因b2 b2=1 b2=2 b2=1 b2=2
目的変数 x1 x2 x3 x4
b1=1 b1=2
2要因参加者内要因
• 目的変数:x1~x4・・・$マークのあとに二つ指定 • 要因:b1とb2・・・$のあとの名前が参加者内要因名となる • 反復測定・・・参加者内要因の水準数を入力
2要因混合計画
• 目的変数:x1~x4・・・$マークのあとに参加者内要因名を書く • 要因:aとbと、その交互作用
共変量のあるモデル
• 共変量はモデルにも指定しておく
– さきに共変量に指定してから、「交互作用を全投入」を押すのが便利
• 共変量の投入ルール
– 「交互作用を全投入」ボタンを押した場合、
– 参加者間要因とは交互作用は作らない
– 参加者内要因とは交互作用項を作る
– というルールで投入される(SPSSのデフォルトと同じ)
共変量のあるモデル
• 目的変数:x1~x4 • 要因:aとbと交互作用・・・$のあとの名前が参加者内要因名となる • 共変量:d・・・参加者内要因とだけ交互作用を作る
単純効果の検定
• スライスに群分け変数を指定 – 「スライスに投入」ボタンを利用すると便利
• 分散分析は5要因まで検討可能 – スライスには4変数まで指定できる
– すべての単純主効果・単純交互作用を検討することができる
• オプションで単純効果検定の方法を選択 – プールされた誤差項による検定・・・検出力が高い
– 水準別の誤差項による検定・・・等分散を仮定しない
単純効果の検定
• スライス変数:a・・・内・間どちらの要因でも指定可能
分析結果 交互作用のp値 = .004 **
x1 x2 x3 x4a=1 3.067 5.074 6.074 7.374 **a=2 3.947 4.141 3.741 3.501
0.602 0.602 0.602 0.6020.539 0.539 0.539 0.539
※エラーバーは標準誤差
0
1
2
3
4
5
6
7
8
9
a=1 a=2
得点
b
x1
x2
x3
x4
分散分析のオプション
一般化線形モデル
一般化線形モデル
• 目的変数に様々なタイプの変数を指定可能 – 順序・・・2値か順序性のある順序尺度変数
– 名義・・・順序性のない、名義尺度変数
– カウント・・・度数データ
– 打ち切り・・・天井・床効果のように途中で測定が 打ち切られているようなデータ
• 回帰分析とほぼ同じようなことができる – 階層的投入orステップワイズ
– 交互作用と単純効果の検定
一般化線形モデル
• モデリングスペース
モデルの指定
• 基本は回帰分析と同じ – 一つの目的変数と,複数の説明変数を選択
– ステップは5つまで
• 目的変数のタイプを指定 – 連続,順序,カウント,打ち切り,名義から一つ選択
• 頑健標準誤差の推定の有無 – モデルの仮定から逸脱していても,妥当な検定を行うこ
とができる
分析実行
• 「分析実行」ボタンを押す – もしモデリングにエラーがあれば、分析が止まる
• 出力・・・重回帰と同じ – Step・・・分析結果をステップごとに出力
• 階層的投入の場合は入力ステップ
• 「各ステップを出力しない」を押すと、出力されない
– HRA・・・階層的重回帰分析の結果をまとめたもの
– Slice・・・単純効果検定の結果
分析結果
• モデル適合の指標が重回帰と異なる
• Χ2乗値: – 有意な場合,モデルの説明率は0ではない
• 適合指標 – 近似R2:残差分散から近似的に計算されたR2
媒介分析
媒介分析
• 目的変数と説明変数の関連を説明
– 間接効果検定とブートストラップ信頼区間を算出
• 多くの分析手法で実行可能
– 重回帰分析
– 一般化線形モデル・・・パラメトリックのみ
– 階層線形モデル・・・パラメトリックのみ
媒介分析を選択
• 媒介分析のモデリングスペース
モデルの指定
• 媒介モデル – X→Yの効果を、変数Mが媒介
– つまり、X→M→Yというモデルを検討
• 目的変数 – 変数Yを指定
• モデル – 変数M、変数Xの順に指定
– モデルに指定できるのは2変数のみ
モデルの指定
• con→talk→idtというモデルを検討
分析実行
• 後は「分析実行」を押すだけ
– ブートストラップ標本数などはオプションで指定
• 出力はこんな感じ
con
talk
idt
.38** .27**
.19** → .09
媒介分析の設定
• ブートストラップ標本の抽出法 – ノンパラメトリック法
• データから反復抽出によるサンプリングを行う
– パラメトリック法 • 推定値とその標準誤差から、正規乱数を発生させる
• ブートストラップ信頼区間の推定法 – バイアス修正法
• 推定値を平均値に調整した場合の信頼区間
– パーセンタイル法 • リサンプリングした推定値をそのまま使う方法
媒介分析のオプション