実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 ·...

16
2014 年度・東京農業大学生物応用化学科(毎週金曜第 2 限) 三中信宏〈実験データー解析概論〉:2014 年 4 月~ 2014 年 9 月 東京農業大学世田谷キャンパス 431 番教室 実験データー解析概論 — 統計学に基づく「よりよい推論」のために — 三中 信宏 MINAKA Nobuhiro 独立行政法人 農業環境技術研究所 生態系計測研究領域 上席研究員[生物統計学] 東京大学大学院 農学生命科学研究科 生物・環境工学専攻 教授[生態系計測学] 東京農業大学大学院 農学研究科 客員教授[応用昆虫学] mailto:[email protected] (メール) http://twitter.com/leeswijzer/ (ツイッター) http://cse.niaes.affrc.go.jp/minaka/ (ウェブサイト) http://d.hatena.ne.jp/leeswijzer/ (ブログ)

Transcript of 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 ·...

Page 1: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果

2014 年度・東京農業大学生物応用化学科(毎週金曜第 2限)三中信宏〈実験データー解析概論〉:2014年 4月~ 2014 年 9月

東京農業大学世田谷キャンパス 431番教室

実験データー解析概論— 統計学に基づく「よりよい推論」のために —

三中 信宏MINAKA Nobuhiro

独立行政法人 農業環境技術研究所 生態系計測研究領域 上席研究員[生物統計学]

東京大学大学院 農学生命科学研究科 生物・環境工学専攻 教授[生態系計測学]

東京農業大学大学院 農学研究科 客員教授[応用昆虫学]

mailto:[email protected] (メール)

http://twitter.com/leeswijzer/ (ツイッター)

http://cse.niaes.affrc.go.jp/minaka/ (ウェブサイト)

http://d.hatena.ne.jp/leeswijzer/ (ブログ)

Page 2: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果

線形統計モデル(LM)への入り口モデルとデータの接点に触る

観察者

現象 データ

モデル×

統計的誤差

共通要因個別要因

パラメータ推定モデル選択アブダクション

Page 3: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果

線形統計モデル(LM)への入り口モデルの構造とパラメータ

パラメータ推定問題

モデルの「構造」を固定

したとしても,パラメー

タ群の値は可変である.

どのような基準で最適な

パラメータ値を決定する

のか.

パラメータ群 ・手足の長さ ・関節の位置 ・屈曲の角度

計算すればなんとかなる

Page 4: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果

線形統計モデル(LM)への入り口モデルの構造とパラメータ

モデル選択問題

モデルの基本となる「構

造」そのものをどのよう

な基準で決定すればいい

のか.モデル構造 ・ボディプラン ・手足の本数 やや難しいかも・・

Page 5: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果

線形モデルを鍛えあげる

線形モデル(LM)

データ 総平均

処理効果 誤差項 誤差は正規分布をする

通常の「線形モデル」の仮定 ・処理効果はある実数(「パラメータ値」)である. ・誤差項は独立かつ同一の正規分布にしたがう.   (「正規性」と「等分散性」)

これらの仮定を緩めよう(一般化)

Page 6: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果

線形モデルを鍛えあげる

一般化線形モデル(GLM)

データ 総平均

処理効果 誤差項 誤差は正規分布をする

何が一般化されたのか? ・誤差項が正規分布でなくてもよい. ・データのある関数変換(「リンク関数」)が   線形モデルで記述できればよい

Page 7: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果

線形モデルを鍛えあげる

一般化加法モデル(GAM)

データ 総平均

処理効果 誤差項 誤差は正規分布をする

さらなる一般化とは? ・予測関数は単一の式で表示される関数である必要  すらなく,スプライン関数によって区分的に構築  された任意に関数(ただし加法性はある)でもか  まわない.

Page 8: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果

線形モデルを鍛えあげる

混合効果モデル(mixed-effect model)

処理効果

要因の「処理効果」は,ある実数の「パラメータ値」という定数として「固定効果」(fixed effect)をもつと仮定してきた.しかし,その処理効果が別の確率分布にしたがう“変量”とみなして,「ランダム効果」をもつと仮定すれば,より細かい変動や個体差をもモデリングできるだろう.

Page 9: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果

線形モデルを鍛えあげる

LM

GLM

GAM

非正規誤差リンク関数

経験的予測関数

LMM

GLMM

GAMM

混合効果線形モデル

一般化線形モデル

一般化加法モデル

混合効果モデル

Page 10: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果

進化認知科学・連続セミナー・第4回(27 October 2004,東京大学)

三中信宏「シンプルって美しい:認知最節約化のための図像と概念」

Curve-fitting problem (2)

Page 11: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

Page 12: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

Page 13: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

Page 14: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

Page 15: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法

Page 16: 実験データー解析概論leeswijzer.org/R/nodai2014-7.pdf · 2016-04-21 · 線形モデルを鍛えあげる 一般化線形モデル(glm) データ 総平均 処理効果

第 3回最先端育種セミナー(17~ 19 November 2005,神戸)〈家畜・水産動物における遺伝的多様性研究―その目的と新しい方法論―〉三中信宏:生物進化の歴史を推定する̶分子系統樹を構築する理論と方法