草薙 2013 nagoyar11　復元抽出と乱数シミュレーションによる信頼区間の検討

復元抽出と乱数シミュレーションを

⽤いた信頼区間の検討

[email protected] R #11

2013/12/5名古屋⼤学国際開発研究科

mailto:[email protected]

信頼区間• ⺟数がどのような数値の範囲にあるか

– Cf. 予測区間（標本値の推定範囲）– 統計量（標本から求められる⺟集団の⺟数の推定

量）– 確率

• 95%, 99%– 求め⽅

• パラメトリック• ノンパラメトリック• 確率分布に基づく計算• ブートストラップ

信頼区間• 情報量の多さ

– スケールが失われない– 推定の正しさも加味される

• APAでも報告を推奨されている（APA, 2009）

• 統計的仮説検定に依存せず，効果量，検定⼒などと合わせ吟味すべき

信頼区間• 確率分布に基づく⺟平均の計算例

– 正規分布を考える– 点推定：標本の平均値（M）→⺟平均（μ）の

推定値とみなす– 区間推定: M ± t（df, 任意の確率）×(SD/√N)– Nが∞時，t値は約1.96（95%）になる

信頼区間• Rで計算してみる

– ⾃作関数 pmci

pmci <‐ function(data){l1 <‐mean(data)‐qt(0.975, length(data)‐1)*(sd(data)/sqrt(length(data)))u1 <‐mean(data)+qt(0.975, length(data)‐1)*(sd(data)/sqrt(length(data)))l2 <‐mean(data)‐qt(0.995, length(data)‐1)*(sd(data)/sqrt(length(data)))u2 <‐mean(data)+qt(0.995, length(data)‐1)*(sd(data)/sqrt(length(data)))list("95%CI:lower"=l1, "95%CI:upper"=u1, "99%CI:lower"=l2, "99%CI:upper"=u2)

}

信頼区間• 可視化したり報告したり

– 95% CI [下限, 上限]

リサンプリング• 確率分布に基づく計算

– 条件が多い– 数学的にもやや複雑– 理想化が激しい– 条件を取っ払い計算機の⼒で代⽤しよう！

リサンプリング• リサンプリングとは

– 標本から再度標本を作り出す統計⼿法全般• 様々な⽅法

– パラメトリック• 標本値から得られた確率密度関数に従う乱数を⽣成す

る⽅法（モンテカルロ法）– ノンパラメトリック

• 元標本を複数抽出することによってブートストラップ標本を作り出す⼿法

• 復元抽出（replacement）：– 抽出の重複を認めるか– 認める／認めない（ジャックナイフ法）

リサンプリング• 理屈

– 元標本から⽣成された⼤数のブートストラップ標本の分布は⺟分布に近似する

• 標本は⺟集団の⼀部• 標本値を再度選ぶのは⺟集団からもう⼀個取るの

と同じ

乱数シミュレーション• ⼿順

– あるテスト，30個の標本を得た– 元標本から推定されたμとσはそれぞれ，73.21,

10,24だった– その分布に従う30個（ブートストラップ標本サ

イズ）の乱数を1000個作る（ブートストラップ標本数，B）

– そのブートストラップ標本毎に平均値を求める– 1000個のブートストラップ平均値の分布は⺟平

均値の分布に近似するだろう→可視化したりできるし，順序区間を信頼区間と

みなすことによって区間を推定できる！

乱数シミュレーション• Rでやってみる

– bsm <- numeric(0)– for(i in 1:1000){bs <- rnorm(30,73.21,10.24); bsm[i] <- mean(bs)}– hist(bsm)

– quantile(bsm, c(0.025, 0.975))

復元抽出• ブートストラップ信頼区間の計算法

– パーセンタイル法• ⼀番シンプル• ブートストラップ標本それぞれにおける統計量の

順序区間を信頼区間とみなす– パーセンタイルt法– BCa法– ベーシック法…

復元抽出• ⼿順

– あるテスト，30個の標本（元標本）を得た– 30個から重複有りで，30個標本値を取り出す

（ブートストラップ標本）– そのブートストラップ標本毎に平均値を求め

る– 1000個のブートストラップ平均値の分布は⺟

平均値の分布に近似するだろう→可視化したりできるし，順序区間を信頼区間

とみなすことによって区間を推定できる！

復元抽出• Rでやってみよう！

– bsm <- numeric(0)– for(i in 1:1000){bs <- sample(dat, 30, replace=T);bsm[i]

<- mean(bs)}– quantile(bsm, c(0.025, 0.975))

応⽤• 基本的にどんな統計量でもできる

– 平均差– 平均差の検定のt値，有意確率– 効果量– 回帰係数– 相関係数– 信頼性係数

– 形態素習得研究におけるGSM（草薙, 2013a）

応⽤• ⼆変数の標準化平均差（Cohenʼs d）の

ブートストラップ信頼区間• bootd(tests, 1000, 10)

• $summary

• Min. 1st Qu. Median Mean 3rd Qu. Max.

• ‐1.4590 ‐0.4546 ‐0.2484 ‐0.2233 0.0000 0.8784

•• $`95%CI`

• 2.5% 97.5%

• ‐0.8994050 0.5433483

bootd <‐ function(x, n.boot, n.sub){

meany = numeric(0)for(i in 1:n.boot){

subs <‐x[sample(nrow(x),n.sub,replace=TRUE),]

y[i] <‐ c((mean(subs[,1])‐mean(subs[,2]))/(sqrt((sd(subs[,1])^2+sd(subs[,2])^2)/2)))

meany[i] <‐mean(y)}par(mfrow=c(1,3))

boxplot(y, ylab="score") plot(meany, xlab="", ylab="score")hist(y, ylab="frequency",

xlab="score", main="")list("summary"=summary(y),"95%CI"=quantile(y,p=c(

0.025,0.975)), "sd"=sd(y))}

応⽤• ブートストラップ標本における標準化平均差の累積順位

– 追⾏確率関数の推定• 上記のデータだと1000回中687個のデータが負の効果量を取った

ということ。• 同条件で実験した場合，⼤体69%は同じ符号の効果量を取りそう

だといえる

Point estimate 95% CI

Flat adverb 526 [492, 559]

Adj-ly adverb 509 [484, 538]

⺟平均値

効果量Point estimate 95% CI

Effect size d 0.19 [0.36, 0.74]

可視化草薙（2013b）

400

500

600

700

slow straight different late close quick deep safe

Rea

din

g ti

me

(ms)

Flat adverbly adverb

可視化草薙（2013b）

ただし• ブートストラップは元標本に依存する

– 適⽤でない場合も勿論ある• あくまでも，ひとつのシミュレーション

的データとして解釈すべき• ⼀回ごとに違う数値になる

復元抽出と乱数シミュレーションを

⽤いた信頼区間の検討やってみようず！

草薙邦広（2013a）「形態素習得研究とリサンプリング」 Nagoya R #10, 名古屋⼤学国際開発研究科.http://www.slideshare.net/Kunihiro_KUSANAGI/nagoyar‐24447878

草薙邦広 (2013b) 「第⼆⾔語としての英語における単純形副詞のオンライン処理：⾃⼰ペース読み課題を⽤いた予備的検討」第82回外国語教育メディア学会中部⽀部秋季研究⼤会. 中部⼤学.

http://www.slideshare.net/Kunihiro_KUSANAGI/let2013‐flatadverb

http://www.slideshare.net/Kunihiro_KUSANAGI/nagoyar-24447878

http://www.slideshare.net/Kunihiro_KUSANAGI/let2013-flatadverb

草薙 2013 nagoyar11　復元抽出と乱数シミュレーションによる信頼区間の検討

Documents

Transcript of 草薙 2013 nagoyar11　復元抽出と乱数シミュレーションによる信頼区間の検討

草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

Documents

Transcript of 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討

草薙 2013 nagoyar11　復元抽出と乱数シミュレーションによる信頼区間の検討

Transcript of 草薙 2013 nagoyar11　復元抽出と乱数シミュレーションによる信頼区間の検討