~シミュレーションによる取り組み~ Momentumで求めたSパラメータを用い、電源ノイズのシミュレーションを実施 電源ノイズのシミュレーション
草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討
-
Upload
kusanagi-kunihiro -
Category
Documents
-
view
884 -
download
2
description
Transcript of 草薙 2013 nagoyar11 復元抽出と乱数シミュレーションによる信頼区間の検討
復元抽出と乱数シミュレーションを
⽤いた信頼区間の検討
信頼区間• ⺟数がどのような数値の範囲にあるか
– Cf. 予測区間(標本値の推定範囲)– 統計量(標本から求められる⺟集団の⺟数の推定
量)– 確率
• 95%, 99%– 求め⽅
• パラメトリック• ノンパラメトリック• 確率分布に基づく計算• ブートストラップ
信頼区間• 情報量の多さ
– スケールが失われない– 推定の正しさも加味される
• APAでも報告を推奨されている(APA, 2009)
• 統計的仮説検定に依存せず,効果量,検定⼒などと合わせ吟味すべき
信頼区間• 確率分布に基づく⺟平均の計算例
– 正規分布を考える– 点推定:標本の平均値(M)→⺟平均(μ)の
推定値とみなす– 区間推定: M ± t(df, 任意の確率)×(SD/√N)– Nが∞時,t値は約1.96(95%)になる
信頼区間• Rで計算してみる
– ⾃作関数 pmci
pmci <‐ function(data){l1 <‐mean(data)‐qt(0.975, length(data)‐1)*(sd(data)/sqrt(length(data)))u1 <‐mean(data)+qt(0.975, length(data)‐1)*(sd(data)/sqrt(length(data)))l2 <‐mean(data)‐qt(0.995, length(data)‐1)*(sd(data)/sqrt(length(data)))u2 <‐mean(data)+qt(0.995, length(data)‐1)*(sd(data)/sqrt(length(data)))list("95%CI:lower"=l1, "95%CI:upper"=u1, "99%CI:lower"=l2, "99%CI:upper"=u2)
}
信頼区間• 可視化したり報告したり
– 95% CI [下限, 上限]
リサンプリング• 確率分布に基づく計算
– 条件が多い– 数学的にもやや複雑– 理想化が激しい– 条件を取っ払い計算機の⼒で代⽤しよう!
リサンプリング• リサンプリングとは
– 標本から再度標本を作り出す統計⼿法全般• 様々な⽅法
– パラメトリック• 標本値から得られた確率密度関数に従う乱数を⽣成す
る⽅法(モンテカルロ法)– ノンパラメトリック
• 元標本を複数抽出することによってブートストラップ標本を作り出す⼿法
• 復元抽出(replacement):– 抽出の重複を認めるか– 認める/認めない(ジャックナイフ法)
リサンプリング• 理屈
– 元標本から⽣成された⼤数のブートストラップ標本の分布は⺟分布に近似する
• 標本は⺟集団の⼀部• 標本値を再度選ぶのは⺟集団からもう⼀個取るの
と同じ
乱数シミュレーション• ⼿順
– あるテスト,30個の標本を得た– 元標本から推定されたμとσはそれぞれ,73.21,
10,24だった– その分布に従う30個(ブートストラップ標本サ
イズ)の乱数を1000個作る(ブートストラップ標本数,B)
– そのブートストラップ標本毎に平均値を求める– 1000個のブートストラップ平均値の分布は⺟平
均値の分布に近似するだろう→可視化したりできるし,順序区間を信頼区間と
みなすことによって区間を推定できる!
乱数シミュレーション• Rでやってみる
– bsm <- numeric(0)– for(i in 1:1000){bs <- rnorm(30,73.21,10.24); bsm[i] <- mean(bs)}– hist(bsm)
– quantile(bsm, c(0.025, 0.975))
復元抽出• ブートストラップ信頼区間の計算法
– パーセンタイル法• ⼀番シンプル• ブートストラップ標本それぞれにおける統計量の
順序区間を信頼区間とみなす– パーセンタイルt法– BCa法– ベーシック法…
復元抽出• ⼿順
– あるテスト,30個の標本(元標本)を得た– 30個から重複有りで,30個標本値を取り出す
(ブートストラップ標本)– そのブートストラップ標本毎に平均値を求め
る– 1000個のブートストラップ平均値の分布は⺟
平均値の分布に近似するだろう→可視化したりできるし,順序区間を信頼区間
とみなすことによって区間を推定できる!
復元抽出• Rでやってみよう!
– bsm <- numeric(0)– for(i in 1:1000){bs <- sample(dat, 30, replace=T);bsm[i]
<- mean(bs)}– quantile(bsm, c(0.025, 0.975))
応⽤• 基本的にどんな統計量でもできる
– 平均差– 平均差の検定のt値,有意確率– 効果量– 回帰係数– 相関係数– 信頼性係数
– 形態素習得研究におけるGSM(草薙, 2013a)
応⽤• ⼆変数の標準化平均差(Cohenʼs d)の
ブートストラップ信頼区間• bootd(tests, 1000, 10)
• $summary
• Min. 1st Qu. Median Mean 3rd Qu. Max.
• ‐1.4590 ‐0.4546 ‐0.2484 ‐0.2233 0.0000 0.8784
•• $`95%CI`
• 2.5% 97.5%
• ‐0.8994050 0.5433483
bootd <‐ function(x, n.boot, n.sub){
meany = numeric(0)for(i in 1:n.boot){
subs <‐x[sample(nrow(x),n.sub,replace=TRUE),]
y[i] <‐ c((mean(subs[,1])‐mean(subs[,2]))/(sqrt((sd(subs[,1])^2+sd(subs[,2])^2)/2)))
meany[i] <‐mean(y)}par(mfrow=c(1,3))
boxplot(y, ylab="score") plot(meany, xlab="", ylab="score")hist(y, ylab="frequency",
xlab="score", main="")list("summary"=summary(y),"95%CI"=quantile(y,p=c(
0.025,0.975)), "sd"=sd(y))}
応⽤• ブートストラップ標本における標準化平均差の累積順位
– 追⾏確率関数の推定• 上記のデータだと1000回中687個のデータが負の効果量を取った
ということ。• 同条件で実験した場合,⼤体69%は同じ符号の効果量を取りそう
だといえる
Point estimate 95% CI
Flat adverb 526 [492, 559]
Adj-ly adverb 509 [484, 538]
⺟平均値
効果量Point estimate 95% CI
Effect size d 0.19 [0.36, 0.74]
可視化草薙(2013b)
400
500
600
700
slow straight different late close quick deep safe
Rea
din
g ti
me
(ms)
Flat adverbly adverb
可視化草薙(2013b)
ただし• ブートストラップは元標本に依存する
– 適⽤でない場合も勿論ある• あくまでも,ひとつのシミュレーション
的データとして解釈すべき• ⼀回ごとに違う数値になる
復元抽出と乱数シミュレーションを
⽤いた信頼区間の検討やってみようず!
草薙邦広(2013a)「形態素習得研究とリサンプリング」 Nagoya R #10, 名古屋⼤学国際開発研究科.http://www.slideshare.net/Kunihiro_KUSANAGI/nagoyar‐24447878
草薙邦広 (2013b) 「第⼆⾔語としての英語における単純形副詞のオンライン処理:⾃⼰ペース読み課題を⽤いた予備的検討」 第82回外国語教育メディア学会中部⽀部秋季研究⼤会. 中部⼤学.
http://www.slideshare.net/Kunihiro_KUSANAGI/let2013‐flatadverb