Tokyo.R #46 Cox比例ハザードモデルとその周辺
-
Upload
kikurage1001 -
Category
Presentations & Public Speaking
-
view
2.083 -
download
6
Transcript of Tokyo.R #46 Cox比例ハザードモデルとその周辺
Cox比例ハザードモデルとその周辺
TokyoR #46
2015/2/21
@kikurag1001
自己紹介
名前:@kikurage1001
お仕事:統計ソフトを作ってます@東京
兼
大学院生として医療統計を勉強してます@福岡
今は遺伝子解析をぼちぼち。。。
よく使うもの:R、SAS
楽しみ:映画データをいじくって眺める
内容
• Cox比例ハザードモデルとは?
• 実際に分析してみる
• ノモグラムを描いてみる
Cox比例ハザードモデル
• イベントが起こったか、起こらなかったかについて、時間も含めて行う多変量解析のこと
• 医療疫学分野、製品の寿命や故障の解析などに使われる
特徴1
ℎ 𝑡 𝑥 = ℎ0(𝑡)exp(𝛽1𝑥1 + 𝛽2𝑥2 + ・・・+ 𝛽𝑘𝑥𝑘)
• 柔軟性の高いモデル
• ハザード比:exp(偏回帰係数)群間でのハザード(単位時間あたりの死亡確率)の比1より大きいとリスクを上げ、1より小さいとリスクを下げる
• 比例ハザード性(ハザード比が常に一定)の仮定が必要
ベースラインハザード(推定しない)
偏回帰係数と共変量の線形結合の指数関数
特徴2
• 累積ハザード関数から生存関数を求めることができる
• 生存予測ができる
𝐻 𝑡 = 0
𝑡
ℎ 𝑥 𝑑𝑥 = −log[𝑆(𝑡)]
累積ハザード関数
こんなニュースが・・・
最近、ミニシアターがどんどん閉館しているらしい
ミニシアターの閉館にどんな因子が関係しているのか?
※5スクリーン未満の映画館
実際に分析してみる
映画館のデータ(自作)を使って分析してみる
1910~2015年に営業している(た)5スクリーン未満の映画館計128件のデータをCox比例ハザードモデルを用いて解析!
変数 説明
営業年数 営業年数(平均約36年)
営業中or閉館 営業中=0、閉館=1
総座席数 館内全体の座席数の合計
スクリーン数 館内のスクリーン数の合計
区のカテゴリー 映画館がある区のカテゴリー
シネコン有無 営業期間内にその映画館がある区内にシネコンがあったか
都心千代田区、中央区、港区
副都心新宿区、文京区、渋谷区、豊島区
城東台東区、墨田区、江東区、荒川区、足立区、葛飾区、江戸川区
城南品川区、目黒区、大田区
城西世田谷区、中野区、杉並区、練馬区
城北 北区、板橋区
その他市部※シネコン:5スクリーン以上ある映画館
コード
結果
コード
結果
結果からわかること
• スクリーンは多いほうが良さそう
• 副都心地域はやばそう(新宿、渋谷等)
• シネコンの影響は・・・あったほうが?
グラフにしてみよう!!
ノモグラムを描いてみる
• 臨床の世界で使われる便利なグラフ
• 死んだり、病気になったりする可能性をざっくりと計算することができる
• Rで描ける!{rms}
コード
結果
市部
市部
市部
実際の使い方もしも
• 総座席数400席 で• スクリーン数2つ の映画館が
• シネコンのない• 中野区に建設されたとしたら
どのくらいの確率で50年後も営業しているかなあ??
市部
市部
市部
市部
3点 35点 38点 67点
市部
3 + 35 + 38 + 67 = 143点
市部
143点
市部
143点
市部
143点
0.65!
65%くらいの確率で、営業してるんじゃないかねぇ、たぶん
まとめ
説明 {survival} {rms}
Cox解析 coxph cph
残差の分析 residuals.coxph residuals.cph
比例ハザード性の確認 cox.zph ―
生存確率の算出 survfit survest.cph
Coxモデルの予測 predict.coxph predict
ノモグラムを描く ― nomogram
• Rを使えば、Cox比例ハザードモデルに関することが色々できます
※ここで用いたデータ及び、解析方法、解釈については個人の見解に基づくものであることをご了承くださいm(-_-)m