DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA...

25
DNA鑑定を理解するため に必要な数学の学び方 法数学勉強会 6月特別会(2017) 平成2967長良川国際会議場 45分?

Transcript of DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA...

Page 1: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

DNA鑑定を理解するために必要な数学の学び方

法数学勉強会6月特別会(2017)平成29年6月7日長良川国際会議場

45分?

Page 2: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

法数学

Page 3: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

「オトナ 数学」で検索

Page 4: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

これさえ読めば、DNA鑑定のための数学の基礎は身につく!• アマゾンで検索!

確率・統計 (理工系の数学入門コース7)

1989/2/8古くても大丈夫!でも、「理工系」の確率統計と法数学は違う

Page 5: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

大学の一般教養の確率統計は『一般的』過ぎる

Page 6: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

「リスク」「株」「経済統計」「保険の数学」

法数学によいことが多い

Page 7: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

何がわかればよいのか?•過去の法数学勉強会の内容がわかれば

•もう、法数学の最先端

•まともな教科書もない世界なのですから

Page 8: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

これまでの法数学勉強会では…• 尤度・尤度比

• ベイズ推定

• ベイジアンネットワーク

• 否定するかしないか

Page 9: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

尤度• とても大事• これさえ解れば、後はいらないかも知れないくらい大事

• 「尤度とは」という本は(基本的に)は

ない

Page 10: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

尤度とは• 法数学を含め、「データを使って何かを考える分野」で、使いまわされる、何か

• 「 とは何か」みたいなもの• とても基礎的で、それなしにはデータについて考えられないようなもの

Page 11: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

尤度とは「 」のようなものなので• たいていの統計確率、データサイエンスの教科書(の冒頭)に少しだけ書いてある。

• たいていの統計確率、データサイエンスの教科書では、そこで説明した「尤度」を、その本の目的のために使っている

本を買って読むなら、「尤度」の説明だけを読んで、それ以外は読まずに終えよう。もし、1冊選ぶなら、その「尤度」の説明の章・節が『自分にとって』わかりやすいかどうかで選ぼう

Page 12: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

尤度比はどうする?• 2x2表を使った臨床診断での説明から入る、と言うやり方は「アリ」

• 「確率統計」に疎い医療系読者を想定しているから

• ただし、法数学のために読む人は、「尤度」「尤度比」という単語を使っている本をみつけないといけません!

• アマゾンでは、見つからないかもしれません。• なぜか• 「本」にするには「既定路線」で説明することが求められ、臨床診断の「既定路線」では「尤度・尤度比」を使うことが主流ではないから

「感度 特異度 尤度 尤度比」で検索

Page 13: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

尤度比 もう1つの道• 遺伝カウンセリング

• もちろん、関係ない内容が山ほどあるので、該当する部分だけつまみ食いするべき

Page 14: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

DNA鑑定のための最尤推定~離散型から連続型へ、シフトしよう~

• 尤度比を考えているときは、「どちら」の尤度が高いか、を問題にする

• たくさんの仮説がある場合は、「どの」尤度が高いか、を問題にする

• 「どちら」「どの」も「あれか・これか」の離散型• 離散型である場合でも「最尤推定」は「できる」けれども、考えてもメリットがない

• 最尤法は連続型が気になるときのために活躍する

Page 15: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

DNA鑑定のための最尤推定~離散型から連続型へ、シフトしよう~

• STRマーカーのアレル頻度の最尤推定問題を丁寧に勉強しよう• データは離散、推定するのは連続

• 基礎から• 「あり」「なし」:2通り、離散• 「ありの割合:0 ~ 1 の連続値

• N回リピート、N+1回リピート、N+2回リピート:3通り、離散• 「N、N+1、N+2」の割合:(p, q, r)の連続値

Page 16: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

「あり」「なし」データからの「あり」の割合の「最尤推定」• これをとことん勉強しよう

• 「あり」「なし」:2通り、離散• 「あり」の割合:0 ~ 1 の連続値

• 大事なポイントは、0 ~ 1 の値のどこを取るかわからないけれど、「最も尤もらしい値」を見つける、ことを理解する

• 基本的過ぎて「良い本」が少ないが、「最尤法」を扱った本の「冒頭の例」として出てくることは多い

Page 17: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

拡張する• 二項分布、ベータ分布

• 「あり」「なし」:2通り、離散• 「ありの割合:0 ~ 1 の連続値

• 多項分布、ディリくれ分布• N回リピート、N+1回リピート、N+2回リピート:3通り、離散• 「N、N+1、N+2」の割合:(p, q, r)の連続値

• この『拡張』はそれほどメジャーな話ではないので、資料がなかなか見つけられないことを覚悟しよう

• 『共役分布』という単語も勉強しないといけなくなる

Page 18: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

最尤推定(点推定)から分布推定• データから何かを推定するときに、「点推定」と「区間推定」とがあることも大事

• またまた「基本」なので、「本」の冒頭に書かれているだけ

• 「統計」「統計解析」の推定の本は選ばずに、「ベイズ推定」と名乗っている本の「冒頭の推定の基本」のところを勉強しよう

• なぜなら、ベイズ推定以外の「統計」「統計解析」の「推定」を読むと、混乱すること、必至なので

Page 19: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

ここまでで、何を?• 高校までの数学• 尤度• 尤度比• 最尤法とそのための、連続値変数• DNAマーカーを扱うための

• 二項分布・多項分布• ベータ分布・ディリクレ分布• それらを理解するための分布の共役関係

• 点推定・区間推定・分布推定:ただしベイズ流

Page 20: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

あとは、何を?• 確率モデル

• 複雑になったときのためのベイジアンネットワーク

• 統計でも尤度でもベイズでもないこと。それは決断

Page 21: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

確率モデル• 最尤法とそのための、連続値変数

• この「連続値変数」というのが、確率モデルの中心

• 何かしらこういう変数を使って、データが出てくる仕組みを「モデル」にする

• ベイズ流に考えているときは、必ずこの「モデル(確率モデル)」がある

めずらしく、お勧めの本

Page 22: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

ベイジアンネットワークが学びたいヒトへ• ベイズ だけど ベイズの定理の拡張でわかろうとしないで

鈴木/譲1993年早稲田大学理工学研究科修了。1995年早稲田大学理工学部助手。大阪大学大学院理学研究科助教授。現在、大阪大学大学院理学研究科准教授・博士(工学)

植野/真臣1994年東京工業大学総合理工学研究科。東京工業大学総合理工学研究科助手。2000年長岡技術科学大学工学部助教授。2006年電気通信大学大学院情報システム学研究科助教授。現在、電気通信大学大学院情報理工学研究科教授・博士(工学)

Page 23: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

決断は 確率・統計・ベイズ ではない• 確率を使わないタイプの決定理論• 哲学・経済学・政治学・心理学・計算機科学・統計学

Page 24: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

DNA鑑定のための数学• 高校までの数学• 尤度• 尤度比• 最尤法とそのための、連続値変数• DNAマーカーを扱うための

• 二項分布・多項分布• ベータ分布・ディリクレ分布• それらを理解するための分布の共役関係

• 点推定・区間推定・分布推定:ただしベイズ流• 確率モデル• ベイジアンネットワーク• 決断

Page 25: DNA鑑定を理解するため に必要な数学の学び方 - 京 …...DNA 鑑定のための最尤推定 ~離散型から連続型へ、シフトしよう~ • 尤度比を考えているときは、「どちら」の尤度が高いか、を問

Kindle ryamada で検索DNA鑑定のための数学• 高校までの数学• 尤度• 尤度比• 最尤法とそのための、連続値変数• DNAマーカーを扱うための

• 二項分布・多項分布• ベータ分布・ディリクレ分布• それらを理解するための分布の共役関係

• 点推定・区間推定・分布推定:ただしベイズ流• 確率モデル• ベイジアンネットワーク• 決断

• 法数学勉強会@京大要録 2010年8月-2013年6月

• ジェノタイプ推定で学ぶベイジアンネットワーク

• 事後分布推定• DNA鑑定のための区間推定• 。。。ほか

ただし、「購入」しなくても大丈夫。http://d.hatena.ne.jp/ryamada22/20141222

に、「無償版」があります。http://statgenet-kyotouniv.wikidot.com/handouts-slides

過去の法数学勉強会のスライドはこちらから取れます。