系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

46
系統樹・系統仮説の可視化 と系統仮説間の統計的比較 田辺晶史 講義編

Transcript of 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

Page 1: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

系統樹・系統仮説の可視化  と系統仮説間の統計的比較

田辺晶史

講義編

Page 2: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編
Page 3: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU4

OTU5

OTU1

OTU2

OTU3

Page 4: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU4

OTU5

OTU1

OTU2

OTU3

Page 5: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1

OTU2

OTU3

OTU5

OTU4

OTU4

OTU5OTU3

OTU1

OTU2

OTU4

OTU5

OTU1

OTU2

OTU3

Page 6: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1

OTU2

OTU3

OTU5

OTU4

OTU4

OTU5OTU3

OTU1

OTU2

OTU4

OTU5

OTU1

OTU2

OTU3

系統樹は多数の系統仮説の

集合体

Page 7: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1

OTU2

OTU3

OTU5

OTU4

OTU4

OTU5OTU3

OTU1

OTU2

Page 8: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1

OTU2

OTU3

OTU5

OTU4

OTU4

OTU5OTU3

OTU1

OTU2同時に成り立つ

Page 9: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1

OTU2

OTU3

OTU5

OTU4

OTU4

OTU5OTU3

OTU1

OTU2互換

Page 10: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1

OTU2

OTU3

OTU5

OTU4

OTU4

OTU5OTU3

OTU1

OTU2

OTU1

OTU3

OTU2

OTU5

OTU4

OTU2

OTU4OTU5

OTU1

OTU3

互換

Page 11: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1

OTU2

OTU3

OTU5

OTU4

OTU4

OTU5OTU3

OTU1

OTU2

OTU1

OTU3

OTU2

OTU5

OTU4

OTU2

OTU4OTU5

OTU1

OTU3互換

互換

Page 12: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1

OTU2

OTU3

OTU5

OTU4

OTU4

OTU5OTU3

OTU1

OTU2

OTU1

OTU3

OTU2

OTU5

OTU4

OTU2

OTU4OTU5

OTU1

OTU3互換

互換

非互換

Page 13: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1

OTU2

OTU3

OTU5

OTU4

OTU4

OTU5OTU3

OTU1

OTU2

OTU1

OTU3

OTU2

OTU5

OTU4

OTU2

OTU4OTU5

OTU1

OTU3互換

互換

非互換

非互換

Page 14: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1

OTU2

OTU3

OTU5

OTU4

OTU4

OTU5OTU3

OTU1

OTU2

OTU1

OTU3

OTU2

OTU5

OTU4

OTU2

OTU4OTU5

OTU1

OTU3互換

互換

非互換

非互換

互換

Page 15: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1

OTU2

OTU3

OTU5

OTU4

OTU4

OTU5OTU3

OTU1

OTU2

OTU1

OTU3

OTU2

OTU5

OTU4

OTU2

OTU4OTU5

OTU1

OTU3互換

互換

非互換

非互換

互換非互換

Page 16: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

系統仮説を比較する

Page 17: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

非互換な系統仮説を比較する

Page 18: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

RELL

Page 19: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1OTU2OTU3OTU4OTU5OTU6OTU7OTU8OTU9

AATTTTTTT

CCCCCCCCC

CCCTTTTTT

GGCCCAAAA

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCCCCCCC

CCCTTTTTT

GGCCCAAAA

AAAAAAAAA

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCCCCCCC

CCCTTTTTT

GGCCCAAAA

AAAAAAAAA

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCTTTTTT

TAACCCGGG

TTTTTTTTT

AATTTTTTT

CCCCCCCCC

Page 20: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1OTU2OTU3OTU4OTU5OTU6OTU7OTU8OTU9-lnL

AATTTTTTT1

CCCCCCCCC3

CCCTTTTTT2

GGCCCAAAA8

TAACCCGGG4

TTTTTTTTT5

AATTTTTTT1

CCCCCCCCC6

CCCTTTTTT3

GGCCCAAAA3

AAAAAAAAA1

TAACCCGGG2

TTTTTTTTT4

AATTTTTTT5

CCCCCCCCC8

CCCTTTTTT1

GGCCCAAAA9

AAAAAAAAA2

TAACCCGGG2

TTTTTTTTT6

AATTTTTTT3

CCCTTTTTT2

TAACCCGGG1

TTTTTTTTT1

AATTTTTTT3

CCCCCCCCC1

系統樹の尤度計算では、各座位の対数尤度を算出してから、「全座位の対数尤度の和」を系統樹の対数尤度として用いている

Page 21: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1OTU2OTU3OTU4OTU5OTU6OTU7OTU8OTU9-lnL

AATTTTTTT1

CCCCCCCCC3

CCCTTTTTT2

GGCCCAAAA8

TAACCCGGG4

TTTTTTTTT5

AATTTTTTT1

CCCCCCCCC6

CCCTTTTTT3

GGCCCAAAA3

AAAAAAAAA1

TAACCCGGG2

TTTTTTTTT4

AATTTTTTT5

CCCCCCCCC8

CCCTTTTTT1

GGCCCAAAA9

AAAAAAAAA2

TAACCCGGG2

TTTTTTTTT6

AATTTTTTT3

CCCTTTTTT2

TAACCCGGG1

TTTTTTTTT1

AATTTTTTT3

CCCCCCCCC1

82 342 3 31 26 6 1 6 111 21 144 4 2 24 8

Page 22: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1OTU2OTU3OTU4OTU5OTU6OTU7OTU8OTU9-lnL

AATTTTTTT1

CCCCCCCCC3

CCCTTTTTT2

GGCCCAAAA8

TAACCCGGG4

TTTTTTTTT5

AATTTTTTT1

CCCCCCCCC6

CCCTTTTTT3

GGCCCAAAA3

AAAAAAAAA1

TAACCCGGG2

TTTTTTTTT4

AATTTTTTT5

CCCCCCCCC8

CCCTTTTTT1

GGCCCAAAA9

AAAAAAAAA2

TAACCCGGG2

TTTTTTTTT6

AATTTTTTT3

CCCTTTTTT2

TAACCCGGG1

TTTTTTTTT1

AATTTTTTT3

CCCCCCCCC1

82 342 3 31 26 6 1 6 111 21 144 4 2 24 8

各座位の尤度をリサンプル

Page 23: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1OTU2OTU3OTU4OTU5OTU6OTU7OTU8OTU9-lnL

AATTTTTTT1

CCCCCCCCC3

CCCTTTTTT2

GGCCCAAAA8

TAACCCGGG4

TTTTTTTTT5

AATTTTTTT1

CCCCCCCCC6

CCCTTTTTT3

GGCCCAAAA3

AAAAAAAAA1

TAACCCGGG2

TTTTTTTTT4

AATTTTTTT5

CCCCCCCCC8

CCCTTTTTT1

GGCCCAAAA9

AAAAAAAAA2

TAACCCGGG2

TTTTTTTTT6

AATTTTTTT3

CCCTTTTTT2

TAACCCGGG1

TTTTTTTTT1

AATTTTTTT3

CCCCCCCCC1

82 342 3 31 26 6 1 6 111 21 144 4 2 24 8

各座位の尤度をリサンプル

尤度の分散を推定

Page 24: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

OTU1OTU2OTU3OTU4OTU5OTU6OTU7OTU8OTU9-lnL

AATTTTTTT1

CCCCCCCCC3

CCCTTTTTT2

GGCCCAAAA8

TAACCCGGG4

TTTTTTTTT5

AATTTTTTT1

CCCCCCCCC6

CCCTTTTTT3

GGCCCAAAA3

AAAAAAAAA1

TAACCCGGG2

TTTTTTTTT4

AATTTTTTT5

CCCCCCCCC8

CCCTTTTTT1

GGCCCAAAA9

AAAAAAAAA2

TAACCCGGG2

TTTTTTTTT6

AATTTTTTT3

CCCTTTTTT2

TAACCCGGG1

TTTTTTTTT1

AATTTTTTT3

CCCCCCCCC1

82 342 3 31 26 6 1 6 111 21 144 4 2 24 8

データをリサンプルして尤度最大化より

はるかに楽

Page 25: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

RELL法を応用した検定

Page 26: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

RELL法を応用した検定

● Kishino-Hasegawa 検定

Page 27: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

RELL法を応用した検定

● Kishino-Hasegawa 検定● 2 つの樹形の対数尤度比のバラツキを RELL 法により推定し, 0

よりも有意に大きいなら帰無仮説 ( 尤度が等しい ) を棄却する

Page 28: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

RELL法を応用した検定

● Kishino-Hasegawa 検定● 2 つの樹形の対数尤度比のバラツキを RELL 法により推定し, 0

よりも有意に大きいなら帰無仮説 ( 尤度が等しい ) を棄却する● Shimodaira-Hasegawa 検定

Page 29: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

RELL法を応用した検定

● Kishino-Hasegawa 検定● 2 つの樹形の対数尤度比のバラツキを RELL 法により推定し, 0

よりも有意に大きいなら帰無仮説 ( 尤度が等しい ) を棄却する● Shimodaira-Hasegawa 検定

● 3 つ以上の樹形を比較するときに FWER を統制して第 1 種の過誤を抑制する ( そのかわり,第 2 種の過誤が増大 )

Page 30: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

RELL法を応用した検定

● Kishino-Hasegawa 検定● 2 つの樹形の対数尤度比のバラツキを RELL 法により推定し, 0

よりも有意に大きいなら帰無仮説 ( 尤度が等しい ) を棄却する● Shimodaira-Hasegawa 検定

● 3 つ以上の樹形を比較するときに FWER を統制して第 1 種の過誤を抑制する ( そのかわり,第 2 種の過誤が増大 )

● 近似的に不偏な (Approximately Unbiased) 検定

Page 31: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

RELL法を応用した検定

● Kishino-Hasegawa 検定● 2 つの樹形の対数尤度比のバラツキを RELL 法により推定し, 0

よりも有意に大きいなら帰無仮説 ( 尤度が等しい ) を棄却する● Shimodaira-Hasegawa 検定

● 3 つ以上の樹形を比較するときに FWER を統制して第 1 種の過誤を抑制する ( そのかわり,第 2 種の過誤が増大 )

● 近似的に不偏な (Approximately Unbiased) 検定● マルチスケールブートストラップにより第 1 種の過誤と第 2 種の

過誤の両方を抑制する

Page 32: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

いつやるか

Page 33: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

いつやるか

● 最尤系統樹の中で特に重要な系統仮説を検証する

Page 34: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

いつやるか

● 最尤系統樹の中で特に重要な系統仮説を検証する● 既知の対立する系統仮説を比較する

Page 35: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

仮説検定の手順

Page 36: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

仮説検定の手順

● 比較する非互換な系統仮説を 2 つ以上用意する

Page 37: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

比較する非互換な仮説を 2つ以上用意する

Page 38: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

比較する非互換な仮説を 2つ以上用意する

● 最尤系統樹の中で特に重要な系統仮説を検証する場合

Page 39: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

比較する非互換な仮説を 2つ以上用意する

● 最尤系統樹の中で特に重要な系統仮説を検証する場合● 最尤系統樹中の系統仮説と、対立する仮説 1 つ以上をブート

ストラップ解析の結果から抽出する

Page 40: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

比較する非互換な仮説を 2つ以上用意する

● 最尤系統樹の中で特に重要な系統仮説を検証する場合● 最尤系統樹中の系統仮説と、対立する仮説 1 つ以上をブート

ストラップ解析の結果から抽出する● 既知の対立する系統仮説を比較する場合

Page 41: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

比較する非互換な仮説を 2つ以上用意する

● 最尤系統樹の中で特に重要な系統仮説を検証する場合● 最尤系統樹中の系統仮説と、対立する仮説 1 つ以上をブート

ストラップ解析の結果から抽出する● 既知の対立する系統仮説を比較する場合

● 既存の系統仮説を系統樹化したファイルを用意する

Page 42: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

比較する非互換な仮説を 2つ以上用意する

● 最尤系統樹の中で特に重要な系統仮説を検証する場合● 最尤系統樹中の系統仮説と、対立する仮説 1 つ以上をブート

ストラップ解析の結果から抽出する● 既知の対立する系統仮説を比較する場合

● 既存の系統仮説を系統樹化したファイルを用意する– (OTU1,OTU2,OTU3,(OTU4,OTU5));

Page 43: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

仮説検定の手順

● 比較する非互換な系統仮説を 2 つ以上用意する● 各系統仮説を満たす系統樹の中で尤度最大の系統樹を用意

する

Page 44: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

仮説検定の手順

● 比較する非互換な系統仮説を 2 つ以上用意する● 各系統仮説を満たす系統樹の中で尤度最大の系統樹を用意

する● 樹形制約付き最尤系統樹推定

Page 45: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

仮説検定の手順

● 比較する非互換な系統仮説を 2 つ以上用意する● 各系統仮説を満たす系統樹の中で尤度最大の系統樹を用意

する● 樹形制約付き最尤系統樹推定

● 各系統樹の各座位の尤度を計算

Page 46: 系統樹・系統仮説の可視化と系統仮説間の統計的比較 講義編

仮説検定の手順

● 比較する非互換な系統仮説を 2 つ以上用意する● 各系統仮説を満たす系統樹の中で尤度最大の系統樹を用意

する● 樹形制約付き最尤系統樹推定

● 各系統樹の各座位の尤度を計算● 各座位の尤度をリサンプルして検定する