複数遺伝子の分子系統樹解析 に基づく 真核生物の...

59
複数遺伝子の分子系統樹解析 に基づく 真核生物の初期進化の解明 生命環境科学研究科 橋本 哲男 2004年11月18日 計算科学コロキウム Margulis Schwartz Five Kingdoms

Transcript of 複数遺伝子の分子系統樹解析 に基づく 真核生物の...

Page 1: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

複数遺伝子の分子系統樹解析に基づく真核生物の初期進化の解明

生命環境科学研究科橋本 哲男

2004年11月18日計算科学コロキウム

Margulis & SchwartzFive Kingdoms

Page 2: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

共同研究者

有末 伸子 (総合研究大学院大学・生命体科学

現 大阪大学・微生物病研究所・分子原虫学分野)

Miklós Müller (ロックフェラー大学)長谷川 政美 (総合研究大学院大学・生命体科学/統計数理研究所)

Page 3: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

複数遺伝子の分子系統樹解析に基づく真核生物の初期進化の解明

1.ミトコンドリアをもたない原生生物は祖先型真核生物か?:アーケゾア仮説とリボソームRNAの古典的系統樹

2.リボソームRNAの系統樹によるパラダイムの崩壊

3. 分子系統樹の推測

4.真核生物の系統樹の改訂に向けて

5.真核生物の初期進化:現在の知見と今後の課題

Page 4: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

複数遺伝子の分子系統樹解析に基づく真核生物の初期進化の解明

1.ミトコンドリアをもたない原生生物は祖先型真核生物か?:アーケゾア仮説とリボソームRNAの古典的系統樹

2.リボソームRNAの系統樹によるパラダイムの崩壊

3. 分子系統樹の推測

4.真核生物の系統樹の改訂に向けて

5.真核生物の初期進化:現在の知見と今後の課題

Page 5: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

真核生物の起源に関するSerial EndosymbioticTheory

←ミトコンドリアの共生以前の段階

Page 6: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

アーケゾア仮説 Cavalier-Smith 1983(アーケゾア:ミトコンドリアの共生以前に分岐した祖先型真核生物)

Microsporidia (微胞子虫)

Giardia lamblia→(Diplomonadida)

Glugea plecoglossiアユの微胞子虫(グルゲア)

ディプロモナス

Page 7: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

SSUrRNAによる真核生物の古典的系統樹(~90年代半ば)

Entamoeba histolytica(Entamoebidae)

Giardia lamblia(Diplomonadida)

Trichomonas vaginalis(Parabasala)

Encephalitozoon hellem(Microsporidia)

*ミトコンドリアをもたない真核生物原始的な細胞構造、70S型リボソーム 他

⇒アーケゾア仮説(Cavalier-Smith 1983)

動物

真菌

緑色植物

ロボサ

紅色植物

ストラメノパイル

アルベオラータ

ペロビオンタ

粘菌

エントアメーバ

ヘテロロボサ

ユーグレノゾア

ディプロモナス

パラバサ-ラ

微胞子虫

Page 8: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

ペプチド鎖伸長因子EF-1αによる真核生物の系統樹

(Kamaishi et al. 1996)

エントアメーバ

パラバサーラ

ディプロモナス

微胞子虫

Page 9: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

Giardia lamblia

(細胞の分子生物学 第3板)

Page 10: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

複数遺伝子の分子系統樹解析に基づく真核生物の初期進化の解明

1.ミトコンドリアをもたない原生生物は祖先型真核生物か?:アーケゾア仮説とリボソームRNAの古典的系統樹

2.リボソームRNAの系統樹によるパラダイムの崩壊

3. 分子系統樹の推測

4.真核生物の系統樹の改訂に向けて

5.真核生物の初期進化:現在の知見と今後の課題

Page 11: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

MicrosporidiaはFungiに近縁!(微胞子虫は真菌に近縁)

βチューブリンの系統樹 RNAポリメラーゼの系統樹Edlinde et.al. 1996 Hirt et.al. 1999

←←

Page 12: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

Long Branch Attraction (LBA) アーテファクト

Page 13: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

SSUrRNAによる真核生物全体の系統樹 Leipe et al. 1993

×←微胞子虫

←パラバサーラ

←ディプロモナス

←エントアメーバ

真核生物

Page 14: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

ペプチド鎖伸長因子EF-1αによる真核生物の系統樹

(Kamaishi et al. 1996)

エントアメーバ

パラバサーラ

ディプロモナス

微胞子虫

Page 15: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

ミトコンドリアをもたない真核生物におけるミトコンドリア型シャペロニン(CPN60)遺伝子の存在

Giardia lambliaにおけるCPN60の発現Roger et. al. 1998

** ・ミトコンドリアをもたない生物の配列

は真核生物ミトコンドリアの系統に含まれる・その姉妹群にはαプロテオバクテリアが位置づけられる

ミトコンドリアをもたない真核生物におけるミトコンドリア型HSP70遺伝子の存在

Trichomonas, Microsporidia,Entamoeba, Giardia

Arisue et al. 2002

Page 16: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

ミトコンドリアをもたない真核生物のミトコンドリア型蛋白質が局在するオルガネラ

Hydrogenosomeの代謝 Trichomonasの hydrogenosome

・ TrichomonasCPN60, mitHSP70 [Hydrogenosome]

Bui et al. (1996) PNAS 93:9651-9656

・ EntamoebaCPN60 [Crypton/Mitosome]

Mai et al. (1999) MCB 19:2198-2205Tover et al. (1999) Mol. Microbiol. 32:1013-1021

・Microsporidiamit-HSP70, Williams et al. (2002) Nature 418:865-869

・ GiardiaIron-Sulphur proteins [Mitosome]

Tover et al. (2003) Nature 426:172-176真核生物におけるミトコンドリア関連オルガネラ

Page 17: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

真核生物の初期進化研究をめぐる90年代後半の情勢

・ミトコンドリアをもたない真核生物のいずれのグループにもミトコンドリア関連遺伝子が存在

→ミトコンドリアの二次的喪失の証拠

⇒ミトコンドリアをもたないことは必ずしも原始的真核細胞たることを意味しない

・TubulinとRNAポリメラーゼの系統樹におけるMicrosporidiaのFungiへの近縁性

→リボソームRNAやEF-1αの系統樹はLBAによるアーテファクトだ

・真核生物の大きなグループの関係についての解析結果は、異なる遺伝子間で大きく異なる

:統計的誤差範囲を超えて有意に異なる場合も多い

Page 18: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

複数遺伝子の分子系統樹解析に基づく真核生物の初期進化の解明

1.ミトコンドリアをもたない原生生物は祖先型真核生物か?:アーケゾア仮説とリボソームRNAの古典的系統樹

2.リボソームRNAの系統樹によるパラダイムの崩壊

3. 分子系統樹の推測

4.真核生物の系統樹の改訂に向けて

5.真核生物の初期進化:現在の知見と今後の課題

Page 19: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

最尤法 (Maximum likelihood method)

S1

S2

S3

S4

t1

t2

t3

t4

i jt5

x1 x3

x2x4

生物種が4つの場合を想定

配列データ

X = (Xij) (i=1,…4; j=1,…,n)

h番目の座位: S1,…, S4 : 現存の生物種x1,…, x4 : 現存の生物種のh番目の座位のデータi, j : 共通祖先種のh番目の座位のデータ

t1,…, t5 : 枝の長さ他 θ1 = (t1,…, t5); θ2

Xh=(X1h, X2h, X3h, X4h)

仮定1. Xt は置換確率行列がPij(t)で表される連続時間定常マルコフ過程であり、kから lへの置換確率は

Pkl(t) = P{Xt+s = l | Xs = k}

で、各枝での進化(置換)は独立に起こる

仮定2.それぞれの座位 Xh (h = 1,…,n) は独立に同一の確率法則に従って進化している

Page 20: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

(1) Xhは定常マルコフ過程、各枝での進化は独立 (仮定1)

Chapmann-Kolmogorovの式により、

f (x1, x2, x3, x4|θ ) ←与えられた系統樹のトポロジーと置換確率モデルのもとでh番目の座位のデータが実現する確率

= P{X0 = i}P{Xt1 = x1, Xt2 = x2, Xt5 = j | X0 = i}ΣΣi j

x P{Xt5+t3 = x3, Xt5+t4 = x4 | Xt1 = x1, Xt2 = x2, Xt5 = j, X0 = i}

= {πi Pix1(t1)Pix2(t2) Pij(t5) Pjx3(t3) Pjx4(t4)}Σ Σ i j

πi は iの組成値

S1

S2

S3

S4

t1

t2

t3

t4

i jt5

x1 x3

x2x4

S1,…, S4 : 現存の生物種x1,…, x4 : 現存の生物種のh番目の座位のデータi, j : 共通祖先種のh番目の座位のデータt1,…, t5 : 枝の長さ

Page 21: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

(2) Xhは独立に同一の確率法則に従って進化している (仮定2)

配列データXが与えられたときの対数尤度は

l (θ | X) = log f (Xh | θ )Σh=1

n

θ = ( θ (1), θ (2) )

θ (1) = ( t1, … , t5 ) 枝の長さ

対数尤度を最大にするθの推定値 θは以下の式を満たすパラメータ空間Θの中の1点である

^

l (θ | X) = max {l (θ | X) : θ ∈ Θ }^ lを最大にするようなθを推定

Page 22: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

異なるモデル(系統樹のトポロジー)において l (θ |X) (最大) 対数尤度の値を比較

^

最大の(最大)対数尤度を示すモデル(系統樹のトポロジー)を選択

最尤系統樹 (ML-tree)

・ 系統樹のトポロジー

・置換確率 Pij (t)

モデル

Page 23: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ
Page 24: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

座位間の進化速度の不均質性の考慮: RASモデルによる解析

Covarionモデル

均質モデル (Homogeneous model)RASモデル (Rate-Across-Site model)

n

l = Σlog f (Xh|λhθ(1), θ(2))

h=1

⇒Γ分布を用いて不均質性をモデル化

n

l = Σlog f (Xh|θ(1), θ(2))h=1

Page 25: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

RASモデルの定式化

Page 26: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ
Page 27: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ
Page 28: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

EF-1αの系統樹:Γ分布の導入により座位間の進化速度の不均質性を考慮 (RASモデルの導入)

△(対数尤度H1ー対数尤度H0)=

△(対数尤度H2ー対数尤度H0)=

H0: Glugeaは真核生物の根もとから分岐←帰無仮説

H1: Glugeaは動物とFungiの共通祖先の枝から分岐

H2: GlugeaはFungiに近縁

Page 29: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

真核生物の無根系統樹 (EF-1α、α/βtubulin、actinの結合データ)

(Baldauf らの系統樹)

Science(2000)290:972-977

Page 30: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

緑色植物と紅色植物は近縁Viridiplantae Rhodophyta

結合データによる解析a) 13遺伝子5171アミノ酸座位b) 6遺伝子1938アミノ酸座位

Moreira et al. 2000 Nature 405:69-72

ペプチド鎖伸長因子EF-2による解析

Page 31: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

複数の遺伝子による系統樹の推測(連結した配列データを用いた解析)

遺伝子1

遺伝子2

遺伝子m

系統樹 iの対数尤度の推定値

最尤系統樹の対数尤度の推定値

Concatenate model

それぞれの遺伝子の配列を連結して作成したデータセットに対して1つのパラメータを推定する

Page 32: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

複数の遺伝子による系統樹の推測(対数尤度の連結による解析)

それぞれの遺伝子について別のパラメータを推定する

最尤系統樹の対数尤度の推定値

Separate model

(5グループ)

Page 33: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

Subtree (グループ)内部の系統関係をあらかじめ仮定:たとえばMetazoaについて

EF-1α ((ヒト,カエル),(ハエ,線虫))EF-2 (ヒト,ハエ,線虫)IleRS (ヒト,ハエ,線虫)ValRS (((ヒト,マウス),フグ),ハエ,線虫)RpS14 (ヒト,ザリガニ,ヒドラ,ハエ,線虫)RpS15a (ヒト,ハエ,線虫,ウニ)RpL5 ((((ヒト,ニワトリ),カエル),ホヤ),(ハエ,カイコ,蚊),線虫)RpL8 ((ヒト,カエル),((蚊,ハエ),線虫))RpL10a (ヒト,ハエ,線虫)RPB1 ((ヒト,ハエ,線虫), Monosiga)・ ・・ ・・ ・・ ・・ ・

Page 34: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

複数遺伝子の分子系統樹解析に基づく真核生物の初期進化の解明

1.ミトコンドリアをもたない原生生物は祖先型真核生物か?:アーケゾア仮説とリボソームRNAの古典的系統樹

2.リボソームRNAの系統樹によるパラダイムの崩壊

3. 分子系統樹の推測

4.真核生物の系統樹の改訂に向けて

5.真核生物の初期進化:現在の知見と今後の課題

Page 35: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

配列を明らかにした遺伝子

・Blastocystis hominis∈ Stramenopiles SSUrRNA, EF-2, v-ATPase, cyto-HSP70・Blastocystis sp.∈ Stramenopiles SSUrRNA・Proteromonas lacertae∈ Stramenopiles LSUrRNA, EF-1α, EF-2・Plasmodium falciparum∈ Alveolata EF-2, IleRS, ValRS・Trypanosoma cruzi∈ Euglenozoa IleRS, ValRS・Entamoeba histolytica∈ Entamoebidae IleRS, ValRS, RPB1, cyto-HSP90, mit-HSP70・Mastigamoeba balamuthi∈ Pelobionta LSUrRNA, EF-1α, EF-2・Encephalitozoon hellem∈Microsporidia IleRS, ValRS, mit-HSP70・E. cuniculi∈Microsporidia IleRS, ValRS・Glugea plecoglossi∈Microsporidia IleRS, ValRS, mit-HSP70・Trichomonas vaginalis∈ Parabasala RPS14, RPS15a, RPL2, RPL5, IleRS, cyto-HSP90・Giardia lamblia∈ Diplomonadida RPS14, RPS15a, RPL2, RPL5, RPL10a, IleRS, RPB1,

cyto-HSP90, mit-HSP70

Page 36: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

解析対象分子 系統樹c Δ l i

d AIC Δ l id AIC Δ l i

d AIC Δ l id AIC

蛋白質(8種) A (-44783.5) 89635.0 (43860.1) 88264.2 (-43312.2) 86694.4 (-42518.9) 85597.8

B -309.3 ± 45.5 90253.6 -337.2 ± 47.6 88938.6 -205.0 ± 31.0 87104.4 -239.6 ± 34.3 86077.0

rRNA(2種) A -101.1 ± 23.5 55087.5 -99.3 ± 23.7 54866.8 -29.1 ± 10.7 51640.2 -11.0 ± 9.9 51345.2

B (-27391.7) 54885.4 (-27232.1) 54668.2 (-25739.0) 51582.0 (-25557.6) 51323.2

without Γa with Γb

連結データ 総合評価 連結データ 総合評価

SSU + LSUrRNA 2512座位22生物種最尤系統樹(Concatenate model)

8蛋白質3879座位9生物種最尤系統樹(Concatenate model)

Microsporidia (微胞子虫)の位置複数遺伝子の解析とモデル評価

Homogeneous vs RAS連結データ(Concatenate) vs総合評価(Separate)

Homogeneous RAS

AIC=-2対数尤度+2パラメータ数

Page 37: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

複数遺伝子の解析:8蛋白質+2rRNA総合評価(Separate Analysis)候補系統樹の選択と相互比較

系統樹のトポロジーb Δ l ie AUf KHg SHh Δ l i

e AUf KHg SHh

1 (Alv,E,(P,(S,(A,(M,F))))) (-92159.9) - - - (-87559.0) - - -

2 (Alv,P,(E,(S,(A,(M,F))))) 27.8 0.249 0.148 0.821 15.1 0.354 0.214 0.859

3 (Alv,E,(S,(P,(A,(M,F))))) 29.0 0.216 0.107 0.801 31.4 0.038 0.022 0.648

4 (Alv,P,((E,S),(A,(M,F)))) 30.0 0.343 0.192 0.799 41.5 0.058 0.042 0.509

5 (Alv,(P,E),(S,((M,F),A))) 30.7 0.223 0.115 0.804 19.5 0.292 0.138 0.821

6 (Alv,E,((P,S),(A,(M,F)))) 35.6 0.112 0.062 0.739 23.2 0.145 0.085 0.760

7 (Alv,S,((E,P),(A,(M,F)))) 42.4 0.197 0.109 0.688 38.0 0.089 0.061 0.556

8 (Alv,(S,(P,E)),(A,(M,F))) 48.2 0.172 0.087 0.603 36.0 0.121 0.079 0.576

9 (Alv,(P,(E,S)),(A,(M,F))) 61.8 0.072 0.042 0.464 66.0 0.005 0.004 0.236

10 (Alv,P,(S,(E,(A,(M,F))))) 68.1 0.010 0.019 0.414 44.5 0.015 0.034 0.470

11 (Alv,(E,S),(P,((M,F),A))) 72.2 0.000 0.017 0.368 74.4 0.003 0.001 0.172

12 (Alv,(E,(P,S)),(A,(M,F))) 91.0 0.004 0.004 0.233 65.0 0.006 0.006 0.249

13 (Alv,S,(P,(E,(A,(M,F))))) 95.0 0.016 0.003 0.196 70.4 0.001 0.002 0.198

14 (Alv,S,(E,(P,(A,(M,F))))) 97.6 0.000 0.002 0.186 77.3 0.001 0.000 0.152

15 (Alv,(P,E),(S,(M,(F,A)))) 107.8 0.004 0.001 0.141 76.2 0.001 0.002 0.163

16 (Alv,P,((E,S),(M,(A,F)))) 112.6 0.003 0.005 0.122 101.4 0.008 0.001 0.056

17 (Alv,P,((E,S),(F,(A,M)))) 113.3 0.003 0.004 0.127 104.9 0.007 0.000 0.049

18 (Alv,(S,(P,E)),(M,(F,A))) 120.2 0.008 0.003 0.099 92.4 0.001 0.002 0.089

19 (Alv,S,((E,P),(M,(A,F)))) 122.9 0.001 0.002 0.083 97.2 0.016 0.001 0.065

20 (Alv,S,((E,P),(F,(A,M)))) 127.3 0.003 0.001 0.074 102.1 0.000 0.000 0.054

21 (Alv,(P,(E,S)),(M,(F,A))) 130.1 0.003 0.002 0.074 120.5 0.001 0.000 0.022

22 (Alv,M,(P,(E,(S,(A,F))))) 203.8 0.000 0.000 0.002 193.4 0.000 0.000 0.000

23 (Alv,(P,E),(A,((M,F),S))) 229.7 0.007 0.000 0.001 203.3 0.000 0.000 0.000

24 (Alv,(P,(E,M)),(S,(F,A))) 248.1 0.005 0.000 0.000 219.7 0.000 0.000 0.000

25 (Alv,E,((M,F),(A,(P,S)))) 262.4 0.000 0.000 0.000 233.6 0.001 0.000 0.000

26 (Alv,(P,(F,A)),(E,(M,S))) 271.3 0.000 0.000 0.000 254.8 0.003 0.000 0.000

27 (Alv,E,(A,((P,S),(M,F)))) 289.3 0.000 0.000 0.000 249.7 0.001 0.000 0.000

28 (Alv,M,(P,(S,(A,(E,F))))) 437.2 0.004 0.000 0.000 368.4 0.000 0.000 0.000

29 (Alv,(M,S),(F,(P,(E,A)))) 527.6 0.000 0.000 0.000 446.7 0.000 0.000 0.000

without Γc with Γd

↑ △<3

SE

Homogeneous RAS

EF-1α Best treeEF-2ActinValRSSSUrRNARPB1IleRSLSUrRNA

TubulinαβBest tree

最尤系統樹 10遺伝子6391座位

Page 38: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

複数遺伝子の解析:8蛋白質+2rRNA総合評価(Separate Analysis)候補系統樹の選択と相互比較

系統樹のトポロジーb Δ l ie AUf KHg SHh Δ l i

e AUf KHg SHh

1 (Alv,E,(P,(S,(A,(M,F))))) (-92159.9) - - - (-87559.0) - - -

2 (Alv,P,(E,(S,(A,(M,F))))) 27.8 0.249 0.148 0.821 15.1 0.354 0.214 0.859

3 (Alv,E,(S,(P,(A,(M,F))))) 29.0 0.216 0.107 0.801 31.4 0.038 0.022 0.648

4 (Alv,P,((E,S),(A,(M,F)))) 30.0 0.343 0.192 0.799 41.5 0.058 0.042 0.509

5 (Alv,(P,E),(S,((M,F),A))) 30.7 0.223 0.115 0.804 19.5 0.292 0.138 0.821

6 (Alv,E,((P,S),(A,(M,F)))) 35.6 0.112 0.062 0.739 23.2 0.145 0.085 0.760

7 (Alv,S,((E,P),(A,(M,F)))) 42.4 0.197 0.109 0.688 38.0 0.089 0.061 0.556

8 (Alv,(S,(P,E)),(A,(M,F))) 48.2 0.172 0.087 0.603 36.0 0.121 0.079 0.576

9 (Alv,(P,(E,S)),(A,(M,F))) 61.8 0.072 0.042 0.464 66.0 0.005 0.004 0.236

10 (Alv,P,(S,(E,(A,(M,F))))) 68.1 0.010 0.019 0.414 44.5 0.015 0.034 0.470

11 (Alv,(E,S),(P,((M,F),A))) 72.2 0.000 0.017 0.368 74.4 0.003 0.001 0.172

12 (Alv,(E,(P,S)),(A,(M,F))) 91.0 0.004 0.004 0.233 65.0 0.006 0.006 0.249

13 (Alv,S,(P,(E,(A,(M,F))))) 95.0 0.016 0.003 0.196 70.4 0.001 0.002 0.198

14 (Alv,S,(E,(P,(A,(M,F))))) 97.6 0.000 0.002 0.186 77.3 0.001 0.000 0.152

15 (Alv,(P,E),(S,(M,(F,A)))) 107.8 0.004 0.001 0.141 76.2 0.001 0.002 0.163

16 (Alv,P,((E,S),(M,(A,F)))) 112.6 0.003 0.005 0.122 101.4 0.008 0.001 0.056

17 (Alv,P,((E,S),(F,(A,M)))) 113.3 0.003 0.004 0.127 104.9 0.007 0.000 0.049

18 (Alv,(S,(P,E)),(M,(F,A))) 120.2 0.008 0.003 0.099 92.4 0.001 0.002 0.089

19 (Alv,S,((E,P),(M,(A,F)))) 122.9 0.001 0.002 0.083 97.2 0.016 0.001 0.065

20 (Alv,S,((E,P),(F,(A,M)))) 127.3 0.003 0.001 0.074 102.1 0.000 0.000 0.054

21 (Alv,(P,(E,S)),(M,(F,A))) 130.1 0.003 0.002 0.074 120.5 0.001 0.000 0.022

22 (Alv,M,(P,(E,(S,(A,F))))) 203.8 0.000 0.000 0.002 193.4 0.000 0.000 0.000

23 (Alv,(P,E),(A,((M,F),S))) 229.7 0.007 0.000 0.001 203.3 0.000 0.000 0.000

24 (Alv,(P,(E,M)),(S,(F,A))) 248.1 0.005 0.000 0.000 219.7 0.000 0.000 0.000

25 (Alv,E,((M,F),(A,(P,S)))) 262.4 0.000 0.000 0.000 233.6 0.001 0.000 0.000

26 (Alv,(P,(F,A)),(E,(M,S))) 271.3 0.000 0.000 0.000 254.8 0.003 0.000 0.000

27 (Alv,E,(A,((P,S),(M,F)))) 289.3 0.000 0.000 0.000 249.7 0.001 0.000 0.000

28 (Alv,M,(P,(S,(A,(E,F))))) 437.2 0.004 0.000 0.000 368.4 0.000 0.000 0.000

29 (Alv,(M,S),(F,(P,(E,A)))) 527.6 0.000 0.000 0.000 446.7 0.000 0.000 0.000

without Γc with Γd

↑ △<

3SE

Homogeneous RAS

EF-1α Best treeEF-2ActinValRSSSUrRNARPB1IleRSLSUrRNA

TubulinαβBest tree←

←◎

Page 39: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

分子 系統樹No.c Δ l id

系統樹No.c Δ l id

EF1α 22 -43.6 ± 15.0 22 -12.7 ± 8.1EF2 23 -17.7 ± 12.0 23 -11.1 ± 9.5VRS 25 -7.5 ± 13.6 25 -7.5 ± 9.7IRS 28 -43.4 ± 22.9 28 -23.3 ± 16.0RPOII 27 -9.7 ± 13.1 6 -2.9 ± 3.7ACT 24 -18.3 ± 13.7 24 -9.9 ± 10.7TBα 2 -7.5 ± 7.1 2 -7.9 ± 6.7TBβ 2 -13.0 ± 8.8 2 -10.6 ± 7.7SSUrRNA 26 -68.0 ± 17.9 26 -13.2 ± 8.7LSUrRNA 29 -37.0 ± 23.5 29 -11.2 ± 13.8

without Γa with Γb

各遺伝子の解析における、各遺伝子の最尤系統樹と総合評価による最尤系統樹との対数尤度差

Homogeneous RAS

← ←

Page 40: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

真核生物の大グループ相互の系統関係(最尤法に基づく総合評価:rRNAを含む) Arisue et al. 2002

8遺伝子5474座位10遺伝子6391座位

13遺伝子5266座位

Page 41: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

複数遺伝子の配列情報に基づく真核生物のコンセンサス系統樹 2002

Moreira et al. 2000Baldauf et al. 2000Bapteste et al. 2002Arisue et al. 2002

7グループ間の系統的位置関係と系統樹の

根もとは不明 ⇒

Page 42: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

真核生物7つの大きな単系統群の解析と系統樹のRooting

Outgroup:原核生物(Archaea, Bacteria)もしくは paralogous遺伝子

Page 43: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

全座位(all)を用いた均質モデルによる解析での the best tree

Parabasala と Diplomonadidaの根もと近くへの位置づけに対する強い支持→ LBA の効果である可能性!(とくにrRNAを入れた場合)

Page 44: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

座位間の進化速度の均質性の仮定の下での解析 (Homogeneous model)各遺伝子について:・Subtree内部の系統関係に対する制約ーあらかじめ関係を固定 (Op, Am, Pl, AS, EH, P, D,or Out)

←予備的解析の結果 / 確立された系統的知見

・Original data set (all) について全10395通りをexhaustive search → the best tree

・The best tree の下で、RASモデルを用いて座位ごとの rate カテゴリー (r1 から r8) を推定

・進化速度の速い座位および/もしくは遅い座位を除外したデータセットを作成 : (-r8, -r18, -r78, -r178)

→ これら4つのデータセットについて: 全10395通りを exhaustive search

結合データ解析:・ max { Σ log-likelihood } → the best tree : 各データセットについて

10395 trees 24 遺伝子

・# { { (all) | Best + Δ≦ 4SE} U { (-r78) | Best + Δ≦ 4SE} } = 577

座位間の進化速度の不均質性を考慮した解析(Rate-Across-Site model)・各遺伝子について577通りをexhaustive search →結合データ解析: 22 蛋白コーディング遺伝子 (All-P)

および 22 蛋白コーディング + 2 rRNA コーディング遺伝子 (All-P+R)

・RELL BP 解析 ・プログラム: ・置換確率モデル: MOLPHY and PAML HKY85 or JTT-F

Page 45: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

進化速度の大きい座位を除外した解析での最尤系統樹(22 protein genes)

r1r2r3r4r5r6r7r8

( )BP値[ ]平均種数

Evolutionary rate category for each site

slow

fast

・-r78 data set(excludingr7 and r8)6047 sites

・JTT-F + Γmodel

Page 46: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

-r78データセットに対するRASモデルの解析での the best tree (577通り中)

(22蛋白質コーディング遺伝子)Tree A の各内部枝に対するBP値の変動

(データセット別モデル別)

・RAS モデルの使用および/もしくは進化速度の大きい座位の削除⇒ D/Pの根もと近くでの分岐に対するBP支持の減少、D/Pの近縁性に対するBP支持の増大

・進化速度の小さい座位の削除⇒ BP値への影響なし

Page 47: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

系統樹の候補の絞り込みのための更なる解析

Page 48: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

異なる系統樹(対立仮説)間の比較: 60 系統樹+3系統樹(p>0.05,

All-Pデータセット)

A B C D E F G H I J K sitesTree topology 6047 5534 513 4501 1476 1773 646 2874 754 1934 7981

- Tu

BL

All

Cy

rR All

BL

Tr

RP

ChTub b to OG <0.5

-P toskel

NAs

-P+R

to OG < 0.1

ansl

B1

ap

Op|(Am,(Pl,(AS,(EH,DP))))Op|(Am,(EH,(AS,(Pl,DP))))Op|(Am,(EH,((AS,Pl),DP)))Op|(Am,((AS,EH),(Pl,DP)))Op|(Am,(DP,(Pl,(AS,EH))))Op|(Am,(DP,(EH,(AS,Pl))))Op|(AS,((Am,Pl),(EH,DP)))Op|(Pl,(Am,((AS,EH),DP)))Op|(EH,((AS,Pl),(Am,DP)))Op|((Am,Pl),(AS,(EH,DP)))Op|((Am,Pl),((AS,EH),DP))Op|((AS,Pl),((Am,EH),DP))Op|((AS,EH),(Am,(Pl,DP)))Op|((AS,EH),(Pl,(Am,DP)))Op|(DP,(Am,((AS,Pl),EH)))Op|(DP,(Am,((AS,EH),Pl)))Op|(DP,(Pl,(Am,(AS,EH))))Op|(DP,((Am,Pl),(AS,EH)))Op|((Am,DP),(Pl,(AS,EH))) best best bestOp|((Am,DP),(EH,(AS,Pl)))Pl|((AS,EH),(Am,(Op,DP)))Pl|((Am,(AS,EH)),(Op,DP))EH|(Am,(DP,(Op,(AS,Pl))))EH|(AS,(Am,(Pl,(Op,DP))))EH|(AS,(Pl,(Am,(Op,DP))))EH|(AS,(Pl,(Op,(Am,DP))))EH|(AS,(Op,(Pl,(Am,DP)))) bestEH|(AS,((Am,Pl),(Op,DP)))EH|(Op,(Am,(AS,(Pl,DP))))EH|(Op,(Am,((AS,Pl),DP)))EH|(Op,(DP,(Am,(AS,Pl))))EH|((Am,Op),(Pl,(AS,DP)))EH|((Am,Op),((AS,Pl),DP))EH|((AS,Pl),(Am,(Op,DP)))EH|((AS,Pl),(Op,(Am,DP)))EH|(DP,(AS,(Pl,(Am,Op))))EH|(DP,((Am,Op),(AS,Pl)))(Am,Pl)|((EH,AS),(Op,DP))(AS,EH)|(Op,(Am,(Pl,DP)))(AS,EH)|(Op,(DP,(Pl,Am)))(AS,EH)|(Pl,(Am,(Op,DP)))(AS,EH)|((Op,Pl),(Am,DP))DP|(Op,(Pl,(Am,(AS,EH)))) best

Tree A DP|(Op,(Am,(Pl,(AS,EH)))) best bestDP|(Op,(Am,(EH,(Pl,AS))))DP|(Op,((Pl,Am),(AS,EH)))DP|(Pl,((Op,Am),(AS,EH)))DP|(EH,(Op,(Am,(Pl,AS))))

Tree B DP|(EH,(AS,(Pl,(Op,Am))))DP|(EH,((Op,Am),(Pl,AS)))DP|(Am,(Op,(Pl,(AS,EH))))

Tree C DP|((Op,Am),(Pl,(AS,EH))) bestDP|((AS,EH),(Pl,(Op,Am)))(Op,(AS,EH))|(Pl,(Am,DP))(Op,DP)|(Am,(Pl,(AS,EH))) best(Op,DP)|(Pl,(Am,(AS,EH)))(Pl,(AS,EH))|(Op,(DP,Am))(Pl,(AS,EH))|(Am,(Op,DP))(Pl,DP)|((Op,Am),(AS,EH))(EH,DP)|((Op,Am),(AS,Pl))

Tree D Op|(Am,((AS,Pl),(EH,DP)))DP|(EH,(Am,(Op,(Pl,AS)))) best(Op,DP)|(Am,((Pl,AS),EH)) best

・Tubulin と rRNA において、22蛋白質遺伝子全体の傾向からのズレが大きい

・Tubulin の系統樹は、Op/DPの近縁性を強力に支持

・Tubulin を除いた20蛋白質の解析ではOpが根もととなる系統樹がbest

best

0.2≦p

0.1≦p<0.2

0.05≦p<0.1

0.01≦p<0.05

p<0.01

Page 49: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

DHFR-TS 融合遺伝子の分布と細胞の基本形態に基づく真核生物の系統樹

(Stechman and Cavalier-Smith 2002 Science 297:89-91)

・真核生物系統樹の根もとはOpisthokontaのところ

・広義のExcavata*は単系統*Cavalier-Smith 2002

(SSUrRNAの根もとのない系統樹からの推測)

・Amoebozoaの位置は不明

Page 50: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

A B C D E F G H I J K sitesTr 6047 5534 513 4501 1476 1773 646 2874 754 1934 7981

Op|(Am,(Pl,(AS,(EH,DP))))Op|(Am,(DP,(Pl,(AS,EH))))Op|(Am,(DP,(EH,(AS,Pl))))Op|(DP,(Am,((AS,Pl),EH)))Op|(DP,(Am,((AS,EH),Pl)))Op|((Am,DP),(Pl,(AS,EH))) best best bestOp|((Am,DP),(EH,(AS,Pl)))

Tree A DP|(Op,(Am,(Pl,(AS,EH)))) best bestDP|(Op,(Am,(EH,(Pl,AS))))DP|(Am,(Op,(Pl,(AS,EH))))

Tree C DP|((Op,Am),(Pl,(AS,EH))) best(Op,DP)|(Am,(Pl,(AS,EH))) best(Pl,(AS,EH))|(Op,(DP,Am))(Pl,(AS,EH))|(Am,(Op,DP))

Tree D Op|(Am,((AS,Pl),(EH,DP)))

- Tub

Tub

BL to OG <0.5

All-P

Cytoskel

rRNAs

All-P+R

BL to OG < 0.1

Transl

RPB1

Chap

A B C D E F G H I J K sitesTree topology 6047 5534 513 4501 1476 1773 646 2874 754 1934 7981

- Tub

Tub

BL to OG <0.5

All-P

Cytoskel

rRNAs

All-P+R

BL to OG < 0.1

Transl

RPB1

Chap

BL to

OG <

0.5

BL to

OG <

0.1

All P

rote

in-T

ubuli

n

Tubu

lin

Tran

slatio

n

Chap

eron

Cyto

skelt

on

All P

rote

in+rR

NAs

best

0.2≦p

0.1≦p<0.2

0.05≦p<0.1

0.01≦p<0.05

p<0.01

DHFR-TS融合遺伝子の分布の知見を踏まえ更なる系統樹の絞り込み

→系統樹の根もとはOpisthokontaもしくはDiplomonadida-Parabasalaの共通祖先のところ

Page 51: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

複数遺伝子の分子系統樹解析に基づく真核生物の初期進化の解明

1.ミトコンドリアをもたない原生生物は祖先型真核生物か?:アーケゾア仮説とリボソームRNAの古典的系統樹

2.リボソームRNAの系統樹によるパラダイムの崩壊

3. 分子系統樹の推測

4.真核生物の系統樹の改訂に向けて

5.真核生物の初期進化:現在の知見と今後の課題

Page 52: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

まとめ

蛋白質コーディング遺伝子の結合データ解析において、・進化速度の大きい座位の除去・RASモデルの適用⇒ Diplomonadidaと

Parabasalaの近縁性に対する支持増大、これら共通祖先の分岐が早いことに対する支持減少

・対立系統樹間の統計的検定・DHFR-TS融合遺伝子の分布⇒ DPもしくはOpのところに根もとがある可能性を示唆

OpAm

PlAS

EHDP

Page 53: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

今後の課題:1. 本研究で用いた遺伝子および他の遺伝子のデータを、十分な種のサンプリングのもとで蓄積とくに、Diplomonadida、Parabasala、Amoebozoa、Euglenozoa、Heterolobosea内部の種のサンプリングの充実、ESTによるリボソーム蛋白質遺伝子の網羅的解析さらに、Excavate taxa、Cryptophytes、Haptophytes、Cercozoa、Heliozoa などの位置づけの検討

2. データ解析システムの改良、拡張とくに、exhaustive search を行えるOTU数の上限の拡張(9,10,11ぐらいまで)、解析プログラムの並列化

3. より現実的で洗練されたモデルの適用、開発とくに、コバリオンモデルのデータ解析への実装

Page 54: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

計算時間の評価: 概評

Sequential Addition Algorithm による最尤系統樹(Best tree)の探索

例) PHYLIP Ver3.6a の PROML program種数N、配列長Mのデータデットにおいて種数がK倍、配列長がL倍になると計算時間はK3×Lに比例

1G flops のPC一台を専用に走らせて標準的なデータセット N=50、M=500 についてアミノ酸置換のJTT-Fモデルでrateカテゴリー数8の離散化Γ分布を導入してRASモデルとしLocal Rearrengement Option をつけてデータエントリーの順番を3回ランダマイズして最尤系統樹を探索するという解析をして、さらに、ブートストラップサンプルで100回解析を繰り返すと、50日必要

→ PC約2000台分の規模で並列化して計算すれば、0.6時間で終了ブートストラップだけ並列化して100台分で計算すれば、半日で終了

Page 55: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

Sequential Addition Algorithm による最尤系統樹(Best tree)の探索

さらに、N=100、M=3000ぐらいのConcatenate Data Setの解析を同様に行なおうとする場合、

計算時間は、2×2×2×6=48倍なのでPC1台では2400日必要、事実上不可能

→ PC約2000台分の規模で並列化して計算すれば、1.2日で終了ブートストラップだけ並列化して100台分で計算すれば、24日で終了なので、実行可能

Page 56: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

Exhaustive Search による最尤系統樹(Best tree)の探索

例) PAML Ver3.1 の CODEML program

1G flops のPC一台を専用に走らせてN=35、M=500の標準的データセットを用いてアミノ酸置換のJTT-Fモデルでrateカテゴリー数8の離散化Γ分布を導入してRASモデルとし各5種からなる7つの系統(グループ)945通りのExhaustive Searchを行うと約50時間必要同一規模のデータセットからなる遺伝子20個についてSeparate Model にて結合データ解析を試み50×20=1000時間=42日 必要

総合評価で近似的なブートストラップ解析を10000回行うとするとさらに5日で合計47日 必要

→ PC945台分の規模でExhaustive Searchを並列化すれば、1.06時間で終了ブートストラップも並列化して2000台分で計算すれば、3.6分で終了

Page 57: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

Exhaustive Search による最尤系統樹(Best tree)の探索

さらに3系統(グループ)について各5種ずつを追加しそれぞれのグループ内部の関係を固定し10グループ2027025通りのExhaustive Searchを行おうとすると推定すべき枝の長さは、97本(50種)/67本(35種)=1.44倍Searchすべき系統樹数は、2027025/945=2145倍同一規模のデータセットからなる遺伝子20個についてSeparate Model にて結合データ解析を試みよう(遺伝子数、すなわち座位数は変わらない)とすると42日×1.44×2145=129729日 必要

総合評価で近似的なブートストラップ解析を10000回行うとするとさらに5日×2145=10725日 必要、 で合計 140454日 必要

→ PC約2000台分の規模でExhaustive Search、ブートストラップともに並列化すれば、70日で終了

Page 58: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

真核生物の初期進化まとめ 2004

(図3)

(有中心粒類)

Page 59: 複数遺伝子の分子系統樹解析 に基づく 真核生物の …...MicrosporidiaのFungiへの近縁性 →リボソームRNAやEF-1αの系統樹はLBAによる アーテファクトだ

リザリアクロララクニオン藻↑↓

Aulacantha ∈放散虫

Globigerina ∈有孔虫タマウキガイ

Chroomonasクリプト植物Cryptomonas

Chrysochromulina

Emiliania huxleyi

ハプト植物

太陽虫(有中心粒類)

Trepomonas HexamitaRaphydiophryspallida (ディプロモナス)

エクスカベート類Carpediemonas