2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング:...

21
2006 年 CASP7 年年年年年年年年年 年年年年年年年年年年年年年年年年年年年年 年年 年年年年年 北北北 北北 、* GSC ○ 北北 北北 北北 北北 北北 北北 *、 北北 北北 北北 北北北 北北 北北 北北 - 北北 北北北 北北 北北 *、 北北 18 北 11 北 15 北 北北北北北北北北北北 北北北 ()

description

2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力. (北里大・薬、 *理研・ GSC ) ○岩舘 満雄*、寺師 玄記、加納 和彦、 高谷 大輔、細井 亜紀男、大田 数広、 竹田 - 志鷹 真由子*、梅山 秀明*. 平成 18 年 11 月 15 日 構造活性シンポジウム(新潟). 遺伝学研究所 GTOP の RPS-BLAST のアライメントをモデリング. NCBI NR に対して RPS-BLAST を行いアライメントの重複を省いてモデリング. - PowerPoint PPT Presentation

Transcript of 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング:...

Page 1: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

2006 年 CASP7 コンテストにおける自動サーバによるタンパク質モデリング:

日本、 米国、欧州の実力

(北里大・薬、 *理研・ GSC)○岩舘 満雄*、寺師 玄記、加納 和彦、高谷 大輔、細井 亜紀男、大田 数広、竹田 -志鷹 真由子*、梅山 秀明*

平成 18 年 11 月 15 日 構造活性シンポジウム(新潟)

Page 2: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

RIKEN FAMSBASE公開しました

                                   

                                            

http://famshelp.gsc.riken.jp/famsbase

遺伝学研究所 GTOPのRPS-BLASTのアライメントをモデリング

NCBI NRに対して RPS-BLASTを行いアライメントの重複を省いてモデリングヒト・ラット・マウスについてより詳細情報とともにモデリング結果を収録

ヒトだけに焦点を絞り高頻度の更新と詳細情報収録を目的としている

                                   

                                            

Page 3: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

Server in CASP

time

QuerySequence

Server Deadline

48 hr

PublishServer Answer (every week)

Human Predictor

CASP Deadlinefor each target

Page 4: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

All 100 Target of CASP7

•88 targets are release on 10 Nov 2006Classification using SVM

•57 CM (Comparative Modeling) targets

•31 FR (Fold Recognition) targets

43 in CASP6, 24 in CASP5

47 in CASP6, 29 in CASP5

CM rate

45.3%47.8%

63.9%

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

casp5 casp6 casp7

CM rate

number of servers

0

10

20

30

40

50

60

70

80

casp5 casp6 casp7

タンパク3000等の構造生物学的プロジェクトの国際的な進展と共にホモロジーモデリング適用可のターゲットが増加してきている

タンパク質自動予測家達が増加してきており、統計情報を取るのに都合が良くなってきている

Page 5: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

Umeyama teams

Page 6: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

Method of Umeyama Server Teams

CIRCLE:Using some important server-answers, modeling by FAMSand estimating structures by threading program

FUNCTIONUsing some homology-searching programs(SPARKS2, BLAST, FASTA) , modeling by FAMSand using a function of e-value, homology% and Secondary Structure

FAMSD:Using some homology-searching programs (SPARKS2, BLAST, FASTA) , modeling by FAMS and another function of e-value, homology% and Seco

ndary Structure and estimating structures by threading program

FAMSUsing multiple-alignment FAMS, ab-initio modeling and estimating struct

ures by threading program

Expand free energy from 3D to 1D using experimental data

Page 7: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

0.8Å 1.9Å

GDT_TS(Global Distance Test Total Score)

GDT_TS=(GDT_P1+ GDT_P2+ GDT_P4+ GDT_P8)/4

WhereGDT_Pn Percent of residues under C distance cutoff <=n.0 Å.

8.1Å

3.5Å

5.7Å 2.2Å

4.2Å

5.3Å

6.5Å

example GDT_P1=(1/9)*100GDT_P2=(2/9)*100GDT_P4=(4/9)*100GDT_P8=(8/9)*100

GDT_TS=41.7

Chain A

Chain B

0.8Å 1.9Å0.8Å3.5Å

2.2Å

1.9Å0.8Å

5.7Å

4.2Å

5.3Å

6.5Å3.5Å

2.2Å

1.9Å0.8Å

Page 8: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

GDT_TS and model quality

100

908070

60

5040 30 20

Page 9: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

χ1 assessment

Correct : | χ1experimental - χ1model | <=40°

•Correctの残基数•CASPの CMサーバー部門でよく用いられる

N

C

O

ここの回転角の精度

Page 10: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

Assessments of CASP7 All 88 targets.

GDT_TS χ1 in 3.5Å C accuracy

1 5291.52 Zhang-Server

2 4976.37 HHpred2

3 4959.04 Pmodeller6

4 4926.6 CIRCLE

5 4917.05 Pcons6

6 4913.53 HHpred3

7 4909.65 ROBETTA

8 4902.41 BayesHH

9 4886.08 FAMSD

10 4879.27 UNI-EID_expm

1 5612 ROBETTA

2 5549 Pmodeller6

3 5432 Pcons6

4 5374 FAMSD

5 5336 FAMS

6 5325 Zhang-Server

7 5223 CIRCLE

8 5085 FUNCTION

9 5012 SAM_T06_server

10 4979 Bilab-ENABLE

Umeyama teams

Page 11: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

Assessments of CASP7 57 CM targets from SVM.

GDT_TS χ1 in 3.5Å C accuracy

1 4125.32 Zhang-Server

2 3949.26 FAMSD

3 3947.64 UNI-EID_expm

4 3944.64 CIRCLE

5 3939.36 HHpred2

6 3937.69 HHpred3

7 3928.55 beautshot

8 3925.04 BayesHH

9 3914.24 FAMS

10 3898.92 SP3

1 5010 ROBETTA

2 4900 Pmodeller6

3 4882 FAMS

4 4879 FAMSD

5 4855 Pcons6

6 4748 CIRCLE

7 4748 Zhang-Server

8 4633 FUNCTION

9 4594 Bilab-ENABLE

10 4571 CaspIta-FOX

Umeyama teams

Page 12: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

Assessments of CASP7 31 FR targets from SVM.

GDT_TS χ1 in 3.5Å C accuracy

1 1166.2 Zhang-Server

2 1129.96 Pmodeller6

3 1056.55 ROBETTA

4 1037.01 HHpred2

5 1033.1 Pcons6

6 1031.74 MetaTasser

7 981.96 CIRCLE

8 977.37 BayesHH

9 975.84 HHpred3

10 973.37 HHpred1

1 649 Pmodeller6

2 602 ROBETTA

3 577 Pcons6

4 577 Zhang-Server

5 559 MetaTasser

6 523 SAM_T06_server

7 503 HHpred2

8 495 FAMSD

9 488 HHpred1

10 475 CIRCLE

Umeyama teams

Page 13: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

Assessments of CASP7 57 CM targets from SVM.

GDT_TS χ1 in 3.5Å C accuracy

1 4125.32 Zhang-Server

2 3949.26 FAMSD

3 3947.64 UNI-EID_expm

4 3944.64 CIRCLE

5 3939.36 HHpred2

6 3937.69 HHpred3

7 3928.55 beautshot

8 3925.04 BayesHH

9 3914.24 FAMS

10 3898.92 SP3

1 5010 ROBETTA

2 4900 Pmodeller6

3 4882 FAMS

4 4879 FAMSD

5 4855 Pcons6

6 4748 CIRCLE

7 4748 Zhang-Server

8 4633 FUNCTION

9 4594 Bilab-ENABLE

10 4571 CaspIta-FOX

日本 米国 欧州

FAMSモデリングプログラムには χ1の確度を高める効果がある

Page 14: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

Assessments of CASP7 31 FR targets from SVM.

GDT_TS χ1 in 3.5Å C accuracy

1 1166.2 Zhang-Server

2 1129.96 Pmodeller6

3 1056.55 ROBETTA

4 1037.01 HHpred2

5 1033.1 Pcons6

6 1031.74 MetaTasser

7 981.96 CIRCLE

8 977.37 BayesHH

9 975.84 HHpred3

10 973.37 HHpred1

1 649 Pmodeller6

2 602 ROBETTA

3 577 Pcons6

4 577 Zhang-Server

5 559 MetaTasser

6 523 SAM_T06_server

7 503 HHpred2

8 495 FAMSD

9 488 HHpred1

10 475 CIRCLE

日本 米国 欧州

Page 15: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

Server in CASP

time

QuerySequence

Server Deadline

48 hr

PublishServer Answer (every week)

Human Predictor

CASP Deadlinefor each target

Automated Procedure

Virtual Servers•サーバーの答えを使うサーバー: meta server•選ぶだけのサーバー: meta selector

Page 16: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

Virtual Servers

• fams_ace :– 3D1D とコンセンサスで選ぶ meta selecter

• CIECLE-FAMS :– 3D1D で選ぶ meta selecter

• fams-multi :– 3D1D で複数のモデルを選び、– 100 %の multi-FAMS を実行する meta serve

r

Page 17: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

Assessments of CASP7 CM targets.

GDT_TS χ1 in 3.5Å C accuracy

1 4125.32 Zhang-Server

2 3949.26 FAMSD

3 3947.64 UNI-EID_expm

4 3944.64 CIRCLE

5 3939.36 HHpred2

6 3937.69 HHpred3

7 3928.55 beautshot

8 3925.04 BayesHH

9 3914.24 FAMS

10 3898.92 SP3

1 5010 ROBETTA

2 4900 Pmodeller6

3 4882 FAMS

4 4879 FAMSD

5 4855 Pcons6

6 4748 CIRCLE

7 4748 Zhang-Server

8 4633 FUNCTION

9 4594 Bilab-ENABLE

10 4571 CaspIta-FOX

4102.61 fams_ace4037.85 CIRCLE_FAMS4023.57 fams_multi

5115 CIRCLE_FAMS

5070 fams_multi

Page 18: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

Assessments of CASP7 FR targets.

GDT_TS χ1 in 3.5Å C accuracy

1 1166.2 Zhang-Server

2 1129.96 Pmodeller6

3 1056.55 ROBETTA

4 1037.01 HHpred2

5 1033.1 Pcons6

6 1031.74 MetaTasser

7 981.96 CIRCLE

8 977.37 BayesHH

9 975.84 HHpred3

10 973.37 HHpred1

1 649 Pmodeller6

2 602 ROBETTA

3 577 Pcons6

4 577 Zhang-Server

5 559 MetaTasser

6 523 SAM_T06_server

7 503 HHpred2

8 495 FAMSD

9 488 HHpred1

10 475 CIRCLE

1093.69 fams_ace1091.55 CIRCLE_FAMS

1023.07 fams_multi

615 CIRCLE_FAMS

568 fams_ace

516 fams_multi

Page 19: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

Assessments of CASP7 All targets.

GDT_TS χ1 in 3.5Å C accuracy

1 5291.52 Zhang-Server

2 4976.37 HHpred2

3 4959.04 Pmodeller6

4 4926.6 CIRCLE

5 4917.05 Pcons6

6 4913.53 HHpred3

7 4909.65 ROBETTA

8 4902.41 BayesHH

9 4886.08 FAMSD

10 4879.27 UNI-EID_expm

1 5612 ROBETTA

2 5549 Pmodeller6

3 5432 Pcons6

4 5374 FAMSD

5 5336 FAMS

6 5325 Zhang-Server

7 5223 CIRCLE

8 5085 FUNCTION

9 5012 SAM_T06_server

10 4979 Bilab-ENABLE

5196.3 fams_ace5129.4 CIRCLE_FAMS5046.64 fams_multi

5730CIRCLE_FAMS5586 fams_multi

5135 fams_ace

Page 20: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

Assessments of CASP7 CM targets.

GDT_TS χ1 in 3.5Å C accuracy

1 4125.32 Zhang-Server

2 3949.26 FAMSD

3 3947.64 UNI-EID_expm

4 3944.64 CIRCLE

5 3939.36 HHpred2

6 3937.69 HHpred3

7 3928.55 beautshot

8 3925.04 BayesHH

9 3914.24 FAMS

10 3898.92 SP3

1 5010 ROBETTA

2 4900 Pmodeller6

3 4882 FAMS

4 4879 FAMSD

5 4855 Pcons6

6 4748 CIRCLE

7 4748 Zhang-Server

8 4633 FUNCTION

9 4594 Bilab-ENABLE

10 4571 CaspIta-FOX

4102.61 fams_ace4037.85 CIRCLE_FAMS4023.57 fams_multi

5115 CIRCLE_FAMS

5070 fams_multi

4131.52 fams_ace_STD3SS_ori

Zhang-Serverはコンセンサスのアルゴリズムをとっていると考えられる

Page 21: 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング: 日本、 米国、欧州の実力

Conclusions• 日米欧の実力は CMでは拮抗、 FRでは少し遅れをとっていると言える

• コンセンサスは主鎖の評価で高得点を取るのに重要

• コンセンサスと物理的関数(特に 3D1D)の組み合わせは強力なツールとなりうる

• 主鎖のみならず側鎖をも評価に含めると、物理的関数が要求される

• 難易度の高いターゲットにおいても物理的関数は要求される。