2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング:...
description
Transcript of 2006 年 CASP7 コンテストにおける 自動サーバによるタンパク質モデリング:...
2006 年 CASP7 コンテストにおける自動サーバによるタンパク質モデリング:
日本、 米国、欧州の実力
(北里大・薬、 *理研・ GSC)○岩舘 満雄*、寺師 玄記、加納 和彦、高谷 大輔、細井 亜紀男、大田 数広、竹田 -志鷹 真由子*、梅山 秀明*
平成 18 年 11 月 15 日 構造活性シンポジウム(新潟)
RIKEN FAMSBASE公開しました
http://famshelp.gsc.riken.jp/famsbase
遺伝学研究所 GTOPのRPS-BLASTのアライメントをモデリング
NCBI NRに対して RPS-BLASTを行いアライメントの重複を省いてモデリングヒト・ラット・マウスについてより詳細情報とともにモデリング結果を収録
ヒトだけに焦点を絞り高頻度の更新と詳細情報収録を目的としている
Server in CASP
time
QuerySequence
Server Deadline
48 hr
PublishServer Answer (every week)
Human Predictor
CASP Deadlinefor each target
All 100 Target of CASP7
•88 targets are release on 10 Nov 2006Classification using SVM
•57 CM (Comparative Modeling) targets
•31 FR (Fold Recognition) targets
43 in CASP6, 24 in CASP5
47 in CASP6, 29 in CASP5
CM rate
45.3%47.8%
63.9%
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
casp5 casp6 casp7
CM rate
number of servers
0
10
20
30
40
50
60
70
80
casp5 casp6 casp7
タンパク3000等の構造生物学的プロジェクトの国際的な進展と共にホモロジーモデリング適用可のターゲットが増加してきている
タンパク質自動予測家達が増加してきており、統計情報を取るのに都合が良くなってきている
Umeyama teams
Method of Umeyama Server Teams
CIRCLE:Using some important server-answers, modeling by FAMSand estimating structures by threading program
FUNCTIONUsing some homology-searching programs(SPARKS2, BLAST, FASTA) , modeling by FAMSand using a function of e-value, homology% and Secondary Structure
FAMSD:Using some homology-searching programs (SPARKS2, BLAST, FASTA) , modeling by FAMS and another function of e-value, homology% and Seco
ndary Structure and estimating structures by threading program
FAMSUsing multiple-alignment FAMS, ab-initio modeling and estimating struct
ures by threading program
Expand free energy from 3D to 1D using experimental data
0.8Å 1.9Å
GDT_TS(Global Distance Test Total Score)
GDT_TS=(GDT_P1+ GDT_P2+ GDT_P4+ GDT_P8)/4
WhereGDT_Pn Percent of residues under C distance cutoff <=n.0 Å.
8.1Å
3.5Å
5.7Å 2.2Å
4.2Å
5.3Å
6.5Å
example GDT_P1=(1/9)*100GDT_P2=(2/9)*100GDT_P4=(4/9)*100GDT_P8=(8/9)*100
GDT_TS=41.7
Chain A
Chain B
0.8Å 1.9Å0.8Å3.5Å
2.2Å
1.9Å0.8Å
5.7Å
4.2Å
5.3Å
6.5Å3.5Å
2.2Å
1.9Å0.8Å
GDT_TS and model quality
100
908070
60
5040 30 20
χ1 assessment
Correct : | χ1experimental - χ1model | <=40°
•Correctの残基数•CASPの CMサーバー部門でよく用いられる
Cα
N
C
O
Cβ
ここの回転角の精度
Assessments of CASP7 All 88 targets.
GDT_TS χ1 in 3.5Å C accuracy
1 5291.52 Zhang-Server
2 4976.37 HHpred2
3 4959.04 Pmodeller6
4 4926.6 CIRCLE
5 4917.05 Pcons6
6 4913.53 HHpred3
7 4909.65 ROBETTA
8 4902.41 BayesHH
9 4886.08 FAMSD
10 4879.27 UNI-EID_expm
1 5612 ROBETTA
2 5549 Pmodeller6
3 5432 Pcons6
4 5374 FAMSD
5 5336 FAMS
6 5325 Zhang-Server
7 5223 CIRCLE
8 5085 FUNCTION
9 5012 SAM_T06_server
10 4979 Bilab-ENABLE
Umeyama teams
Assessments of CASP7 57 CM targets from SVM.
GDT_TS χ1 in 3.5Å C accuracy
1 4125.32 Zhang-Server
2 3949.26 FAMSD
3 3947.64 UNI-EID_expm
4 3944.64 CIRCLE
5 3939.36 HHpred2
6 3937.69 HHpred3
7 3928.55 beautshot
8 3925.04 BayesHH
9 3914.24 FAMS
10 3898.92 SP3
1 5010 ROBETTA
2 4900 Pmodeller6
3 4882 FAMS
4 4879 FAMSD
5 4855 Pcons6
6 4748 CIRCLE
7 4748 Zhang-Server
8 4633 FUNCTION
9 4594 Bilab-ENABLE
10 4571 CaspIta-FOX
Umeyama teams
Assessments of CASP7 31 FR targets from SVM.
GDT_TS χ1 in 3.5Å C accuracy
1 1166.2 Zhang-Server
2 1129.96 Pmodeller6
3 1056.55 ROBETTA
4 1037.01 HHpred2
5 1033.1 Pcons6
6 1031.74 MetaTasser
7 981.96 CIRCLE
8 977.37 BayesHH
9 975.84 HHpred3
10 973.37 HHpred1
1 649 Pmodeller6
2 602 ROBETTA
3 577 Pcons6
4 577 Zhang-Server
5 559 MetaTasser
6 523 SAM_T06_server
7 503 HHpred2
8 495 FAMSD
9 488 HHpred1
10 475 CIRCLE
Umeyama teams
Assessments of CASP7 57 CM targets from SVM.
GDT_TS χ1 in 3.5Å C accuracy
1 4125.32 Zhang-Server
2 3949.26 FAMSD
3 3947.64 UNI-EID_expm
4 3944.64 CIRCLE
5 3939.36 HHpred2
6 3937.69 HHpred3
7 3928.55 beautshot
8 3925.04 BayesHH
9 3914.24 FAMS
10 3898.92 SP3
1 5010 ROBETTA
2 4900 Pmodeller6
3 4882 FAMS
4 4879 FAMSD
5 4855 Pcons6
6 4748 CIRCLE
7 4748 Zhang-Server
8 4633 FUNCTION
9 4594 Bilab-ENABLE
10 4571 CaspIta-FOX
日本 米国 欧州
FAMSモデリングプログラムには χ1の確度を高める効果がある
Assessments of CASP7 31 FR targets from SVM.
GDT_TS χ1 in 3.5Å C accuracy
1 1166.2 Zhang-Server
2 1129.96 Pmodeller6
3 1056.55 ROBETTA
4 1037.01 HHpred2
5 1033.1 Pcons6
6 1031.74 MetaTasser
7 981.96 CIRCLE
8 977.37 BayesHH
9 975.84 HHpred3
10 973.37 HHpred1
1 649 Pmodeller6
2 602 ROBETTA
3 577 Pcons6
4 577 Zhang-Server
5 559 MetaTasser
6 523 SAM_T06_server
7 503 HHpred2
8 495 FAMSD
9 488 HHpred1
10 475 CIRCLE
日本 米国 欧州
Server in CASP
time
QuerySequence
Server Deadline
48 hr
PublishServer Answer (every week)
Human Predictor
CASP Deadlinefor each target
Automated Procedure
Virtual Servers•サーバーの答えを使うサーバー: meta server•選ぶだけのサーバー: meta selector
Virtual Servers
• fams_ace :– 3D1D とコンセンサスで選ぶ meta selecter
• CIECLE-FAMS :– 3D1D で選ぶ meta selecter
• fams-multi :– 3D1D で複数のモデルを選び、– 100 %の multi-FAMS を実行する meta serve
r
Assessments of CASP7 CM targets.
GDT_TS χ1 in 3.5Å C accuracy
1 4125.32 Zhang-Server
2 3949.26 FAMSD
3 3947.64 UNI-EID_expm
4 3944.64 CIRCLE
5 3939.36 HHpred2
6 3937.69 HHpred3
7 3928.55 beautshot
8 3925.04 BayesHH
9 3914.24 FAMS
10 3898.92 SP3
1 5010 ROBETTA
2 4900 Pmodeller6
3 4882 FAMS
4 4879 FAMSD
5 4855 Pcons6
6 4748 CIRCLE
7 4748 Zhang-Server
8 4633 FUNCTION
9 4594 Bilab-ENABLE
10 4571 CaspIta-FOX
4102.61 fams_ace4037.85 CIRCLE_FAMS4023.57 fams_multi
5115 CIRCLE_FAMS
5070 fams_multi
Assessments of CASP7 FR targets.
GDT_TS χ1 in 3.5Å C accuracy
1 1166.2 Zhang-Server
2 1129.96 Pmodeller6
3 1056.55 ROBETTA
4 1037.01 HHpred2
5 1033.1 Pcons6
6 1031.74 MetaTasser
7 981.96 CIRCLE
8 977.37 BayesHH
9 975.84 HHpred3
10 973.37 HHpred1
1 649 Pmodeller6
2 602 ROBETTA
3 577 Pcons6
4 577 Zhang-Server
5 559 MetaTasser
6 523 SAM_T06_server
7 503 HHpred2
8 495 FAMSD
9 488 HHpred1
10 475 CIRCLE
1093.69 fams_ace1091.55 CIRCLE_FAMS
1023.07 fams_multi
615 CIRCLE_FAMS
568 fams_ace
516 fams_multi
Assessments of CASP7 All targets.
GDT_TS χ1 in 3.5Å C accuracy
1 5291.52 Zhang-Server
2 4976.37 HHpred2
3 4959.04 Pmodeller6
4 4926.6 CIRCLE
5 4917.05 Pcons6
6 4913.53 HHpred3
7 4909.65 ROBETTA
8 4902.41 BayesHH
9 4886.08 FAMSD
10 4879.27 UNI-EID_expm
1 5612 ROBETTA
2 5549 Pmodeller6
3 5432 Pcons6
4 5374 FAMSD
5 5336 FAMS
6 5325 Zhang-Server
7 5223 CIRCLE
8 5085 FUNCTION
9 5012 SAM_T06_server
10 4979 Bilab-ENABLE
5196.3 fams_ace5129.4 CIRCLE_FAMS5046.64 fams_multi
5730CIRCLE_FAMS5586 fams_multi
5135 fams_ace
Assessments of CASP7 CM targets.
GDT_TS χ1 in 3.5Å C accuracy
1 4125.32 Zhang-Server
2 3949.26 FAMSD
3 3947.64 UNI-EID_expm
4 3944.64 CIRCLE
5 3939.36 HHpred2
6 3937.69 HHpred3
7 3928.55 beautshot
8 3925.04 BayesHH
9 3914.24 FAMS
10 3898.92 SP3
1 5010 ROBETTA
2 4900 Pmodeller6
3 4882 FAMS
4 4879 FAMSD
5 4855 Pcons6
6 4748 CIRCLE
7 4748 Zhang-Server
8 4633 FUNCTION
9 4594 Bilab-ENABLE
10 4571 CaspIta-FOX
4102.61 fams_ace4037.85 CIRCLE_FAMS4023.57 fams_multi
5115 CIRCLE_FAMS
5070 fams_multi
4131.52 fams_ace_STD3SS_ori
Zhang-Serverはコンセンサスのアルゴリズムをとっていると考えられる
Conclusions• 日米欧の実力は CMでは拮抗、 FRでは少し遅れをとっていると言える
• コンセンサスは主鎖の評価で高得点を取るのに重要
• コンセンサスと物理的関数(特に 3D1D)の組み合わせは強力なツールとなりうる
• 主鎖のみならず側鎖をも評価に含めると、物理的関数が要求される
• 難易度の高いターゲットにおいても物理的関数は要求される。