Post on 13-Jul-2015
aLeaves(エイリーヴズ)を用いて
分子系統樹推定におけるデータセット生成の
ストレスを減らす
~ tackling a bottleneck of modern molecular phylogenetics ~
工樂 樹洋(理研CDB・ゲノム資源解析ユニット)
Shigehiro Kuraku (Genome Resource & Analysis Unit, RIKEN CDB)
Informatics Modern sequencing
Molecular Developmental Biology
ゲノム資源解析ユニット Genome Resource & Analysis Unit Center for Developmental Biology
RIKEN, Kobe, Japan
Who am I ?
コンセプト
系統樹推定法が成熟し、多数のゲノムプロジェクトにより配列情報が非常に
豊かになったにもかかわらず、実験生物学者にとって分子系統樹推定の
作業は身近になるどころか、より手の届きにくいものになったのではないか?
情報過多になりがちな昨今の配列リソースを網羅しつつも、
生物学者が頼りにしやすい手掛かりを用いて配列数を絞り込む
ことができるオンラインツールをつくる
Hidden paralogy とは?: 例、zebrafish Emx3
Derobert et al., 2002 etc. Morita et al., 1995
Reviewed in Kuraku, 2010. Integ. Comp. Biol.
配列情報が散在していることがネック
Ensembl NCBI Protein (annotated)
Individual web sites of genome projects
Your sequences
NCBI Refseq (annotated)
Ensembl Metazoa
データセット
コンセプト
系統樹推定法が成熟し、多数のゲノムプロジェクトにより配列情報が非常に
豊かになったにもかかわらず、実験生物学者にとって分子系統樹推定の
作業は身近になるどころか、より手の届きにくいものになったのではないか?
情報過多になりがちな昨今の配列リソースを網羅しつつも、
生物学者が頼りにしやすい手掛かりを用いて配列数を絞り込む
ことができるオンラインツールをつくる
Collaborators
GRAS, RIKEN CDB CBRC, AIST &
iFReC, Osaka Univ.
Christian M. Zmasek
Sanford-Burnham Medical Research Institute
USA
Kazutaka Katoh 加藤 和貴 Osamu Nishimura 西村 理
aLeaves – http://aleaves.cdb.riken.jp
5分以内に対象データベース から配列を収集しmultifasta 形式で出力
EnsemblやNCBIに加え、 ゾウギンザメ、ナメクジウオ、 アコヤガイなどの配列も含め ワンサーチで
アミノ酸配列クエリー1本 から検索スタート
Downstream analysis on MAFFT server
様々な基準に従い、配列の体系的な取捨選択が可能
・配列長
・酷似する配列を削除 (CD-HIT)
・Gap-freeな座位数を制限している配列を削除(Max-Align)
・特定の生物種に絞る
・Guide-tree(案内木)上の位置
Managed by K. Katoh
Heuristic identification of homologs (in publications, etc.)
Exhaustive collection of homologs Careful refinement of dataset by deleting unnecessary sequences
Phylogenetic tree inference
Retrieval of limited number of sequences
(on MAFFT server at CBRC, AIST)
(on aLeaves server at CDB, RIKEN)
Workflow using aLeaves-MAFFT
注意点
・aLeaves は他所ですでに公開されているリソースだけ
に基づいたツールです(オリジナルサイトへリンク)
・aLeavesプロジェクトとしては、独自にタンパクコード遺伝子
の推定およびその吟味を行わず、オリジナルリソースの情報を
そのまま踏襲しています
・aLeaves-MAFFTサーバを利用し予備的な分子系統解析が
可能だが、本格的な解析は、作成した配列セットをダウン
ロードし、やはりローカルで行ってください