Spotfire_8

24
次世代シークエンサから得られる 大規模データにおける Spotfireを用いた解析手法 8回スポットファイアーユーザ総会 ライフサイエンス統合データベースセンター リサーチアシスタント  奥田裕樹

Transcript of Spotfire_8

Page 1: Spotfire_8

次世代シークエンサから得られる大規模データにおける

Spotfireを用いた解析手法

第8回スポットファイアーユーザ総会

ライフサイエンス統合データベースセンター リサーチアシスタント  奥田裕樹

Page 2: Spotfire_8

今日お話すること

大量のデータを

Spotfireで

どのように処理するのか

次世代シークエンサから出る

Page 3: Spotfire_8

自己紹介• 奥田裕樹

• DBCLS リサーチアシスタント

• 新世代DNA塩基配列解析技術の開発

http://g86.dbcls.jp/~yag/wordpress/twitter id : yag_ays

Page 4: Spotfire_8

自己紹介• Spotfireとの関わり

• Spotfire 3.0から

• 個人的な解析のみ

• これまで第7回ユーザ総会および第9回ユーザ会ワークショップに参加

Page 5: Spotfire_8

次世代シークエンサ• サンガー法などの従来の方法とは異なるゲノム解読装置

• 短い塩基配列を大量に読む• 利用方法・de novoアセンブリ・RNA-Seq

・ChIP-Seq

・エピゲノム・SNP探索

Page 6: Spotfire_8

次世代シークエンサのスペック

read length(base)

day / run base/run(Gb)

Solexa (50bp)

SOLiD3

454 FLX Ti (330bp)

75 9.5 20.5 - 25

50 6 - 7 20 - 30

400 0.4 0.4 - 0.6

http://spreadsheets.google.com/pub?key=tQ5PDSBsSTkLXhDQFugandg&output=html

Page 7: Spotfire_8

遺伝子発現解析発現量

発現領域

• 発現量の絶対定量• わずかな発現量も検出できる

• 発現領域決定(高解像度)

http://g86.dbcls.jp/mtblm/b/NM_133977

Page 8: Spotfire_8

Cell

RNA fragments

mRNAAAAAA

AAAAAAAAAA

Mapping

Page 9: Spotfire_8
Page 10: Spotfire_8

ORF

gt ag ag

or

Page 11: Spotfire_8
Page 12: Spotfire_8

発現領域・発現量の推定• 読んだ配列をマッピング

• エキソン・イントロン領域を推定

• FPKM (Fragments Per Kilobase of exon model per Million mapped fragments)  で正規化

遺伝子ID発現領域発現量

Page 13: Spotfire_8

今回使用するデータRefseq id diff FPKM...etc

Page 14: Spotfire_8

Reference

Analyzed data

diff

Page 15: Spotfire_8

Spotfire解析画面

組織1

組織2

組織3

Page 16: Spotfire_8

発現量が高く発現領域の差が大きい

Page 17: Spotfire_8
Page 18: Spotfire_8
Page 19: Spotfire_8
Page 20: Spotfire_8

外部データベースの活用• 大量のデータから絞り込んだ特定の 遺伝子の特徴などを外部データベースで検索する

Page 21: Spotfire_8

Spotfireからブラウザへ• レンダラーの設定

Page 22: Spotfire_8
Page 23: Spotfire_8

http://g86.dbcls.jp/mtblm/

Page 24: Spotfire_8

今後の予定• 次世代シークエンサの解析パイプラインを作成し,Spotfire側で用意したフレームワークと連携

http://g86.dbcls.jp/~yag/spotfire.pdfスライド