ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ...

30
1 ヒト遺伝子情報と バイオデータベース 山口由美

Transcript of ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ...

Page 1: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

1

ヒト遺伝子情報とバイオデータベース

山口由美

Page 2: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

2

ゲノム解析とトランスクリプトーム解析

膨大な塩基配列長を解読、注釈付け

発現されているところを、(機能している領域を)解析する。

ゲノム解析

トランスクリプトーム解析

Page 3: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

3

産業技術総合研究所(産業技術総合研究所(AIST)AIST) 生物情報解析研究センター(BIRC)生物情報解析研究センター(BIRC)統合データベース解析グループ統合データベース解析グループ

ヒト遺伝子アノテーション統合データベースヒト遺伝子アノテーション統合データベース

::HH--InvDBInvDBの紹介の紹介

BioJapan 2005

Page 4: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

4

HH--InvDBInvDBとは?とは?

HH--Invitational Invitational プロジェクト概要プロジェクト概要

日本中心とする6つの国際配列解析プロジェクトより計41,118本のヒト完全長cDNA塩基配列を提供。

統一基準による多岐にわたる包括的なアノテーションを実施した結果をデータベースとして無償で公開。

2002年8月-9月 H-Invitationalジャンボリー会議

(お台場マラソン)

2003年12月 全データ・精査完了

2004年4月20日 H-Invitational database (H-InvDB) 公開

H-Invitational論文オンライン発表

2005年8月31日 H-InvDB_2.0 公開(cDNA数:56,419に拡張)

Page 5: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

5

遺伝子についての様々な情報

遺伝子 疾患 カテゴリー

表現形ヒト

動物

パラログ遺伝子

遺伝子機能

遺伝子多型

ゲノム上の位置 マップされた染色体領域

影響を受ける臓器遺伝子発現

類似、関連した疾患

オーソログ遺伝子オーソログ遺伝子

Page 6: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

6

HH--InvDBInvDBとはとは??HH--InvDBInvDB画面紹介画面紹介

http://www.hhttp://www.h--invitational.jpinvitational.jp

22つのつのTopTopページページ

22つのメイン画面とつのメイン画面と66つのサブデータベースから構成つのサブデータベースから構成

Page 7: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

7

HH--InvDBInvDB画面紹介画面紹介

HH--InvDB 2InvDB 2つのつのTopTopページページ

www.h-invitational.jp

H-InvDB TopページH-InvDB Topページ

公式サイト公式サイト

Page 8: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

8

HH--InvDB: InvDB: メイン画面メイン画面 (1(1)) Locus viewLocus view

25,585 25,585 遺伝子座に関遺伝子座に関

するアノテーションするアノテーションゲノム地図

ゲノム上の位置情報

遺伝子構造

スプライシング変異体

遺伝子発現特性

疾患関連情報

等のアノテーション項目を表示

Page 9: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

9

HH--InvDB: InvDB: メイン画面メイン画面 (2) (2) cDNA viewcDNA view

56,419 cDNA56,419 cDNAに関するに関するアノテーション情報を提供アノテーション情報を提供遺伝子機能遺伝子名予測ORF機能性モチーフ情報酵素番号(EC番号)代謝経路情報(KEGG)細胞内局在予測立体構造予測(GTOP)一塩基多型分子進化的解析等のアノテーションデータ提供

Page 10: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

10

HH--InvDB:InvDB:ご質問等の問い合わせご質問等の問い合わせ

ご指摘・ご質問等は・・・

1. H-InvDB各画面の をクリック

2. フォームに入力

3. “Submit” をクリック

お気軽にお問い合わせ下さい。

Page 11: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

11

HH--InvDBInvDB利用法利用法

HH--InvDBInvDBデータへのアクセスデータへのアクセス#1 簡易検索キーワード入力例) BC003551

#3 染色体マップ対応するゲノムマップへリンク

#2 詳細検索詳細なテキスト・キーワード・ID検索

#4 Blast検索配列の相同性による検索

#5 サンプル画面各サンプル画面へリンク

#6 G-integra検索

Page 12: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

12

http://www.hhttp://www.h--invitational.jpinvitational.jp

Page 13: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

13

HH--InvDB: InvDB: サブデータベースサブデータベース (1(1))GG--integraintegra

ゲノム統合データベースヒトとマウスのゲノム地図

cDNA/EST/SNP/repeat配列の遺伝子構造・ゲノム上の位置情報を提供

他DB(RefSeq/Ensembl)のデータも参照可能

IDによる独自の検索機能HH--Inv cDNAs (Inv cDNAs (GreenGreen))

RefSeq & Ensembl (RefSeq & Ensembl (RedRed))Genome (Genome (purplepurple))

ESTsESTs

NotionNotion

Other spiecesOther spieces

ScaleScale Start positionStart position Search windowSearch window

Position on chromosomePosition on chromosome

Page 14: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

14

HH--Inv DB: Inv DB: サブデータベースサブデータベース (2)(2)Human ANatomic Gene Expression Library (HHuman ANatomic Gene Expression Library (H--ANGEL)ANGEL)

ヒト遺伝子発現プロファイルデータベース7つのプラットフォーム、3種の実験手法から得られた発現データを格納(iAFLP, SAGE and DNA array etc.)ヒト組織を10および40 に分類し、ヒト健常人の発現情報を正規化

発現パターンによる検索機能

Page 15: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

15

HH--Inv DB: Inv DB: サブデータベースサブデータベース (3)(3)DiseaseInfo ViewerDiseaseInfo Viewer

疾患情報データベース

既知疾患関連遺伝子情報

原因遺伝子が特定されていない遺伝性疾患情報

他DBへのリンク:LocusLink, OMIM and GenAtlas

疾患情報データベース

既知疾患関連遺伝子情報

原因遺伝子が特定されていない遺伝性疾患情報

他DBへのリンク:LocusLink, OMIM and GenAtlas

Page 16: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

16

HH--Inv DB: Inv DB: サブデータベースサブデータベース (4, 5)(4, 5)Clustering Viewer & TOPO viewerClustering Viewer & TOPO viewer

Clustering ViewerClustering Viewer

TOPO ViewerTOPO Viewer

クラスタリングに関する詳細情クラスタリングに関する詳細情報検討ツール報検討ツールH-Invitationalプロジェクト参加機関のクラスタリング手法を比較可能(Ensembl, FLJ, SANBI, TIGR, UniGene, and JBIRC)

細胞内局在予測情報提供ツール細胞内局在予測情報提供ツールPSORT IIおよびTargetPによって予測された細胞内指向シグナル予測結果を提供

SOSUIおよびTMHMMによって予測された膜貫通へリックスの予測結果を提供

Page 17: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

17

HH--Inv DB: Inv DB: サブデータベースサブデータベース (6)(6)EvolaEvola

分子進化アノテーションデータベース

系統樹アノテーション結果

Alignment表示

検索機能

分子進化アノテーショ分子進化アノテーションンデータベース

系統樹アノテーション結果

Alignment表示

検索機能

Page 18: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

18

H-InvDB利用法

簡易検索簡易検索 && 詳細検索詳細検索

特定の条件にあてはまる遺伝子を検索1. 簡易検索

2. 詳細検索

詳細検索アイコンをクリック

H-InvDB top page

検索項目を入力(複数可)

データセット選択

該当するH-InvDBの遺伝

子リスト表示

データ表示画面へのリンク

テキストボックスにキーワード入力例 “kinase”

①簡易検索

②詳細検索

Page 19: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

19

HH--InvDBInvDB利用法利用法

BlastBlastによる配列検索による配列検索

塩基またはアミノ酸配列に対する相同性検索Blast による検索

Blastトップ画面

H-InvDB top page配列データを入力して実行・塩基配列・アミノ酸配列

該当するH-InvDB遺伝子リスト

Blast search

Page 20: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

20

HH--InvDBInvDB利用法利用法

HH--InvDB InvDB データダウンロードデータダウンロード

各アイコンをクリックすると対応する形式でデータダウンロード

cDNA viewまたはLocus view

JBIRC flat file形式 DDBJ flat file形式

JBIRC XML file形式

3つのファイル形式でデータ提供

Page 21: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

21

HH--InvDBInvDB利用法利用法

全件データダウンロード(全件データダウンロード(HTTP / FTPHTTP / FTP))

HTTP site

H-InvDB top page

HTTP download siteFTP server

H-InvDB official page

FTP download site

Downloading annotated data

Page 22: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

22

HH--InvDBInvDB利用法利用法

HH--InvDBInvDB:: ドキュメントドキュメント

1. H-Invitationalプロジェクト

2. ヘルプドキュメント1. H-InvDB概要説明

2. アノテーション内容説明

3. 検索システム使用方法

4. 画面説明

5. ファイル形式

6. よくある質問

7. H-InvDB引用方法

Help 1. What is H-InvDB ?

Page 23: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

23

Page 24: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

24

予測されたアミノ酸配列Open Reading Frame (ORF)

Page 25: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

25

機能ドメイン情報

Page 26: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

26

遺伝子多型情報もあります

Page 27: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

27

ヒト遺伝子多型解析の流れ

dbSNP (NCBI)からの

ゲノム多型データ

H-Invitationalからの

遺伝子構造

SNP, indel の選択

IntronOn cDNAゲノム座標

cDNA塩基配列上の位置

Other genomic region

ORFと対応付けた多型の分類解析

ORF予測結果

genomecDNA

ORF

Single Nucleotide Polymorphism (SNP)

..ATCGATCG..

..ATC--TCG..

..ACCGATCG..

..ATCAATCG..

修正を含めたcDNA塩基配列上の位置

Insertion/Deletion (Indel)GA/-

G/A

5’UTR 3’UTR

座標変換座標変換

Page 28: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

28

cDNA上のSNPの分類解析

SNP is located …

Inside of ORF

Outside of ORF

5’UTR

3’UTR

Exact 2alleles

More than 2 alleles

Synonymous

Nonsynonymous

Termination codon is included.

Nonsense

Read through

(synonymous)Unclassified

Alleles in Amino acid

Get codon from cDNA sequence

Exact two codons of a, t, c, g

Yes

No

Page 29: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

29

代表cDNA上の分類された多型

SNP

Indel

5’UTR ORF 3’UTR

1863347955**

55825Synonymous

Nonsynonymous

20408

26545

702

972 1123 3206

Polymorphism: dbSNP build 121 with Human genome assembly build 34

Total

5299*

122413

127714Total 19605 49078 59031

NonsenseExtension

Synonymous at termination codon7039

cDNA : representative H-Inv 2 cDNA (with ORF)

[1/471.03bp]

[1/9029.44bp] [1/21806.36bp] [1/7171.82bp]

[1/411.87bp] [1/510.66bp]

# of cDNAs analyzed = 21087

Number of SNPs and indels on cDNAs without ORF = 16002 in total

[1/196.32bp]

[1/673.64bp]

** This includes 191 unclassifiable SNPs. * This includes two indels located on the boundary of ORF and UTR.

Total number of SNP/Indel on representative cDNAs: 143716

Page 30: ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ ンデータベース 9 系統樹アノテーション結果 9 Alignment表示 9 検索機能

30

遺伝子の紹介

●H-InvDB(ヒト遺伝子アノテーションデータベース)データ紹介PPARγ - 糖尿病に関連した倹約遺伝子の実体(3p25.2)○cDNA view

http://www.jbirc.aist.go.jp/hinv/soup/pub_Detail.pl?acc_id=BC006811PPARは、peroxisome proliferator-activated receptorといって、

ペルオキシソーム増殖剤応答性受容体などと訳されています。核内レセプター型の転写因子でして、リガンド分子を受け取ってDNAに結合して遺伝子を活性化します。細胞の分化によって

脂肪細胞を作ることに関わっています。このタンパク質は、リガンドと結合する部分とDNAと結合する部分の両方が必要です。PPARγは、糖尿病との関係が知られています。12番目の

アミノ酸がプロリンまたはアラニンの多型があり、プロリン型が大多数です。アラニン型の方がPPARγの活性が低く、糖尿病に

なりにくいことが分かっています。食糧が必ずしも豊富でなかった太古の時代より、PPARγはエネルギーの浪費を抑えて節約し、脂肪細胞を作るように働いてきた遺伝子なのです。