神戸洋藝菓子ボックサン · 2020. 11. 9. · Created Date: 11/9/2020 10:25:30 AM
ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ...
Transcript of ヒト遺伝子情報と バイオデータベース - JST...Evola 分子進化アノテーショ...
1
ヒト遺伝子情報とバイオデータベース
山口由美
2
ゲノム解析とトランスクリプトーム解析
膨大な塩基配列長を解読、注釈付け
発現されているところを、(機能している領域を)解析する。
ゲノム解析
トランスクリプトーム解析
3
産業技術総合研究所(産業技術総合研究所(AIST)AIST) 生物情報解析研究センター(BIRC)生物情報解析研究センター(BIRC)統合データベース解析グループ統合データベース解析グループ
ヒト遺伝子アノテーション統合データベースヒト遺伝子アノテーション統合データベース
::HH--InvDBInvDBの紹介の紹介
BioJapan 2005
4
HH--InvDBInvDBとは?とは?
HH--Invitational Invitational プロジェクト概要プロジェクト概要
日本中心とする6つの国際配列解析プロジェクトより計41,118本のヒト完全長cDNA塩基配列を提供。
統一基準による多岐にわたる包括的なアノテーションを実施した結果をデータベースとして無償で公開。
2002年8月-9月 H-Invitationalジャンボリー会議
(お台場マラソン)
2003年12月 全データ・精査完了
2004年4月20日 H-Invitational database (H-InvDB) 公開
H-Invitational論文オンライン発表
2005年8月31日 H-InvDB_2.0 公開(cDNA数:56,419に拡張)
5
遺伝子についての様々な情報
遺伝子 疾患 カテゴリー
表現形ヒト
動物
パラログ遺伝子
遺伝子機能
遺伝子多型
ゲノム上の位置 マップされた染色体領域
影響を受ける臓器遺伝子発現
類似、関連した疾患
オーソログ遺伝子オーソログ遺伝子
6
HH--InvDBInvDBとはとは??HH--InvDBInvDB画面紹介画面紹介
http://www.hhttp://www.h--invitational.jpinvitational.jp
22つのつのTopTopページページ
22つのメイン画面とつのメイン画面と66つのサブデータベースから構成つのサブデータベースから構成
7
HH--InvDBInvDB画面紹介画面紹介
HH--InvDB 2InvDB 2つのつのTopTopページページ
www.h-invitational.jp
H-InvDB TopページH-InvDB Topページ
公式サイト公式サイト
8
HH--InvDB: InvDB: メイン画面メイン画面 (1(1)) Locus viewLocus view
25,585 25,585 遺伝子座に関遺伝子座に関
するアノテーションするアノテーションゲノム地図
ゲノム上の位置情報
遺伝子構造
スプライシング変異体
遺伝子発現特性
疾患関連情報
等のアノテーション項目を表示
9
HH--InvDB: InvDB: メイン画面メイン画面 (2) (2) cDNA viewcDNA view
56,419 cDNA56,419 cDNAに関するに関するアノテーション情報を提供アノテーション情報を提供遺伝子機能遺伝子名予測ORF機能性モチーフ情報酵素番号(EC番号)代謝経路情報(KEGG)細胞内局在予測立体構造予測(GTOP)一塩基多型分子進化的解析等のアノテーションデータ提供
10
HH--InvDB:InvDB:ご質問等の問い合わせご質問等の問い合わせ
ご指摘・ご質問等は・・・
1. H-InvDB各画面の をクリック
2. フォームに入力
3. “Submit” をクリック
お気軽にお問い合わせ下さい。
11
HH--InvDBInvDB利用法利用法
HH--InvDBInvDBデータへのアクセスデータへのアクセス#1 簡易検索キーワード入力例) BC003551
#3 染色体マップ対応するゲノムマップへリンク
#2 詳細検索詳細なテキスト・キーワード・ID検索
#4 Blast検索配列の相同性による検索
#5 サンプル画面各サンプル画面へリンク
#6 G-integra検索
12
http://www.hhttp://www.h--invitational.jpinvitational.jp
13
HH--InvDB: InvDB: サブデータベースサブデータベース (1(1))GG--integraintegra
ゲノム統合データベースヒトとマウスのゲノム地図
cDNA/EST/SNP/repeat配列の遺伝子構造・ゲノム上の位置情報を提供
他DB(RefSeq/Ensembl)のデータも参照可能
IDによる独自の検索機能HH--Inv cDNAs (Inv cDNAs (GreenGreen))
RefSeq & Ensembl (RefSeq & Ensembl (RedRed))Genome (Genome (purplepurple))
ESTsESTs
NotionNotion
Other spiecesOther spieces
ScaleScale Start positionStart position Search windowSearch window
Position on chromosomePosition on chromosome
14
HH--Inv DB: Inv DB: サブデータベースサブデータベース (2)(2)Human ANatomic Gene Expression Library (HHuman ANatomic Gene Expression Library (H--ANGEL)ANGEL)
ヒト遺伝子発現プロファイルデータベース7つのプラットフォーム、3種の実験手法から得られた発現データを格納(iAFLP, SAGE and DNA array etc.)ヒト組織を10および40 に分類し、ヒト健常人の発現情報を正規化
発現パターンによる検索機能
15
HH--Inv DB: Inv DB: サブデータベースサブデータベース (3)(3)DiseaseInfo ViewerDiseaseInfo Viewer
疾患情報データベース
既知疾患関連遺伝子情報
原因遺伝子が特定されていない遺伝性疾患情報
他DBへのリンク:LocusLink, OMIM and GenAtlas
疾患情報データベース
既知疾患関連遺伝子情報
原因遺伝子が特定されていない遺伝性疾患情報
他DBへのリンク:LocusLink, OMIM and GenAtlas
16
HH--Inv DB: Inv DB: サブデータベースサブデータベース (4, 5)(4, 5)Clustering Viewer & TOPO viewerClustering Viewer & TOPO viewer
Clustering ViewerClustering Viewer
TOPO ViewerTOPO Viewer
クラスタリングに関する詳細情クラスタリングに関する詳細情報検討ツール報検討ツールH-Invitationalプロジェクト参加機関のクラスタリング手法を比較可能(Ensembl, FLJ, SANBI, TIGR, UniGene, and JBIRC)
細胞内局在予測情報提供ツール細胞内局在予測情報提供ツールPSORT IIおよびTargetPによって予測された細胞内指向シグナル予測結果を提供
SOSUIおよびTMHMMによって予測された膜貫通へリックスの予測結果を提供
17
HH--Inv DB: Inv DB: サブデータベースサブデータベース (6)(6)EvolaEvola
分子進化アノテーションデータベース
系統樹アノテーション結果
Alignment表示
検索機能
分子進化アノテーショ分子進化アノテーションンデータベース
系統樹アノテーション結果
Alignment表示
検索機能
18
H-InvDB利用法
簡易検索簡易検索 && 詳細検索詳細検索
特定の条件にあてはまる遺伝子を検索1. 簡易検索
2. 詳細検索
詳細検索アイコンをクリック
H-InvDB top page
検索項目を入力(複数可)
データセット選択
該当するH-InvDBの遺伝
子リスト表示
データ表示画面へのリンク
テキストボックスにキーワード入力例 “kinase”
①簡易検索
②詳細検索
19
HH--InvDBInvDB利用法利用法
BlastBlastによる配列検索による配列検索
塩基またはアミノ酸配列に対する相同性検索Blast による検索
Blastトップ画面
H-InvDB top page配列データを入力して実行・塩基配列・アミノ酸配列
該当するH-InvDB遺伝子リスト
Blast search
20
HH--InvDBInvDB利用法利用法
HH--InvDB InvDB データダウンロードデータダウンロード
各アイコンをクリックすると対応する形式でデータダウンロード
cDNA viewまたはLocus view
JBIRC flat file形式 DDBJ flat file形式
JBIRC XML file形式
3つのファイル形式でデータ提供
21
HH--InvDBInvDB利用法利用法
全件データダウンロード(全件データダウンロード(HTTP / FTPHTTP / FTP))
HTTP site
H-InvDB top page
HTTP download siteFTP server
H-InvDB official page
FTP download site
Downloading annotated data
22
HH--InvDBInvDB利用法利用法
HH--InvDBInvDB:: ドキュメントドキュメント
1. H-Invitationalプロジェクト
2. ヘルプドキュメント1. H-InvDB概要説明
2. アノテーション内容説明
3. 検索システム使用方法
4. 画面説明
5. ファイル形式
6. よくある質問
7. H-InvDB引用方法
Help 1. What is H-InvDB ?
23
24
予測されたアミノ酸配列Open Reading Frame (ORF)
25
機能ドメイン情報
26
遺伝子多型情報もあります
27
ヒト遺伝子多型解析の流れ
dbSNP (NCBI)からの
ゲノム多型データ
H-Invitationalからの
遺伝子構造
SNP, indel の選択
IntronOn cDNAゲノム座標
cDNA塩基配列上の位置
Other genomic region
ORFと対応付けた多型の分類解析
ORF予測結果
genomecDNA
ORF
Single Nucleotide Polymorphism (SNP)
..ATCGATCG..
..ATC--TCG..
..ACCGATCG..
..ATCAATCG..
修正を含めたcDNA塩基配列上の位置
Insertion/Deletion (Indel)GA/-
G/A
5’UTR 3’UTR
座標変換座標変換
28
cDNA上のSNPの分類解析
SNP is located …
Inside of ORF
Outside of ORF
5’UTR
3’UTR
Exact 2alleles
More than 2 alleles
Synonymous
Nonsynonymous
Termination codon is included.
Nonsense
Read through
(synonymous)Unclassified
Alleles in Amino acid
Get codon from cDNA sequence
Exact two codons of a, t, c, g
Yes
No
29
代表cDNA上の分類された多型
SNP
Indel
5’UTR ORF 3’UTR
1863347955**
55825Synonymous
Nonsynonymous
20408
26545
702
972 1123 3206
Polymorphism: dbSNP build 121 with Human genome assembly build 34
Total
5299*
122413
127714Total 19605 49078 59031
NonsenseExtension
Synonymous at termination codon7039
cDNA : representative H-Inv 2 cDNA (with ORF)
[1/471.03bp]
[1/9029.44bp] [1/21806.36bp] [1/7171.82bp]
[1/411.87bp] [1/510.66bp]
# of cDNAs analyzed = 21087
Number of SNPs and indels on cDNAs without ORF = 16002 in total
[1/196.32bp]
[1/673.64bp]
** This includes 191 unclassifiable SNPs. * This includes two indels located on the boundary of ORF and UTR.
Total number of SNP/Indel on representative cDNAs: 143716
30
遺伝子の紹介
●H-InvDB(ヒト遺伝子アノテーションデータベース)データ紹介PPARγ - 糖尿病に関連した倹約遺伝子の実体(3p25.2)○cDNA view
http://www.jbirc.aist.go.jp/hinv/soup/pub_Detail.pl?acc_id=BC006811PPARは、peroxisome proliferator-activated receptorといって、
ペルオキシソーム増殖剤応答性受容体などと訳されています。核内レセプター型の転写因子でして、リガンド分子を受け取ってDNAに結合して遺伝子を活性化します。細胞の分化によって
脂肪細胞を作ることに関わっています。このタンパク質は、リガンドと結合する部分とDNAと結合する部分の両方が必要です。PPARγは、糖尿病との関係が知られています。12番目の
アミノ酸がプロリンまたはアラニンの多型があり、プロリン型が大多数です。アラニン型の方がPPARγの活性が低く、糖尿病に
なりにくいことが分かっています。食糧が必ずしも豊富でなかった太古の時代より、PPARγはエネルギーの浪費を抑えて節約し、脂肪細胞を作るように働いてきた遺伝子なのです。