生物信息学课程 -- 数据库与网络服务

55
生生生生生生生 -- 生生生生生生生生 生生 生生生生生 2007 生 生生生生生

description

生物信息学课程 -- 数据库与网络服务. 杜舟 生物信息学 2007 级 苏震实验室. 博二的老人了. Concepts. Bioinformatics Computational Biology Database Web server Web service. (Many who draw a distinction between bioinformatics and computational biology portray the former as a tool kit and the latter as science. ). - PowerPoint PPT Presentation

Transcript of 生物信息学课程 -- 数据库与网络服务

Page 1: 生物信息学课程 --  数据库与网络服务

生物信息学课程-- 数据库与网络服务

杜舟生物信息学

2007 级苏震实验室

Page 2: 生物信息学课程 --  数据库与网络服务

博二的老人了

Page 3: 生物信息学课程 --  数据库与网络服务

Concepts

• Bioinformatics• Computational Biology

• Database• Web serverWeb service

(Many who draw a distinction between bioinformatics and computational biology portray the former as a tool kit and the latter as science. )

Page 4: 生物信息学课程 --  数据库与网络服务

Nucleic Acids Research Database and Web Server issue

Database Web Server

Page 5: 生物信息学课程 --  数据库与网络服务

http://www.oxfordjournals.org/nar/database/c/Database

Page 6: 生物信息学课程 --  数据库与网络服务

http://bioinformatics.ca/links_directory/Web sever

Page 7: 生物信息学课程 --  数据库与网络服务

Google !!!

Page 8: 生物信息学课程 --  数据库与网络服务

Bioinformatics 主要期刊专业期刊(以计算文章为主):Bioinformaitcs,plos computational biology, BMC bioinformatics, journal of computational biology, BMC genomics , BMC systems biology, molecular biology eolution...

准专业期刊(基本上每期都有一定比例):genome biology, nucleic acids research, genome research, molecular systems biology, american journal of human genetics,...  综合期刊: nature,science,pnas,plos one,...

其它(偶尔有计算类文章发表):nature biotechnology, nature genetics, nature methods, cell , trends genetics, plos genetics,...

Page 9: 生物信息学课程 --  数据库与网络服务

Part I Overview of the bioinformaticsDatabase and web server

Part II Introduction to bioinformatics webservices created in Su Zhen's lab

Part III Construction of database and web services

Page 10: 生物信息学课程 --  数据库与网络服务
Page 11: 生物信息学课程 --  数据库与网络服务
Page 12: 生物信息学课程 --  数据库与网络服务
Page 13: 生物信息学课程 --  数据库与网络服务
Page 14: 生物信息学课程 --  数据库与网络服务

14

GenBankEMBL DDBJ

Three major public DNA databases

In 1988, 由此三家组成了国际核酸序列数据库协作组织( INSDC ),规定:1 、数据交换与共享(每 24 小时进行一次)2 、使用统一的数据记录格式处理提交数据,以保证各数据库相应记录在内容上的一致性。3 、数据的维护与更新。 Each database updates only the records that were directly submitted to it.

Page 15: 生物信息学课程 --  数据库与网络服务
Page 16: 生物信息学课程 --  数据库与网络服务
Page 17: 生物信息学课程 --  数据库与网络服务
Page 18: 生物信息学课程 --  数据库与网络服务
Page 19: 生物信息学课程 --  数据库与网络服务

19

Accession number 是用来确定一个记录的标签。

Examples (all for retinol-binding protein, RBP4):

X02775 GenBank genomic DNA sequence ( 1+5 , 2+6 )NT_030059 Genomic contig in RefSeqRs7079946 dbSNP (single nucleotide polymorphism)

N91759.1 An expressed sequence tag (1 of 170)NM_006744 RefSeq DNA sequence (from a transcript)

NP_007635 RefSeq proteinAAC02945 GenBank proteinQ28369 SwissProt protein1KT7 Protein Data Bank structure record

protein

DNA

RNA

What is accession number?

Page 20: 生物信息学课程 --  数据库与网络服务

20

Accession number series in RefSeq

Experimentally determined sequences NT_123456 Genomic contigs (DNA) NM_123456 mRNA NP_123456 Proteins

• Sequences derived through genome annotation efforts XM_123456 Model mRNAs XP_123456 Model proteins

Page 21: 生物信息学课程 --  数据库与网络服务

NCBI 简介• NCBI(National Center for Biotechnology Information), 建立于 1988 年• 主要任务

– 开发数据库– 进行计算生物学研究– 开发基因组数据分析的工具– 发布生物医学信息等

• 对于数据库– 管理数据库

• Genbank• Unigene• Refseq• dbSNP• dbEST• OMIM

– 提供 Entrez 数据库检索– BLAST 数据库序列搜索比对等

Page 22: 生物信息学课程 --  数据库与网络服务
Page 23: 生物信息学课程 --  数据库与网络服务

利用 NCBI 获取所有玉米的全长cDNA

1. 利用关键字 FLI-CDNA 搜索2. 选择 nucleotide

Page 24: 生物信息学课程 --  数据库与网络服务

3. 选择物种 --- 玉米

Page 25: 生物信息学课程 --  数据库与网络服务

4. 选择浏览方式 (可选)

Page 26: 生物信息学课程 --  数据库与网络服务

5. 选择下载方式,可直接下载 fasta 文件

Page 27: 生物信息学课程 --  数据库与网络服务
Page 28: 生物信息学课程 --  数据库与网络服务
Page 29: 生物信息学课程 --  数据库与网络服务
Page 30: 生物信息学课程 --  数据库与网络服务
Page 31: 生物信息学课程 --  数据库与网络服务
Page 32: 生物信息学课程 --  数据库与网络服务
Page 33: 生物信息学课程 --  数据库与网络服务

Pfam

http://pfam.janelia.org/

Page 34: 生物信息学课程 --  数据库与网络服务
Page 35: 生物信息学课程 --  数据库与网络服务
Page 36: 生物信息学课程 --  数据库与网络服务
Page 37: 生物信息学课程 --  数据库与网络服务

Genome Browser

• 浏览基因组信息:原始测序序列、基因结构、 EST支持、转录因子、序列保守性、 SNP 等一系列信息。

• 缺点:只适合手工浏览,不适和大规模处理

Page 38: 生物信息学课程 --  数据库与网络服务

Jbrowser

Page 39: 生物信息学课程 --  数据库与网络服务

UCSC Introduction

• University of California Santa Cruz (UCSC)• Genome Browser Database• URL : http://genome.ucsc.edu/• 数据构成:

– 基因组数据– 基因组间的比对信息– 参考序列( mRNA, EST )– 基因注释信息( ENCODE 项目)

Page 40: 生物信息学课程 --  数据库与网络服务

UCSC HomePage

Page 41: 生物信息学课程 --  数据库与网络服务

Genome Browser

Page 42: 生物信息学课程 --  数据库与网络服务

Customized UCSC Browser

Page 43: 生物信息学课程 --  数据库与网络服务
Page 44: 生物信息学课程 --  数据库与网络服务

苏震实验室数据库及网络服务介绍

Page 45: 生物信息学课程 --  数据库与网络服务

植物 mRNA 数据库

Zhenhai Zhang, Jingyin Yu, Daofeng Li, Zuyong Zhang, Fengxia Liu, Xin Zhou, Tao Wang, Yi Ling, and Zhen Su Nucleic Acids Research, 2010, Vol. 38, Database issue D806-D813

Page 46: 生物信息学课程 --  数据库与网络服务

大豆功能数据库

Page 47: 生物信息学课程 --  数据库与网络服务

苜蓿数据库

Li D, Su Z, Dong J, Wang T. An expression database for roots of the model legume Medicago truncatula under salt stress. BMC Genomics. 2009 Nov 11;10(1):517.

Page 48: 生物信息学课程 --  数据库与网络服务

植物分泌蛋白数据库

Page 49: 生物信息学课程 --  数据库与网络服务

Zhou Du, Xin Zhou, Li Li, Zhen Su, plantsUPS: a database of plants' Ubiquitin Proteasome System, BMC Genomics, 2009, 10:227

植物泛素化系统数据库

Page 50: 生物信息学课程 --  数据库与网络服务

玉米信号转导数据库

BMC genomics, 2010

Page 51: 生物信息学课程 --  数据库与网络服务

EasyGO : GO 富集分析平台

Xin Zhou, Zhen Su, EasyGO: Gene Ontology-based annotation and functional enrichment analysis tool for agronomical species, BMC Genomics 2007, 8:246

Page 52: 生物信息学课程 --  数据库与网络服务

agriGO :农业物种 GO 富集分析平台

Zhou Du, Xin Zhou, Yi Ling, Zhenhai Zhang and Zhen SuNucleic Acids Research, 2010Faculty of 1000 biology “Recommend”

Page 53: 生物信息学课程 --  数据库与网络服务
Page 54: 生物信息学课程 --  数据库与网络服务

构建数据库或网络服务可能需要用到的技术

Database

Biological Meaning

Computertechnique

Linux

Apache

MySQL

PHP/Python/Perl

(LAMP) + HTML (CSS) + Javascript

Literaturemining

Page 55: 生物信息学课程 --  数据库与网络服务

谢谢 ~