计算机科学与生命科学( 11 ) 生物信息学基础 2013 年秋季学期通选课程...

17
1 计计计计计计计计计计11 计计计计计计计 2013 年年年年年年年年年 年年年年 年年 :一 18:30 年 年年年年 年年年 4 年 502d 年年年 年年年 年年年年http://www.mbtech.sdu.edu.cn/bioco mp/

description

计算机科学与生命科学( 11 ) 生物信息学基础 2013 年秋季学期通选课程 上课时间:周一 18:30 点 上课地点:软件园 4 区 502d 主讲人:魏天迪 讲义网址: http://www.mbtech.sdu.edu.cn/biocomp/. 多序列比对. 常用的多序列比对工具包:. ClustalW – 最广泛使用的 T-coffee – 最新的 MUSCLE – 最快的. 多序列比对. 常用的多序列比对工具包:. - PowerPoint PPT Presentation

Transcript of 计算机科学与生命科学( 11 ) 生物信息学基础 2013 年秋季学期通选课程...

1

计算机科学与生命科学( 11)生物信息学基础

2013 年秋季学期通选课程上课时间:周一 18:30 点 上课地点:软件园 4 区 502d主讲人:魏天迪讲义网址: http://www.mbtech.sdu.edu.cn/biocomp/

2

ClustalW – 最广泛使用的

T-coffee – 最新的

MUSCLE – 最快的

多序列比对

常用的多序列比对工具包:

3

Clustal 是最早的多序列比对软件, ClustalW 是 Clustal 的最新版本。至今它已经有 35,000 多次文献引用,是在生物学领域中被引用最多的多序列比对软件。

多序列比对

常用的多序列比对工具包:

4

A List of ClustalW Servers

Name Location URL

EBI Europe http://www.ebi.ac.uk/Tools/msa/clustalw2

PIR USA http://pir.georgetown.edu/pirwww/search/multialn.shtml

EMBnet Europe http://www.ch.embnet.org/software/ClustalW.html

BCM USA http://searchlauncher.bcm.tmc.edu/multi-align/Options/clustalw.html

GenomeNet Japan http://www.genome.jp/tools/clustalw

DDBJ Japan http://clustalw.ddbj.nig.ac.jp/top-j.html

Strasbourg Europe http://bips.u-strasbg.fr/fr/Documentation /ClustalW

多序列比对

常用的多序列比对工具包:

5

氨基酸基本结构

酸根氨基

侧链

6

氨基酸性质

负电 正电

疏水

亲水

7

红 : 疏水

蓝 :酸性(负电)

紫红 :碱性(正电)

绿 :羟基 + 胺基 + 疏水

EMBL ClustalW http://www.ebi.ac.uk/Tools/msa/clustalw2

多序列比对

常用的多序列比对工具包:

8

(*) 绝对保守的位点 (:) 拥有大致相同大小的氨基酸并且这些氨基酸的亲属水性相似。 (.) 拥有大致相同大小的氨基酸或亲属水性相似的氨基酸。

EMBL ClustalW http://www.ebi.ac.uk/Tools/msa/clustalw2

多序列比对

常用的多序列比对工具包:

9

T-coffee 是近几年发表的多序列比对软件,很准确,速度相对慢一些。http://tcoffee.crg.cat/apps/tcoffee/play?name=regular

多序列比对

常用的多序列比对工具包:

10

T-Coffee Mirror Sites

Name URL

SIB http://tcoffee.vital-it.ch

EBI http://www.ebi.ac.uk/Tools/msa/tcoffee

CNRS http://www.igs.cnrs-mrs.fr/Tcoffee/tcoffee_cgi/ index.cgi

Max-Planck http://toolkit.tuebingen.mpg.de/t_coffee

CBSU http://cbsuapps.tc.cornell.edu/t_coffee.aspx

EMBnet http://www.es.embnet.org/Services/MolBio/t-coffee

多序列比对

常用的多序列比对工具包:

T-coffee 是近几年发表的多序列比对软件,很准确,速度相对慢一些。http://tcoffee.crg.cat/apps/tcoffee/play?name=regular

11

T-Coffee http://tcoffee.crg.cat

多序列比对

常用的多序列比对工具包:

12

T-Coffee http://tcoffee.crg.cat

score_html file

clustalw_aln file

fasta_aln file

phylip file

多序列比对

常用的多序列比对工具包:

13

MUSCLE 是一个运算速度较快的多序列比对软件。

Home page : http://www.ebi.ac.uk/Tools/msa/muscle/

多序列比对

常用的多序列比对工具包:

14

多序列比对结果的查看编辑器

http://www.jalview.org/

15

多序列比对中找保守区

16

多序列比对中找保守区

http://meme.nbcr.net/meme/cgi-bin/meme.cgi

17

序列 Logo

对于某一列来说:每个字母的高度 Height = fi * R (i=1,…,20) (f 是出现频率 )R = log2(20) – (entropy + en) entropy = -∑fi * log2(fi)en = (20 - 1) / 2*ln(2)*nentropy: 熵en: 小样本检验修正

TRVGNYEMGRTLGEGSFAKVKYAKNTVTGDQAAIK TRVGNYEMGRTLGEGSFAKVKYAKNTVTGDQAAIK TRVGNYEMGRTLGEGSFAKVKYAKNTVTGDQAAIK KQTISYMAERVVGTGSFGIVFQAKCLETGESVAIK KQTISYMAERVVGTGSFGIVFQAKCLETGESVAIK VVGGKFKLGRKLGSGSFGEIFLGVNVQTGEEVAVK VIGGKFKLGRKIGSGSFGELYLGINVQTGEEVAVK VSKKYVPPLRPIGRGASGIVCAAWNSETGEEVAIK MGADDFELLTMIGKGAFGEVRVVREINTGHVFAMK

在线软件 WebLogo : http://weblogo.berkeley.edu/