Post on 06-Jan-2016
description
第六章 第六章 DNADNA 序列分析序列分析
人类基因组计划人类基因组计划 (human genome p(human genome project, HGP)roject, HGP)
人类基因组计划 (human genome project, HGP) 是由美国科学家于 1985 年率先提出,于 1990 年正式启动的。总体计划在 15 年内投入至少 30 亿美元进行人类全基因组的分析。
美国、英国、法兰西共和国、德意志联邦共和国、日本和我国科学家共同参与。
我国承担其中 1% 的任务,即人类 3 号染色体短臂上约 30 亿个碱基的测序任务。
人类基因组
线粒体基因组核基因组 ( 约 30 亿个碱基 )
基因外序列基因和基因有关序列约 10% 约 90%
专一或中等重复序列
Non-coding DNA
假基因 内含子基因片段
<10% >90%
专一的或低拷贝数序列 中度至高度重复序列
20~30%70~80%
分散重复序列串联重复序列 /成簇重复序列
约 60% 约 40%
蛋白编码基因
rRNA基因
tRNA基因
Coding DNA
序列测定的技术
杂交测序法 质谱法 单分子测序法 原子探针显微镜测序法DNA 芯片法
经典方法 :
Sanger 双脱氧链终止法 (Sanger,1977)
Maxam-Gilbert DNA 化学降解法 (Maxam &Gilbert,1977)
新技术方法 :
• 与 与 PCRPCR 反应类似。反应类似。
• 反应体系中包含:模板 反应体系中包含:模板 DNA,DNA, Taq Taq 酶酶 , dNTPs, ddNTPs, dNTPs, ddNTPs 和和测序引物;测序引物;
• 反应过程:反应过程: 变性-复性-延伸-终止变性-复性-延伸-终止
Sanger 双脱氧终止法
DideoxynucleotidesDideoxynucleotides(双脱氧核苷酸)(双脱氧核苷酸)
• ddNTPs ddNTPs 是反应终止剂是反应终止剂
可以当作正常碱基参与复制,可以当作正常碱基参与复制,一旦链入一旦链入 DNADNA 中,中,其后就不能再继续连接。其后就不能再继续连接。
• 反应体系中反应体系中 dNTPsdNTPs 的浓度远高于的浓度远高于 ddNTPs(ddNTPs( 一般一般 33
~4 ~4 :: 1)1) 。。
*少一个- OH少一个- OH
脱氧核甘酸
与
双脱氧核甘酸
结构比较
H
SangerSanger 第一步:加入复制终止第一步:加入复制终止剂剂
荧光检测探头
电泳,看谁跑得
快
ddNTPsddNTPs 参与下的参与下的 DNADNA 复制复制SangerSanger 法测序产物的平法测序产物的平
均链长取决于均链长取决于 ddNTPddNTP与与 dNTPdNTP 的比例,比例的比例,比例高时,得到较短的产物;高时,得到较短的产物;
Gel ElectrophoresisGel Electrophoresis DNA Fragment Size DeterminationDNA Fragment Size Determination
• DNA DNA 带负电带负电
• DNADNA 在电泳胶中的迁移率在电泳胶中的迁移率与其片段大小有关与其片段大小有关
SangerSanger 第二步:荧光检测第二步:荧光检测
除核苷酸序列文本文件外,全自动测序仪还提供曲线图。
Maxam-GilbertMaxam-Gilbert 化学裂解法化学裂解法
一个末端标记的一个末端标记的 DNADNA 片段在几组互相独立的的化学反片段在几组互相独立的的化学反应分别得到部分降解,其中每一组反应特异地针对应分别得到部分降解,其中每一组反应特异地针对某一种或某一类碱基。因此生成一系列放射性标记某一种或某一类碱基。因此生成一系列放射性标记的分子,从共同起点(放射性标记末端)延续到发的分子,从共同起点(放射性标记末端)延续到发生化学降解的位点。每组混合物中均含有长短不一生化学降解的位点。每组混合物中均含有长短不一的的 DNADNA 分子,其长度取决于该组反应所针对的碱基分子,其长度取决于该组反应所针对的碱基在原在原 DNADNA 全片段上的位置。此后,各组均通过聚丙全片段上的位置。此后,各组均通过聚丙烯酰胺凝胶电泳进行分离,再通过放射自显影来检烯酰胺凝胶电泳进行分离,再通过放射自显影来检测末端标记的分子。测末端标记的分子。
碱基特异性化学切割反应:碱基特异性化学切割反应: 硫酸二甲酯(硫酸二甲酯( DMS DMS ):使):使 DNADNA 分子中分子中
鸟嘌呤(鸟嘌呤( GG )上的)上的 NN77 原子甲基化。原子甲基化。 肼:使肼:使 DNADNA 分子中胸腺嘧啶(分子中胸腺嘧啶( TT )和胞)和胞
嘧啶(嘧啶( CC )的嘧啶环断裂;但高盐条件)的嘧啶环断裂;但高盐条件下,只下,只 CC 断裂,而不与断裂,而不与 TT 反应。反应。
哌啶:从修饰甲基处断裂核苷酸链。哌啶:从修饰甲基处断裂核苷酸链。
在不同的酸、碱、高盐和低盐条件下,在不同的酸、碱、高盐和低盐条件下,三种化学试剂按不同组合可以特异地切三种化学试剂按不同组合可以特异地切割核苷酸序列中特定的碱基。割核苷酸序列中特定的碱基。
GG 反应:反应: DMSDMS 使使 GG 在中性和高温条件在中性和高温条件下脱落。下脱落。
G+AG+A 反应:酸性条件(如甲酸)可使反应:酸性条件(如甲酸)可使 AA和和 GG 嘌呤环上的嘌呤环上的 NN 原子质子化,利用哌原子质子化,利用哌啶使啶使 AA 、、 GG 脱落。脱落。
T+CT+C 反应:肼(低盐)反应:肼(低盐) CC 反应:肼(高盐)反应:肼(高盐)
测定测定 DNADNA 长度长度 ~250bp~250bp 。。
化学裂解法测定 DNA 的核苷酸序列
DNADNA 片断序列测定的策略片断序列测定的策略
测定未知序列的测定未知序列的 DNADNA 片断片断 一次测序结果有长度限制(﹤一次测序结果有长度限制(﹤ 1000bp)1000bp)
通用引物指导未知序列的测定通用引物指导未知序列的测定 引物步移引物步移 随机克隆测序随机克隆测序 缺失克隆测序缺失克隆测序
通用引物指导未知序列的测定通用引物指导未知序列的测定
根据载体序列设计通用引物测定待测 DNA 片断
引物步移策略引物步移策略将待测将待测 DNADNA 片断克隆在质粒载体上,利用引物步移延伸,从片断克隆在质粒载体上,利用引物步移延伸,从
DNADNA 片断的一端开始逐步进行序列测定,直至另一端为止。片断的一端开始逐步进行序列测定,直至另一端为止。
克服了鸟枪法的盲目性,并省去亚克隆制备步骤,也减轻了数克服了鸟枪法的盲目性,并省去亚克隆制备步骤,也减轻了数
据分析工作量。据分析工作量。
但由于测定下一段序列前要预先知道上游序列的碱基顺序,才但由于测定下一段序列前要预先知道上游序列的碱基顺序,才
能合成适当的引物进行测序。能合成适当的引物进行测序。
定向缺失克隆策略、染色体步查法等。定向缺失克隆策略、染色体步查法等。
鸟枪测序法鸟枪测序法 (shotgun sequencing)(shotgun sequencing):随机:随机克隆测序克隆测序
将待测的将待测的 DNADNA 片段随机打断片段随机打断并构建随机重叠并构建随机重叠克隆文库克隆文库,然后通过,然后通过通用引物测定通用引物测定每个克隆中的每个克隆中的待测待测 DNADNA 序列。当这些已测序列的数量达到一序列。当这些已测序列的数量达到一定程度后,相当于待测定程度后,相当于待测 DNADNA 片断的每一部位的片断的每一部位的序列也就被测定出来了,通过这些所测序列之间序列也就被测定出来了,通过这些所测序列之间的的重叠部分重叠部分,最终可将整个,最终可将整个 DNADNA 片断的序列拼片断的序列拼接出来,这样的测序策略称为随机克隆测序。接出来,这样的测序策略称为随机克隆测序。
将将 DNADNA 大片段切割成小片段的三种方法:大片段切割成小片段的三种方法: 限制性内切酶酶切限制性内切酶酶切 超声波处理超声波处理 DNADNA 酶酶 II降解降解 (( 加加 MnMn2+2+))
鸟枪法测序的缺点鸟枪法测序的缺点
随着所测基因组总量增大,所需测序的片段大量随着所测基因组总量增大,所需测序的片段大量增加,造成重复测定,也易丢失某些序列,且数增加,造成重复测定,也易丢失某些序列,且数据处理分析工作量大。据处理分析工作量大。
高等真核生物(如人类)基因组中有大量重复序高等真核生物(如人类)基因组中有大量重复序列,导致判断失误。列,导致判断失误。
完整基因组的测序过程一般包括三个步骤:完整基因组的测序过程一般包括三个步骤:
(( 11 )建立克隆的物理图谱:如酵母人工染色体)建立克隆的物理图谱:如酵母人工染色体 YACYAC (( Yeast Yeast
Artificial ChromosomeArtificial Chromosome)克隆、细菌人工染色体)克隆、细菌人工染色体 BACBAC (( BacBac
terial Artificial Chromosometerial Artificial Chromosome)克隆等;)克隆等;
(( 22 )利用鸟枪法()利用鸟枪法( Shotgun StrategyShotgun Strategy )测定每个克隆的序)测定每个克隆的序
列;列;
(( 33 )序列拼装和注释:当得到一段)序列拼装和注释:当得到一段 DNADNA 序列之后,可以利用序列之后,可以利用
序列分析工具,进行序列的拼接;继而通过与数据库序列的比序列分析工具,进行序列的拼接;继而通过与数据库序列的比
较,得到与该序列相关的信息,如基因、调控元件、重复区域较,得到与该序列相关的信息,如基因、调控元件、重复区域
等,进而对序列的生物学特性进行注释。等,进而对序列的生物学特性进行注释。
基因组测序基因组测序
DNA 全序列
切成小段
小段和载体结合
结合后进行测序
Map fragments
Sequence overlappingfragments
Assembledsequence
基因组 DNA 序列测定示意图
通过随机剪切得到的大分子 DNA 片段克隆到载体上。绘制出这些重叠片段的图谱,并对重叠片段进行测序,通过“拼装”得到基因组序列。另一种方法不是根据片段的染色体位置,而是根据其重叠部分进行“拼装”。
Sequence all fragments and assemble
第四章作业:Southern 、 Northern 、 Western 杂交、生物芯片技术、 RNAi 技术原理分别是什么?
第五章作业: PCR克隆与一般的 DNA 片段的克隆有何异同点?
第六章作业: 1 Sanger 双脱氧终止法化学降解法进行序列分析的原理是什么 ?
第七章作业: 1 DNA 诱变种类有哪些,各有何特点?