Molekul ární ekologie
description
Transcript of Molekul ární ekologie
Molekulární ekologie
Molekulární data
Molekulární data
Molekulární data
Molekulární data
Molekulární data
Molekulární data
Debata mezi„classical and balanced schools“
dospěla k potvrzení vysoké úrovně polymorfismu a následně
formulování neutrální teorie –
dobrá zpráva, bude dost znaků…
Molekulární data
Debata mezi„classical and balanced schools“
dospěla k potvrzení vysoké úrovně polymorfismu a následně
formulování neutrální teorie –
dobrá zpráva, bude dost znaků…
….ještě bude zajímavé, jaké množství variability bude
ukryto na další úrovni, tedy v DNA…
Molekulární data
Molekulární data
Lidský genom:cca 3,4 Gb
např. 30 bialelických markerů = 330 možných
genotypů
Molekulární data
Molekulární data
unikátní „idiosynkratické“
znaky
multigenové a multilokusové informace
sekvence celých genů, velké množství kompletních mt genomů
Molekulární data
Molekulární data
• Nejčastěji využívané sekvence:• 16S rDNA• gen pro COI• gen pro cytochrom b• control region (D-loop)
• Velké množství kompletních sekvencí v Genbank NCBI - mitogenomika
• jediný matrilineárně předávaný lokus
• Nerekombinující - ???
• Rychlá molekulární evoluce
Molekulární ekologie
D-loop sekvence47 odlišných haplotypů
Microcebus murinus(Maki trpasličí)
Molekulární data
• Heteroplasmy
• Paternal leakage
• Recombination
Molekulární data
mitochondriální bottleneck
heteroplasmiedůsledek vysoké mutační rychlosti, ve velkých populacích a parental leakage.
Molekulární data
Rekombinace ve 14% z 279 testovaných souborů
mtDNA u živočichů
Molekulární data
heteroplasmie
Molekulární data
A co mitochondriální Eva?
Molekulární data
Potenciálně obrovské množství informace. Jak vybrat tu správnou a jak ji získat?
Molekulární data
Nejdříve trochu terminologie
• Kódující vs. nekódující DNA
• Bialelické vs. multialelické znaky (markery)
• Dominantní vs. kodominantní markery
• Ortologní vs. paralogní geny
• Exon vs. intron
• Haplotypy
Molekulární data
Ideální marker:
• Početný a rozšířený přes celý genom
• S dobře prostudovanými vlastnostmi molekulární evoluce
• Data přenosná a porovnatelná mezi a studiemi (laboratořemi)
• Technicky (a finančně) dostupný i pro velké vzorky (populace).
• ……a musejí být selekčně neutrální??
• Problém modelový vs. nemodelový organismus
Molekulární data
Vznik nových mutací,gene trees
(μ)
změny frekvencí alel(drift, Ne)
Molekulární data
Vznik nových mutací,gene trees
(μ)
gene treesvs.
organism tree
Potřeba většího množství informace z různých částí genomu
alignment (matice)
problém homologie
Molekulární data
orthology paralogy
„proužkové“ homologie
5’ – GAATCATCCGGACCAGGCTTA --------- AAGATTTCGCCGTGTAATTAACA – 3’
TGTTAATTACACGGCG
3’ - CTTAGTAGGCCTGGTCCGAAT --------- TTCTAAAGCGGCACATTAATTGT - 5’
5’ 3’
3’ 5’
forward
reverse
Molekulární data
Většina současných metod získávání molekulárních dat je nějakým způsobem závislá na PCR a tedy kvalitě primerů.
Molekulární data
Molekulární data
Molekulární data
S rostoucím počtem markerů se zvyšuje přesnost analýz. Ale! : zároveň klesá míra jejich nezávislosti….!
3.0 Gb 35mer
500Mb300-500bphigher error rate for homopolymers>2.0 Gb
35 bp reads
Molekulární data
Nuclear Protein Coding Loci (NPCL)• Vysoce konzervované v důsledku funkčního konstraintu. • Obvykle je k dispozici kompletní anotace umožňující identifikovat paralogy a ortology, popřípadě repetitivní elementy. • Vzácné ztráty a získávání těchto genů v genomech. • Při vzrůstajícím počtu kompletních genomů se zjednodušuje příprava a testování primerů.
Ale mohou být pod silnou selekcí.
Exon-primed Intron-crossing (EPIC) Markers• Dostatečně variablní avšak umožňující postavení konzervativních („univerzálních“) primerů. • Typicky introny s přilehlými konzervativními sekvencemi exonů. Markery nazývané Comparative anchor tagged sequences (CATS), Traced orthologous amplified sequence tags (TOASTs) a sequence-tagged sites (STS).
Anonymous Nuclear Markers (ANMs)• Obvykle náhodné úseky genomu, většinou nekódující. • Vysoká substituční rychlost a tedy většinou značná variabilita.
Ale obvykle nedostatečně anotované – nejistota z hlediska paralogů, množství kopií, atd. Často se také „trefí“ do různých repetitivních sekvencí, například SINE, LINE.
Molekulární data
nuclearprotein coding
Exon-primed Intron-crossing
Anonymous Nuclear Markers
Molekulární data
Molekulární data
Molekulární data
Molekulární data
Molekulární data
Molekulární data
• Obtížná detekce a příprava primerů (druhově specifické) – pro některé taxony velmi obtížná
• Problém nulových alel
• Mutační rychlost – homoplasie
opakování 1-6 bp motivu (v kódujících sekvencích nejčastěji 3 a 6)není náhodným seskupením nukleotidů – příliš frekventovanéobvykle považované za neutrální markerymultialelické, kodominantní – vysoká rozlišovací schopnost
nebo také simple sequence repeats (SSR), variable number tandem repeats (VNTR), short tandem repeats (STR).
flanking region
• Druhově specifické – nehrozí kontaminace jinou DNA
• Krátké – lze využít i degradovanou DNA popřípadě DNA ze srsti apod. (neinvazivní metoda)
Molekulární data
homoplasy
detectableundetectable
ATA TATATATATAT
Molekulární data
Detekce a izolace mikrosatelitů pro nový druh
Existují mikrosatelity pro blízký druh? (obvykle ale dojde ke snížení diverzity a problémům s „ascertainment bias“
komerční služba
• Izolace DNA• Vytvoření knihovny
• Separace fragmentů s repeat sequences
• Sekvenování fragmentů, identifikace a statistické vyhodnocení mikrosatelitů
ATATATAT – magnetická sonda
linker PCR s primery speciickými pro linker
linker ATATATAT
Molekulární data
Detekce a izolace mikrosatelitů pro nový druh
Existují mikrosatelity pro blízký druh? (obvykle ale dojde ke snížení diverzity a problémům s „ascertainment bias“
komerční služba
Molekulární data
Detekce a izolace mikrosatelitů pro nový druh
S přibývajícím množstvím dat v GenBank se objevila možnost vyhledávání vhodných mikrosatelitů in silico (EST databáze)
• Není příliš znám mutační proces – problém s některými typy statistického zpracování:
• Obdoba FST pro mikrosatelity, RST, je parametr závislý na modelu