Molekul ární ekologie

Molekulární ekologie

Molekulární data

Molekulární data

Debata mezi„classical and balanced schools“

dospěla k potvrzení vysoké úrovně polymorfismu a následně

formulování neutrální teorie –

dobrá zpráva, bude dost znaků…

Molekulární data

Debata mezi„classical and balanced schools“

dospěla k potvrzení vysoké úrovně polymorfismu a následně

formulování neutrální teorie –

dobrá zpráva, bude dost znaků…

….ještě bude zajímavé, jaké množství variability bude

ukryto na další úrovni, tedy v DNA…

Molekulární data

Molekulární data

Lidský genom:cca 3,4 Gb

např. 30 bialelických markerů = 330 možných

genotypů

Molekulární data

unikátní „idiosynkratické“

znaky

multigenové a multilokusové informace

sekvence celých genů, velké množství kompletních mt genomů

Molekulární data

Molekulární data

• Nejčastěji využívané sekvence:• 16S rDNA• gen pro COI• gen pro cytochrom b• control region (D-loop)

• Velké množství kompletních sekvencí v Genbank NCBI - mitogenomika

• jediný matrilineárně předávaný lokus

• Nerekombinující - ???

• Rychlá molekulární evoluce

Molekulární ekologie

D-loop sekvence47 odlišných haplotypů

Microcebus murinus(Maki trpasličí)

Molekulární data

• Heteroplasmy

• Paternal leakage

• Recombination

Molekulární data

mitochondriální bottleneck

heteroplasmiedůsledek vysoké mutační rychlosti, ve velkých populacích a parental leakage.

Molekulární data

Rekombinace ve 14% z 279 testovaných souborů

mtDNA u živočichů

Molekulární data

heteroplasmie

Molekulární data

A co mitochondriální Eva?

Molekulární data

Potenciálně obrovské množství informace. Jak vybrat tu správnou a jak ji získat?

Molekulární data

Nejdříve trochu terminologie

• Kódující vs. nekódující DNA

• Bialelické vs. multialelické znaky (markery)

• Dominantní vs. kodominantní markery

• Ortologní vs. paralogní geny

• Exon vs. intron

• Haplotypy

Molekulární data

Ideální marker:

• Početný a rozšířený přes celý genom

• S dobře prostudovanými vlastnostmi molekulární evoluce

• Data přenosná a porovnatelná mezi a studiemi (laboratořemi)

• Technicky (a finančně) dostupný i pro velké vzorky (populace).

• ……a musejí být selekčně neutrální??

• Problém modelový vs. nemodelový organismus

Molekulární data

Vznik nových mutací,gene trees

(μ)

změny frekvencí alel(drift, Ne)

Molekulární data

Vznik nových mutací,gene trees

(μ)

gene treesvs.

organism tree

Potřeba většího množství informace z různých částí genomu

alignment (matice)

problém homologie

Molekulární data

orthology paralogy

„proužkové“ homologie

5’ – GAATCATCCGGACCAGGCTTA --------- AAGATTTCGCCGTGTAATTAACA – 3’

TGTTAATTACACGGCG

3’ - CTTAGTAGGCCTGGTCCGAAT --------- TTCTAAAGCGGCACATTAATTGT - 5’

5’ 3’

3’ 5’

forward

reverse

Molekulární data

Většina současných metod získávání molekulárních dat je nějakým způsobem závislá na PCR a tedy kvalitě primerů.

Molekulární data

Molekulární data

http://www.usask.ca/agriculture/plantsci/classes/plsc416/projects_2002/pawlin/resources/PlSc416.html

Molekulární data

S rostoucím počtem markerů se zvyšuje přesnost analýz. Ale! : zároveň klesá míra jejich nezávislosti….!

3.0 Gb 35mer

500Mb300-500bphigher error rate for homopolymers>2.0 Gb

35 bp reads

Molekulární data

Nuclear Protein Coding Loci (NPCL)• Vysoce konzervované v důsledku funkčního konstraintu. • Obvykle je k dispozici kompletní anotace umožňující identifikovat paralogy a ortology, popřípadě repetitivní elementy. • Vzácné ztráty a získávání těchto genů v genomech. • Při vzrůstajícím počtu kompletních genomů se zjednodušuje příprava a testování primerů.

Ale mohou být pod silnou selekcí.

Exon-primed Intron-crossing (EPIC) Markers• Dostatečně variablní avšak umožňující postavení konzervativních („univerzálních“) primerů. • Typicky introny s přilehlými konzervativními sekvencemi exonů. Markery nazývané Comparative anchor tagged sequences (CATS), Traced orthologous amplified sequence tags (TOASTs) a sequence-tagged sites (STS).

Anonymous Nuclear Markers (ANMs)• Obvykle náhodné úseky genomu, většinou nekódující. • Vysoká substituční rychlost a tedy většinou značná variabilita.

Ale obvykle nedostatečně anotované – nejistota z hlediska paralogů, množství kopií, atd. Často se také „trefí“ do různých repetitivních sekvencí, například SINE, LINE.

Molekulární data

nuclearprotein coding

Exon-primed Intron-crossing

Anonymous Nuclear Markers

Molekulární data

Molekulární data

• Obtížná detekce a příprava primerů (druhově specifické) – pro některé taxony velmi obtížná

• Problém nulových alel

• Mutační rychlost – homoplasie

opakování 1-6 bp motivu (v kódujících sekvencích nejčastěji 3 a 6)není náhodným seskupením nukleotidů – příliš frekventovanéobvykle považované za neutrální markerymultialelické, kodominantní – vysoká rozlišovací schopnost

nebo také simple sequence repeats (SSR), variable number tandem repeats (VNTR), short tandem repeats (STR).

flanking region

• Druhově specifické – nehrozí kontaminace jinou DNA

• Krátké – lze využít i degradovanou DNA popřípadě DNA ze srsti apod. (neinvazivní metoda)

Molekulární data

homoplasy

detectableundetectable

ATA TATATATATAT

Molekulární data

Detekce a izolace mikrosatelitů pro nový druh

Existují mikrosatelity pro blízký druh? (obvykle ale dojde ke snížení diverzity a problémům s „ascertainment bias“

komerční služba

• Izolace DNA• Vytvoření knihovny

• Separace fragmentů s repeat sequences

• Sekvenování fragmentů, identifikace a statistické vyhodnocení mikrosatelitů

ATATATAT – magnetická sonda

linker PCR s primery speciickými pro linker

linker ATATATAT

Molekulární data


Existují mikrosatelity pro blízký druh? (obvykle ale dojde ke snížení diverzity a problémům s „ascertainment bias“

komerční služba

Molekulární data


S přibývajícím množstvím dat v GenBank se objevila možnost vyhledávání vhodných mikrosatelitů in silico (EST databáze)

• Není příliš znám mutační proces – problém s některými typy statistického zpracování:

• Obdoba FST pro mikrosatelity, RST, je parametr závislý na modelu

Molekul ární ekologie

Documents

Transcript of Molekul ární ekologie