Počítačová část
description
Transcript of Počítačová část
![Page 1: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/1.jpg)
Počítačová část1. Databáze na internetu:
(Databáze, navržení primerů)
2. Fylogenetická analýza
![Page 2: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/2.jpg)
Kde se dozvědět více?
• Kurz Computational Genomics(Marc VanRanst)Bioinformatics bookmarks(http://www.kuleuven.ac.be/rega/mvr/bioinformatics.htm)
• Úvod do bioinformatiky/Základy bioinformatiky(F. Cvrčková)
• Molekulární ekologie(letní semestr, populační genetika, analýza paternity)
![Page 3: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/3.jpg)
Kde najdu adresy stránek z tohoto praktika?
(http://www.natur.cuni.cz/~muncling)
![Page 4: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/4.jpg)
DATABÁZE
Primární databáze DNA sekvencí
GenBank (Amerika) EMBL (Evropa) DDBJ (Japonsko)
Databáze genů
Entrez GeneRefSeq
Databáze genových expresních dat
UniGeneGEO
Databáze genomů
NCBIEnsemblUCSC Genome Browser
Důležité odkazy
PROGRAMY
BLASTNa stránkách NCBI, Ensembl
BLATNa stránkách USCS
Primer3 – navrhování primerů
In Silico PCR
RepeatMasker
NCBI - http://www.ncbi.nlm.nih.gov/ tam najdu skoro vše: GenBank, Entrez Gene, UniGene, MapViewer, BLAST…
ENSEMBL - http://www.ensembl.org/Genome Browser, BLAST
USCS – http://genome.ucsc.edu/Genome Browser, BLAT, In Silico PCR
![Page 5: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/5.jpg)
Formáty sekvencí
• Fasta
• GenBank
• NEXUS
• Phylip
![Page 6: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/6.jpg)
FASTA
>gi|gi-number|gb|accession|locus – description
GATCCTCCATATACAACGGTATCTCCACCTCAGGTTTAGATCTCAACAACGGAACCATTGCCGACATGAGACAGTTAGGTATCGTCGAGAGTTACAAGCTAAAACGAGCAGTAGTCAGCTCTGCATCTGAAGCCGCTGAAGTTCTACTAAGGGTGGATAACATCATCCGTGCAAGACCAAGAACCGCCAATAGACAACATATGTAACATATTTAGGATATACCTCGAAAATAATAAACCGCCACACTGTCATTATTATAATTAGAAACAGAACGCAAAAATTATCCACTATATAATTCAAAGACGCGAAAAAAAAAGAACAACGCGTCATAGAACTTTTGGCAATTCGCGTCACAAATAAATTTTGGCAACTTATGTTTCCTCTTCGAGCAGTACTCGAGCCCTGTCTCAAGAATGTAATAATACCCATCGTAGGTATGGTTAAAGATAGCATCTCCACAACCTCAAAGCTCCTTGCCGAGAGTCGCCCTCCTTTGTCGAGTAATTTTCACTTTTCATATGAGAACTTATTTTCTTATTCTTTACTCTCACATCCTGTAG
![Page 7: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/7.jpg)
GenBank• Obsahuje velmi podrobnou informaci o sekvenci:
Locus Základní vlastnosti sekvence (název, délka, typ)
Definition Výpis genů v sekvenci
Accession Databázové přístupové číslo
Version Verze dané sekvence
Keywords Pod kterými klíčovými slovy ji lze najít
Source organism Zařazení v systému
Reference Článek, kde byla daná sekvence publikována
Features Podrobný popis jednotlivých genů včetně jejich pozic
Origin Sekvence
![Page 8: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/8.jpg)
Sekvence v genetické bance• Jsou známy nějaké sekvence mamuta (nejlépe
cytochrom b)?
• Z jakého druhu mamuta jsou známé sekvence?
• Sekvence si chci stáhnout a porovnat
Využijeme:
1. genetickou banku na stránkách NCBI (National Centre for Biotechnology Information)
http://www.ncbi.nlm.nih.gov/
2. Volně dostupný program BioEdit
http://www.mbio.ncsu.edu/BioEdit/bioedit.html
![Page 9: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/9.jpg)
Alignment
• Přiřazení dvou i více sekvencí
Sekvence si navzájem odpovídají
Sekvence se liší
Sekvence chybí
![Page 10: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/10.jpg)
• Pairwise Alignment (2 sekvence)– Globální:
• Zhruba stejně dlouhé sekvence
• Snaží se přiřadit od začátku až do konce sekvence
– Lokální:• Jen nejlépe shodující se místa obou sekvencí
• Sekvence různě dlouhé
Např. BioEdit http://www.ebi.ac.uk/http://www.bioinformatics.org/sms2/index.html
http://en.wikipedia.org/wiki/Sequence_alignment
![Page 11: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/11.jpg)
• Multiple Alignment– Více sekvencí– Hledá konzervativní místa– ClustalW
Např. BioEdit,http://www.ebi.ac.uk/,http://www.bioinformatics.org/sms2/index.html
http://en.wikipedia.org/wiki/Multiple_sequence_alignment
![Page 12: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/12.jpg)
Příklad
• Zkuste provést alignment stažených sekvencí mamutů
• V programu BioEdit lze použít možnost:Accessory Applications – ClustalW Multiple Alignment
![Page 13: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/13.jpg)
Čemu je tato sekvence podobná?
BLASTBasic Local Alignment SearchTool
===========================================
• Hledá lokální (částečné) podobnosti• Na rozdíl od klasického alignmentu, umožňuje velmi
rychle a efektivně prohledávat velké databáze
![Page 14: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/14.jpg)
Úloha
• Vyhledejte sekvence nejpodobnější cytochromu b mamuta
• Použijeme BLAST na stránkách NCBI - http://www.ncbi.nlm.nih.gov/
![Page 15: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/15.jpg)
BLAST - Úloha ze života
• Sekvenuji mamuty
• Jedna ze sekvencí se mi nějak nezdáctagccatgc actactcacc agacgcctca accgcctttt catcaatcgc ccacatcact cgagacgtaa attatggctg aatcatccgc taccttcacg ccaatggcgc ctcaatattc tttatctgcc tcttcctaca catcgggcga ggcctatatt acggatcatt tctctactca gaaacctgaa acatcggcat tatcctcctg cttgcaacta tagcaacagc cttcataggc tatgtcctcc cgtgaggaca aatatcattc tga
• V laboratoři se pracuje i s jinými zvířaty
• Chci zjistit, kdo mi zkontaminoval vzorky
![Page 16: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/16.jpg)
![Page 17: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/17.jpg)
Navržení vlastních primerů pro PCR
![Page 18: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/18.jpg)
http://www.repeatmasker.org/
RepeatMasker
• Umožní vyhledat a „zakrýt“ oblasti, které jsou v genomu ve větším počtu (mikrosatelity, retrotranspozony a transpozony)
• Umožní nám to při navrhování primerů se vyvarovat nespecifickým amplifikacím při PCR
• Pouze ale organismy, které jsou již osekvenovány
![Page 19: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/19.jpg)
Zamaskovaná sekvence
• Pomocí N nebo použitím malých písmen (většina programů určených pro analýzu sekvencí s nimi umí pracovat)
>MusY.1ACACTTTTTCTTTTGCATAATGCTGTGTGGAGATTTTGCAGACAGCATTGCTGTAAAATGCAGAGTAATTTCTGTAATGAGCTTGTGAAATATTGACTATTATGGCCCTCTCTAAGCATGGCTTTAATTATATTCTAGCACAGCAGCTTCTCTGGGGATACTCAGGTCAGATCACTGACTGAATGTTGTGTTCATTTGAAACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGTCATTTGTTGGTGTGCTGAATTCTGTTTTGTTTTGCTTTTAACCTAACTAGCTAGAAATTCTGTCAATCTTTTTTCCTTCCTAGAAAGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGAAACACAGGCTTT
![Page 20: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/20.jpg)
Primer3, Primer3Plus
http://primer3.sourceforge.net/
![Page 21: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/21.jpg)
TGCG{CGCTAAGA<CTCCT>AA[CACACACACA]CGGAATTAGGGAAC}TT
Included RegionTargetExcluded Region
![Page 22: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/22.jpg)
Maskování repeatů
Koncentrace Mg2+ Koncentrace dNTPs
Rozestup primerů => délka amplifikované oblasti
![Page 23: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/23.jpg)
Elektronická PCR
• Vezme dvojici primerů a zkouší, zda-li by PCR ve známém genomu amplifikovala pouze námi požadovanou oblast nebo i jiné oblasti
• Server UCSC (http://www.genome.ucsc.edu/)
• Lze i na NCBI
![Page 24: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/24.jpg)
Úloha:
• Zjistěte zda-li se nachází v sekvencích mikrosatelity
• Zamaskujte je pomocí Repeatmaskeru
• Navrhněte kolem nich primery v Primer3
• Zjistěte, které z těchto primerů jsou dále použitelné pomocí e-PCR
![Page 25: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/25.jpg)
Vyhledání restrikčních míst
• WebCutter
• http://rna.lundberg.gu.se/cutter2/
![Page 26: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/26.jpg)
Příklad• Castor fiber • Castor canadensis
• Je známa sekvence cytochromu b (Kuehn at al. 2000)
• V mrazáku mám enzym RsaI (GT/AC)• Lze použít pro rychlé rozlišení druhů?
• Postup: • Stažení sekvencí z genetické banky• Vyhledání restrikčních míst pro RsaI• Navržení primerů
• V praxi bychom samozřejmě výsledky ověřili sekvenováním.
![Page 27: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/27.jpg)
Celé genomy
![Page 28: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/28.jpg)
MAPY:
Cytogenetická(proužky)
Genetická(cM)
Fyzická (Mb, sekvence, složeno z menších úseků - contig)
![Page 29: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/29.jpg)
Příklad:
• Zjistěte přesnou pozici genu pro TLR1 u orangutana a zjistěte, zda se v jeho okolí vyskytují další TLR geny.
![Page 30: Počítačová část](https://reader036.fdocument.pub/reader036/viewer/2022062409/568145ef550346895db2f554/html5/thumbnails/30.jpg)
Samostatná úloha
• Stáhnout sekvenci cytochromu b alky velké(Pinguinus impennis), tak aby před začátkem i koncem sekvence cyt b byly dostatečně dlouhé oblasti na navrhnutí primerů
• Navrhnout primery na vybranou část sekvence
• Vyhledat podobné sekvence přes BLAST nebo prověřit příbuzné druhy
• Udělat alignment sekvencí sekvencí cytochromu b