Einführung in Microarray Genexpressionsdaten
Ewgenij ProschakYusuf Tanrikulu
Seminar: Aktuelle Themen der Bioinformatik13.05.2004
Organizer: Prof. Dr. D. MetzlerTutor: Lin Himmelmann
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
2
Ablauf
13.05.2004 Einführung in Microarray Genexpressionsdaten
20.05.2004 Feiertag
27.05.2004 Varianzstabilisierung der Genexpressionsdaten
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
3
Inhalt
EinleitungDurchführung eines Microarray-
ExperimentsAuslesen der DatenVisualisierungWeiterverarbeitungMustererkennung
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
4
Einleitung
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
5
Einleitung
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
6
Einleitung
Prof. Dr. Wolfgang Huber Gen-
Transkriptionsanalyse mit DNA Microarrays
Statistical Computing Computational Biology
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
7
Durchführung eines Microarray-Experiments
Zutaten: cDNA Unterlage mRNA
Ergebnis
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
8
Durchführung eines Microarray-Experiments
Flashanimation
DVD
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
9
Auslesen der Daten
Laser- oder Betastrahlendetektor
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
10
Auslesen der Daten – Batcheffekte
Verfälschungen des Experimentergebnisses: Spotting PCR Amplifikation Probenaufbereitung RNA-Abbau Array-Beschichtung
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
11
Visualisierung
Wieso?
Frühzeitige Erkennung von Experimentierfehlern und Hintergrundrauschen
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
12
Visualisierung-Falschfarbenrepräsentation
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
13
Visualisierung – Histogramm
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
14
Visualisierung –Scatterplot
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
15
Wieterverarbeitung-Maße für die Genexpression
Aussagen über absolute Genexpression nicht möglich
Gründe: RNA-Stabilität Hybridisierung PCA
Ausweg:
Ratios Log-Ratios
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
16
Weiterverarbeitung-Exkurs
Heteroskedastizität Varianz nicht konstant
Homoskedastizität Varianz konstant
Nächstes Mal
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
17
Weiterverarbeitung
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
18
Mustererkennung-Methoden
Projektionsmethoden Hauptkomponentenanalyse SOMs
Clusteralghorithmen Hierarchisches Clustering
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
19
Mustererkennung-Hauptkomponentenanalyse
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
20
Mustererkennung-Hauptkomponentenanalyse
Projektion des Datensatzes auf die Hauptkomponenten
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
21
Mustererkennung-Hauptkomponentenanalyse
Aufstellen der Covarianzmatrix
Finden der Eigenvektoren
Projektion des Datensatzes auf die Eigenvektoren mit den größten Eigenwerten
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
22
Mustererkennung-Hauptkomponentenanalyse
Ergebnisse (Alter et al. 2000):
Eigenvektor mit dem größten Eigenwert: Hintergrundrauschen kann herausgefiltert werden
Danach Projektion auf die beiden nachfolgenden Eigenvektoren periodische Funktion von der Zeit repräsentiert den Zellzyklus
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
23
Mustererkennung-Self Organizing Maps
X
Z
Y
SOM
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
24
Mustererkennung-Self Organizing Maps
Algorithmus:
1. Zufälliges Aussuchen eines Musters
2. Ermitteln des Gewinnerneurons
3. Aktualisieren der Neuronengewichte
4. Zurück zu 1 oder terminieren
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
25
Mustererkennung-Self Organizing Maps
LernzeitVoronoi-Verteilung
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
26
Mustererkennung-Clusteralgorithmen
Basiert auf globaler Ähnlichkeitsmessung
Ziel: Aus den Genexpressionsdaten auf funktionelle
Verwandschaft oder Coregulation zu schließen.
Annahme: Gene, die gemeinsame Eigenschaften
aufweisen, haben ähnliche Expressionsprofile.
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
27
Mustererkennung-Hierarchisches Clustern
Top-downBottom up
13.05.2004 Einführung in Mictoarray Genexpressionsdaten
28
Mustererkennung-Hierarchisches Clustern
Anwendungsbeispiel:
CAGE
Ewgenij Proschak
To be continued…
Yusuf Tanrikulu
Top Related