Inst. Cavanilles de biodiversidad y biología evolutiva ...
Transcript of Inst. Cavanilles de biodiversidad y biología evolutiva ...
Inst. Cavanilles de biodiversidad y biología evolutiva
Genética EvolutivaIÑAKI COMAS, ANDRÉS MOYA,
FERNANDO GONZÁLEZ-CANDELAS
Filogenia de especies
Métodos filogenómicos
Filogenética vs. Filogenómica
Bfl proteoma
583 prot.
árbol guía
BLAST<21 homólogos21 homólogos
árbol génicoconcatenados árbol génico
ÁRBOL SPP. CONSENSO FILOMA SUPERÁRBOL
Rprα-proteob.Rickettsia prowazekii
Rsoβ-proteob.Ralstonia solanacearum
NmeMβ-proteob.Neisseria meningitidis MC58
NmeZβ-proteob.Neisseria meningitidis Z2491
Styγ-proteob.Salmonella enterica subsp. enterica serovar Typhi
StyLγ-proteob.Salmonella typhimurium LT2
Vchγ-proteob.Vibrio cholerae
Wbrγ-proteob.Wigglesworthia glossinidia brevipalpis
Xcaγ-proteob.Xanthomonas axonopodis pv. citri str. 306
Xciγ-proteob.Xanthomonas campestris pv. campestris str. ATCC 33913
Xfaγ-proteob.Xylella fastidiosa
Ypeγ-proteob.Yersinia pestis KIM
Pmuγ-proteob.Pasteurella multocida
Paeγ-proteob.Pseudomonas aeruginosa
γ-proteob.
γ-proteob.
γ-proteob.
γ-proteob.
γ-proteob.
γ-proteob.
γ-proteob.
HinHaemophilus influenzae Rd
EcoOEscherichia coli O157:H7 EDL933
EcoK12Escherichia coli K12
BapAPSBuchnera sp. APS
BapSgBuchnera aphidicola str. Sg (Schizaphisgraminum)
BapbpiBuchnera aphidicola (Baizongia pistaciae)
BflBlochmannia floridanusGENOMASANOTADAS: 579
DESCONOCIDAS: 4
ÁRBOL DE ESPECIES GUÍA
0.1
RprXfa
XcaXci
PaeVch
HinPmuYpeStyStyL
EcoK12EcoO
WbrBfl
BapbpiBapSg
BapAPSNmeM
Rso
100/1.0
96/1.0
96/1.0
98/1.098/1.0
79/1.0
66/1.0
98/1.0
100/1.0
100/1.0
100/1.0
94/1.0
100/1.0
98/1.0
100/1.0
100/1.0
99/1.0
Xanthomonadales
Pseudomonadales
Vibrionales
Pasteurellales
Enterobacteriales
Rickettsiales
Burkholderiales
Neisseriales
α−PROTEOBAC
100/1.0
γ−PROTEOBAC
β−PROTEOBAC
NmeZ
Concatenado de 60 genes relacionados con la traducción: 8067 aa.
JTT + F + 8G. +INV.
Nm
eM
Nm
eZ
Rso
BapSg
BapAPS
Bapbpi
Wbr
Bfl
Ype
EcoK12EcoO
Sty
StyL
Hin
Pmu
Vch
Pae
Xfa
Xca
Xci
Rpr
Rso
BapbpiW
brYpePm
uVc
h
Pae
Xfa
Rpr
Bfl579 prot.
1º BLAST
mejor hit de cada
representante
2º BLAST
resto de spp. de cada grupo
Nm
eM
Nm
eZ
Rso
BapSg
BapAPS
Bapbpi
Wbr
Bfl
Ype
EcoK12EcoO
Sty
StyL
Hin
Pmu
Vch
Pae
Xfa
Xca
Xci
Rpr
set1
set2set3
set4
set5
set6
set7
set8
set9
Bfl579 prot.
1º BLAST
mejor hit de cada
set2º BLAST
resto de spp. de cada set
Obtención secuencias Alineamiento de las secuencias sin selección previa
Obtención filogenia
2º
3º
1º
ANÁLISIS DEL INFORME DE BLAST
ANÁLISIS DE ANOTACIÓN
ANÁLISIS DE ALINEAMIENTO
ANÁLISIS DE FILOGENIA
ANÁLISIS DE CLUSTERS EN
MICROBIAL GENOME DATABASE
4º Post-análisis:
PROTEOMA Blochmannia floridanus
0
10
20
30
40
50
60
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
379
GENES
200
GENES COMUNES
Gen2
sp1
sp2
sp3
sp4
Gen3
sp1
sp2
sp3
sp4
Concat
sp1
sp2
sp3
sp4
Gen1
sp1
sp2
sp3
sp4
Árbol Gen1
Árbol Gen2
Árbol Gen3
concatenadosconsensos
1 11 3 2
StyL
Sty
EcoO
EcoK12
Bf l
Wbr
BapAPS
BapSg
Ype
Vch
Pmu
Hin
NmeZ
NmeM
Rso
Pae
Xfa
Xci
Xca
0 .1
EcoK12
EcoO
StyL
Sty
Ype
Wbr
Bfl rpoC
Bapbpi
BapAPS
BapSg
Pmu
Hin
Vch
Pae
Xfa
Xci
Xca
Rso
NmeZ
NmeM
Rpr
0 .1
Árboles de genes obtenidos por ML
de PHYML (JTT+8G+F+Inv)
Número insuficiente de sitios informativos
Transferencia génica horizontal
Variabilidad de las tasas de evolución entre linajes
Otras “fuerzas” evolutivas
200 GENES
COMUNES
60
AZAR
CONCATENADO+
TREE-PUZZLE
X
100
RprXfaXca
100
100
PaeVchPmuHin
100
YpeEcoK12EcoO
100
StyLSty100
100
100
BapbpiBapAPS
BapSg100
100
Bfl
Wbr95
100
100
83
100
81
Monofilia
endosimbiontes
Xci
98
RsoNmeMNmeZ100
100
Problemas
Xanthomonadales
Árboles de concatenados
obtenidos por ML de TREEPUZZLE
(JTT+8G+F+INV)
Bfl
579 prot.200 árboles
génicos
21 SPP.
379 árboles
génicos
4-20 SPP.
CONSENSO
TRADICIONALSUPERÁRBOL
Método de consenso que combina la información de múltiples árboles para
construir un único árbol
F B G D
DBACF G E
T1T3
T2
T1 + T2 + T3 = SUPERÁRBOL
F C B D E
F C A B D
Rpr
Vch
Bapbpi
BapSg
BapAPS
Wbr
BflYpe
EcoO
EcoK12
StyL
StyPmu
Hin
Pae
Xfa
Xca
Xci
Rso
NmeZ
NmeM
48
61,5
8857,5
4233
6390,5
90,589
21,5
96,5
34,590
9324,5
67,597,5
CONSENSO
BapAPS
BapSg
Bapbpi
Bfl
WbrYpeEcoK12
EcoO
StyL
Sty
PmuHin
VchPae
Xca
Xci
Xfa
Rso
NmeZ
NmeM
Rpr
100
100100
100
100
100100
100
100
100
99
100
100100
86100
100
100
SUPERÁRBOL
PROGRAMA CLANN (algoritmo MRP)
PROGRAMA CONSENSE (PHYLIP)
CONCATENADO 200 GENES: 52029 AA.
SUPERÁRBOL: 579 ÁRBOLES GÉNICOS
EcoK12EcoOStyStyLYpeBflWbr
BapbpiBapAPSBapSgHinPmuVchPaeXfaXcaXciRso
NmeMNmeZ
RprMRPEcoK12
EcoOSty
StyLYpeBfl
WbrBapbpi
BapAPS
BapSgHinPmuVchPaeXfaXca
XciRsoNmeM
NmeZ
Rpr
100/100/87
100/58/81
100/100/100100/100/99
100/100/100
100/100/100
100/100/100100/100/100
100/100/100
100/100/100
100/78/88100/100/98
100/100/94
100/100/88
100/100/69
100/100/95
100/100/90
100/100/80
PHYML/PAUP/TP
100
100
100100
100100
100100
100100
10097
100
100100
100100
!¡
APLICACIÓNVENTAJAPROBLEMAMÉTODO
COMBINACIÓN DE ÁRBOLES DE MÚLTIPLES FUENTES
GENERACIÓN DE GRANDES ÁRBOLES FILOGENÉTICOS
NO NECESITA DE GENES PRESENTES EN TODAS LAS ESPECIES
RELACIÓN INDIRECTA CON LAS SECUENCIAS
SUPERÁRBOLES
INFERENCIA DEL ÁRBOL DE ESPECIES
ALTA EFICACIA
ALTO SOPORTE
GENES PRESENTES EN TODAS LAS ESPECIES
MODELO DE EVOLUCIÓN ÚNICO
CONCATENACIÓN
ANÁLISIS DEL PARECIDO DE LOS ÁRBOLES
RESUMEN FRECUENCIA DE GRUPOS
DETECCIÓN DE ZONAS CONFLICTIVAS
GENES PRESENTES EN TODAS LAS ESPECIES
RELACIÓN INDIRECTA CON LAS SECUENCIAS
CONSENSOÁRBOLESGÉNICOS
EVALUACIONES INICIALESRAPIDEZ
BAJA EFICACIA43 / 579 =7.4 %
ÁRBOLESGÉNICOS