Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos...
description
Transcript of Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos...
![Page 1: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/1.jpg)
Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos
empregados
Almir R. Pepato
![Page 2: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/2.jpg)
O problemaPara cada conjunto de terminais podemos imaginar um número de hipóteses filogenéticas expressas por árvores não-enraizadas, definido pela fórmula:
Os métodos de inferência filogenéticas são os que permitem a escolha, dentre todas essas hipóteses, daquela que consideramos a que melhor representa as relações de ancestralidade dentre os terminais em consideração.
![Page 3: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/3.jpg)
Representando filogenias
Árvore não enraizada
Ramos:
N= (2i-3)= 7
Número de árvores não enraizadas:
Cada árvore que antecede a árvore com i terminais possui 2i-5 ramos, assim ela produz :
Árvores. Exemplo:
![Page 4: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/4.jpg)
Representando filogeniasÁrvores enraizadas:
Apresentam informação temporal.
Há muito mais, já que podemos inserir a raiz em qualquer nó.
No exemplo:
![Page 5: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/5.jpg)
Representando filogenias
(((A, B), (C, D)), E);
Bipartições ou splits
![Page 6: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/6.jpg)
Representando filogenias
L1
L4
L7
L6
L5
L6
L1
L3
L2
L5
L4
L3
L2
L7
L8
Árvore aditiva: A distância entre qualquer par de OTUs é a soma dos comprimentos de ramo que as separam.Comprimentos de ramos estimados de maneira independente. Portanto devem ser calculados N= (2i-3)= 7Ramos.
Árvore ultramétrica: Todas as OTU equidistantes da raiz. Ramos a serem calculados: (i-1)=4Pois: L1=L2+L4+L8 L4+L8 = L3+L5 L5 = L6 L7=L8
![Page 7: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/7.jpg)
Número de clados
Enraizada Não-enraizada
2 1 13 3 14 15 35 105 156 954 1057 10,395 9548 135,135 10,3959 2,027,025 135,13510 34,459,425 2,027,025
O problema
![Page 8: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/8.jpg)
Métodos de inferência
A- Algoritmos- Uma série de passos que conduzem à árvore filogenética.
A1-Análises de agrupamento (UPGMA)A2- Neighbour Joining
B- Critérios de Otimização – Emprega uma função objetiva para comparar as hipóteses filogenéticas.
B1- Máxima ParcimôniaB2- Máxima VerossimilhançaB3- Evolução MínimaB4- Mínimos Quadrados
C- Inferência Bayesiana - Avalia a probabilidade posterior dos clados formados pelos terminais sob consideração.
![Page 9: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/9.jpg)
Parcimônia
De forma independente, Luca Cavalli-Sforza e Anthony Edwards em 1963 e Camin e Sokal em 1965 chegaram a parcimônia como critério para otimização de cladogramas em caso de conflito entre caracteres (homoplasia)
William de Ockham (1288-1347 ou 1348)“entia non sunt multiplicanda praeter necessitatem”
![Page 10: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/10.jpg)
Parcimônia
Função objetiva da parcimônia:
![Page 11: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/11.jpg)
Parcimônia
![Page 12: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/12.jpg)
Parcimônia de Fitch
Premissas: Caracteres não polarizados e não ordenados. Todas as mudanças de caráter com o mesmo custo.
1- Para cada terminal atribua um estado de caráter conforme a matriz à sua disposição. Estabeleça arbitrariamente uma raiz (ela não muda o comprimento da árvore).
C
A
GC
A
![Page 13: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/13.jpg)
Parcimônia de Fitch
C
A
G
C
A
Visite um nó interno para o qual se conhece o conjunto de caracteres Sk para os dois descendentes (Si, Sj) imediatos. Assinale a ele um conjunto de valores Sk conforme as regras:
A- Se então , nesse caso deve-se acrescentar 1 ao comprimento da árvore;
B- Se então nesse caso não se acrescenta nada ao comprimento da árvore.
Comprimento: 3
X
Y
Z
1
1
0W 1
![Page 14: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/14.jpg)
Generalizando... Parcimônia de Sankoff
A C G T
A 0 1 1 1
C 1 0 1 1
G 1 1 0 1
T 1 1 1 0
Parcimônia de Fitch
A B C D
A 0 1 2 3
B 1 0 1 2
C 2 1 0 1
D 3 2 1 0
Parcimônia de Wagner, caracteres ordenados:A-B-C-D
A B C D
A 0
B 1 0
C 2 1 0
D 3 2 1 0
Parcimônia de Dollo, caracteres ordenados:A-B-C-D
As matrizes de Sankoff permitem que o procedimento apresentado para a parcimônia de Fitch seja generalizado para outras situações.
![Page 15: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/15.jpg)
Generalizando... Parcimônia de Sankoff
![Page 16: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/16.jpg)
Métodos de distânciaAlgorítmos de agrupamento (não otimizam uma função):
1-UPGMA (Árvores ultramétricas)2-Neighbour Joining3- Neighbourliness4- “Transformed distance method”
Evolução Mínima:
Otimiza a função (busca a árvore que oferece a melhor nota):
![Page 17: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/17.jpg)
UPGMAOTU A B C DAB dAB
C dAC dBC
D dAD DBD DCD
OTU (AB) C D(AB)C d(AB)C
D d(AB)D dCD
A raiz é posta em:
![Page 18: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/18.jpg)
Transformed distance method
OTU A B CAB 10/3C 13/3 13/3
![Page 19: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/19.jpg)
“Relação de vizinhança”
Dada uma árvore aditiva, vale a condição dos quatro pontos:
d(a,c) + d(b,d) < d(a,b) + d(c,d) = d(a,d) + d(b,c)
3.7+3.2 < 2.9+5.6 = 3.9+4.6
6.9 < 8.5 = 8.5
![Page 20: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/20.jpg)
Neighbor-JoiningPasso a passo:
1- Começamos com uma matriz de distância relacionando n OTUs.2- Uma nova matriz é calculada (Matriz Q). Nessa matriz a separação de cada par de
terminais é ajustada com base na sua divergência média desde todos os outros terminais.
3- Agrupe dois terminais ao acaso:
![Page 21: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/21.jpg)
Neighbor-Joining
4- Calcule o comprimento da árvore sabendo que:
Distância do par de membros ao novo nó: Distância dos demais OTUs ao novo nó:
![Page 22: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/22.jpg)
Neighbor-Joining
5- Determine o comprimento para todas as combinações de duas OTUs. Escolha a que minimiza o comprimento da árvore.
6- Recalcule a matriz de distâncias de considerando os dois terminais escolhidos como um único táxon.
7- Repita o processo até obter uma árvore completamente resolvida.
![Page 23: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/23.jpg)
Neighbor-Joining
![Page 24: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/24.jpg)
Mínimos Quadrados
![Page 25: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/25.jpg)
Mínimos QuadradosOTU A B C DAB dAB
C dAC dBC
D dAD DBD DCD
![Page 26: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/26.jpg)
Algoritmos de busca
A
B C
1
2a
Árvore inicial, três espécies ao acaso.
A
B DC
A
BD C
A
B CD
2b 2c
E
E
EE
E
Adiciona-se o próximo táxon (D) (três árvores):
Adiciona-se o quinto táxon(E) (15 árvores)....
E
E
E E
E
E
E
EE
E
EE
Impraticável para um número maior de terminais!!!!!
![Page 27: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/27.jpg)
Stepwise addition
A
B C
1
2a
Árvore inicial, três espécies ao acaso.
A
B DC
A
BD C
A
B CD
2b 2c
Adiciona-se o próximo táxon (D) (três árvores):
Escolhe-se a melhor árvore e adiciona-se o quinto táxon(E) (5 árvores)....
E
E
E E
A ordem em que são acrescidos os terminais determina o resultado da busca.
E
![Page 28: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/28.jpg)
Star-tree decomposition
A ordem em que são agrupados os terminais determina o resultado da busca. Mais lento que o anterior: as árvores tem sempre o mesmo número de terminais.
![Page 29: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/29.jpg)
Nearest-neighbor interchanges (NNI)
![Page 30: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/30.jpg)
Subtree pruning and regrafting (SPR)
![Page 31: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/31.jpg)
Tree bisection and reconnection (TBR)
![Page 32: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/32.jpg)
Algoritmos de Busca
![Page 33: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/33.jpg)
Novas TecnologiasRatchet:
Desenhado para maximizar o número de pontos iniciais e reduzir o tempo gasto na procura a partir de cada ponto inicial e assim examinar mais ilhas de árvores. Perturba os dados mudando o peso a eles atribuído.
Tree fusing (TF):
Troca de sub-grupos idênticos entre árvores diferentes.
Sectorial Seaches (SS):Tipo especial de avaliação de rearranjo, que necessita de uma árvore como ponto inicial. Seleciona diferentes setores da árvore e os re-analisa separadamente. Se uma configuração melhor é encontrada, ela é substituída na árvore inicial.
![Page 34: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/34.jpg)
Novas Tecnologias
Tree Drifting (DFT): Soluções sub-ótimas são aceitas durante o rearranjo, com uma certa probabilidade. A probabilidade de aceitar uma solução sub-ótima depende da Relative Fit Difference (RFD) e a diferença de comprimento entre a nova e a velha solução.
RFDAB = (F–C)/F
F = Soma das diferenças de passosnas duas árvores (A e B) quemelhor ajusta (fit) a árvore A
C = Soma dos caracteres quemelhor ajustam (fit) a árvore B
![Page 35: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/35.jpg)
ÍndicesÍndice de consistência (CI)- É a medida de quão bem um caráter ajusta-se a uma topologia. É calculado dividindo-se o menor número possível de passos do caráter pelo número de passos observados ao longo da topologia. Ou então é uma medida de homoplasia de uma árvore, sendo dado por:
CI = Número total de mudanças de estado esperado dada a matriz de dados X 100/ Número de passos na árvore
CI= 6*100/7 = 85,7
![Page 36: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/36.jpg)
Índices
![Page 37: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/37.jpg)
ÍndicesÍndice de retenção (RI):
RI = Número máximo de passos na árvore – número de mudanças de estado na árvore X 100/número máximo de passos na árvore – número de mudanças de estado nos dados
![Page 38: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/38.jpg)
SuporteBootstrap
![Page 39: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/39.jpg)
SuporteBootstrap
![Page 40: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/40.jpg)
Suporte
Suporte de Bremer:
Quanta homoplasia é necessária para derrubar um clado?
Ex: A menor árvore que NÃO tem o clado (A C) é dois passos mais longa que a árvore apresentada.
![Page 41: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/41.jpg)
Problemas com a Parcimônia
![Page 42: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/42.jpg)
Qual método empregar?
Huelsenbeck et al., 1996
![Page 43: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/43.jpg)
Qual método empregar?
Huelsenbeck et al., 1996
![Page 44: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/44.jpg)
O uso da distância para inferência filogenética
1- Há perda de informação com a conversão da matriz de caracteres em matriz de distâncias.
2- O comprimento dos ramos de uma árvore de distância não são independentes, mas calculados em relação aos demais. Assim mesmo que as distâncias sejam corrigidas com o emprego de modelos estocásticos, elas serão sub-estimativas. Qualquer “problema” relacionado a um dos ramos (mudança na frequência das bases, ramo especialmente longo) será propagado ao longo de toda a filogenia.
![Page 45: Revisão de conceitos relacionados à inferência filogenética. Visão geral dos métodos empregados](https://reader036.fdocument.pub/reader036/viewer/2022062501/56816585550346895dd831e0/html5/thumbnails/45.jpg)
Substituições multiplasDistância genética p difere da distância aparente D, devido às substituições múltiplas.