Seleção de modelos de substituição de nucleotídeos II
Transcript of Seleção de modelos de substituição de nucleotídeos II
![Page 1: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/1.jpg)
1
Seleção de modelos de substituição de nucleotídeos − II
1. Testes (hierárquicos) da razão das verossimilhanças [hLRT]
2. Critério de informação
3. Enfoque Bayesiano
Objetivos: Compreender como escolher entre diferentes modelos de substituição que competem entre si para explicar os dados de sequências alinhadas.
![Page 2: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/2.jpg)
2
Seleção de modelos de substituição II
1. Teste da razão das verossimilhanças
345
![Page 3: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/3.jpg)
3
10.1 Modelos de evolução e reconstrução filogenética
Inferência estatística: processo pelo qual conclusões são tiradas de dados que estão sujeitos a variação aleatória, por exemplo, erros de observação ou erros de amostragem. 345
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 4: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/4.jpg)
4
tij etp α4
41
41)( −−=t
ii etp α4
43
41)( −+=
Probabilidades de substituição no modelo de Jukes−Cantor
A G
TC
α
α
αα αα
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 5: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/5.jpg)
5
A G
TC
α
α
ββ ββ
TGCA ππππ ===
A G
TC
α
α
αα αα
TGCA ππππ ===1 2 3 4
3451. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 6: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/6.jpg)
6
10.2 Ajuste de modelos
3471. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 7: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/7.jpg)
7
• Testes (hierárquicos) da razão das verossimilhanças [hLRT]
• Critério de informação
• Bayesiano
Enfoques para a seleção de modelos de evolução
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 8: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/8.jpg)
),,,( ντθMDPL ∝347
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 9: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/9.jpg)
Sequência 1 — A A T C G A G C C A T A G C G
Sequência 2 — A A C A G A C A C A G T C C G
Sequência n — A A C A G A C A C A G T C C G
M
Dados, amostra − alinhamento
L ∝ P(D⏐M,θ,τ,ν)
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 10: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/10.jpg)
A G
TC
Modelo de evolução
L ∝ P(D⏐M,θ,τ,ν)
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 11: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/11.jpg)
11
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
=
ãosubstituiç de taxas nas variaçãoosnucleotíde entre ãosubstituiç de taxas
osnucleotíde de sfrequênciaotransversã:transiçãorazão
θ
Vetor de parâmetros do modelo de evolução
L ∝ P(D⏐M,θ,τ,ν)
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 12: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/12.jpg)
12
1 2 3 4
Topologia da árvore
L ∝ P(D⏐M,θ,τ,ν)
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 13: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/13.jpg)
13
Vetor de comprimento dos ramos
1 2 3 4
ν1 ν2
ν3 ν4 ν5 ν6
⎟⎟⎟⎟⎟
⎠
⎞
⎜⎜⎜⎜⎜
⎝
⎛
=
iν
νν
νM2
1
L ∝ P(D⏐M,θ,τ,ν)
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 14: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/14.jpg)
14
10.3 Testes (hierárquicos) da razão das verossimilhanças [hLRT ]
3481. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 15: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/15.jpg)
15
( ) ( )⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢
⎣
⎡
−+⎥⎥⎥
⎦
⎤
⎢⎢⎢
⎣
⎡
+= −−
434214434421ijii p
t
p
t eeL αα 44 1161ln731
161ln8ln
Função de verossimilhança
αt — número esperado de substituições por sítio
ln L
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 16: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/16.jpg)
16
Estatística do teste da razão
das verossimilhanças
Λ− log201 loglog2 LL −
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 17: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/17.jpg)
17
86,7675log 0 −=L
Peixe
Rã Humano
Pássaro
Rato
A G
TC
α
α
αα αα
TGCA ππππ ===
Peixe
Rã Humano
Pássaro
Rato
α
α
αα αα
A G
TC
TGCA ππππ ≠≠≠
08,7667log 1 −=L
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 18: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/18.jpg)
18348
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 19: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/19.jpg)
19348
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 20: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/20.jpg)
20
• Estatística do teste da razão das
verossimilhanças, −2 log Λ, pode ser
comparada à distribuição χ2 com 3
graus de liberdade
−2 log Λ = 17,56 > valor crítico = 7,18
Hipótese alternativa explica os dados
significativamente melhor que a
hipótese nula
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 21: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/21.jpg)
21
• Testes (hierárquicos) da razão das verossimilhanças [hLRT]
– Comparação de dois modelos
– Modelos hierárquicos
1. Teste da razão das verossimilhanças
Seleção de modelos de substituição II
![Page 22: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/22.jpg)
22
1. Testes (hierárquicos) da razão das verossimilhanças [hLRT]
2. Critério de informação
3. Enfoque Bayesiano
Seleção de modelos de substituição de nucleotídeos − II
![Page 23: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/23.jpg)
23
10.4 Critério de informação
3492. Critério de informação
Seleção de modelos de substituição II
![Page 24: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/24.jpg)
24
• Critério de informação de
Akaike
– Medida da distância entre o
modelo verdadeiro e o modelo
estimado
KlAIC 22 +−=2. Critério de informação
Seleção de modelos de substituição II
![Page 25: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/25.jpg)
25351
2. Critério de informação
Seleção de modelos de substituição II
![Page 26: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/26.jpg)
26
1)1(2
−−+
+=KnKKAICAICc
3512. Critério de informação
Seleção de modelos de substituição II
![Page 27: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/27.jpg)
27
• Critério de informação
– Comparação simultânea de todos os modelos
– Comparação de modelos hierárquicos e não-hierárquicos
2. Critério de informação
Seleção de modelos de substituição II
![Page 28: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/28.jpg)
28
1. Testes (hierárquicos) da razão das verossimilhanças [hLRT]
2. Critério de informação
3. Enfoque Bayesiano
Seleção de modelos de substituição de nucleotídeos − II
![Page 29: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/29.jpg)
29
10.5 Enfoque Bayesiano
)(
)(
j
iij MDP
MDPB =
3. Enfoque Bayesiano
351
Seleção de modelos de substituição II
![Page 30: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/30.jpg)
30
αt — número esperado de substituições por sítio
ln L
)(
)(
j
iij MDP
MDPB =
3. Enfoque Bayesiano
351
Seleção de modelos de substituição II
![Page 31: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/31.jpg)
313. Enfoque Bayesiano
351
Seleção de modelos de substituição II
![Page 32: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/32.jpg)
323. Enfoque Bayesiano
351
Seleção de modelos de substituição II
![Page 33: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/33.jpg)
333. Enfoque Bayesiano
351
Seleção de modelos de substituição II
![Page 34: Seleção de modelos de substituição de nucleotídeos II](https://reader036.fdocument.pub/reader036/viewer/2022081603/62c05b02f4c81e07c968a9fd/html5/thumbnails/34.jpg)
34
1. Testes (hierárquicos) da razão das verossimilhanças [hLRT]
2. Critério de informação
3. Enfoque Bayesiano
Seleção de modelos de substituição de nucleotídeos − II