Что такое K a , K n , K s , d N , d S ?

26
Что такое K a , K n , K s , d N , d S ? Екатерина Ермакова Алматы, апрель 2006

description

Что такое K a , K n , K s , d N , d S ?. Екатерина Ермакова Алматы, апрель 2006. K a , K n , K s , d N , d S : этимология. K  constant d  distance S, s  synonymous N, n  nonsynonymous a  amino acid altering. - PowerPoint PPT Presentation

Transcript of Что такое K a , K n , K s , d N , d S ?

Page 1: Что такое  K a , K n , K s , d N , d S ?

Что такое Ka, Kn, Ks, dN, dS?

Екатерина Ермакова

Алматы, апрель 2006

Page 2: Что такое  K a , K n , K s , d N , d S ?

Ka, Kn, Ks, dN, dS : этимология

K constant

d distance

S, s synonymous

N, n nonsynonymous

a amino acid altering

Page 3: Что такое  K a , K n , K s , d N , d S ?

• альтернативный сплайсинг• вторичная структура РНК• структура белков• сайты связывания• …

Нуклеотидные замены в кодирующих областях генов распределены неравномерно. Нуклеотидные сайты испытывают различную функциональную нагрузку:

Page 4: Что такое  K a , K n , K s , d N , d S ?

Типичная задача

Сравнить скорость и паттерн эволюции нескольких групп кодирующих участков генома, например:

• постоянно и альтернативно сплайсируемые участки

• гены, экспрессируемые в сердце и гены, экспрессируемые в пятках

Page 5: Что такое  K a , K n , K s , d N , d S ?

Точечные замены в кодирующей области

синонимичные несинонимичные

полезные

нейтральные

вредные

Page 6: Что такое  K a , K n , K s , d N , d S ?

Универсальный генетический код

  T C A G  

 T

TTT Phe TCT Ser TAT Tyr TGT Cys T

TTC Phe TCC Ser TAC Tyr TGC Cys C

TTA Leu TCA Ser TAA Стоп TGA Стоп A

TTG Leu TCG Ser TAG Стоп TGG Trp G

 C

CTT Leu CCT Pro CAT His CGT Arg T

CTC Leu CCC Pro CAC His CGC Arg C

CTA Leu CCA Pro CAA Gln CGA Arg A

CTG Leu CCG Pro CAG Gln CGG Arg G

 A

ATT Ile ACT Thr AAT Asn AGT Ser T

ATC Ile ACC Thr AAC Asn AGC Ser C

ATA Ile ACA Thr AAA Lys AGA Arg A

ATG Met ACG Thr AAG Lys AGG Arg G

 G

GTT Val GCT Ala GAT Asp GGT Gly T

GTC Val GCC Ala GAC Asp GGC Gly C

GTA Val GCA Ala GAA Glu GGA Gly A

GTG Val GCG Ala GAG Glu GGG Gly G

Page 7: Что такое  K a , K n , K s , d N , d S ?

Что такое dN и dS?

dS (dN) — это число (не)синонимичных замен, фиксировавшихся в кодирующей последовательности в процессе эволюции, поделенное на суммарный (не)синонимичный потенциал последовательности.

Это функции двух моментов времени (t0,t), но существующие методы позволяют оценить эти функции только если t «сейчас», а t0 — момент расхождения двух ортологов или дупликация.

Page 8: Что такое  K a , K n , K s , d N , d S ?

А остальные?

Ka = Kn = dN

Ks = dS

ω = dN/dS = Ka/Ks = Kn/Ks

ω не зависит от времени, это отношение скоростей

Page 9: Что такое  K a , K n , K s , d N , d S ?

Нейтральные замены: на что делим?

Не все нуклеотидные замены в геноме нейтральны.

Чтобы извлекать информацию из количества «активных» замен, нужно нормировать их количество на «фоновый уровень» нейтральных замен.

Какие замены считаются нейтральными - это параметр эволюционной модели.

Нуклеотидные замены, которые на практике считают нейтральными:

• замены в некодирующих участках: интронах, межгенных областях, в т.ч. псевдогенах и повторах;

• синонимичные замены в кодирующих областях.

Page 10: Что такое  K a , K n , K s , d N , d S ?

dN/dS = ω

μ — фоновый уровень мутаций

ρ — давление отбора на уровне РНК

ω — давление отбора на уровне белка

dN = ωρμdS = ρμ

Page 11: Что такое  K a , K n , K s , d N , d S ?

dN/dS критерий: отбор на уровне аминокислотной последовательности

• dN/dS < 0 отрицательный отбор

• dN/dS = 0 нейтральная эволюция

• dN/dS > 0 положительный отбор

Page 12: Что такое  K a , K n , K s , d N , d S ?

«Жадные» (parsymony) оценки dN и dS

Основанные на эволюционных путях:• Nei & Gojobori 1986 (однопараметрическая модель)

• Ina 1995 (двупараметрическая модель)

Page 13: Что такое  K a , K n , K s , d N , d S ?

«Жадные» (parsymony) оценки dN и dS

Основанные на учёте вырожденности позиций в кодонах:• Pamilo - Bianchi - Lee 1993 • Comeron 1995

ATT Ile ACT Thr AAT Asn

ATC Ile ACC Thr AAC Asn

ATA Ile ACA Thr AAA Lys

ATG Met ACG Thr AAG Lys

Третья позиция кодона ATG невырождена,

AAA — 2-вырождена, ATA — 3-вырождена, ACA — 4-вырождена

Page 14: Что такое  K a , K n , K s , d N , d S ?

«Наиболее правдоподобные» (maximum likelyhood) оценки dN и dS

Yang & Nielsen 2000

PAML (http://abacus.gene.ucl.ac.uk/software/paml.html)

Единица эволюции — кодон.

Page 15: Что такое  K a , K n , K s , d N , d S ?

Метод Ины (Ina 1995)

• простой, но основную «асимметрию» учитывает

• быстро работает на длинных выравниваниях, позволяет делать bootstrap и оценивать точность

• допускает усовершенствования

Page 16: Что такое  K a , K n , K s , d N , d S ?

Метод Ины: подготовка выравнивания

• выравниваем две достаточно длинных кодирующих нуклеотидных последовательности (≥ 300 п.н.)

• кодоны с делециями выбрасываем

Page 17: Что такое  K a , K n , K s , d N , d S ?

Метод Ины: допущения

• рассматриваемые последовательности ортологи или паралоги из одного организма

• с момента расхождения организмов (для ортологов) или с момента дупликации (для паралогов) две рассматриваемые последовательности эволюционировали с одинаковой скоростью

Page 18: Что такое  K a , K n , K s , d N , d S ?

Метод Ины: (не)синонимичный потенциал

Каждая позиция нетерминального кодона обладает синонимичным потенциалом s и несинонимичным потенциалом n, s+n=1. В общем случае (не)синонимичный потенциал позиции в кодоне — это вероятность получить (не)синонимичную замену кодона мутацией нуклеотида в этой позиции. Если замена основания в одной из позиций кодона (при прочих фиксированных) приводит к несинонимичной замене кодона, эта позиция называется несинонимичной, для неё s=0, n=1. Если же любая замена основания в данной позиции приводит к синонимичной замене кодона, эта позиция называется синонимичной, для неё s=1, n=0.

Page 19: Что такое  K a , K n , K s , d N , d S ?

Метод Ины: двупараметрическая модель эволюции (Kimura)

— скорость транзиций

— скорость трансверсий

R = /

Page 20: Что такое  K a , K n , K s , d N , d S ?

Метод Ины: s и n могут быть выражены через R

Page 21: Что такое  K a , K n , K s , d N , d S ?

Метод Ины: число нуклеотидных различий между кодонами

Page 22: Что такое  K a , K n , K s , d N , d S ?

Метод Ины: оценивание dN, dS и ω

S* — среднее арифметическое суммарных синонимичных потенциалов выравненных последовательностей

STs* — количество транзиций, наблюдаемых в выравнивании

STv* — количество наблюдаемых трансверсий

Наблюдаемые частоты синонимичных различий — транзиций и трансверсий — в синонимичных позициях:

PS* = STs

*/S* QS* = STv

*/S*

Оценка dS* для dS получается применением к PS

* и QS* поправки Кимуры

на множественные замены:

dS* = –1/2 ln(1 – 2 PS

* – QS*) – 1/4 ln(1 –2 QS

*)

Оценка dN* для dN строится аналогично.

Параметр ω оценивается как dN*/dS

*.

Page 23: Что такое  K a , K n , K s , d N , d S ?

Метод Ины: оценивание R = /

R = 2 ln(1 – 2 P3* – Q3

*) / ln(1 –2 Q3*) – 1

P3* и Q3

* — наблюдаемые частоты транзиций и трансверсий в третьих позициях кодонов

выравнивания

Page 24: Что такое  K a , K n , K s , d N , d S ?

Нуклеотидные замены в постоянных и альтернативных участках альтернативно сплайсируемых генов человека и мыши

dNУчастки кодирующей области:

C — постоянные

A — альтернативные

AN — N-концевые альтернативные

AI — внутренние альтернативные

AC — С-концевые альтернативные

Слева — гены разделены на 3 равные группы по скорости

Справа — все альтернативно сплайсируемые гены (3029 штук)

Page 25: Что такое  K a , K n , K s , d N , d S ?

Нуклеотидные замены в постоянных и альтернативных участках альтернативно сплайсируемых генов человека и мыши

dS

Page 26: Что такое  K a , K n , K s , d N , d S ?

Нуклеотидные замены в постоянных и альтернативных участках альтернативно сплайсируемых генов человека и мыши

ω