Слайд 2
Особенности молекулярной эволюции
1. Скорость эволюции любого белка, выраженная
через число аминокислотных замен на сайт в год, приблизительно
постоянна и одинакова в разных филогенетических линиях, если только функция и третичная структура этого белка остаются в основном неизменными.
Слайд 3
Что такое филогенетические деревья?
Дерево — это граф, в
котором два соседних узла соединены только одним ребром.
Слайд 4
Кладограммы и филограммы
Кладограммы отражают только порядок ветвления, филограммы
— ещё и длину ветвей
Слайд 5
Сколько здесь разных кладограмм?
a
b
c
d
e
a
e
c
d
b
a
b
c
e
d
b
a
c
d
e
Слайд 6
Выбор последовательностей
Последовательности должны быть гомологичны! Программа выровняет любые
последовательности => нужно проверить с помощью Blast
Затем нужно выровнять
последовательности, и по получившемуся выравниванию, определить, какие последовательности включить в анализ
Слайд 7
«Эффект тыквенного пирога»
Рецепт тыквенного пирога на филогенетическом дереве
креветок.
Слайд 9
Особенности молекулярной эволюции
2. Функционально менее важные молекулы или
их части эволюционируют (накапливая эволюционные замены) быстрее, чем более
важные
3. Мутационные замены, приводящие к меньшим нарушениям структуры и функции молекулы (консервативные замены), в ходе эволюции происходят чаще тех, которые вызывают существенное нарушение структуры и функции этой молекулы
Слайд 10
Различия между деревом генов и деревом видов
Проблема: ортологи
и паралоги
Слайд 12
Филогенетические маркёры
Свойства:
Гены, которые представлены одной копией в
геноме лучше, чем те, у которых множество копий.
Длина гена
не должна варьировать у разных организмов
Скорость изменения гена должна соответствовать скорости эволюции таксонов заданного уровня
Должны легко подбираться специфические праймеры
Слайд 14
Филогенетические маркёры
Рибосомальные гены
Митохондриальные гены (COI/II, 12s RNA,
cyt b)
Хлоропластные гены
Гены домашнего хозяйства и некоторые другие ядерные
Слайд 15
Выбор модели замен
Результаты вычисления эволюционных дистанций будут отличаться
в зависимости от выбранной модели замен
Слайд 16
Выбор модели замен
AIC — Akaike’s Information Criterion. Быстрее
BIC
— Bayesian information criteria. Не «любит» более сложные модели
DT
— decision theory
LRT — тест соотношения вероятностей. «Любит» более сложные модели.
Слайд 19
Дистанционные методы
Neghbor-joining
Начинаем с пары ветвей, которые меньше всего
отличаются между собой
Слайд 20
Дистанционные методы
Neghbor-joining
Слайд 21
Дистанционные методы
Neghbor-joining
Слайд 22
Зачем нужна аутгруппа
Молекулярно-филогенетические методы используют информацию о последовательностях
внешней группы (контроля), дистанция от которой для всех остальных
последовательностей заведомо выше, чем от других.
Таким образом дерево «укореняется», а также внутри дерева убирается «шум»
Слайд 23
Дистанционные методы
Neghbor-joining
Не учитываются обратные и параллельные замены
=> Мы
считаем не настоящую дистанцию (расстояние), а редакционное расстояние.
Вычислительно более
быстрые.
В большинстве случаев оценивают только топологию дерева, не воспроизводя исходную последовательность.
Если у нас будет бесконечная последовательность, то мы с вероятностью 100% получим истинное дерево.
Слайд 24
Методы максимальной экономии
Минимизация числа замен символов
Всегда реконструируют предковые
последовательности
Лучше работает на
небольших наборах
последовательностей
во многих случаях
на больших
объёмах
данных работает хуже.
Слайд 25
Методы максимальной экономии
B
C
A
B
C
A
B
C
A
B
C
A
D
D
D
B
C
A
D
B
C
A
D
E
E
B
C
A
D
E
…………………
Step 1
Step 2
Step 3
Слайд 27
Методы максимальной вероятности
Так же, как и в случае
с методами максимальной экономии, генерирует все возможные топологии деревьев
Предположение
особой модели эволюции
В отличие от метода максимальной экономии может предполагать разную скорость эволюции и скорость замен в разных ветвях дерева
Поиск дерева с максимальной вероятностью существования, соответствующего данным
Чем больше последовательность, тем вероятнее найти истинное дерево
Самые медленные
Слайд 28
Методы максимальной вероятности
В позиции j для каждого внутреннего
узла допустимы все четыре нуклеотида, значит всего 4*4=16 возможных
деревьев.
Каждое из деревьев это произведение вероятности возникновения какого-либо основания в корне дерева и вероятность его замены на тот, который в следующем узле. Т.е. частота нуклеотида умноженная на вероятность его мутации, если грубо.
A = 0.25 or средняя частота A в последовательности зависит от модели) A->C трансверсия = 10-6 and A->G транзиции = 2x10-6
Вероятность T1 = 0.25 x 2x10-6 x 10-6 = 5x10-13
Вероятность всего дерева равна произведению вероятностей деревьев для каждой позиции в выравнивании
Слайд 29
Оценка поддержки дерева
Bootstrap