Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Бiоiнформатика

Содержание

При аналізі первинних структур процедура вирівнювання виявляє сходство між послідовностями (sequence similarity), яке може свідчити про гомологію (homology), тобто еволюційну спорідненість макромолекул. Основний спосіб визначити схожість двох послідовностей - вирівняти їхГеп – пропуск в послідовності>EC_Tr :
БІОІНФОРМАТИКАк.б.н. Нипорко О. Ю.Київський національний університет ім. Тараса ШевченкаІнститут високих технологій При аналізі первинних структур процедура вирівнювання виявляє сходство між послідовностями (sequence similarity), Гомологичные последовательности – последовательности, имеющие общее происхождение (общего предка). Что изображено?Название последовательностиНомер столбца выравниванияНомер последнего в строке остатка ИЗ ЭТОЙ ПОСЛЕДОВАТЕЛЬНОСТИКонсервативный остатокФункционально консервативная позиция «Идеальное» выравнивание – запись последовательностей одна под другой так, чтобы гомологичные фрагменты Ортологи и паралогиОртологи – гени з різних організмів, що розійшлися при видоутворенні.Мається Множественное выравнивание: содержаниеОпределение, разновидности, решаемые задачи, общие проблемыГлобальное выравниваниеПрогрессивное выравниваниеИтерационные методыЛокальные множественные Выравнивание полных геномов: крыса – мышь – человек Множественное выравнивание: иллюстрации Множественное выравнивание: определение и проблемыОпределение: найти оптимальное соответствие между несколькими последовательностями, если Множественное выравнивание: проблемы (прод.)Проблемы:Локальные минимумынакопление первоначальных ошибок в иерархических алгоритмахлучшее дерево соответствует Множественное выравнивание: решаемые задачиПоиск мотивов (блоков) – коротких сигнатур, идентифицируемых в консервативных Паттерн – регулярное выражение UNIX’a: Профиль или весовая матрица (PSSM)Seq1 	F K L L S H C Множественное выравнивание: области применения Один из ключевых методов в современной молекулярной биологииСферы Множественное выравнивание и филогенетический анализИдея – минимизация числа мутацийЧто сначала: выравнивание или дерево?Решение не единственно ! Множественное выравнивание: консервативные участки во многих пос-стяхКонсервативный – не значит «совпадающий» ! Множественное выравниваsние: белки vs. ДНКВыравнивание белковых семействВ алфавите много «букв»Эволюционная близость белковых Множественное выравнивание ДНКСайты связывания TFs = мотивы ДНК-последовательностейКонсерватизмвнутривидовой (синергичная регуляция транскрипции нескольких Множественное выравнивание ДНК: проблемы и варианты решенияГораздо сложнее выравнивания белковвсего 4 «буквы»Отсутствие Множественное выравнивание: четыре группы методовПрогрессивное глобальное выравниваниеначать с наиболее близких пос-стейИтерационные процедурывыравнивание Множественное выравнивание: история	До 1987 г. множественные выравнивания строились вручнуюSankoff (1975 и 1987) Глобальное выравнивание(обобщение ДП) Глобальное выравниваниеОбобщение метода динамического программированияпрограмма MSA (Lipman et al., 1989)результат далек от Множественное выравнивание: трехмерное динамическое программирование Множественное выравнивание: трехмерное динамическое программирование (прод.) Глобальное выравнивание (прод.)Оценка качествавеса множественных выравниваний (SP score) = сумме весов попарных Прогрессивное  выравнивание Прогрессивное выравнивание: идеяСначала – эволюционно наиболее близкие пос-стиПостепенное добавление новых пос-стей / Филогенетический анализ – не панацеяПроблемынеопределенность в порядке замен / делецийвзвешивание ветвей (пос-стей)подбор Прогрессивное выравниваниеЕсли эволюционное дерево известносначала выравниваются элементы, самые близкие на эволюционном деревена Прогрессивное выравнивание (прод.)Если эволюционное дерево неизвестно:построить всевозможные парные выравниванияопределить матрицу расстояний D, Прогрессивное выравнивание: детали алгоритмаТри этапапопарные выравнивания «каждая с каждой»филогенетическое дерево по весам Прогрессивное выравнивание: детали алгоритма (прод.)Взвешивание пос-стей (ветвей дерева)мультипликативная модельШтрафы за делециипредыдущие делеции Прогрессивное выравнивание: взвешивание ветвей дерева Множественное выравнивание: популярный инструментарий	ClustalXDCSE Прогрессивное выравнивание: штрафы за делецииСуществующие делеции влияют на выравнивание следующих пос-стейих позиции Прогрессивное выравнивание: штрафы за делеции (прод.)Компенсационная модификация штрафовсредний вес соответствий по матрице Прогрессивное выравнивание: проблемыРезультат зависит от начальных парных выравниванийошибки первых выравниваний накапливаютсявыравнивание непохожих Итерационное  выравнивание Итерационное выравнивание: идея методаЗадачаизбежать накопления ошибок начальных выравнива-ний, свойственных прогрессивным методамВариант решениямногократные Итерационное выравнивание: варианты реализацииMultAlin (Corpet, 1998)пересчет весов парных выравниваний в прогрессивном алгоритмеиспользование Muscle или как исправить ClustalW Локальные множественные выравнивания Локальные множественные выравнивания: виды алгоритмовАнализ профилейБлочное выравниваниеПоиск мотивовСтатистические методы Анализ профилей: введениеИдея:MSA для группы пос-стейВыделение высоко консервативных участков в мини-MSAПрофиль - Анализ профилей: идентификация в семействе белков теплового шока (hsp70)Матрица весов (профиль) содержит Блочное выравнивание: семейство из 34 тубулиновых белков Анализ профилей: ограниченияПрофиль отражает вариабельность в данном MSAсмещение в сторону похожих пос-стейвариант Профиль – позиционно-специфическая матрица замен21 столбец и N строкN – длина последовательностей в выравнивании Множественное выравнивание на базе вероятностно-статистических методовМаксимизация математического ожиданияСэмплирование ГиббсаСкрытые марковские моделиsee Russ Множественное выравнивание, весна 2008Наиболее известные программы множественного выравнивания:MSA => оптимальное выравнивание, Структурное выравнивание Правильно ли выровнены последовательности? В чем биологический смысл выравнивания?Буквы в одной колонке определяют сопоставление аминокислотных остатков Какое выравнивание “правильнее”?13 “консервативных” остатков12 консервативных остатков Чтобы понять смысл выравнивания, вернемся к тому, что такое последовательность аминокислотных остатков и что такое белок (i)Последовательность – удобный способ закодировать структурную (химическую) формулу молекулы белка (до посттрансляционных Пространственное совмещение полипептидных цепей белков mta1_yeast и mat2_yeastНа плоской картинкевидно плохо  Схематическое изображение совмещенных структур Другой способ отобразить совмещение полипептидных цепей называется структурным выравниванием последовательностейСтрелки как на предыдущемслайде Совмещение структур и выравнивание последовательностей Еще раз: разметка по совмещенным структурам Биологически обоснованное выравнивание гомеодоменов Совмещение 5-и гомеодоменов Множественное выравнивание гомеодоменовКрасным выделены консервативные (одинаковые у всех) остатки;желтым – на 80% Размеченное множественное выравнивание Функции аминокислотных остатковTrp48Arg53Leu16Pro442/Lys442 В “правильном” выравнивании много консервативных аминокислотных остатков и функционально консервативных позиций Выравнивание и эволюцияПоследовательности белка оболочки из двух штаммоввируса Коксаки ..Последовательности белка оболочки из двух штаммоввируса Коксаки и энтеровируса человека Аминокислотные остатки в одной колонке биологически обоснованного выравнивания, как правило, “произошли” из Алгоритмические решения проблемы воплощены в программах Программы выравнивания последовательностей тестируются путем сравнения Предположим, известны структуры родственных белков и, значит, биологически обоснованное выравнивание последовательностейПри > Применения«золотой стандарт» для выравнивания высоко гомологичных белков – выявление общего предка идентификация Структурное выравнивание: постановка задачиДля двух пространственных структур найти соответствие между атомами, обеспечивающее Структурное выравнивание: оценка результатаКритериичисло соответствий между АКсуммарное евклидово расстояние между выровненными АКдоля Структурное выравнивание: наложение пространственных структурНаложение на усредненнуюструктуру Структурное выравнивание: наложение пространственных структур Структурное выравнивание: различные классы белковых структур (1) Структурное выравнивание: различные классы белковых структур (2) Структурное выравнивание: различные классы белковых структур (3)Разные суперсемейства «бочонков» Поиск структурного выравнивания «вручную»Класспохожие вторич. структурывсе α, все β, α + β, Пример инструментария: Structural Classification Of Proteins (SCOP)http://scop.stanford.eduhttp://scop.mrc-lmb.cam.ac.uk/scop/ Пример инструментария: SCOP (прод.) Пример инструментария: SCOP (прод.) Пример инструментария: SCOP (прод.)http://scop.stanford.eduhttp://scop.mrc-lmb.cam.ac.uk/scop/ Как распознать близость структур?На глазАлгоритмическиточечные методы: установление соответствий по точечным свойствам (расстояниям)анализ Структурное выравнивание при помощи прототипов: STRUCTALИтерационное динамическое программирование для улучшения случайно выбранного Структурное выравнивание при помощи прототипов: STRUCTAL (прод.)Оценка выравнивания: чем лучше выравнивание, тем Структурное выравнивание при помощи прототипов: STRUCTAL (прод.)Итерационное динамическое программирование Структурное выравнивание при помощи прототипов: STRUCTAL (прод.) Структурное выравнивание при помощи прототипов: LOCKОсновная идея:элементы вторичной структуры представляются при помощи векторовбыстрый поиск похожих структур Структурное выравнивание при помощи прототипов: LOCK (прод.)Сравнение «векторов вторичной структуры» Структурное выравнивание при помощи прототипов: LOCK (прод.)Выравнивание «векторов вторичной структуры» Структурное выравнивание при помощи прототипов: LOCK (прод.)Шаги алгоритмаопределить локальные элементы вторичной структурыпостроить Структурное выравнивание при помощи прототипов: шаги алгоритма LOCK (1) Структурное выравнивание при помощи прототипов: шаги алгоритма LOCK (1a) Структурное выравнивание при помощи прототипов: шаги алгоритма LOCK (1b) Структурное выравнивание при помощи прототипов: шаги алгоритма LOCK (2) Структурное выравнивание при помощи прототипов: шаги алгоритма LOCK (3) Структурное выравнивание: «за» и «против»«Золотой» стандарт для выравнивания пос-стейТрехмерная структура часто неизвестнаСтруктурное ПРОБЛЕМА: как построить “правильное” выравнивание последовательностей белков если структуры белков неизвестны? На сегодня известны: более 10 млн(!!!) последовательностей белков (включая фрагменты и трансляты)пространственные Дякую за увагуБлагодарю за вниманиеThank you for your attention
Слайды презентации

Слайд 2 При аналізі первинних структур процедура вирівнювання виявляє сходство

При аналізі первинних структур процедура вирівнювання виявляє сходство між послідовностями (sequence

між послідовностями (sequence similarity), яке може свідчити про гомологію

(homology), тобто еволюційну спорідненість макромолекул.

Основний спосіб визначити схожість двох послідовностей - вирівняти їх

Геп – пропуск в
послідовності

>EC_Tr : MQNRLTIKDIARLSGVGKSTVSRVLNNE---YR
>EC_Fr : ----MKLDEIARLAGVSRTTASYVINGKAKQYR


Слайд 3 Гомологичные последовательности – последовательности, имеющие общее

Гомологичные последовательности – последовательности, имеющие общее происхождение (общего предка).

происхождение (общего предка).

Признаки гомологичности белков
сходная

3D-структура
в той или иной степени похожая аминокислотная последовательность
разные другие соображения…

Слайд 4 Что изображено?
Название последовательности
Номер столбца выравнивания
Номер последнего в строке

Что изображено?Название последовательностиНомер столбца выравниванияНомер последнего в строке остатка ИЗ ЭТОЙ ПОСЛЕДОВАТЕЛЬНОСТИКонсервативный остатокФункционально консервативная позиция

остатка ИЗ ЭТОЙ ПОСЛЕДОВАТЕЛЬНОСТИ
Консервативный остаток
Функционально консервативная позиция


Слайд 5 «Идеальное» выравнивание – запись последовательностей одна под другой

«Идеальное» выравнивание – запись последовательностей одна под другой так, чтобы гомологичные

так, чтобы гомологичные фрагменты оказались друг под другом.

домовой скупидом водомерка ?
лесовоз ---лесо---воз ледоход лед---оход---

?

Гэп – пропуск в
последовательности


Слайд 7 Ортологи и паралоги
Ортологи – гени з різних організмів,

Ортологи и паралогиОртологи – гени з різних організмів, що розійшлися при

що розійшлися при видоутворенні.
Мається на увазі, що ортологи мають

спільного «предка» і однакову функцію (якщо тиск відбора слабкий, то функція может «плисти»).
Паралоги – гени, що розійшлися при дуплікації («копіюванні»).
Копії гена не зазнавали тиска відбора, а значить, могли змінити функцію.


Слайд 8 Множественное выравнивание: содержание
Определение, разновидности, решаемые задачи, общие проблемы
Глобальное

Множественное выравнивание: содержаниеОпределение, разновидности, решаемые задачи, общие проблемыГлобальное выравниваниеПрогрессивное выравниваниеИтерационные методыЛокальные

выравнивание
Прогрессивное выравнивание
Итерационные методы
Локальные множественные выравнивания
Вероятностно-статистические методы множественного выравнивания
Оценка качества

выравнивания
Структурное выравнивание


Слайд 9 Выравнивание полных геномов: крыса – мышь – человек

Выравнивание полных геномов: крыса – мышь – человек

Слайд 10 Множественное выравнивание: иллюстрации

Множественное выравнивание: иллюстрации

Слайд 11 Множественное выравнивание: определение и проблемы
Определение: найти оптимальное соответствие между

Множественное выравнивание: определение и проблемыОпределение: найти оптимальное соответствие между несколькими последовательностями,

несколькими последовательностями, если заданы
Матрица соответствия
Штраф за делецию
Функция веса выравнивания
Проблемы:
Множество

делеций, замен,…
Ограниченное обобщение метода динамического программирования
Подсчет суммарного веса замен в колонке
Размещение делеций в разных пос-стях и штрафы за них

Слайд 12 Множественное выравнивание: проблемы (прод.)
Проблемы:
Локальные минимумы
накопление первоначальных ошибок в иерархических

Множественное выравнивание: проблемы (прод.)Проблемы:Локальные минимумынакопление первоначальных ошибок в иерархических алгоритмахлучшее дерево

алгоритмах
лучшее дерево соответствует лучшему выравниванию
Выбор параметров
один набор параметров не

может быть пригодным на все случаи жизни
Сложности выравнивания нарастают с ростом различий между последовательностями

Слайд 13 Множественное выравнивание: решаемые задачи
Поиск мотивов (блоков) – коротких сигнатур,

Множественное выравнивание: решаемые задачиПоиск мотивов (блоков) – коротких сигнатур, идентифицируемых в

идентифицируемых в консервативных участках множественного выравнивания
отсутствие вставок и делеций
Построение

профилей (матриц весов): оценка частоты встречаемости каждой АК в каждой позиции
Построение скрытых марковских моделей (HMM) – обобщенных профилей, описываемых строго математически

Слайд 14 Паттерн – регулярное выражение UNIX’a:

Паттерн – регулярное выражение UNIX’a:     [AC]-x-V-x(4)-{ED}Ala или

[AC]-x-V-x(4)-{ED}
Ala или Cys-

х-Val- х- х- х - х- (любой, но не Glu и не Asp)



Слайд 15 Профиль или весовая матрица (PSSM)
Seq1 F K L

Профиль или весовая матрица (PSSM)Seq1 	F K L L S H

L S H C L L V
Seq2 F K A

F G Q T M F Q
Seq3 Y P I V G Q E L L G
Seq4 F P V V K E A I L K
Seq5 F K V L A A V I A D
Seq6 L E F I S E C I I Q
Seq7 F K L L G N V L V C

A -18 -10 -1 -8 8 -3 3 -10 -2 -8
C -22 -33 -18 -18 -22 -26 22 -24 -19 -7
D -35 0 -32 -33 -7 6 -17 -34 -31 0
E -27 15 -25 -26 -9 23 -9 -24 -23 -1
F 60 -30 12 14 -26 -29 -15 4 12 -29
G -30 -20 -28 -32 28 -14 -23 -33 -27 -5
H -13 -12 -25 -25 -16 14 -22 -22 -23 -10
I 3 -27 21 25 -29 -23 -8 33 19 -23
K -26 25 -25 -27 -6 4 -15 -27 -26 0
L 14 -28 19 27 -27 -20 -9 33 26 -21
M 3 -15 10 14 -17 -10 -9 25 12 -11
N -22 -6 -24 -27 1 8 -15 -24 -24 -4
P -30 24 -26 -28 -14 -10 -22 -24 -26 -18
Q -32 5 -25 -26 -9 24 -16 -17 -23 7
R -18 9 -22 -22 -10 0 -18 -23 -22 -4
S -22 -8 -16 -21 11 2 -1 -24 -19 -4
T -10 -10 -6 -7 -5 -8 2 -10 -7 -11
V 0 -25 22 25 -19 -26 6 19 16 -16
W 9 -25 -18 -19 -25 -27 -34 -20 -17 -28
Y 34 -18 -1 1 -23 -12 -19 0 0 -18

Паттерн:
F-[KP]-x(3)-[EQ]-x(4)

Не найдем!

Позиционно-специфичная матрица весов аминокислот


Слайд 16 Множественное выравнивание: области применения
Один из ключевых методов в

Множественное выравнивание: области применения Один из ключевых методов в современной молекулярной

современной молекулярной биологии
Сферы применения
Филогенетический анализ, «эволюция» пос-сти
Предсказание вторичной/третичной структуры

белков
Выявление АК-остатков (консервативных участков)
экспонированных на поверхности белка
формирующих активный центр
обеспечивающих субстратную специфичность
критичных для стабилизации втор./трет. структуры
Выявление характерных фрагментов для описания белковых семейств
Выявление неизвестных ранее гомологий между генами и последовательностями
Длинные пос-сти из случайных коротких фрагментов

Слайд 17 Множественное выравнивание и филогенетический анализ
Идея – минимизация числа

Множественное выравнивание и филогенетический анализИдея – минимизация числа мутацийЧто сначала: выравнивание или дерево?Решение не единственно !

мутаций
Что сначала: выравнивание или дерево?
Решение не единственно !


Слайд 18 Множественное выравнивание: консервативные участки во многих пос-стях
Консервативный – не

Множественное выравнивание: консервативные участки во многих пос-стяхКонсервативный – не значит «совпадающий» !

значит «совпадающий» !


Слайд 19 Множественное выравниваsние: белки vs. ДНК
Выравнивание белковых семейств
В алфавите много

Множественное выравниваsние: белки vs. ДНКВыравнивание белковых семействВ алфавите много «букв»Эволюционная близость

«букв»
Эволюционная близость белковых молекул, основа для филогенетических деревьев
какие события

привели к возникновению данного семейства?
Идентификация функционально важных областей
Данные для предсказания структуры
Выравнивание некодирующих участков ДНК
Консервативные участки, отвечающие за регуляцию экспрессии
Установление эволюционной близости
Идентификация функционально важных областей


Слайд 20 Множественное выравнивание ДНК
Сайты связывания TFs = мотивы ДНК-последовательностей
Консерватизм
внутривидовой

Множественное выравнивание ДНКСайты связывания TFs = мотивы ДНК-последовательностейКонсерватизмвнутривидовой (синергичная регуляция транскрипции

(синергичная регуляция транскрипции нескольких генов)
межвидовой (близкие механизмы регуляции транскрипции)
Дивергенция
внутривидовая

(«специальные» цели, завязанные на метаболизм)
межвидовая (эволюционный дрейф)

Слайд 21 Множественное выравнивание ДНК: проблемы и варианты решения
Гораздо сложнее

Множественное выравнивание ДНК: проблемы и варианты решенияГораздо сложнее выравнивания белковвсего 4

выравнивания белков
всего 4 «буквы»
Отсутствие «золотого стандарта»
Необходимость оценить
способность связывать белки
влияние

на функцию
Смысл – тестирование гипотез
об общем предке
об общих механизмах связывания белков
о близости функций

Слайд 22 Множественное выравнивание: четыре группы методов
Прогрессивное глобальное выравнивание
начать с наиболее

Множественное выравнивание: четыре группы методовПрогрессивное глобальное выравниваниеначать с наиболее близких пос-стейИтерационные

близких пос-стей
Итерационные процедуры
выравнивание групп пос-стей с последующей оптимизацией
Выравнивание по

локальным консерватив-ным участкам
построение профилей (разновидности матрицы весов)
поиск блоков в пос-стях (выравниваний без делеций)
Статистические методы и вероятностные модели
поиск шаблонов (patterns)
скрытые марковские модели

Слайд 23 Множественное выравнивание: история
До 1987 г. множественные выравнивания строились

Множественное выравнивание: история	До 1987 г. множественные выравнивания строились вручнуюSankoff (1975 и

вручную
Sankoff (1975 и 1987) – первый программно реализованный алгоритм
основа

– филогенетический анализ
Barton (1990) – оценка качества выравнивания методом рандомизации, AMPS
Russel & Barton (1992) – структурное выравнивание, STAMP
Thomson et al. (1994) – ClustalW
Altshul et al. (1997) – PSI-BLAST
Notredame et al. (2000) – неиерархическое выравнивание, T-Coffee
Clamp (2004) - JalView

Слайд 24 Глобальное выравнивание
(обобщение ДП)

Глобальное выравнивание(обобщение ДП)

Слайд 25 Глобальное выравнивание
Обобщение метода динамического программирования
программа MSA (Lipman et

Глобальное выравниваниеОбобщение метода динамического программированияпрограмма MSA (Lipman et al., 1989)результат далек

al., 1989)
результат далек от оптимального (Gupta et al., 1995)
ресурсы:

Nm сравнений для m пос-стей длины N
Развитие MSA
метод суммирования пар (sum of pairs, SP) – Carrillo & Lipman (1988)
попарные выравнивания
филогенетическое дерево
выравнивание в ограниченной области куба
эвристическое выравнивание ≠ оптимальному
реализация в ClustalW / ClustalX
сокращение необходимых ресурсов – Gupta et al. (1995)

Слайд 26 Множественное выравнивание: трехмерное динамическое программирование

Множественное выравнивание: трехмерное динамическое программирование

Слайд 27 Множественное выравнивание: трехмерное динамическое программирование (прод.)

Множественное выравнивание: трехмерное динамическое программирование (прод.)

Слайд 28 Глобальное выравнивание (прод.)
Оценка качества
веса множественных выравниваний (SP score)

Глобальное выравнивание (прод.)Оценка качествавеса множественных выравниваний (SP score) = сумме весов

= сумме весов попарных выравниваний
поиск набольшего суммарного веса
взвешивание весов

(опционально)
по филогенетическому дереву
учет эволюционно близких пос-стей
«дифференц.» вес ε для каждой пары = (вес пары в MSA) – (вес при оптимальн. парном вырав-нии)
степень дивергенции пос-стей в выравнивании δ = Σ εi (чем больше δ, тем сильнее дивергенция)
MSA: матрица замен PAM250, постоянный штраф за любую делецию
Возможность применения к большему числу (6-8) коротких последовательностей

Слайд 29 Прогрессивное выравнивание

Прогрессивное выравнивание

Слайд 30 Прогрессивное выравнивание: идея
Сначала – эволюционно наиболее близкие пос-сти
Постепенное

Прогрессивное выравнивание: идеяСначала – эволюционно наиболее близкие пос-стиПостепенное добавление новых пос-стей

добавление новых пос-стей / групп пос-стей
Waterman & Perlwitz (1984)
Feng

& Doolittle (1987, 1996)
Higgins et al. (1996)

Отображение близости на филогенетическом дереве
методы попарного сравнения пос-стей
Проблема: неопределенность отдельных замен

Слайд 31 Филогенетический анализ – не панацея
Проблемы
неопределенность в порядке замен /

Филогенетический анализ – не панацеяПроблемынеопределенность в порядке замен / делецийвзвешивание ветвей

делеций
взвешивание ветвей (пос-стей)
подбор матрицы замен
назначение штрафов за делеции
Реализация: ClustalW/X

и PILEUP

?

} ?

Отражение
эволюции


Слайд 32 Прогрессивное выравнивание
Если эволюционное дерево известно
сначала выравниваются элементы, самые

Прогрессивное выравниваниеЕсли эволюционное дерево известносначала выравниваются элементы, самые близкие на эволюционном

близкие на эволюционном дереве
на каждом шаге выравниваются пос-сти x

и y, или профили px и py для построения нового выравнивания с профилем presult
Версия со взвешиванием
ветви дерева имеют веса, пропорциональные степени расхождения
новый профиль – взвешенное среднее двух предыдущих

x

w

y

z

pxy

pzw

pxyzw


Слайд 33 Прогрессивное выравнивание (прод.)
Если эволюционное дерево неизвестно:
построить всевозможные парные

Прогрессивное выравнивание (прод.)Если эволюционное дерево неизвестно:построить всевозможные парные выравниванияопределить матрицу расстояний

выравнивания
определить матрицу расстояний D, элементы которой D(x, y) соответствуют

эволюционному расстоянию, определенному по парным выравниваниям
реконструировать эволюционное дерево
построить выравнивание на основе реконструированного дерева

x

w

y

z

?


Слайд 34 Прогрессивное выравнивание: детали алгоритма
Три этапа
попарные выравнивания «каждая с каждой»
филогенетическое

Прогрессивное выравнивание: детали алгоритмаТри этапапопарные выравнивания «каждая с каждой»филогенетическое дерево по

дерево по весам парных выравниваний (по генетическим расстояниям)
последовательное построение

множественного выравнивания
от похожих – к непохожим
Генетическое расстояние = (число замен) / (полное число соответствий)
делеции не учитываются

Дерево


Слайд 35 Прогрессивное выравнивание: детали алгоритма (прод.)
Взвешивание пос-стей (ветвей дерева)
мультипликативная модель
Штрафы

Прогрессивное выравнивание: детали алгоритма (прод.)Взвешивание пос-стей (ветвей дерева)мультипликативная модельШтрафы за делециипредыдущие

за делеции
предыдущие делеции влияют на последующие выравнивания
местоположение делеций (учет

вторичной структуры)
таблица встречаемости делеций
штраф за открытие делеции и ее продолжение на каждую позицию
штрафы во множественном выравнивании модифицируются с учетом матрицы замен, степени сходства и длины пос-стей
Схема назначения штрафов в Clustal противоположна таковой в MSA
чем уникальнее пос-сть, тем больше вес

Слайд 36 Прогрессивное выравнивание: взвешивание ветвей дерева

Прогрессивное выравнивание: взвешивание ветвей дерева

Слайд 37 Множественное выравнивание: популярный инструментарий
ClustalX
DCSE

Множественное выравнивание: популярный инструментарий	ClustalXDCSE

Слайд 38 Прогрессивное выравнивание: штрафы за делеции
Существующие делеции влияют на выравнивание

Прогрессивное выравнивание: штрафы за делецииСуществующие делеции влияют на выравнивание следующих пос-стейих

следующих пос-стей
их позиции фиксируются
ClustalW: размещение делеций между консервативными доменами
Pascarella

& Argos (1992): частоты встречаемости делеций после каждой АК в неконсервативных участках структурно близких белков
Штрафы
за открытие делеции
за продолжение делеции
та же схема за делеции внутри существующих делеций

Слайд 39 Прогрессивное выравнивание: штрафы за делеции (прод.)
Компенсационная модификация штрафов
средний вес

Прогрессивное выравнивание: штрафы за делеции (прод.)Компенсационная модификация штрафовсредний вес соответствий по

соответствий по матрице замен
уровень гомологии между пос-стями
длины пос-стей
Таблица делеций

для каждой группы выравниваемых пос-стей
Другие варианты модификаций
↓ штрафов для областей с существующими делециями
↑ штрафов для областей, соседствующих с делециями
↑ штрафов для областей с гидрофильными АК

Слайд 40 Прогрессивное выравнивание: проблемы
Результат зависит от начальных парных выравниваний
ошибки первых

Прогрессивное выравнивание: проблемыРезультат зависит от начальных парных выравниванийошибки первых выравниваний накапливаютсявыравнивание

выравниваний накапливаются
выравнивание непохожих пос-стей  Байесовские методы (e.g. HMM)
Матрица

замен и штрафы за делеции должны отражать специфику всего набора пос-стей

Слайд 41 Итерационное выравнивание

Итерационное выравнивание

Слайд 42 Итерационное выравнивание: идея метода
Задача
избежать накопления ошибок начальных выравнива-ний, свойственных

Итерационное выравнивание: идея методаЗадачаизбежать накопления ошибок начальных выравнива-ний, свойственных прогрессивным методамВариант

прогрессивным методам
Вариант решения
многократные итерационные выравнивания подгрупп последовательностей
построение общего глобального

выравнивания
оптимизация общего веса выравнивания (суммы парных весов)

Слайд 43 Итерационное выравнивание: варианты реализации
MultAlin (Corpet, 1998)
пересчет весов парных выравниваний

Итерационное выравнивание: варианты реализацииMultAlin (Corpet, 1998)пересчет весов парных выравниваний в прогрессивном

в прогрессивном алгоритме
использование весов для пересчета дерева
улучшение множественного выравнивания
PRRP

(1994)
построение дерева по начальным парным выравниваниям
вычисление весов по дереву и построение выравниваний по аналогии с MSA (но: локальные участки вместо глобального выравнивания + возможны делеции)
итерационный пересчет локально выровненных участков для повышения веса выравнивания
выравнивание с наибольшим весом  новое дерево, новые веса и новые выравнивания
повторение, пока суммарный вес не перестанет меняться

Слайд 44
Muscle или как исправить ClustalW

Muscle или как исправить ClustalW

Слайд 45 Локальные множественные выравнивания

Локальные множественные выравнивания

Слайд 46 Локальные множественные выравнивания: виды алгоритмов
Анализ профилей
Блочное выравнивание
Поиск мотивов
Статистические

Локальные множественные выравнивания: виды алгоритмовАнализ профилейБлочное выравниваниеПоиск мотивовСтатистические методы

методы


Слайд 47 Анализ профилей: введение
Идея:
MSA для группы пос-стей
Выделение высоко консервативных

Анализ профилей: введениеИдея:MSA для группы пос-стейВыделение высоко консервативных участков в мини-MSAПрофиль

участков в мини-MSA
Профиль - матрица весов для мини-MSA
Профиль допускает

соответствия, замены, делеции и вставки
Применения
поиск соответствий профилю в последовательности-мишени (программа Profilesearch)
в качестве матрицы замен для построения выравниваний (программа Profilegap)

Слайд 48 Анализ профилей: идентификация в семействе белков теплового шока

Анализ профилей: идентификация в семействе белков теплового шока (hsp70)Матрица весов (профиль)

(hsp70)
Матрица весов (профиль) содержит вероятности
встречаемости АК в разных

позициях

Слайд 49 Блочное выравнивание: семейство из 34 тубулиновых белков

Блочное выравнивание: семейство из 34 тубулиновых белков

Слайд 50 Анализ профилей: ограничения
Профиль отражает вариабельность в данном MSA
смещение

Анализ профилей: ограниченияПрофиль отражает вариабельность в данном MSAсмещение в сторону похожих

в сторону похожих пос-стей
вариант коррекции: Gribskov & Veternik, 1996
взвешивание

пос-стей по удаленности на филогенетическом дереве: чем меньше расстояние, тем меньше вес
Недостаточное число пос-стей в MSA
некоторые АК на некоторых позициях не представлены

Слайд 51 Профиль – позиционно-специфическая матрица замен
21 столбец и N

Профиль – позиционно-специфическая матрица замен21 столбец и N строкN – длина последовательностей в выравнивании

строк
N – длина последовательностей в выравнивании


Слайд 52 Множественное выравнивание на базе вероятностно-статистических методов
Максимизация математического ожидания
Сэмплирование

Множественное выравнивание на базе вероятностно-статистических методовМаксимизация математического ожиданияСэмплирование ГиббсаСкрытые марковские моделиsee

Гиббса
Скрытые марковские модели
see Russ Altman, Lecture 4-27-06, pp. 8-20


Слайд 53
Множественное выравнивание, весна 2008
Наиболее известные программы
множественного

Множественное выравнивание, весна 2008Наиболее известные программы множественного выравнивания:MSA => оптимальное

выравнивания:
MSA => оптимальное выравнивание, если дождаться результата

ClustalW (реализации

 ClustalX, emma из EMBOSS) 
до сих пор самый популярный алгоритм, в сложных
случаях может ошибиться.

Muscle  итеративный прогрессивный алгоритм,
точнее и быстрее ClustalW

Т-COFFEE – немного точнее, но существенно медленнее

HMMER – часто ошибается, но хорошо строит профили

.........



Слайд 54 Структурное выравнивание

Структурное выравнивание

Слайд 55 Правильно ли выровнены последовательности?

Правильно ли выровнены последовательности?

Слайд 56 В чем биологический смысл выравнивания?
Буквы в одной колонке

В чем биологический смысл выравнивания?Буквы в одной колонке определяют сопоставление аминокислотных

определяют сопоставление аминокислотных остатков двух белков
Сопоставленные остатки, по идее,

должны иметь что-то общее в молекулах белка; что???

Предложение: биологический смысл имеет сопоставление одинаковых или функционально сходных остатков белка. Эти остатки играют сходную роль.
Сопоставление непохожих остатков не имеет смысла.


Слайд 57 Какое выравнивание “правильнее”?
13 “консервативных” остатков
12 консервативных остатков

Какое выравнивание “правильнее”?13 “консервативных” остатков12 консервативных остатков

Слайд 58 Чтобы понять смысл выравнивания, вернемся к тому, что

Чтобы понять смысл выравнивания, вернемся к тому, что такое последовательность аминокислотных остатков и что такое белок

такое последовательность аминокислотных остатков и что такое белок


Слайд 59 (i)Последовательность – удобный способ закодировать структурную (химическую) формулу

(i)Последовательность – удобный способ закодировать структурную (химическую) формулу молекулы белка (до

молекулы белка (до посттрансляционных модификаций)
(iii) Последовательность однозначно определяет в

какую пространственную структуру свернется белок в клетке

(ii) Белок – это большая молекула, сохраняющая в живой клетке постоянную пространственную структуру, т.е.– взаимное расположение ковалентно связанных атомов (конформацию)

(iv) Функция белка в клетке проявляется только при сохранении уникальной пространственной структуры


Слайд 60 Пространственное совмещение полипептидных цепей белков mta1_yeast и mat2_yeast
На

Пространственное совмещение полипептидных цепей белков mta1_yeast и mat2_yeastНа плоской картинкевидно плохо 

плоской картинке
видно плохо 


Слайд 61 Схематическое изображение совмещенных структур

Схематическое изображение совмещенных структур

Слайд 62 Другой способ отобразить совмещение полипептидных цепей называется структурным

Другой способ отобразить совмещение полипептидных цепей называется структурным выравниванием последовательностейСтрелки как на предыдущемслайде

выравниванием последовательностей
Стрелки как на
предыдущем
слайде


Слайд 63 Совмещение структур и выравнивание последовательностей

Совмещение структур и выравнивание последовательностей

Слайд 64 Еще раз: разметка по совмещенным структурам

Еще раз: разметка по совмещенным структурам

Слайд 65 Биологически обоснованное выравнивание гомеодоменов

Биологически обоснованное выравнивание гомеодоменов

Слайд 66 Совмещение 5-и гомеодоменов

Совмещение 5-и гомеодоменов

Слайд 67 Множественное выравнивание гомеодоменов
Красным выделены консервативные (одинаковые у всех)

Множественное выравнивание гомеодоменовКрасным выделены консервативные (одинаковые у всех) остатки;желтым – на

остатки;
желтым – на 80% консервативные (одинаковые почти у всех)

остатки

Красным выделены консервативные и функционально консервативные остатки


Слайд 68 Размеченное множественное выравнивание

Размеченное множественное выравнивание

Слайд 69 Функции аминокислотных остатков
Trp48

Arg53
Leu16
Pro442/
Lys442

Функции аминокислотных остатковTrp48Arg53Leu16Pro442/Lys442

Слайд 70 В “правильном” выравнивании много консервативных аминокислотных остатков и

В “правильном” выравнивании много консервативных аминокислотных остатков и функционально консервативных позиций

функционально консервативных позиций


Слайд 71 Выравнивание и эволюция
Последовательности белка оболочки из двух штаммов
вируса

Выравнивание и эволюцияПоследовательности белка оболочки из двух штаммоввируса Коксаки

Коксаки


Слайд 72 ..
Последовательности белка оболочки из двух штаммов
вируса Коксаки и

..Последовательности белка оболочки из двух штаммоввируса Коксаки и энтеровируса человека

энтеровируса человека


Слайд 73 Аминокислотные остатки в одной колонке биологически обоснованного выравнивания,

Аминокислотные остатки в одной колонке биологически обоснованного выравнивания, как правило, “произошли”

как правило, “произошли” из одного и того же остатка

- их общего предка

Слайд 74 Алгоритмические решения проблемы воплощены в программах
Программы выравнивания

Алгоритмические решения проблемы воплощены в программах Программы выравнивания последовательностей тестируются путем

последовательностей тестируются путем сравнения с биологически обоснованными – построенными

по совмещению структур – выравниваниями
Существуют базы данных структурных выравниваний последовательностей (BAliBAse и др.)

Слайд 75 Предположим, известны структуры родственных белков и, значит, биологически

Предположим, известны структуры родственных белков и, значит, биологически обоснованное выравнивание последовательностейПри

обоснованное выравнивание последовательностей
При > 60% совпадающих букв любая современная

программа даст (почти) правильный результат
При < 20% совпадающих букв (такие примеры существуют) ни одна программа не даст правильного выравнивания
Между 20% и 60% , обычно, результат программы частично правилен



Слайд 76 Применения
«золотой стандарт» для выравнивания высоко гомологичных белков –

Применения«золотой стандарт» для выравнивания высоко гомологичных белков – выявление общего предка

выявление общего предка
идентификация общих значимых элементов структуры для

негомологичных белков
кластеризация белков (разбиение на белковые семейства) на основе структурной близости
Выравнивание должно отражать сходство структур
совпадение общих структурных и функциональных элементов
Проблема: оптимум в вычислениях

оптимуму в биологии


Слайд 77 Структурное выравнивание: постановка задачи
Для двух пространственных структур найти соответствие

Структурное выравнивание: постановка задачиДля двух пространственных структур найти соответствие между атомами,

между атомами, обеспечивающее наилучшее «выравнивание»
для большинства атомов достигается минимум

с.к.о.
проблема: «идеальное» выравнивание для нескольких атомов и плохое для остальных

Слайд 78 Структурное выравнивание: оценка результата
Критерии
число соответствий между АК
суммарное евклидово расстояние

Структурное выравнивание: оценка результатаКритериичисло соответствий между АКсуммарное евклидово расстояние между выровненными

между выровненными АК
доля идентичных АК среди выровненных
число введенных делеций
размер

сравниваемых белков
консерватизм окружения известных активных центров
Универсальных критериев не существует
Замечание
отличие от поиска минимума евклидова расстояния при известном соответствии атомов
с.к.о. используется только в качестве метрики
комбинаторный подход

!!


Слайд 79 Структурное выравнивание: наложение пространственных структур
Наложение на усредненную
структуру

Структурное выравнивание: наложение пространственных структурНаложение на усредненнуюструктуру

Слайд 80 Структурное выравнивание: наложение пространственных структур

Структурное выравнивание: наложение пространственных структур

Слайд 81 Структурное выравнивание: различные классы белковых структур (1)

Структурное выравнивание: различные классы белковых структур (1)

Слайд 82 Структурное выравнивание: различные классы белковых структур (2)

Структурное выравнивание: различные классы белковых структур (2)

Слайд 83 Структурное выравнивание: различные классы белковых структур (3)
Разные суперсемейства

Структурное выравнивание: различные классы белковых структур (3)Разные суперсемейства «бочонков»

«бочонков»


Слайд 84 Поиск структурного выравнивания «вручную»
Класс
похожие вторич. структуры
все α, все

Поиск структурного выравнивания «вручную»Класспохожие вторич. структурывсе α, все β, α +

β, α + β, α/β
Слой (fold)
значительное структурное сходство
сходная организация

вторичной структуры
Суперсемейство (топология)
предположительный общий предок

Семейство
очевидные эволюционные отношения
гомологичность последовательностей > 25%
Конкретный белок


Слайд 85 Пример инструментария: Structural Classification Of Proteins (SCOP)
http://scop.stanford.edu
http://scop.mrc-lmb.cam.ac.uk/scop/

Пример инструментария: Structural Classification Of Proteins (SCOP)http://scop.stanford.eduhttp://scop.mrc-lmb.cam.ac.uk/scop/

Слайд 86 Пример инструментария: SCOP (прод.)

Пример инструментария: SCOP (прод.)

Слайд 87 Пример инструментария: SCOP (прод.)

Пример инструментария: SCOP (прод.)

Слайд 88 Пример инструментария: SCOP (прод.)
http://scop.stanford.edu
http://scop.mrc-lmb.cam.ac.uk/scop/

Пример инструментария: SCOP (прод.)http://scop.stanford.eduhttp://scop.mrc-lmb.cam.ac.uk/scop/

Слайд 89 Как распознать близость структур?
На глаз
Алгоритмически
точечные методы: установление соответствий

Как распознать близость структур?На глазАлгоритмическиточечные методы: установление соответствий по точечным свойствам

по точечным свойствам (расстояниям)
анализ вторичной структуры: установление соответствий по

векторам, изображающим элементы вторичной структуры
Четыре метода, оперирующих прототипами
STRUCTAL (Levitt, Subbiah, Gerstein)
DALI (Holm, Sander)
LOCK (Singh, Brutlag)
геометрическое хэширование (Nussinov et al)

Слайд 90 Структурное выравнивание при помощи прототипов: STRUCTAL
Итерационное динамическое программирование

Структурное выравнивание при помощи прототипов: STRUCTALИтерационное динамическое программирование для улучшения случайно

для улучшения случайно выбранного начального выравнивания
Шаги алгоритма
начать с произвольного

набора соответствий между двумя структурами (выравнивание пос-стей, вторичных структур, на глаз, случайное)
выровнять две структуры, исходя из текущего набора соответствий
построить матрицу весов (Нидлмана-Вунша), исходя из расстояний между всевозможными парами точек
ДП: обратное движение по матрице весов для нахождения выравнивания с наибольшим суммарным весом
повторение шагов 2-4, пока суммарный вес не перестанет меняться
Метод эвристический, не гарантирует результата, зависит от выбора начального выравнивания

Слайд 91 Структурное выравнивание при помощи прототипов: STRUCTAL (прод.)
Оценка выравнивания:

Структурное выравнивание при помощи прототипов: STRUCTAL (прод.)Оценка выравнивания: чем лучше выравнивание,

чем лучше выравнивание, тем выше суммарный вес
возможность учесть дополнительные

факторы
Вес

S(d) = M { 2 / [1 + (d/d0)2] – 1}

где M – максимальный ожидаемый вес, d – измеряемая величина (e.g. расстояние между точками), d0 – значение d, соответствующее M = 0
При 0 ≤ d ≤ d0 увеличение веса, при d > d0 - штраф

Слайд 92 Структурное выравнивание при помощи прототипов: STRUCTAL (прод.)
Итерационное динамическое

Структурное выравнивание при помощи прототипов: STRUCTAL (прод.)Итерационное динамическое программирование

программирование


Слайд 93 Структурное выравнивание при помощи прототипов: STRUCTAL (прод.)

Структурное выравнивание при помощи прототипов: STRUCTAL (прод.)

Слайд 94 Структурное выравнивание при помощи прототипов: LOCK
Основная идея:
элементы вторичной

Структурное выравнивание при помощи прототипов: LOCKОсновная идея:элементы вторичной структуры представляются при помощи векторовбыстрый поиск похожих структур

структуры представляются при помощи векторов
быстрый поиск похожих структур


Слайд 95 Структурное выравнивание при помощи прототипов: LOCK (прод.)
Сравнение «векторов

Структурное выравнивание при помощи прототипов: LOCK (прод.)Сравнение «векторов вторичной структуры»

вторичной структуры»


Слайд 96 Структурное выравнивание при помощи прототипов: LOCK (прод.)
Выравнивание «векторов

Структурное выравнивание при помощи прототипов: LOCK (прод.)Выравнивание «векторов вторичной структуры»

вторичной структуры»


Слайд 97 Структурное выравнивание при помощи прототипов: LOCK (прод.)
Шаги алгоритма
определить

Структурное выравнивание при помощи прототипов: LOCK (прод.)Шаги алгоритмаопределить локальные элементы вторичной

локальные элементы вторичной структуры
построить начальное наложение структур методом ДП,

используя
выбранную функцию веса
векторное представление элементов вторичной структуры
определить ближайших соседей, минимизируя евклидовы расстояния
удалить лишние атомы, чтобы получить минимальное с.к.о.

Слайд 98 Структурное выравнивание при помощи прототипов: шаги алгоритма LOCK

Структурное выравнивание при помощи прототипов: шаги алгоритма LOCK (1)

Слайд 99 Структурное выравнивание при помощи прототипов: шаги алгоритма LOCK

Структурное выравнивание при помощи прототипов: шаги алгоритма LOCK (1a)

(1a)


Слайд 100 Структурное выравнивание при помощи прототипов: шаги алгоритма LOCK

Структурное выравнивание при помощи прототипов: шаги алгоритма LOCK (1b)

(1b)


Слайд 101 Структурное выравнивание при помощи прототипов: шаги алгоритма LOCK

Структурное выравнивание при помощи прототипов: шаги алгоритма LOCK (2)

Слайд 102 Структурное выравнивание при помощи прототипов: шаги алгоритма LOCK

Структурное выравнивание при помощи прототипов: шаги алгоритма LOCK (3)

Слайд 103 Структурное выравнивание: «за» и «против»
«Золотой» стандарт для выравнивания пос-стей
Трехмерная

Структурное выравнивание: «за» и «против»«Золотой» стандарт для выравнивания пос-стейТрехмерная структура часто

структура часто неизвестна
Структурное выравнивание не всегда отражает ход эволюции
точная

последовательность вставок/замен/делеций неизвестна

Слайд 104 ПРОБЛЕМА: как построить “правильное” выравнивание последовательностей белков если

ПРОБЛЕМА: как построить “правильное” выравнивание последовательностей белков если структуры белков неизвестны?

структуры белков неизвестны?


Слайд 105 На сегодня известны:
более 10 млн(!!!) последовательностей белков

На сегодня известны: более 10 млн(!!!) последовательностей белков (включая фрагменты и

(включая фрагменты и трансляты)
пространственные структуры около 70 тыс. белков



  • Имя файла: bioinformatika.pptx
  • Количество просмотров: 167
  • Количество скачиваний: 0