Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Введение в биоинформатику

Содержание

Будущее инженерной науки будет связано с робототехникой, биоинженерией и биоинформатикой, а также физико-химическим конструированиемВиктор Садовничий: ректор МГУ, президент Союза ректоровЧелябинск, совете Союза ректоров, посвященном созданию новой концепции инженерного образования. 26.09.2014
Введение в биоинформатику Программные средства и базы данныхЖулин Игорь Борисович ицентр биоинформатики ПСПбГМУ им. И.П.Павлова Будущее инженерной науки будет связано с робототехникой, биоинженерией и биоинформатикой, а также Что такое биоинформатика?Википедия (англ):Биоинформатика — это междисциплинарная область исследований и разработки методов National Science Foundation (США):Узкие места в биоинформатике: необходимость обучения биологов владению передовыми Цели биоинформатикиКонструирование и сопровождение биологических баз данных.Разработка программного обеспечения для анализа последовательностей, Зачем углубляться в изучение средств и баз данных по биоинформатике?Важно иметь представление Что такое алгоритм?Алгоритм – это набор инструкций, которые необходимо выполнить для того, чтобы решить задачу. Что такое база данных?Коллекция взаимосвязанных элементов данныхтаблиц (например, генов, организмов, последовательностей и т.д.)столбцов (полей)строк (записей) Биологические базы данныхСколько их?Разные по размеру, качеству, полноте, степени интересаЧто представляет из себя «хорошая» база данных? GenBank		www.ncbi.nlm.nih.gov	последовательности нуклеотидовEnsembl		www.ensembl.org		человеческие, мышиные и др. геномы PubMed		www.ncbi.nlm.nih.gov	научные публикацииNR		www.ncbi.nlm.nih.gov	белковые последовательностиSWISS-PROT	www.expasy.ch		белковые последовательностиInterPro		www.ebi.ac.uk		белковые доменыOMIM		www.ncbi.nlm.nih.gov	генетические заболеванияEnzymes		www.chem.qmul.ac.uk	ферментыPDB		www.rcsb.org/pdb/		белковые структурыKEGG		www.genome.ad.jp		метаболические путиБазы данных Специализированные базы данныхPomBase компиляция данных, посвященных организму Schizosaccharomyces pombe Wormpep предсказанные белки Вебсайт или веб-приложение?Статический – Интерактивный контентЧисто информационный – Программное средство Веб-серверы и облачные вычисленияПреимущества:Удаленная инфраструктура, возможно, имеет большую вычислительную мощность чем ваша.Обновления Советы для использования удаленных серверов в научных исследованияхЗаписывайте все:имя и/или адрес сервера, «Кейс с инструментами» специалиста-биоинформатика Предсказание геновGRAIL (Xgrail, JavaGrail, etc.) Gene Relationships Across Implicated LociGeneidNetgeneGenMarkFexon, Hexon GENSCANXpound Genefinder Выравнивание последовательностейВыравнивание двух последовательностейОдновременное выравнивание нескольких последовательностей Выравнивание пар последовательностейSIM (только белки) – поиск k-лучших непересекающихся выравниваний (ExPASy, Швейцария)ALIGN Взаимное выравнивание нескольких последовательностейClustalWMAFFTT-Coffee MUSCLE Поиск совпаденийBLASTblastp,  запрос — последовательность аминокислот к базе белковых последовательностей.blastn Предсказание структуры белкаAb initio («с нуля»): основанное на минимизации энергииРаспознавание фолдинга: последовательность Предсказание вторичной структуры белкаCoils – предсказания суперспиральных регионовnnPredict – использует двухуровневую нейронную Предсказание функции белкаHomologySequenceStructureGenomic contextCo-expression Филогенетический анализПостроение эволюционных деревьев на основе дивиргенций возникших в связянных последовательностяхPhymlraxMLFastTreeProtdist and Предсказание эффекта мутацийPolyPhenSIFTSNAPPROVEAN…Какая информация используется для решения о том, является мутация разрушительной или нет? Take home messagesЗадачи биоинформатики очень похожи на лабораторные эксперименты:Мы должны понимать концепции, ВопросКак мы используем избыточность в последовательностях?
Слайды презентации

Слайд 2 Будущее инженерной науки будет связано с робототехникой, биоинженерией

Будущее инженерной науки будет связано с робототехникой, биоинженерией и биоинформатикой, а

и биоинформатикой, а также физико-химическим конструированием
Виктор Садовничий: ректор МГУ,

президент Союза ректоров

Челябинск, совете Союза ректоров, посвященном созданию новой концепции инженерного образования. 26.09.2014


Слайд 3 Что такое биоинформатика?
Википедия (англ):
Биоинформатика — это междисциплинарная область

Что такое биоинформатика?Википедия (англ):Биоинформатика — это междисциплинарная область исследований и разработки

исследований и разработки методов и программных средств для изучения биологических

данных.

Зачем она нужна?

- Иногда по существу вопроса
Иногда для экономии времени
Иногда в дополнение

Какие узкие места были у биоинформатики при ее возникновении?



Слайд 4 National Science Foundation (США):
Узкие места в биоинформатике:
необходимость

National Science Foundation (США):Узкие места в биоинформатике: необходимость обучения биологов владению

обучения биологов владению передовыми вычислительным средствами,
Необходимость приглашения программистов

в эту развивающуюся область знаний,
ограниченная доступность баз данных биологической информации,
потребность в более эффективных и интеллектуальных поисковых системах для этих баз данных.


Слайд 5 Цели биоинформатики
Конструирование и сопровождение биологических баз данных.
Разработка программного

Цели биоинформатикиКонструирование и сопровождение биологических баз данных.Разработка программного обеспечения для анализа

обеспечения для анализа последовательностей, структур и функций.
Применение или разработка

подходов к пониманию биологических данных.

Слайд 6 Зачем углубляться в изучение средств и баз данных

Зачем углубляться в изучение средств и баз данных по биоинформатике?Важно иметь

по биоинформатике?
Важно иметь представление о базовых концепциях и алгоритмах

в биоинформатике (исследования in silico),
также как необходимо понимать базовые основы и химический базис молекулярной биологии, генетики, биохимии если вы занимаетесь лабораторными экспериментами (исследования in vitro).

Слайд 7 Что такое алгоритм?
Алгоритм – это набор инструкций, которые

Что такое алгоритм?Алгоритм – это набор инструкций, которые необходимо выполнить для того, чтобы решить задачу.

необходимо выполнить для того, чтобы решить задачу.


Слайд 8 Что такое база данных?
Коллекция взаимосвязанных элементов данных
таблиц (например,

Что такое база данных?Коллекция взаимосвязанных элементов данныхтаблиц (например, генов, организмов, последовательностей и т.д.)столбцов (полей)строк (записей)

генов, организмов, последовательностей и т.д.)
столбцов (полей)
строк (записей)


Слайд 9 Биологические базы данных
Сколько их?
Разные по размеру, качеству, полноте,

Биологические базы данныхСколько их?Разные по размеру, качеству, полноте, степени интересаЧто представляет из себя «хорошая» база данных?

степени интереса
Что представляет из себя «хорошая» база данных?


Слайд 10 GenBank www.ncbi.nlm.nih.gov последовательности нуклеотидов
Ensembl www.ensembl.org человеческие, мышиные и др. геномы
PubMed www.ncbi.nlm.nih.gov научные публикации
NR www.ncbi.nlm.nih.gov белковые

GenBank		www.ncbi.nlm.nih.gov	последовательности нуклеотидовEnsembl		www.ensembl.org		человеческие, мышиные и др. геномы PubMed		www.ncbi.nlm.nih.gov	научные публикацииNR		www.ncbi.nlm.nih.gov	белковые последовательностиSWISS-PROT	www.expasy.ch		белковые последовательностиInterPro		www.ebi.ac.uk		белковые доменыOMIM		www.ncbi.nlm.nih.gov	генетические заболеванияEnzymes		www.chem.qmul.ac.uk	ферментыPDB		www.rcsb.org/pdb/		белковые структурыKEGG		www.genome.ad.jp		метаболические путиБазы данных

последовательности
SWISS-PROT www.expasy.ch белковые последовательности
InterPro www.ebi.ac.uk белковые домены
OMIM www.ncbi.nlm.nih.gov генетические заболевания
Enzymes www.chem.qmul.ac.uk ферменты
PDB www.rcsb.org/pdb/ белковые структуры
KEGG www.genome.ad.jp метаболические пути
Базы данных


Слайд 11 Специализированные базы данных
PomBase компиляция данных, посвященных организму Schizosaccharomyces

Специализированные базы данныхPomBase компиляция данных, посвященных организму Schizosaccharomyces pombe Wormpep предсказанные

pombe


Wormpep предсказанные белки по проекту секвенирования Caenorhabditis elegans

(C. elegans).

Mistdb база данных передачи сигналов в микробиологии


Слайд 12 Вебсайт или веб-приложение?
Статический – Интерактивный контент
Чисто информационный –

Вебсайт или веб-приложение?Статический – Интерактивный контентЧисто информационный – Программное средство

Программное средство


Слайд 13 Веб-серверы и облачные вычисления
Преимущества:
Удаленная инфраструктура, возможно, имеет большую

Веб-серверы и облачные вычисленияПреимущества:Удаленная инфраструктура, возможно, имеет большую вычислительную мощность чем

вычислительную мощность чем ваша.
Обновления данных и изменения функциональности происходят

онлайн.
Недостатки:
Вы используете чужой компьютер с ограниченными возможностями администрирования и программирования.
Вы (вероятно) имеете урезанный выбор опций или мощности.
Взаимодействие с внешними сетями может значительно замедлить выполнение задачи.

Серверы хороши для разовой проверки какой-то идеи, при критической необходимости в вычислительных сверхмощностях, а также в период интенсивно обновляемых разработчиком данных и функций.
Для регулярной ежедневной работы желательно получить и установить программное обеспечение локально

Слайд 14 Советы для использования удаленных серверов в научных исследованиях
Записывайте

Советы для использования удаленных серверов в научных исследованияхЗаписывайте все:имя и/или адрес

все:
имя и/или адрес сервера, названия баз данных и версии.
дату
идентификационные

номера последательностей
параметры (настройки, умолчания, параметры запросов)
Сохраняйте результаты
Установите локально если знаете, что будете использовать в будущем

Слайд 15 «Кейс с инструментами» специалиста-биоинформатика

«Кейс с инструментами» специалиста-биоинформатика

Слайд 16 Предсказание генов
GRAIL (Xgrail, JavaGrail, etc.) Gene Relationships Across

Предсказание геновGRAIL (Xgrail, JavaGrail, etc.) Gene Relationships Across Implicated LociGeneidNetgeneGenMarkFexon, Hexon GENSCANXpound Genefinder

Implicated Loci
Geneid
Netgene
GenMark
Fexon, Hexon
GENSCAN
Xpound
Genefinder


Слайд 17 Выравнивание последовательностей
Выравнивание двух последовательностей
Одновременное выравнивание нескольких последовательностей

Выравнивание последовательностейВыравнивание двух последовательностейОдновременное выравнивание нескольких последовательностей

Слайд 18 Выравнивание пар последовательностей
SIM (только белки) – поиск k-лучших

Выравнивание пар последовательностейSIM (только белки) – поиск k-лучших непересекающихся выравниваний (ExPASy,

непересекающихся выравниваний (ExPASy, Швейцария)
ALIGN – оптимальное глобальное выравнивание без

сокращений (EERIE, Франция)
LALIGN – вычисление N-лучших локальных выравниваний (EERIE)
LFASTA – поиск локальных совпадений, демонстрирущих локальные выравнивания (EERIE)
BLAST 2 – локальное выравнивание с использованием BLAST (NCBI, США)
LAP2 – локальное выравнивание ДНК–белок LAP2 (MTU, США)



Слайд 19 Взаимное выравнивание нескольких последовательностей
ClustalW
MAFFT
T-Coffee
MUSCLE

Взаимное выравнивание нескольких последовательностейClustalWMAFFTT-Coffee MUSCLE

Слайд 20 Поиск совпадений
BLAST
blastp, запрос — последовательность аминокислот к

Поиск совпаденийBLASTblastp, запрос — последовательность аминокислот к базе белковых последовательностей.blastn запрос

базе белковых последовательностей.
blastn запрос — последовательность нуклеотидов к

базе известных последовательностей нуклеотидов.
blastx запрос — последовательность нуклеотодов и продукты ее трансляции (обе нити) к базе белковых последовательностей.
tblastn запрос — последовательность аминокислот к базе последовательностей нуклеотидов, динамически транслируемых на всех рамках считывания (обеих нитях).
tblastx запрос — все трансляции последовательности нуклеотидов к динамически вычисляемым трансляциям базы данных нуклеотидных последовательностей.


Слайд 21 Предсказание структуры белка
Ab initio («с нуля»): основанное на

Предсказание структуры белкаAb initio («с нуля»): основанное на минимизации энергииРаспознавание фолдинга:

минимизации энергии
Распознавание фолдинга: последовательность -> вторичная структура, затем выравнивание

вторичных структур со вторичными структурами соответствующих белков, и т.д.
Статистическое: основанное на «скрытых образцах (hidden patterns)»; схожие шаблонные образцы -> сходная структура.

Слайд 22 Предсказание вторичной структуры белка
Coils – предсказания суперспиральных регионов
nnPredict

Предсказание вторичной структуры белкаCoils – предсказания суперспиральных регионовnnPredict – использует двухуровневую

– использует двухуровневую нейронную сеть
PSSP / SSP – сегментно-ориентированные

предсказания
PSSP / NNSSP – предсказание методом ближайшего соседа
SAPS – статистический анализ белковых последовательностей
Paircoil – поедсказания суперспиральных регионы по корреляциям парных остатков
Protein Hydrophilicity /Hydrophobicity
SOPM – самооптимизирующийся метод предсказания

Слайд 23 Предсказание функции белка
Homology
Sequence
Structure
Genomic context
Co-expression

Предсказание функции белкаHomologySequenceStructureGenomic contextCo-expression

Слайд 24 Филогенетический анализ
Построение эволюционных деревьев на основе дивиргенций возникших

Филогенетический анализПостроение эволюционных деревьев на основе дивиргенций возникших в связянных последовательностяхPhymlraxMLFastTreeProtdist

в связянных последовательностях
Phyml
raxML
FastTree
Protdist and Neighbor-joining


Как построить бактериальное дерево

жизни?
Как лучше всего построить дерево жизни, включающее человека, шимпанзе, лошадь и крысу?


Слайд 25 Предсказание эффекта мутаций
PolyPhen
SIFT
SNAP
PROVEAN


Какая информация используется для решения о

Предсказание эффекта мутацийPolyPhenSIFTSNAPPROVEAN…Какая информация используется для решения о том, является мутация разрушительной или нет?

том, является мутация разрушительной или нет?


Слайд 26 Take home messages
Задачи биоинформатики очень похожи на лабораторные

Take home messagesЗадачи биоинформатики очень похожи на лабораторные эксперименты:Мы должны понимать

эксперименты:
Мы должны понимать концепции, используя программные средства и базы

данных
Это замечательно выполнять эксперименты в рамках компьютерной геномики, если вы четко понимаете что делаете.
Разработка алгоритма (или подхода) требует опыта и знаний в соответствующих областях.
Если вы в лаборатории компьютерной биологии, то ведение журналов – необходимый навык.

  • Имя файла: vvedenie-v-bioinformatiku.pptx
  • Количество просмотров: 115
  • Количество скачиваний: 0