Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Введение в техническое зрение

Содержание

Презентации будут доступны (флешка, дропбокс, BTSync)Вместо упражнений по пятницам – домашние задания1-2 домашних задания => экзамен/зачёт за СЕМЕСТР автоматомВозможные задания:1) практическая работа + её демонстрация на лекции2) реферат + докладСписок вопросов/тем будет ближе к середине семестраМеня
Введение в техническое зрениеСтепанов Дмитрий НиколаевичНачальник лаборатории систем технического зренияdnstepanov@gmail.comImage by kirkh.deviantart.com Презентации будут доступны (флешка, дропбокс, BTSync)Вместо упражнений по пятницам – домашние задания1-2 Есть возможность написания НИР и бакалаврских работТематика: техническое зрение и/или нейронные сети, Что такое компьютерное зрение?Почему это сложноПримеры использованияСмежные областиМобильные роботыВопросыСегодняшнее занятие - введение Основная идеяПозволить компьютерам понимать изображения и видеоСмежные областиКомпьютерная графика: модели – в ЗрениеПотрясающая способность живых существ50% головного мозга макакиСамая большая часть мозга человека среди Почему это сложно Почему это важноБезопасностьЗдоровьеОхранаКомфорти др.Развлечение Самая короткая история технического зренияЗрение1966: Марвин Минский сформулировал студенту летнюю задачу в Optical character recognition (OCR)Распознавание цифр, AT&T labshttp://www.research.att.com/~yann/Технология для преобразования сканированных документов в текстРаспознавание номерных знаковhttp://en.wikipedia.org/wiki/Automatic_number_plate_recognition Обнаружение лицКамеры, смартфоны сейчас легко обнаруживают лица Обнаружение улыбокSony Cyber-shot® T70 Digital Still Camera Распознавание объектов (в супермаркетах)Штрих-кодыLaneHawk by EvolutionRobotics“A smart camera is flush-mounted in the БиометрияКак «афганская девушка» Шарбат Гула была идентифицирована спустя 18 лет по радужной оболочке (iris recognition) Вход без пароляСканеры отпечатков – смартфоны, мыши, системы безопасности, автомобилиРаспознавание лиц (по Распознавание объектовPoint & Find, NokiaGoogle Goggles СпецэффектыThe Matrix movies, ESC Entertainment, XYZRGB, NRC Реконструкция 3D-модели движущегося лицаTotal Moving Face Reconstruction, ECCV 2014Supasorn Suwajanakorn, Ira Kemelmacher-Shlizerman, Steven M. Seitz Захват движения (MoCap)Pirates of the Carribean, Industrial Light and Magic Захват движения (MoCap) Анализ спортивных игрSportvision first down lineNice explanation on www.howstuffworks.comhttp://www.sportvision.com/video.html «Умные» автомобилиMobileyeBMW, GM, Volvo и др. (70% производителей ещё в 2010 году)Slide GoogleOct 9, 2010.  ИгрыObject Recognition: http://www.youtube.com/watch?feature=iv&v=fQ59dXOo63oMario: http://www.youtube.com/watch?v=8CTJL5lUjHg3D: http://www.youtube.com/watch?v=7QrnwoO1-8ARobot: http://www.youtube.com/watch?v=w8BmgtMKFbY МедицинаImage guided surgeryGrimson et al., MIT3D imagingMRI, CT Промышленные роботыVision-guided robots position nut runners on wheels Мобильные роботыhttp://www.robocup.org/NASA’s Mars Spirit Roverhttp://en.wikipedia.org/wiki/Spirit_roverSaxena et al. 2008STAIR at Stanford КосмосVision systems (JPL) used for several tasksPanorama stitching3D terrain modelingObstacle detection, position НавигацияПо визуальным маркерамPTAM, LSD-SLAM, ORB-SLAMОбеспечение безопасного вождения, обнаружение препятствийПлоскостьСтереоKinectСтруктурированная подсветкаСТЗ для роботов Соединение информации от датчиков различной физической природыСТЗ +Одометрия (пройденный путь)GPS(сканирующий) лазерный дальномерКомплексирование Качественная навигацияКак мы определяем, куда идтиКак ставим и описываем себе и другим Камера и человеческий глазВосприятие света и цветаПикселиМодель камеры, преобразование геометрииФильтрация изображенийДальше Россия, 194064, г. Санкт-Петербург, Тихорецкий пр., 21тел.: (812) 552-0110 (812) 552-1325
Слайды презентации

Слайд 2 Презентации будут доступны (флешка, дропбокс, BTSync)
Вместо упражнений по

Презентации будут доступны (флешка, дропбокс, BTSync)Вместо упражнений по пятницам – домашние

пятницам – домашние задания
1-2 домашних задания => экзамен/зачёт за

СЕМЕСТР автоматом
Возможные задания:
1) практическая работа + её демонстрация на лекции
2) реферат + доклад
Список вопросов/тем будет ближе к середине семестра
Меня можно найти почти каждый день, 10:00-18:00, к. 5014/5017
Электронная почта: dnstepanov@gmail.com
Кафедра требует отмечать посещаемость, 4 пропуска – объяснения с Юревичем

Организационные вопросы


Слайд 3 Есть возможность написания НИР и бакалаврских работ
Тематика: техническое

Есть возможность написания НИР и бакалаврских работТематика: техническое зрение и/или нейронные

зрение и/или нейронные сети, машинное обучение
Требования: чтение иностранных статей,

программирование (Matlab, C/C++, Python)
Бонусы: реальное внедрение, возможность устройства на работу

НИР и бакалаврские работы


Слайд 4 Что такое компьютерное зрение?
Почему это сложно
Примеры использования
Смежные области
Мобильные

Что такое компьютерное зрение?Почему это сложноПримеры использованияСмежные областиМобильные роботыВопросыСегодняшнее занятие - введение

роботы
Вопросы
Сегодняшнее занятие - введение


Слайд 5 Основная идея
Позволить компьютерам понимать изображения и видео
Смежные области
Компьютерная

Основная идеяПозволить компьютерам понимать изображения и видеоСмежные областиКомпьютерная графика: модели –

графика: модели – в изображения
Компьютерная фотография: изображения – в

изображения
Компьютерное зрение: изображения – в модели

Что такое компьютерное зрение?

Что изображено на сцене?
Где автомобили?
Как далеко до здания?


Слайд 6 Зрение
Потрясающая способность живых существ
50% головного мозга макаки
Самая большая

ЗрениеПотрясающая способность живых существ50% головного мозга макакиСамая большая часть мозга человека

часть мозга человека среди других функций
До 93% информации –

из зрения

Почему это сложно

Это король или ферзь?


Слайд 7 Почему это сложно

Почему это сложно

Слайд 10 Почему это важно
Безопасность
Здоровье
Охрана
Комфорт
и др.
Развлечение

Почему это важноБезопасностьЗдоровьеОхранаКомфорти др.Развлечение

Слайд 11 Самая короткая история технического зрения
Зрение
1966: Марвин Минский сформулировал

Самая короткая история технического зренияЗрение1966: Марвин Минский сформулировал студенту летнюю задачу

студенту летнюю задачу в области технического зрения (connect a

television camera to a computer and get the machine to describe what it sees)
1970’s: Некоторый прогресс в понимании отдельных изображений
1980’s: нейросети; сдвиг в сторону геометрии и математической строгости
1990’s: распознавание лиц; статистический анализ
2000’s: широкое признание; большие размеченные базы данных; начало обработки видео
2030’s: восстание машин?

Guzman ‘68

Ohta Kanade ‘78

Turk and Pentland ‘91


Слайд 12 Optical character recognition (OCR)
Распознавание цифр, AT&T labs
http://www.research.att.com/~yann/
Технология для

Optical character recognition (OCR)Распознавание цифр, AT&T labshttp://www.research.att.com/~yann/Технология для преобразования сканированных документов в текстРаспознавание номерных знаковhttp://en.wikipedia.org/wiki/Automatic_number_plate_recognition

преобразования сканированных документов в текст
Распознавание номерных знаков
http://en.wikipedia.org/wiki/Automatic_number_plate_recognition


Слайд 13 Обнаружение лиц
Камеры, смартфоны сейчас легко обнаруживают лица

Обнаружение лицКамеры, смартфоны сейчас легко обнаруживают лица

Слайд 14 Обнаружение улыбок
Sony Cyber-shot® T70 Digital Still Camera

Обнаружение улыбокSony Cyber-shot® T70 Digital Still Camera

Слайд 18 Распознавание объектов (в супермаркетах)
Штрих-коды
LaneHawk by EvolutionRobotics
“A smart camera

Распознавание объектов (в супермаркетах)Штрих-кодыLaneHawk by EvolutionRobotics“A smart camera is flush-mounted in

is flush-mounted in the checkout lane, continuously watching for

items. When an item is detected and recognized, the cashier verifies the quantity of items that were found under the basket, and continues to close the transaction. The item can remain under the basket, and with LaneHawk,you are assured to get paid for it… “

Слайд 19 Биометрия
Как «афганская девушка» Шарбат Гула была идентифицирована спустя

БиометрияКак «афганская девушка» Шарбат Гула была идентифицирована спустя 18 лет по радужной оболочке (iris recognition)

18 лет по радужной оболочке (iris recognition)


Слайд 20 Вход без пароля
Сканеры отпечатков – смартфоны, мыши, системы

Вход без пароляСканеры отпечатков – смартфоны, мыши, системы безопасности, автомобилиРаспознавание лиц

безопасности, автомобили
Распознавание лиц (по небольшой базе – вполне надёжно)


Слайд 21 Распознавание объектов
Point & Find, Nokia
Google Goggles

Распознавание объектовPoint & Find, NokiaGoogle Goggles

Слайд 22 Спецэффекты
The Matrix movies, ESC Entertainment, XYZRGB, NRC

СпецэффектыThe Matrix movies, ESC Entertainment, XYZRGB, NRC

Слайд 23 Реконструкция 3D-модели движущегося лица
Total Moving Face Reconstruction, ECCV

Реконструкция 3D-модели движущегося лицаTotal Moving Face Reconstruction, ECCV 2014Supasorn Suwajanakorn, Ira Kemelmacher-Shlizerman, Steven M. Seitz

2014
Supasorn Suwajanakorn, Ira Kemelmacher-Shlizerman, Steven M. Seitz


Слайд 26 Захват движения (MoCap)
Pirates of the Carribean, Industrial Light

Захват движения (MoCap)Pirates of the Carribean, Industrial Light and Magic

and Magic


Слайд 28 Захват движения (MoCap)

Захват движения (MoCap)

Слайд 29 Анализ спортивных игр
Sportvision first down line
Nice explanation on

Анализ спортивных игрSportvision first down lineNice explanation on www.howstuffworks.comhttp://www.sportvision.com/video.html

www.howstuffworks.com

http://www.sportvision.com/video.html


Слайд 30 «Умные» автомобили
Mobileye
BMW, GM, Volvo и др. (70% производителей

«Умные» автомобилиMobileyeBMW, GM, Volvo и др. (70% производителей ещё в 2010

ещё в 2010 году)
Slide content courtesy of Amnon Shashua


Слайд 31 Google
Oct 9, 2010. "Google Cars Drive Themselves, in Traffic". The

GoogleOct 9, 2010. 

New York Times. John Markoff
June 24, 2011. "Nevada state

law paves the way for driverless cars". Financial Post. Christine Dobby
Aug 9, 2011, "Human error blamed after Google's driverless car sparks five-vehicle crash". The Star (Toronto)

Слайд 32 Игры
Object Recognition: http://www.youtube.com/watch?feature=iv&v=fQ59dXOo63o
Mario: http://www.youtube.com/watch?v=8CTJL5lUjHg
3D: http://www.youtube.com/watch?v=7QrnwoO1-8A
Robot: http://www.youtube.com/watch?v=w8BmgtMKFbY

ИгрыObject Recognition: http://www.youtube.com/watch?feature=iv&v=fQ59dXOo63oMario: http://www.youtube.com/watch?v=8CTJL5lUjHg3D: http://www.youtube.com/watch?v=7QrnwoO1-8ARobot: http://www.youtube.com/watch?v=w8BmgtMKFbY

Слайд 33 Медицина
Image guided surgery
Grimson et al., MIT
3D imaging
MRI, CT

МедицинаImage guided surgeryGrimson et al., MIT3D imagingMRI, CT

Слайд 34 Промышленные роботы
Vision-guided robots position nut runners on wheels

Промышленные роботыVision-guided robots position nut runners on wheels

Слайд 35 Мобильные роботы
http://www.robocup.org/

NASA’s Mars Spirit Rover
http://en.wikipedia.org/wiki/Spirit_rover
Saxena et al. 2008
STAIR

Мобильные роботыhttp://www.robocup.org/NASA’s Mars Spirit Roverhttp://en.wikipedia.org/wiki/Spirit_roverSaxena et al. 2008STAIR at Stanford

at Stanford


Слайд 36 Космос
Vision systems (JPL) used for several tasks
Panorama stitching
3D

КосмосVision systems (JPL) used for several tasksPanorama stitching3D terrain modelingObstacle detection,

terrain modeling
Obstacle detection, position tracking
For more, read “Computer Vision

on Mars” by Matthies et al.

NASA'S Mars Exploration Rover Spirit captured this westward view from atop a low plateau where Spirit spent the closing months of 2007.


Слайд 37 Навигация
По визуальным маркерам
PTAM, LSD-SLAM, ORB-SLAM
Обеспечение безопасного вождения, обнаружение

НавигацияПо визуальным маркерамPTAM, LSD-SLAM, ORB-SLAMОбеспечение безопасного вождения, обнаружение препятствийПлоскостьСтереоKinectСтруктурированная подсветкаСТЗ для роботов

препятствий
Плоскость
Стерео
Kinect
Структурированная подсветка



СТЗ для роботов


Слайд 38 Соединение информации от датчиков различной физической природы
СТЗ +
Одометрия

Соединение информации от датчиков различной физической природыСТЗ +Одометрия (пройденный путь)GPS(сканирующий) лазерный дальномерКомплексирование

(пройденный путь)
GPS
(сканирующий) лазерный дальномер



Комплексирование


Слайд 39 Качественная навигация
Как мы определяем, куда идти
Как ставим и

Качественная навигацияКак мы определяем, куда идтиКак ставим и описываем себе и

описываем себе и другим цели навигации
Уровень абстракции – «какой-то

розовый 9-этажный дом»
Без метрики и чисел


Новый подход (самое начало пути)


Слайд 40 Камера и человеческий глаз
Восприятие света и цвета
Пиксели
Модель камеры,

Камера и человеческий глазВосприятие света и цветаПикселиМодель камеры, преобразование геометрииФильтрация изображенийДальше

преобразование геометрии
Фильтрация изображений
Дальше


  • Имя файла: vvedenie-v-tehnicheskoe-zrenie.pptx
  • Количество просмотров: 87
  • Количество скачиваний: 1
- Предыдущая Позвоночные мышцы
Следующая - Адаптация к школе