Слайд 2
Введение
В настоящее время попытки создания интеллектуального речевого интерфейса
“человек-машина” все более перемещаются в реальную жизнь, а соответствующие
системы стремятся занять свое место под солнцем в кабинах самолетов, рубках кораблей, трубках мобильных телефонов и т.д.
Слайд 3
Электронные приборы как бытовые, так и используемые в
различной профессиональной деятельности людей, продолжают “обрастать” все новыми многофункциональными
кнопками, значения которых не в состоянии быстро запомнить и эффективно использовать, особенно в условиях возможного дефицита времени, ни один нормальный человек.
Актуальность
Слайд 4
Позволит легко открывать необходимое приложение вместо длительного и
скучного процесса поиска нужных файлов в различных системных директориях
компьютера.
Поможет работе с ПК людям с различными патологиями (например: зрения и др.).
Облегчит работу с ПК в ситуациях, когда руки пользователя заняты.
Актуальность
Слайд 5
Еще лет 30 назад, а может быть и
более, специалисты предрекали блестящее будущее подобным системам.
Но предсказания
не оправдались, несмотря на значительные успехи в области повышения надежности распознавания речи, в особенности команд из ограниченного набора.
Актуальность
Слайд 6
Причины
Существенную зависимость надежности распознавания от индивидуальных особенностей диктора
Подчиненность результатов распознавания текущему психофизиологическому состоянию человека
Сильное влияние
акустических помех, присутствующих в ситуациях реальной жизни
Наличие пользовательского стереотипа управления
Слайд 7
Принципы работы
Технология распознавания позволяет организовать одновременное распознавание 100-200
команд в дикторозависимом режиме.
То есть, пользователь должен обучить
каждую команду на свой голос, прежде чем система начнет работать.
И 30-50 команд в дикторонезависимом режиме, но только для неизменного набора команд, для которого предварительно собирается база эталонов этих команд.
Слайд 8
При этом пользователю не обязательно обучать систему перед
началом работы.
При правильном структурировании использования словаря, то есть
когда на каждом уровне доступно 20-30 команд, возможно использование словарей практически неограниченного объема.
Принципы работы
Слайд 9
Ошибки распознавания
1) “Неизвестная команда --> известная недоступная
команда” - (оператор ошибся, машина не смогла распознать ошибку);
2) “Неизвестная команда --> известная доступная команда ” - (оператор ошибся, машина не смогла распознать ошибку);
3) “Известная доступная команда ---> неизвестная команда ” (ошиблась машина);
Слайд 10
4) “Известная недоступная команда --> неизвестная команда ”
- (оператор ошибся, машина не смогла распознать ошибку);
5)
“Известная доступная команда --> известная недоступная команда ” (ошиблась машина);
6) “Известная доступная команда --> известная доступная команда распознана неправильно ” (ошиблась машина).
Ошибки распознавания
Слайд 11
Чтобы поведение машины выглядело дружелюбным и “интеллектуальным” возможны
следующие основные варианты ее реакции:
промолчать и ничего не делать;
сообщить человеку о возможной ошибке и попросить повторить команду;
предложить помощь, произнося доступные в данном режиме команды.
Реакция компьютера
Слайд 12
Совсем не лишним будет заранее “договориться” с машиной
о том, как она будет интерпретировать молчание хозяина:
молчит -
выполнить команду;
молчит - не выполнять команду;
молчит - у хозяина отказали мозги или пропал голос, запрошу еще раз, а там видно будет…
Реакция компьютера
Слайд 13
Программы для голосового управления компьютером
Слайд 14
DragonDictate for Windows 3.0
Программа для контроля за работой
и предоставления возможности диктования для Microsoft Windows 95, Windows
NT и Windows 3.x. Пакет позволяет виртуально поддерживать многие приложения Windows, включая Corel WordPerfect Suite, Lotus SmartSuite и Microsoft Office. Вы можете также осуществить поддержку других программ, использовать мощный редактор макросов. DragonDictate позволяет диктовать в любом приложении, а также поддерживать широкий набор голосовых команд редактирования и навигации.
Слайд 15
Voice Systems Listen 3.0 for Windows
Программа предоставляет список
предусмотренных команд, который изменяется в зависимости от контекста речевой
акции и приложения, в котором используется. Предусмотрена возможность добавлять новые команды. Следует отметить несколько сложный процесс тренировки, предусматривающий, в частности, голосовой контроль размера шрифта от 1 до 99. Утешением может служить то, что это придется делать лишь единожды.
Слайд 16
Simply Speaking Gold
Программа для голосового контроля, предусматривающая также
возможность дискретного диктования. Прежде чем дать голосовую команду, следует
прекратить диктование. Есть возможность использовать подсказку "Что я могу сказать?", открывающую окно со списком команд, работающим в данном приложении. Сопутствующая документация очень слаба, однако ее расширенный вариант доступен через Интернет.
Слайд 17
VoicePlus
Программа для голосовых команд. Вы можете использовать ее
для диктования в различных Windows-приложениях, а открыв специальное окно,
произвести побуквенную транскрипцию слов. Новая программа компании L&H Voice Xpress поддерживает режим непрерывной речи и полный набор голосовых команд.
Слайд 18
VoiceCommands
Разработана специально для Microsoft Word. Она не поддерживает
режим диктования вообще, однако имеет широкий набор команд редактирования
и форматирования.
Слайд 19
Горыныч
Программа распознавания русской речи. Программный комплекс "Горыныч" –
первая русскоязычная система автоматического распознавания речи. Программа для диктовки
и голосового управления компьютером по-русски.
Слайд 20
ввод текста с голоса на русском и английском
языке;
голосовое управление периферийным оборудованием;
голосовое управление отдельными функциями операционных
систем Microsoft Windows;
голосовое управление функциями текстовых редакторов и прикладных программ;
позволяет оформлять документы, дипломные работы (включая формулы) для школьников, абитуриентов, студентов.
Слайд 21
Заключение
Предложенный подход к созданию систем речевого управления в
части психолого-эргономических аспектов проектирования интерфейса “человек – машина” для
работы на ограниченном наборе речевых команд был достаточно успешно апробирован при создании компьютерных прототипов систем речевого управления общего назначения с использованием собственного оригинального программного обеспечения процедуры распознавания.
Слайд 22
Ресурсы
http://209.85.135.132/search?q=cache:VOQlfj8TQwkJ:www.evarussia.ru/upload/doklad/doklad_198.rtf+%D0%B3%D0%BE%D0%BB%D0%BE%D1%81%D0%BE%D0%B2%D0%BE%D0%B5+%D1%83%D0%BF%D1%80%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5+%D0%BA%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BE%D0%BC+%D0%B4%D0%BE%D0%BA%D0%BB%D0%B0%D0%B4&cd=3&hl=ru&ct=clnk&gl=ru
http://mixzona.ru/referat/referat/73201/
http://103.by/blog/tag/upravlenie-kompyuterom-golosom/
http://speech-soft.ru/index.php?a=inf&inf=rasp