Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Системы оптического распознавания документов

Содержание

Системы оптического распознавания символовПри coздании электронных библиотек и архивов путем перевода книг и документов в цифровой компьютерный формат, при переходе предприятий от бумажного к электронному документообороту, при необходимости отредактировать полученный по факсу документ используются системы оптического
Системы оптического распознавания документов Системы оптического распознавания символовПри coздании электронных библиотек и архивов путем перевода книг Оптическое распознавание символовОптическое распознавание символов (англ. optical character recognition, OCR) — механический или Однако для получения документа в формате текстового файла необходимо провести распознавание текста, Сначала необходимо распознать структуру размещения текста на странице: выделить колонки, таблицы, изображения Хорошее качество текста Растровый метод распознавания текстаСначала растровое изображение страницы разделяется на Хорошее качество текста Растровый метод распознавания текстаРастровое изображение каждого символа последовательно накладывается Плохое качество текста Структурный метод распознаванияПри распознавании документов с низким качеством печати Плохое качество текста Структурный метод распознаванияПри pacпознавании структурным методом в искаженном символьном Системы оптического распознавания форм При проведении Единого государственного экзамена, при заполнении налоговых Бланком называется стандартный лист бумаги, на котором размещается постоянная информация и отведено Для обработки бланков предназначено специальное приложение FineReader Forms.Для распознавания содержимого бланка необходимо Системы распознавания рукописного текста С появлением первого карманного компьютера Newton фирмы Apple Системы распознавания рукописного текста Программы оптического распознавания текста Программы оптического распознавания документовБумажный носитель помещается под крышку сканераВ программе отдаётся команда Принцип работы сканера состоит в следующем: в результате Программы распознавания текстаПреобразованием графического изображения в текст занимаются специальные программы распознавания текста ABBYY FineReader Популярная проприетарная программа распознавания текста компании ABBYYПрограмма производит распознавание текста Процесс обработки FineReaderСканирование (сканер, цифровой фотоаппарат, цифровая видеокамера).Сегментация - выделение блоков на
Слайды презентации

Слайд 2 Системы оптического распознавания символов
При coздании электронных библиотек и

Системы оптического распознавания символовПри coздании электронных библиотек и архивов путем перевода

архивов путем перевода книг и документов в цифровой компьютерный

формат, при переходе предприятий от бумажного к электронному документообороту, при необходимости отредактировать полученный по факсу документ используются системы оптического распознавания символов.

Слайд 3 Оптическое распознавание символов
Оптическое распознавание символов (англ. optical character recognition,

Оптическое распознавание символовОптическое распознавание символов (англ. optical character recognition, OCR) — механический

OCR) — механический или электронный перевод изображений рукописного, машинописного

или печатного текста в последовательность кодов, использующихся для представления в текстовом редакторе.

С помощью сканера несложно получить изображение страницы текста в графическом файле.

Слайд 4 Однако для получения документа в формате текстового файла

Однако для получения документа в формате текстового файла необходимо провести распознавание

необходимо провести распознавание текста, т. е. преобразовать элементы графического

изображения в последовательности текстовых символов.

Слайд 5 Сначала необходимо распознать структуру размещения текста на странице:

Сначала необходимо распознать структуру размещения текста на странице: выделить колонки, таблицы,

выделить колонки, таблицы, изображения и т. д.
Далее выделенные

текстовые фрагменты графического изображения страницы необходимо преобразовать в текст.

Слайд 6 Хорошее качество текста Растровый метод распознавания текста
Сначала растровое изображение

Хорошее качество текста Растровый метод распознавания текстаСначала растровое изображение страницы разделяется

страницы разделяется на изображения отдельных символов.
Затем каждый из

них последовательно накладывается на шаблоны символов, имеющихся в памяти системы, и выбирается шаблон с наименьшим количеством точек, отличных от входного изображения.

Слайд 7 Хорошее качество текста Растровый метод распознавания текста
Растровое изображение каждого

Хорошее качество текста Растровый метод распознавания текстаРастровое изображение каждого символа последовательно

символа последовательно накладывается на растровые шаблоны символов, хранящиеся в

памяти системы оптического распознавания. Результатом распознавания является символ, шаблон которого в наибольшей степени совпадает с изображением

Например, распознаваемый символ "Б" накладывается на растровые шаблоны символов (А, Б, В и т. д.)


Слайд 8 Плохое качество текста Структурный метод распознавания

При распознавании документов с

Плохое качество текста Структурный метод распознаванияПри распознавании документов с низким качеством

низким качеством печати (машинописный текст, факс и т.д.) используется

метод распознавания структурных элементов (отрезков, колец, дуг и др.) символов. В искаженном символьном изображении выделяются характерные детали и сравниваются со структурными шаблонами символов.


Любой символ можно описать через набор параметров, определяющих взаимное расположение eгo элементов. Например, буква «Н» и буква «И» состоят из трех отрезков, два из которых расположены параллельно друг другу, а третий соединяет эти отрезки. Различие между буквами в величине улов, которые составляет третий отрезок с двумя другими.

Слайд 9 Плохое качество текста Структурный метод распознавания
При pacпознавании структурным методом

Плохое качество текста Структурный метод распознаванияПри pacпознавании структурным методом в искаженном

в искаженном символьном изображении выделяются характерные детали и сравниваются

со структурными шаблонами символов.
В результате выбирается тот символ, для которого совокупность всех структурных элементов и их расположение больше всего coответствуют распознаваемому символу.

Например, распознаваемый символ "Б" накладывается на векторные шаблоны символов (А, Б, В и т. д.)


Слайд 10 Системы оптического распознавания форм
При проведении Единого государственного

Системы оптического распознавания форм При проведении Единого государственного экзамена, при заполнении

экзамена, при заполнении налоговых деклараций и т. д. используются

различного вида бланки с полями. Рукописные тексты (данные вводятся в поля печатными буквами от руки) распознаются с помощью систем оптического распознавания форм и вносятся в компьютерные базы данных.
Сложность состоит в том, что необходимо распознавать символы, написанные от руки, а они довольно сильно различаются у разных людей. Кроме того, система должна определить, к какому полю относится распознаваемый текст.

Слайд 11 Бланком называется стандартный лист бумаги, на котором размещается

Бланком называется стандартный лист бумаги, на котором размещается постоянная информация и

постоянная информация и отведено место для переменной.
Сложность состоит

в том, что необходимо распознать написанные от руки символы, довольно сильно различающиеся у разных людей.
Кроме того система должна определить, к какому полю относится распознаваемый текст.

FineReader Forms

Системы оптического распознавания форм


Слайд 12 Для обработки бланков предназначено специальное приложение FineReader Forms.
Для

Для обработки бланков предназначено специальное приложение FineReader Forms.Для распознавания содержимого бланка

распознавания содержимого бланка необходимо предварительно создать шаблон формы.
Сервис/

Шаблоны
Шаблон используют на этапе сегментации. Сегментация в данном случае состоит в наложении шаблона.
Положение шаблона корректируется в соответствии с тем, насколько ровно был размещён бланк при сканировании.
Заключительный этап состоит в распознавании содержимого бланка.

Системы оптического распознавания форм


Слайд 13 Системы распознавания рукописного текста
С появлением первого карманного

Системы распознавания рукописного текста С появлением первого карманного компьютера Newton фирмы

компьютера Newton фирмы Apple в 1990 году начали создаваться

системы распознавания рукописного текста. Такие системы преобразуют текст, написанный на экране карманного компьютера специальной ручкой, в текстовый компьютерный документ.

Слайд 14 Системы распознавания рукописного текста

Системы распознавания рукописного текста

Слайд 15
Программы оптического распознавания текста

Программы оптического распознавания текста

Слайд 16 Программы оптического распознавания документов
Бумажный носитель
помещается под крышку

Программы оптического распознавания документовБумажный носитель помещается под крышку сканераВ программе отдаётся

сканера
В программе отдаётся команда
Сканировать и распознать
Распознанный текст переносится
в

окно текстового редактора

Работа с программой распознавания текста







Отсканированные документы

Фотографии текстов

Оптическое распознавание документов


Слайд 17 Принцип работы сканера состоит

Принцип работы сканера состоит в следующем: в результате преобразования

в следующем: в результате преобразования света получается электрический сигнал,

содержащий информацию об активности цвета в исходной точке сканируемого изображения. После оцифровки аналогового сигнала в АЦП цифровой сигнал через аппаратный интерфейс сканера идет в компьютер, где его получает и анализирует программа для работы со сканером. После окончания одного такого цикла (освещение оригинала — получение сигнала — преобразование сигнала — получение его программой) источник света и приемник светового отражения перемещается относительно оригинала.

Принцип работы сканера


Слайд 18 Программы распознавания текста
Преобразованием графического изображения в текст занимаются

Программы распознавания текстаПреобразованием графического изображения в текст занимаются специальные программы распознавания

специальные программы распознавания текста (Optical Character Recognition - OCR).
Современная

OCR должна уметь многое: распознавать тексты, набранные не только определенными шрифтами, но и самыми экзотическими, вплоть до рукописных. Уметь корректно работать с текстами, содержащими слова на нескольких языках, корректно распознавать таблицы. И самое главное — корректно распознавать не только четко набранные тексты, но и такие, качество которых, мягко говоря, далеко от идеала. Например, текст с пожелтевшей газетной вырезки или третьей машинописной копии. Само собой, распознать текст — это еще полдела. Не менее важно обеспечить возможность сохранения результата в файле популярного текстового (или табличного) формата — скажем, формата Microsoft Word.



Слайд 19 ABBYY FineReader
Популярная проприетарная программа распознавания текста компании ABBYY
Программа

ABBYY FineReader Популярная проприетарная программа распознавания текста компании ABBYYПрограмма производит распознавание

производит распознавание текста с более 180 языков, для 38

из них предусмотрена встроенная проверка орфографии. Начиная с версии Professional, распознаются иврит, японский, тайский, китайский языки. Finereader открывает файлы графических форматов (TIFF, JPG, PFD, PNG и др.) в том числе DjVu – компактный формат для хранения отсканированных документов, книг.


  • Имя файла: sistemy-opticheskogo-raspoznavaniya-dokumentov.pptx
  • Количество просмотров: 140
  • Количество скачиваний: 0