Слайд 2
Сканер - оптико-электронное устройство для ввода в компьютер
графических изображений.
Сканер создает оцифрованное изображение документа и помещает
его в память компьютера.
Слайд 3
Виды сканеров
Планшетные
Протяжные или роликовые
Планетарные или книжные
Слайд 4
Планшетные
Планшетный сканер - сканер, в котором оригинал кладется
на стекло и сканируется при помощи подвижной линейной ПЗС
матрицы.
Предназначены для ежедневного сканирования небольшого объёма фотографий, слайдов или документов.
простота конструкции, ручная обработка документов, низкая производительность.
Слайд 5
Протяжной или роликовый сканер.
двустороннее сканирование (дуплекс)
подсветка оригинала разными
цветами для отсечки цветного фона
система компенсации неоднородного фона
модули динамической
обработки разнотипных оригиналов
надпечатывание отметки о том, что документ прошел обработку
Слайд 6
Планетарный или книжный сканер.
предназначен для сканирования скреплённых документов,
периодических изданий и книг.
бесконтактный метод сканирования
большая производительность при
оцифровке книг и сшитых оригиналов.
Слайд 7
Основные характеристики сканеров
Разрешение (Resolution) - число точек или
растровых ячеек, из которых формируется изображение, на единицу длины
или площади.
Измеряется в "точках на квадратный дюйм" (DPI, dots per inch).
Типовое разрешение промышленных сканеров - 200-300 DPI.
Слайд 8
Разрядность цвета - количество разрядов каждого пикселя в
цифровом изображении. Описывает максимальное количество цветов, воспроизводимое сканером в
виде степени числа 2.
Время сканирования измеряется в страницах в минуту.
Формат сканируемого документа - A3/A4.
Интерфейс передачи данных могут быть различны (к COM или USB порту, к SCSI карте и др.).
Слайд 9
Программное обеспечение сканирования
Существует три категории ПО сканирования:
ПО сканирование
малых объёмов документов
ПО сканирования больших объёмов документов
ПО для специальных
задач сканирования
Слайд 10
ПО сканирование малых объёмов документов.
Применяется при домашнем и
офисном сканировании.
Используется практически любое программное обеспечение, совместимое со
стандартом TWAIN и поддерживающее функцию сканирования.
TWAIN - является стандартом для прикладного программного интерфейса (API) таких периферийных устройств, как сканеры.
Слайд 11
Примеры ПО сканирования малых объемов:
ABBYY FineReader
Adobe
PhotoShop
Cognitive Cuineiform
Microsoft Photo Editor
ACDSEE
Слайд 12
ПО сканирования больших объёмов документов.
Применяется при промышленном сканировании.
При поточном сканировании один сканер ежедневно может обрабатывать до
50.000 и более документов.
Для программного управления сканерами используется промышленный стандарт ISIS (ISIS - Image and Scanner Interface Specification).
Слайд 13
Примеры применяемого ПО:
Kofax Ascent Capture
Captiva InputAccel
Слайд 14
ПО для специальных задач сканирования.
Применяется при планетарном, высококачественном
сканировании.
Разрабатывается с учётом специфики сканирующего устройства
Применяемое ПО:
ПланСкан BSC-2
RZ ProScan
Book (Minolta PS7000 edition)
Zeutschel OmniScan
Слайд 15
Что такое системы распознавания?
Необходимо выполнить сканирование бумажных документов
и распознать их содержимое с помощью специальных программ (Optical
Character Recognition - OCR).
Системы оптического распознавания символов предназначены для автоматического ввода печатных документов в компьютер. Обработка изображения OCR-системой включает в себя анализ графического изображения и распознавание каждого символа.
Слайд 16
Процессы анализа макета страницы:
определение областей распознавания
определение таблиц
определение
картинок
выделение в тексте строк и отдельных символов
Слайд 17
Точность распознавания
OCR-системы могут достигать наилучшей точности распознавания —
свыше 99,9% для чистых изображений.
Если имеется приблизительно 1500
символов на странице, то даже при коэффициенте успешного распознавания 99,9 % получается одна или две ошибки на страницу. В таких случаях на помощь приходит метод проверки по словарю.
Но это все равно не позволяет исправлять 100 % ошибок, что требует человеческого контроля результатов.
Слайд 18
Причины ошибок при распознавании
Грязные изображения
Неаккуратное сканирование, связанное
с «человеческим фактором»
Если документ был ксерокопирован, нередко возникают разрывы
и слияния символов.
Страница, расположенная с нарушением границ или перекосом, создает немного искаженные символьные изображения, которые могут быть перепутаны OCR.