От параметров выбранного сканера будет зависеть как скорость, так и качество обработки данных. Следует сразу отметить, что при большом количестве форм (свыше 100 ежедневно) обычный планшетный сканер неприменим.
Эти устройства, широко распространённые в офисах и неплохо справляющиеся с оцифровкой фотографий и обычной документации, для потокового ввода непригодны: у них невысокое быстродействие и относительно небольшой ресурс.
Только представьте, во что превратится стекло планшетного аппарата после сканирования тысячи страниц!
Для полноценного, быстрого и качественного ввода большого количества форм нужен специальный аппарат. На что нужно обратить внимание при выборе сканера? Основные критерии выбора сканера для автоматизированного ввода форм таковы:
Формат. Чаще всего для ввода форм используются устройства, способные сканировать листы формата А3, А4 и А5.
Оптическое разрешение. Для ввода форм требуется разрешение 200–300 dpi (dots per inch — точек на дюйм) и все сканеры поддерживают такие режимы. Сканирование с более высоким разрешением приводит к непременному замедлению, а скорость сканирования может быть одним из самых критичных параметров при потоковом вводе форм.
Двустороннее сканирование. Для многих проектов необходимо применять сканеры, которые могут осуществлять как одностороннее, так и двустороннее сканирование в чёрно-белом или цветном режимах. Последний режим необходимо использовать, например, при очистке изображения от цветных печатей и сохранении цветных фотографий с анкет.
Наличие устройства для автоматической подачи бумаги — автоподатчика (ADF, Automatic Document Feeder). Это устройство, позволяющее загружать формы в сканер пачками, обычно по 25, 50 или 100 документов, необходимо практически в любом случае. Иначе работа оператора ввода будет на 90% состоять из манипуляций с бумагой и сканером.
Производительность. Часто скорость работы всей системы автоматизированного ввода зависит именно от быстродействия выбранного сканера. Выделяют три основных категории офисных документных сканеров: низко-, средне- и высокопроизводительные. Аппараты первой категории способны обрабатывать от 500 до 2 000 страниц в день, второй — от 5 000 до 10 000, третьей — до 60 000 и больше страниц в день.
Контроль двойного захвата листа. Захват протяжным механизмом сканера более чем одного листа бумаги может привести к тому, что какая-то форма вообще не будет обработана. Для предотвращения подобной ситуации во многих сканерах реализованы системы контроля: при помощи взвешивания захваченной бумаги, замера толщины бумаги или контроля светового потока, проходящего через сканируемую бумагу.
Однако эти способы неприменимы, если поток форм неоднороден, т. е. если вводятся формы различных видов (на разных форматах бумаги, разного цвета, плотности и т. д.). Поэтому наибольшее распространение получают системы контроля на базе ультразвуковых датчиков, которые следят за тем, чтобы отражённый сигнал приходил не более чем от одной поверхности, то есть от одного листа бумаги.
Наличие специальных возможностей. Некоторые аппараты оборудованы вспомогательными устройствами, которые могут оказаться очень полезными. Среди них:
- принтер для надпечатки на одной из сторон отсканированного документа (endorser) специального индекса для идентификации документа в дальнейшем;
- аппаратный модуль для улучшения качества получаемого изображения;
- аппаратный модуль компрессии изображений;
- цветные лампы подсветки для удаления определённого цвета с так называемых «фоновых» (drop-out) форм, обычно красного, реже — синего или зелёного;
- кеширование изображений с использованием собственной памяти сканера, что также повышает быстродействие системы.