Почему при распознавании банковских чеков недостаточно OCR

28.11.2013
Часто возникает необходимость прочтения различных данных указанных в банковских чеках, например, суммы, даты, подписи и так далее. Может показаться, что наиболее логичным решением этой задачи является использование возможностей OCR.

К сожалению, распознавание чеков при помощи OCR располагает базовыми возможностями и зачастую не является решением проблемы. Чтение полей на банковских чеках является гораздо более сложной задачей. Вот лишь некоторые сложности: качество изображения чека значительно хуже, чем текст, который может быть прочитан при помощи OCR; чеки являются полуструктурированными документами (т.е. на чеках нет заданной позиции для целевых полей); на всех персональных и коммерческих банковских чеках присутствует рукописный текст.

Из этого следует, что для прочтения данных на банковских чеках необходимы более продвинутые технологии распознавания. Существуют системы, которые специально ориентированны на чтение данных с персональных или коммерческих чеков. Данные системы используют инновационные технологии, которые могут распознавать информацию в печатном и рукописном виде (раздельные рукописные буквы, естественный рукописный текст). Эта специализированная программа также решает одну из самых сложных проблем в распознавании — определяет местоположения целевых данных, например, полей суммы, даты, подписи и т.д. В то время как другие технологии способны определить поле суммы исключительно на документах заданного формата (структурированные документы), усовершенствованное решение использует универсальные алгоритмы, которые позволяют программе идентифицировать местоположение полей на любых чеках, независимо от их типа и формата.

Проверка подлинности подписи является еще одной проблемой, с которой обычная OCR система не справится. Специализированное программное обеспечение не только находит подпись или несколько подписей на документе, но и сравнивает эту подпись с изображением контрольной подписи и делает вывод о подлинности.
Теги: OCR, IDR, FormXtra

автоматизация ввода документов, распознавание документов, распознавание рукописного текста   услуги распознавания и ввода документов, распознавание рукописного текста


Читати інші новини...