05.01.2014
Некоторые люди считают, что рукописный текст распознается также, как и печатный текст плохого качества, и что ICR является более продвинутой формой OCR и может обрабатывать тексты плохого качества. На самом деле технологии OCR и ICR предназначены для обработки совершенно разных типов текстов: OCR предназначена для распознавания печатного текста, а ICR для рукописного. Печатный и рукописный тексты очень отличаются друг от друга.
OCR поможет в распознавании печатных текстов плохого качества. Тем не менее, несмотря на то, что все программы распознавания в основе имеют одну и ту же технологию, они, как правило, настроены на обработку конкретных типов полей или данных. Кроме того, качество OCR варьируется в зависимости от продукта.
Чтобы справиться с плохим качеством печатного текста, мы рекомендуем использовать OCR систему, которая может быть специально настроена на конкретную задачу, или настроить Вашу OCR самостоятельно (если это возможно) на распознавание конкретного поля. Некоторые OCR системы имеют настройки для обработки полей, таких как, например, номера телефонов, имена, даты, суммы и т.д. Зная тип данных, который содержится в поле, OCR может распознавать тексты гораздо лучше.
Очень важно использовать словари и шаблоны. Когда программа распознавания располагает контекстом, она гораздо лучше выполняют свою работу. Например, при распознавании имен OCR покажет более высокие результаты, зная, что работа происходит не просто с набором символов, а конкретно в поле "имя" или "фамилия". Кроме того, использование словарей (например, справочника) может существенно ограничить количество доступных ответов.
Итак, для распознавания печатного текста плохого качества нужно использовать те программы, которые могут быть настроены на конкретную задачу, и не забыть про все преимущества использования контекста. В этом случае, даже если некоторые символы видны частично, они могут быть прочитаны благодаря контексту.
Теги: OCR, ICR
![]() |
![]() |
Читати інші новини...