FormXtra Capture - розпізнавання документів
Інтелектуальне розпізнавання документів (Intelligent Document Recognition) — нова технологія, яка обіцяє змінити спосіб обработки документів та направлена на вилучення важливої інформації з ділових та адміністративних документів.
Рішення істотно відрізняється від типових програм розпізнавання тексту та дозволяє обробляти складні документи будь-якого типу та змісту. Ключові особливості:
-
Компонування форми паперового документа та визначення полів
Готові компоненти для розпізнавання даних будь-якого типу: друкований текст (OCR), рукодрукований текст (ICR), природний рукописний текст (Parascript ICR), мітки (OMR), штрихкоди.
-
Інструменти для налаштування
Усунення кутового перекосу, очищення зображення від дрібного сміття, видалення фоновой текстури, можливість регулювання помилок і відмов, налаштування формату вихідних даних.
-
Вбудоване середовище розробки
Крм штатних інструментів можна задіяти додаткову логіку при обробці документів, використовуючи мови програмування (C#, VB.Net). Усі роботи із створення, тестування, компіляції коду можна виконувати в межах FormXtra Capture.
Розпізнавання анкет та бланків
Велика кількість рукодрукованих цифр і слів, наявність міток та підкреслювань — все це присутнє в анкетах та бланках. Так само в них присутнє виправлення, шум, рукописний текст (більшість людей, коли записують кожну букву в окрему розмічену позицію, мимоволі з’єднують літери та починають писати їх дуже близько одна до одної). В підсумку, замість рукодрукованого текста анкета може містити також рукописний. FormXtra Capture - одне із небагатьох рішень, яке дозволяє впоратися навіть з розпізнаванням природного рукописного тексту. Докладніше про розпізнавання анкет та бланків..
Розпізнавання опитувальних листів
Докладні форми містять велику кількість міток різних варіацій (одиночні мітки або розмічені зони). Окрім задач розпізнавання та подальшого експорту, необхідно контролювати коректність заповнення опитувального листа. В залежності від вимог, документ можна визнати недійсним, якщо респондент ставив кілька міток, там де була потрібна лише одна (або не ставив взагалі). Рішення дозволяє вбудовувати будь-яку логіку при обробці опитувальних листів, завдаючи різні правила та винятки. Докладніше про розпізнавання опитувальних листів..
Розпізнавання інвентаризаційних відомостей
Як правило, інвентаризаційна відомість складається з десятка сторінок. На кожній сторінці присутня розмічена таблиця з великою кількістю комірок, деякі з них заповнюють рукописными цифрами. Розпізнавання в одне коло не дасть прийнятний рівень точності. Рішення дозволяє задіяти алгоритми голосування, де одна і та сама комірка розпізнається декілька разів, після чого їх відповіді порівнюються. Такий підхід значно підвищує точність вилучених даних. Докладніше про розпізнавання інвентаризаційних відомостей..
Розпізнавання первинних бухгалтерських документів
Відмінними рисами первинних документів (накладних, платіжних документів, чеків) є їх візуальні відмінності. Накладні відрізняються розмірами, змістом, компоновкою таблиць. Відповідно, місцезнаходження полів, які потрібно розпізнати, наперед невідомо. В таких випадках можна вдатися до логічного дослідження документу та подальшого динамічного розпізнавання. Наприклад, потрібно знайти і розпізнати вміст поля «Сума». Як правило, це поле розташоване в нижній частині форми, строкою вище присутнє поле «ПДВ», а зона для розпізнавання знаходиться справа від тексту «Сума». Спираючись на подібний опис, можна розпізнати всі об’єкти такого роду.
Сьогодні система розпізнавання форм FormXtra Capture являє собою уникальне інтелектуальне рішення з удосконаленим механізмом обробки та розпізнавання даних. Це готовий інструмент для офісного використання у великих корпораціях та малих компаніях.