Корекція

Корекція результатів розпізнавання

Корекція результатів розпізнавання.

Сучасні технології не дозволяють досягти 100% точності у розпізнаванні. Особливо це стосується рукописного тексту, де присутні стільки варіантів написання літер та слів, скільки людей на Землі. У кожної людини свій почерк, який перетворюється у незбагненну кількість різних стилів написання літер. Тим не менш, отримати результат дуже близький до 100% цілком реально.

У більшості випадків ділові та офісні документи мають структуру, де у обов’язковому порядку фігурує підсумкова графа, яка містить суму угоди або деяку підсумкову кількість. Для людини, яка порівнює результати розпізнавання з паперовим документом, ця графа виявляється свого роду зворотнім зв’язком Якщо підсумкові числа співпали, це каже про те, що документ розпізнано з максимальною якістю та не має сенсу його доповнювати та перевіряти.

Використовуючи додаткові інструменти для корекції, стає можливим досягнення бажаних 100%. У тому випадку, коли підсумкові суми не співпали, даний інструмент дає підказку про можливу помилку та вказує її можливе місцезнаходження, що дозволяє скоротити час на втомливу перевірку. В якості прикладу розглянутий випадок обробки інвентаризаційних відомостей, в яких розпізнається друкований і рукописний текст. Час корекції однієї інвентаризаційної відомості (до 10 сторінок) складає менше 1 хвилини.



Паперовий документ інвентаризації.

Паперовий документ інвентаризації, у якому присутня помилка при розпізнаванні

Результати розпізнавання.

Результати розпізнавання у текстовому файлі

Програма корекції.

Програма для корекції результатів розпізнавання