Обработка сканов и фото документов на основе «no-code» технологии извлечения реквизитов (OCR)

В облачном приложении для поддержки совместной работы Paydox Cloud появилась подсистема распознавания текстов Paydox OCR.

Функциональность подсистемы предоставляет возможность распознавать тексты из сканированных образов и фотографий, автоматически извлекать реквизиты документов на основе «no-code» правил извлечения атрибутов и записывать их в базу данных.

Данная технология позволяет создавать структурированное хранилище документов с автоматически заполняемыми карточками документов. Атрибуты для карточек определяются пользовательскими настройками.

Автоматизация данного вида обработки документов поможет существенно снизить затраты времени и усилий сотрудников на заведение в информационную систему детальной информации о документе.

Пользователи самостоятельно без программирования могут формировать правила извлечения реквизитов из документов, создавать HTML-формы для просмотра и редактирования извлеченных атрибутов и осуществлять контекстный поиск по извлеченным реквизитам.

В процессе извлечения приложение записывает найденные атрибуты в поля формы, выбранной пользователем. Если пользователь не выбрал форму перед началом процесса извлечения атрибутов, приложение самостоятельно пытается определить нужную форму из списка ранее созданных. Если нужная форма не найдена, приложение самостоятельно создает HTML-форму и вносит в нее извлеченные атрибуты документа.

Пользователь может отредактировать вид созданной приложением HTML-формы и сохранить новую форму как шаблон в список стандартных форм для дальнейшего использования.

Также возможна настройка приложения на поточную обработку очереди входящих сканов документов. В этом случае обработка образов документов осуществляется непрерывно, результаты распознавания и извлеченные реквизиты сразу помещаются в базу данных. Неуспешные результаты могут быть откорректированы вручную после завершения обработки.

Тематики: Интеграция, ПО

Ключевые слова: автоматизация, электронный документооборот