Искусственный интеллект упростил добавление новых типов документов в IDP-платформу ContentCapture

25.07.2024 |

Content AI, российский разработчик решений для интеллектуальной обработки информации, продолжает расширять функциональность своих продуктов с помощью искусственного интеллекта.

Компания выпустила релиз IDP-платформы ContentCapture 14.2 с усовершенствованным инструментом добавления новых типов документов. Начиная с этой версии, обучение распознаванию новых типов документов, с которыми планирует работать пользователь, реализовано на основе технологий машинного обучения. Теперь достаточно показать системе несколько примеров документов и разметить в них необходимые для извлечения поля. Далее ContentCapture сможет автоматически обрабатывать аналогичные файлы, извлекая данные из указанных ранее полей.

Данная функциональность доступна как для Windows, так и для и Linux.

«Удобство добавления новых типов документов позволит ускорить настройку комплекса и значительно упростить работу с платформой, так как заказчики смогут делать это самостоятельно, не обращаясь к вендору и не привлекая дорогостоящих специалистов, – уточнила Светлана Дергачева, генеральный директор Content AI. – Развивая ContentCapture, мы думаем не только над принципиально новыми функциями, но и учитываем персональный опыт сотрудников, взаимодействующих с системой. Большое внимание уделяется таким факторам как простота «входа» в продукт новых пользователей и удобство выполнения различных операций.»

«Технологии на основе машинного обучения и нейронных сетей открывают широкие возможности для улучшения продуктов. Мы выбираем только такие решения, которые, действительно, работают и несут наибольшую практическую пользу нашим заказчикам», – добавил Иван Волков, директор по продуктам Content AI.

IDP-платформа ContentCapture предназначена для автоматизации обработки информации из любых типов документов: отсканированных бумаг, фотографий, электронных документов, текстов писем и вложений. Решение востребовано крупными компаниями из различных сфер бизнеса и государственными организациями, которые в ежедневном режиме принимают большой поток документов. ContentCapture распознает, классифицирует документы, извлекает данные, проверяет их корректность и передает в корпоративные информационные системы.

Вместе с тем в новом релизе продукта команде разработки Content AI удалось качественно оптимизировать технологию распознавания русского рукописного текста. Для этого были задействованы нейронные сети. ContentCapture научилась распознавать рукописный текст в полнотекстовом формате и в документах с многострочными полями. Система стала лучше считывать сложный почерк и в целом увеличила качество распознавания на 5%. Кроме того, в версии 14.2 появилась поддержка распознавания печатного и рукописного текста в одном поле, что позволяет в едином потоке обрабатывать документы, содержащие такие виды текста, например, паспорта. Также система научилась распознавать рукописные слова, содержащие буквы и цифры, – артикулы деталей или номера автомобилей.

IDP-платформа ContentCapture включена в реестр российского ПО, работает на отечественных ОС и на Windows. Подходит для импортозамещения ABBYY FlexiСapture, Kofax Capture, IBM Datacap.