В новом релизе платформа для извлечения данных и потоковой обработки информации из любых типов документов стала доступна на Linux в сетевом варианте использования, который позволяет задействовать мощности нескольких серверов для обработки большого количества документов. Сетевая установка предназначена для крупных проектов, где требуется обрабатывать десятки и сотни тысяч страниц ежедневно. Благодаря переходу на кросс-платформенный технологический стек продукт предоставляет одинаковую функциональность, вне зависимости от используемой ОС.
Также поддержан вариант гибридной инсталляции, когда в процессе импортозамещения на первом этапе на Linux мигрирует только серверная часть, а рабочие станции остаются на Windows. Это позволит осуществить миграцию максимально комфортно для пользователей.
«В 2023 году фокус внимания команды Content AI сосредоточен на адаптации ключевых продуктов, в том числе ContentCapture для Linux, – уточнил технический директор компании Иван Волков. – В процессе реализации задачи мы ориентировались на лучшие практики по созданию кросс-платформенного ПО. Важно, чтобы наши решения сохраняли привычные пользователям свойства Windows-версий, и при этом были совместимы с отечественными операционными системами, такими как Astra Linux, ОС Альт и РЕД ОС. Серверная часть решения упакована в docker-контейнеры и готова к работе как на отдельных Linux-машинах, так и в составе docker-кластера».
Решение СontentCapture предназначено для компаний, которые в ежедневном режиме обрабатывают большие потоки входящей электронной и бумажной документации. Платформа позволяет автоматизировать обработку информации, извлеченной из отсканированных бумаг, фотографий, электронных документов. Решение распознает, классифицирует документы, извлекает данные, проверяет их корректность и передает в корпоративные информационные системы.
ContentCapture входит в реестр отечественного ПО и может заместить продукты западных вендоров – ABBYY FlexiCapture, Kofax Capture, IBM Datacap.
«В основе продуктов Content AI лежат одни из лучших в мире технологий для интеллектуального распознавания данных и обработки естественного языка. Сегодня нам важно адаптировать их для нужд российских заказчиков, поэтому компания занимается выпуском решений для Linux и их совместимостью с отечественными операционными системами. Мы работаем в тесной связке с представителями различных секторов бизнеса и вместе находим оптимальные решения задач замещения иностранного софта», – пояснила Светлана Дергачева, генеральный директор Content AI.
Возможность устойчивой работы на разных операционных системах – не единственная новая характеристика ContentCapture, появившаяся в этом году. В июле 2023 года Content AI выпустила версию ContentCapture с функцией распознавания русского рукописного текста. Эта задача востребована при обработке документов, содержащих блоки текста, написанные от руки, например, анкет, заявлений для банков или страниц паспорта с данными регистрации. В основе технологии распознавания русского рукописного текста лежат инновационные разработки Content AI в области нейронных сетей, впервые примененные для реализации этой функциональности.
В 2024 году Content AI также планирует выпустить ряд важных функциональных обновлений ContentCapture, связанных с повышением удобства использования продукта и упрощением основных операций.