Назначение робота класса RPA (Robotic process automation) – автоматическая обработка, идентификация и классификация файловых архивов разных отраслей по элементам онтологической модели под управлением обученной нейросети.
Результатом работы робота является оцифрованный источник неструктурированных данных в виде реестра цифровых паспортов документов с заполненными атрибутами из содержимого файлов и распределенными файлами по структурам цифровых паспортов без изменения физической схемы хранения файлов.
По исследованиям корпорации Microfocus, компании в течение 3-х – 5-ти лет снижают долю обращений в соотношении к объему данных с 65% до 5% из-за невозможности быстрого извлечения бизнес-критичной информации. Оцифрованный роботом источник неструктурированных данных становится доступным для использования шинами данных, обогащая формируемые запросы по онтологической модели информацией, хранящейся в оцифрованном файловом архиве.
При регламентном применении робот минимизирует время специалистов по классификации вновь появляющихся файлов и по поиску бизнес-значимых данных в файловых архивах.
Вместе с «ДатиУм.Смарт Файл» выпущена обученная нейросеть для предприятий ТЭК, позволяющая автоматически обрабатывать более 90% типовых документов в файловых архивах. Оставшиеся 10% выполняются в автоматизированном режиме, дообучая модель на варианты классификации, специфичные для каждого предприятия. Для иных отраслей первоначальное обучение нейросети может занимать несколько месяцев.
Обучение нейросети выполнялось бизнес-экспертами компании От-Ойл, входящей в группу «АТОЛЛис», на более чем 1Тб файлов по недропользованию из источников в свободном доступе Росгефонда. В процессе 23 итерации на 188 узлах онтологической модели было обработано 2348 объектов. Использование предоставленного компанией IBM высокопроизводительного стенда (в рамках технологического партнерства) позволило сократить время каждой итерации полного обучения модели с 2,5 месяцев до 10 суток.
Первые применения робота успешно выполнялись компанией От-Ойл при реализации проектов управления проектной документацией на предприятиях нефтяной отрасли.
В настоящее время ТехноИнтеллект ведет разработку сразу нескольких роботов из серии управления данными: