В отличие от сканеров, использующихся в системах распознавания предыдущих поколений, смартфоны позволяют использовать для распознавания видеопоток. В этом случае в систему распознавания на входе поступает целая серия изображений объекта различного качества, в том числе, с бликами, в необычных ракурсах или даже в темноте.
Для решения задачи мобильного распознавания авторы патента – научный сотрудник-программист Ольга Петрова, старший научный сотрудник-программист к.т.н. Константин Булатов и генеральный директор Smart Engines к.т.н. Владимир Арлазаров – предложили предварительно оценивать пригодность поступающих кадров для распознавания, и для наилучших кадров совместно использовать результаты их обработки. Это позволяет существенно повысить качество распознавания документа. Такой способ они назвали методом взвешенной интеграции.
Как следует из описания патента №11640720 от 2 мая 2023 года, ученые Smart Engines предложили использовать 50% лучших кадров с учетом точности фокусировки изображения и оценки результатов распознавания и назначать каждому символу "вес", опираясь на эти критерии. Например, если часть поля перекрыта пальцем или бликом, то вес символа будет стремиться к нулю, а если символ видно четко – его "стоимость" будет приближена к 1. После назначения весов итоговый результат анализа видеопотока реконструируется при помощи предложенного исследователями алгоритма.
"Метод посимвольного взвешивания с оценкой фокусировки позволяет существенно повысить качество распознавания в тех случаях, когда удостоверяющий документ снят в неидеальных условиях – под углом, в темноте, с бликами. Посимвольное взвешивание также положительно влияет на результат распознавания, если в документе присутствуют длинные непрерывные строки – скажем, машиночитаемая зона", – отмечает Владимир Арлазаров.
Этот патент стал четвертым изобретением, полученным учеными Smart Engines в США, и третий подряд патент компании, зарегистрированный Штатами в 2023 г.
"Патент на технологию распознавания документов в видеопотоке стал нашим третьим изобретением, которое регистрируется в Штатах в текущем году. Конечно, в связи с напряженной международной обстановкой, мы столкнулись с различными сложностями в процессе регистрации изобретений. И сейчас Америка признала первенство нашей компании и всей российской науки в сфере мобильного распознавания и именно текущий патент стал свидетельством этого", – комментирует Владимир Арлазаров.
Метод взвешенной интеграции при распознавании текста в видеопотоке был разработан учеными Smart Engines еще в 2015 году. Он лег в основу программных продуктов Smart ID Engine (распознавание и проверка подлинности паспорта РФ), Smart Code Engine (распознавание QR-кодов, банковских карт, номеров телефонов и номеров банковских карт), Smart Document Engine (распознавание корпоративных документов). Все программные продукты Smart Engines внесены в реестр российских программ. Компания Smart Engines реализует их в России, США и других странах. Только в 2022 году защищенная патентом технология принесла Smart Engines более 400 млн рублей выручки.
Технологии Smart Engines также защищены патентами в России. Сотрудники Smart Engines зарегистрировали девять патентов РФ и 40 полезных моделей. По числу "цифровых" патентов Smart Engines находится на седьмом месте среди российских ИТ-компаний, подсчитали "Высшая школа экономики" и АНО "Цифровая экономика".
"Правительство поставило задачу бизнесу активнее вести научные разработки и быстрее внедрять их в производство. А мы и так всегда работаем, не покладая рук, и седьмое место по числу цифровых патентов в России тому свидетельство", – комментирует генеральный директор Smart Engines к.т.н. Владимир Арлазаров.
Научные исследования для Smart Engines играют роль стратегических инвестиций, отметил он. "Мы серьезно инвестируем в науку и развиваем научное направление в нашей фирме для того, чтобы не только выпускать продукты на злобу сегодняшнего дня, но чтобы и решать проблемы, которые еще не возникли. И быть готовыми к тем вызовам, которые нам несет завтра", – сказал Владимир Арлазаров.