Компания «Цифровые дороги» специализируется на пространственных измерениях и контроле состояния объектов городской и промышленной инфраструктуры в режиме реального времени.
Цифровые двойники дорожной инфраструктуры позволяют отслеживать организацию дорожного движения, а также состояние светофоров, знаков, тротуаров и оперативно принимать решения по приведению их в надлежащее состояние. Кроме того, подобная автоматизация помогает более эффективно использовать время специалистов, которое ранее они тратили на рутинные, а порой и опасные процессы. Для создания цифровых двойников инфраструктуры используется программное обеспечение на основе искусственного интеллекта ‒ детекторы объектов дорожной инфраструктуры, разработкой которых в рамках данного проекта занимались специалисты «Наносемантики».
Проект занял почти два года и проходил в десять этапов по числу представленных детекторов, среди которых были такие, как МАФ (малые архитектурные формы), ворота, шлагбаумы, дорожные тумбы и другие. В процессе создания решения, основанного на технологиях компьютерного зрения и машинного обучения, разработчики выбрали и реализовали наилучший алгоритм из исследованных с точки зрения точности и скорости работы. Для качественного обучения нейросетей по каждому из направлений были сформированы тренировочные и валидационные датасеты, насчитывающие по нескольку тысяч изображений с шести камер мобильных лабораторий. Партнером по разметке предоставленных данных для последующего обучения нейросетей стала компания «Геодата».
Наиболее сложным стало создание детекторов, где были задействованы мелкие объекты, и при этом требовалась высокая точность распознавания. Например, светоотражатели и камеры ‒ это небольшие объекты, и зачастую на изображении они сливаются с фоном. Данная задача требовала тщательного препроцессинга и предварительной обработки изображений, качественной подготовки датасета и выбора оптимальных моделей для обучения нейросети.
Всего для обучения было использовано более 77 тыс. изображений, при этом скорость обработки изображений составила 3 bps на батче из 6 изображений (или 18 fps). По результатам финального тестирования все детекторы показали соответствие метрикам, установленным заказчиком изначально: box mAP - 0,55, mask mAP - 0,48, F1-мера - 0,83.
«Для нас проект для компании «Цифровые дороги» стал одним из ключевых по итогам прошлого года не только с точки зрения объемов работ, но и с точки зрения технологического лидерства страны. Уверен, что применение ИИ-технологий способно улучшить управление движением и обеспечить более безопасную и современную среду для водителей и пешеходов», – отметил Илья Иванов, коммерческий директор компании «Наносемантика».