Технология распознавания звуков может использоваться во множестве сценариев: распознавание отдельных звуков в аудиопотоке (крики, выстрелы, шаги, звуки разбитого стекла, плач), очистка аудиозаписей от шумов, идентификация людей по голосам, повышение чёткости голоса диктора, выявление неполадок в работе механизмов. Сервис аудиоаналитики Sounds, работающий на базе нейронных сетей, позволяет решать задачи в сферах безопасности, ритейла, медиа, телекоммуникаций и др.
С помощью аудиоаналитики можно обрабатывать как архивные файлы, так и онлайн-потоки. В ряде ситуаций технология применяется как альтернатива видеонаблюдению: технология распознает звуки в полной темноте, а микрофоны стоят значительно дешевле камер и не требуют специальных условий для размещения и обслуживания.
Нейронные сети «компьютерного слуха» обучены на собственных датасетах Mail.Ru Group и работают на серверных мощностях компании, что гарантирует высокую скорость и бесперебойность сервиса.
«Не так давно Mail.Ru Group вышла на рынок компьютерного зрения, запустив проект Vision. Мы убедились, что решение востребовано, поэтому пошли дальше и дополнили зрение слухом. Новая технология позволит развить эффективность “предложения” в целом. Например, нестандартный шум или шорох на наблюдаемом объекте должен вызывать подозрение, если речь идет об охранных функциях, – говорит руководитель направления облачных и бизнес-сервисов Mail.Ru Group Егор Ганин. — Это перспективное направление, которое сейчас активно развивается. По прогнозам исследовательской компании Research and Markets, к 2023 году объем рынка аудиоаналитики составит 18 млрд долларов».
Подробнее ознакомиться с технологиями анализа звуков и оставить заявку на внедрение можно на странице сервиса. Специалисты Mail.Ru Group сопровождают проект на всех стадиях реализации и дорабатывают его в соответствии с задачами заказчика.