Новая функция Yandex SpeechKit называется Пунктуатор и работает как при распознавании в реальном времени для сценариев с голосовыми помощниками, так и при распознавании предзаписанных аудиофайлов.
Пунктуатор разработан с помощью двух последовательно работающих моделей машинного обучения. Первая переводит голос в текст, вторая расставляет знаки препинания в соответствии с нормами русского языка. Сейчас модель расставляет все основные знаки пунктуации русского языка. Пуктуатор доступен для всех пользователей Yandex SpeechKit и настраивается стандартными средствами в API.
“Мы развиваем сервисы Yandex Cloud, отвечая на запросы наших клиентов, а иногда и предвосхищая их. Многие наши заказчики, сегодня используют Yandex SpeechKit для создания голосовых помощников с диалоговым интерфейсом. В таких проектах распознанный машиной текст важно сделать максимально приближенным к тому, как его написал бы реальный собеседник. Пунктуатор решает эту задачу просто” - рассказал Василий Ершов, руководитель разработки Yandex SpeechKit.