Возможности классификации на базе YandexGPT
После обучения классификатор на базе YandexGPT позволит определить категорию текста по заранее выбранным тегам – например, “реклама”, “отклик на вакансию”, “нецензурная лексика” и так далее. Для этого клиенту достаточно загрузить в сервис Yandex DataSphere примеры текстов для каждой категории, по которым нужно будет распределять тексты. После обработки клиент получит доступ к уникальной модели, которую он может интегрировать в собственные решения с помощью API.
Нейросеть понадобится для работы с обращениями клиентов, антифрода и обнаружения противоправной информации. Классификатор на базе YandexGPT уже тестируется в одной из крупных российских сетей парфюмерных магазинов.
“При разработке новых ML-моделей для разработчиков и дата-аналитиков мы исходим из их применимости к конкретным рабочим процессам. Задачи классификации – одни из самых распространенных в Data Science. И по нашим оценкам, в некоторых кейсах классификатор YandexGPT справляется с задачей почти в два раза лучше, чем стандартная версия генеративной нейросети. Благодаря простому интерфейсу и автоматизации обучения на облачной платформе для использования модели-классификатора не нужны знания в ML-разработке, и клиенту не придется думать о развертывании и отказоустойчивости классификатора”, - рассказал Алексей Долотов, руководитель продуктового направления ML в Yandex Cloud.
YandexGPT API уже протестировали более 10 тыс. клиентов, среди клиентов – компании как из малого (69%), так и из среднего и крупного бизнеса (31%). Самыми активными пользователями стали ИТ-компании, ритейлеры, банки, образовательные организации, а также компании из сферы транспорта и логистики и медиа.
Yandex SpeechSense
По запросу пользователей теперь Yandex SpeechSense может анализировать не только аудиозаписи из колл-центров, но и текстовые сообщения. Это позволит контролировать удовлетворенность пользователей и качество работы операторов во всех каналах связи с компанией – через чат-бот, мессенджер, комментарии на сайте или письма в техподдержку. Коммуникация клиентов с бизнесом постепенно переходит в текстовый формат – по оценкам аналитического агентства iKS-Consulting, в 2023 году голосовые коммуникации занимали 59% от количества обращений в компании.
Также данные из Yandex SpeechSense теперь можно выгрузить в сервисы заказчиков с помощью API. Это позволит работать с результатами анализа в собственном, более знакомом интерфейсе и использовать эти данные при формировании отчетов. По внутренним опросам Yandex Cloud, эта возможность будет востребована как минимум у 30% пользователей. При разговоре с клиентом сотрудник колл-центра сможет сразу увидеть в CRM-системе подробности предыдущих коммуникаций – была ли решена проблема, предложил ли оператор дополнительные услуги и какая была реакция абонента и т.д.
Yandex DataSphere
Также Yandex Cloud расширила возможности обучения ML-моделей с помощью сервиса Yandex DataSphere. Теперь программисты, использующие для разработки собственную локальную среду, могут автоматизировать регулярное обучение нейросетей с помощью повторяющихся заданий DataSphere Jobs. Для этого достаточно настроить повторение скриптов обучения по времени или привязать их к какому-либо событию в системе. Это позволит значительно сэкономить время на повторных запусках одного и того же задания.
Кроме того, теперь пользователи Yandex DataSphere могут развернуть в облаке нейросети любого объема, подключив в сервисе дополнительный виртуальный диск. Как правило, это необходимо для использования опенсорсных и кастомных ML-моделей для крупных проектов, в которых могут быть значительные объемы данных для обучения.