Проект стартует 4 февраля. Его цель — обучить специалистов эффективно работать с данными в облаке и дать пошаговые инструкции по применению облачных инструментов в области MLOps.
MLOps — это современный подход к автоматизации работы аналитика данных. С ним легко выстроить процессы работы с технологиями машинного обучения, чтобы они приносили пользу бизнесу. Сочетание Cloud-Native и MLOps-подходов позволяет просто и быстро проверять ML-модели с использованием облачных сервисов, таких как Kubernetes, не погружаясь в инфраструктурные дебри.
Полученные знания помогут аналитикам, разработчикам и DevOps автоматизировать работу с данными и ускорить выпуск ML-моделей в продакшен.
"Облачный рынок стремительно развивается, увеличивается количество компаний, которые используют облачные ресурсы для решения разных бизнес-задач. Растет запрос на ИТ-специалистов с компетенциями по работе в облачной среде, — отмечает Дмитрий Лазаренко, директор по продукту Mail.ru Cloud Solutions. — Но часто компании переносят в облако старые процессы по работе с данными, не адаптируя их к Cloud-Native и таким образом не получая все преимущества облака. Мы видим своей миссией научить рынок продвинутым подходам и инструментам. В прошлом году мы запустили факультет облачной дата-инженерии на образовательном портале GeekBrains. Сейчас мы хотим дать разработчикам и аналитикам довольно узкие, но прикладные знания по работе с большими данными в облаке".
Пилотный воркшоп про разворачивание Kubeflow в облаке прошел в декабре. Он вызвал большой интерес со стороны ИТ-специалистов, и в течение 2021 года было запланировано больше 10 мероприятий в рамках образовательного проекта по работе с Big Data в облаке.
4 февраля в 17 часов пройдет воркшоп «Разворачиваем приложение на Apache Spark в Kubernetes. Пошаговый рецепт». Большинство доступных материалов по этой теме ограничиваются запуском тестового приложения в K8s, которое считает число пи. На мероприятии специалисты Mail.ru Cloud Solutions пойдут дальше: помогут собрать свой образ со своим кодом, добавить необходимые библиотеки, креды для доступа к S3-хранилищу, научат читать из S3 и записывать в него. Даже начинающие специалисты научатся обрабатывать данные с помощью Spark в облаке.
Участники воркшопа получат готовый репозиторий в Github с инструкцией, всеми командами, примерами кода, готовыми приложения — и смогут самостоятельно повторить все действия, которые будут продемонстрированы спикером.
Ведущий воркшопа — архитектор PaaS-продуктов Mail.ru Cloud Solutions Александр Волынский.