Сбер представил бесплатную бета-версию нейросети Kandinsky Video 1.1 для создания полноценных видеороликов по текстовому описанию и изображению.
Формат сгенерированного видео — это непрерывная сцена с движением и объекта, и фона. Модель генерирует видеоряд продолжительностью до шести секунд с частотой 8 и 32 кадра в секунду. С обновлённым Kandinsky Video можно создавать видео в разных форматах — 16:9, 9:16 или 1:1.
Новая версия модели позволяет генерировать видео не только по тексту, но и по изображению, то есть «оживлять» статичную картинку. Благодаря этому у пользователей появилось ещё больше возможностей для креатива и реализации своих творческих задумок любой направленности. Кроме того, в новой версии модели можно контролировать динамику генерируемого видео с помощью специального параметра motion score.
Андрей Белевцев, старший вице-президент, руководитель блока «Технологическое развитие» Сбербанка: «Сегодня мы сделали ещё один шаг в будущее видеотворчества. Теперь каждый пользователь Kandinsky Video может воплотить свои идеи и выразить их в видеоформате. С момента запуска первой версии нейросети прошло менее года, и за это время наша команда значительно улучшила такие показатели, как качество и скорость генерации полноценных видеороликов, открывая тем самым безграничные горизонты для креатива. Мы всегда рады видеть, как наши технологии помогают людям реализовывать свои самые смелые творческие задумки».
Уникальная архитектура была разработана и обучена исследователями Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённом датасете Sber AI и компании SberDevices.