Сбербанк запустил первую в России нейросеть для создания видео

Сбербанк объявил о запуске первой в России нейросети Kandinsky Video, способной создавать видеоролики на основе текстового описания. Об этом сообщил заместитель председателя правления банка Александр Ведяхин на международной конференции AI Journey.

Прорывная технология Kandinsky Video позволяет генерировать видео длительностью до 8 секунд при частоте 30 кадров в секунду. Ведяхин подчеркнул значимость этого достижения для развития российских генеративных нейросетей.

Нейросеть Kandinsky Video состоит из двух основных компонентов. Первый компонент отвечает за создание ключевых кадров, которые формируют структуру сюжета видео. Второй компонент занимается генерацией интерполяционных кадров, обеспечивающих плавность движений.

Видео создаются с разрешением 512х512 пикселей и могут иметь различное соотношение сторон. Модель обучалась на датасете, содержащем более 300 тысяч пар «текст—видео». Процесс генерации одного видео занимает до трех минут.

Этот шаг Сбербанка стал значительным вкладом в область искусственного интеллекта и развитие технологий генерации контента на основе текста в России.

Science XXI