Сбербанк объявил о доступе для разработчиков к нейросетевой модели генерации текста на русском языке под названием ruGPT-3.5, а также к расширенной версии этой модели — mGPT. Об этом сообщила пресс-служба кредитной организации.
Модель ruGPT-3.5 13B, представляющая собой дообученную версию ранее существовавшей модели, в настоящее время используется в сервисе GigaChat. Банк также опубликовал новую версию модели mGPT 13B, которая является самой крупной в семействе многоязычных моделей Сбербанка, способной генерировать тексты на 61 языке.
Обе модели теперь доступны на депозитарии HuggingFace и доступны для использования всеми разработчиками. Они были опубликованы под лицензией открытого и свободного программного обеспечения MIT, разработанной Массачусетским технологическим институтом.
GigaChat, внутри которого размещается набор моделей, известен как NeONKA (Neural Omnimodal Network with Knowledge-Awareness). Этот ансамбль моделей был создан на базе языковой модели Russian Generative Pretrained Transformer версии 3.5 с 13 миллиардами параметров (ruGPT-3.5 13B), которая является обновленной версией предыдущей нейросети ruGPT-3 13B.
Андрей Белевцев, старший вице-президент и руководитель блока «Технологии» Сбербанка, подчеркнул, что банк поддерживает открытость технологий и обмен опытом с профессиональным сообществом. Сбербанк уверен, что публикация обученных моделей побудит российских исследователей и разработчиков использовать мощные языковые модели для создания своих собственных технологических продуктов и решений.