Сбербанк предоставил доступ к нейросетевой модели для создания текстов на русском языке

Сбербанк объявил о доступе для разработчиков к нейросетевой модели генерации текста на русском языке под названием ruGPT-3.5, а также к расширенной версии этой модели – mGPT. Об этом сообщила пресс-служба кредитной организации.

Модель ruGPT-3.5 13B, представляющая собой дообученную версию ранее существовавшей модели, в настоящее время используется в сервисе GigaChat. Банк также опубликовал новую версию модели mGPT 13B, которая является самой крупной в семействе многоязычных моделей Сбербанка, способной генерировать тексты на 61 языке.

Обе модели теперь доступны на депозитарии HuggingFace и доступны для использования всеми разработчиками. Они были опубликованы под лицензией открытого и свободного программного обеспечения MIT, разработанной Массачусетским технологическим институтом.

GigaChat, внутри которого размещается набор моделей, известен как NeONKA (Neural Omnimodal Network with Knowledge-Awareness). Этот ансамбль моделей был создан на базе языковой модели Russian Generative Pretrained Transformer версии 3.5 с 13 миллиардами параметров (ruGPT-3.5 13B), которая является обновленной версией предыдущей нейросети ruGPT-3 13B.

Андрей Белевцев, старший вице-президент и руководитель блока “Технологии” Сбербанка, подчеркнул, что банк поддерживает открытость технологий и обмен опытом с профессиональным сообществом. Сбербанк уверен, что публикация обученных моделей побудит российских исследователей и разработчиков использовать мощные языковые модели для создания своих собственных технологических продуктов и решений.

Science XXI
Adblock
detector