Сбербанк представил общественности технический отчет Green-VLA, который посвящен развитию ключевой технологии физического искусственного интеллекта. Речь идет о моделях типа Vision-Language-Action, позволяющих машинам не только видеть и понимать человеческую речь, но и преобразовывать инструкции в конкретные физические действия. О выходе этого важного документа, который должен стать опорой для отечественных инженеров, сообщила пресс-служба Сбербанка в феврале. Теперь специалисты смогут использовать наработки банка для создания надежных систем управления, способных эффективно взаимодействовать с окружающей средой.
Новая архитектура базируется на возможностях отечественной нейросети GigaChat и предлагает детальное описание процесса обучения умных систем. Методология охватывает весь путь подготовки искусственного интеллекта, начиная от базовых алгоритмов и заканчивая тонкой настройкой поведения робота в реальных, а не лабораторных условиях. Данный проект задуман как открытый инструмент для исследователей, который поможет ускорить прогресс в области робототехники на национальном уровне. Благодаря понятному изложению принципов работы нейросети инженеры смогут быстрее внедрять инновации в производство.
Современная робототехника уже достигла определенных высот, однако эксперты выделяют несколько критических задач, требующих решения для качественного рывка. К ним относятся повышение стабильности работы механизмов, обеспечение взаимодействия между разными платформами и выполнение сложных операций, состоящих из множества этапов. Методика Green-VLA предлагает системный инженерный подход, основанный на точных и выверенных принципах обучения. Это позволяет создавать «мозги» для роботов, которые будут работать предсказуемо и надежно в самых разных сценариях эксплуатации.
Руководитель блока «Технологическое развитие» Сбербанка Андрей Белевцев подчеркнул стратегическую значимость открытости этих данных для страны. Он отметил, что подобные решения уже помогли банку создать собственного ИИ-робота, а теперь эти знания станут доступны всей экосистеме. «Технология VLA становится «мозгом» физического искусственного интеллекта: Vision Action Language модели превращают зрение и язык в исполняемое действие. В Green-VLA мы показываем, как сделать этот слой инженерно надежным», — заявил топ-менеджер. Сбер планирует активно делиться своими достижениями, чтобы российские исследователи могли создавать конкурентоспособные продукты.
Важно понимать, что Green-VLA не является готовой универсальной программой для всех типов машин, а представляет собой гибкую методологию обучения. Архитектура решения подразумевает этап предварительной подготовки с последующей адаптацией под конкретную роботизированную систему. Такой подход обеспечивает широкие возможности для масштабирования технологии и ее применения в самых разных отраслях промышленности. Открытый доступ к этим знаниям станет мощным стимулом для развития отечественного программного обеспечения и укрепления технологического суверенитета России.
