DeepSeek обошел ограничения США и создал конкурента ChatGPT

DeepSeek обошел ограничения США и создал конкурента ChatGPT

В мире искусственного интеллекта появился новый значимый игрок — китайский стартап DeepSeek, который бросает вызов доминированию OpenAI своей экономически эффективной языковой моделью DeepSeek-R1. Несмотря на ограничения США на экспорт передовых чипов для искусственного интеллекта, компании удалось достичь прорывных результатов благодаря инновационным стратегиям.

В отличие от западных компаний, которые делают ставку на наращивание вычислительных мощностей, DeepSeek выбрал иной путь развития. Столкнувшись с экспортными ограничениями на современные чипы, компания сосредоточилась на оптимизации программного обеспечения и алгоритмов для достижения максимальной эффективности.

Компания представила две передовые модели искусственного интеллекта: DeepSeek-V3, предназначенную для широкого спектра применений, включая обработку естественного языка, обслуживание клиентов, образование и здравоохранение. Модель оптимизирована для понимания китайского языка и культурного контекста, при этом поддерживает возможности глобального использования.

DeepSeek-R1 предлагает производительность, сопоставимую с ChatGPT от OpenAI, но при значительно меньших затратах. Несмотря на ограничения, модель демонстрирует высококачественные результаты благодаря эффективности и инновационным подходам, что делает DeepSeek конкурентоспособным игроком на глобальном рынке искусственного интеллекта.

Основатель DeepSeek Лян Вэньфэн, бывший управляющий квантового хедж-фонда, собрал команду молодых амбициозных исследователей из ведущих университетов Китая. Им предоставлены широкие возможности и свобода для изучения нестандартных идей. Этот подход привел к разработке революционных технологий, таких как Multi-head Latent Attention (MLA) и Mixture-of-Experts, существенно снижающих потребность в вычислительных ресурсах при обучении моделей.


Подписывайтесь на Science XXI в Дзен и Telegram.

Поделиться с друзьями
Science XXI