NVIDIA снизила производительность своих ускорителей на 30% для китайского рынка

NVIDIA снизила производительность своих ускорителей на 30% для китайского рынка

В ответ на запрет, введенный американскими властями в прошлом году, NVIDIA приняла решение модифицировать свои ускорители для китайского рынка. Ранее запретили поставку в Китай ускорителей вычислений с уровнем производительности A100 и H100. NVIDIA в свою очередь разработала ускорители H800 и A800, которые имеют меньшую производительность и, следовательно, не попадают под действие санкций.

Увеличение интереса к сложным нейронным языковым моделям, таким как Generative Pre-trained Transformer (GPT), обучаемым на больших объемах текстовых данных для генерации текста, напоминающего человеческий, стимулировало рост спроса и инвестиций в ускорители вычислений, которые используются для обучения этих моделей.

Согласно информации, опубликованной на MyDrivers, модифицированный для китайского рынка ускоритель вычислений A800 обеспечивает 70% от производительности стандартной модели A100. Последняя показывает 9,7 Тфлопс в операциях FP64, 19,5 Тфлопс в задачах FP64 с использованием тензорных ядер и до 624 Тфлопс в смешанных задачах FP16 и BF16. Так, при снижении производительности на 30%, ускорители A800 выдают 6,8 Тфлопс в задачах FP64, 13,7 Тфлопс в операциях FP64 с использованием тензорных ядер и 437 Тфлопс в смешанных задачах FP16 и BF16.

Стоимость NVIDIA A800 на китайском рынке, согласно данным MyDrivers, составляет около 100 тыс. юаней, что эквивалентно приблизительно 14 462 долларам. Однако, это не самый мощный ускоритель, доступный для китайского рынка. NVIDIA также предлагает модель H800, которая занимает более высокую позицию в линейке продуктов, хотя подробные данные о ее производительности пока не предоставлены.

Science XXI