Nvidia представила Blackwell: платформу суперчипов AI нового поколения
Nvidia, лидер в области ускоренных вычислений и искусственного интеллекта, представила свою долгожданную платформу нового поколения, построенную на базе мощного Blackwell GPU. Новая архитектура, анонсированная на конференции GTC 2024 и названная в честь математика Дэвида Блэквелла, приходит на смену влиятельному поколению Hopper (H100/H200). Важно отметить, что Blackwell представляет собой первый опыт Nvidia в чиплетном дизайне для своих GPU для центров обработки данных, объединяя два больших GPU-чипа, произведенных по специальному техпроцессу TSMC 4NP.

Платформа Blackwell позволяет компаниям создавать и запускать беспрецедентно большие AI-модели, потенциально масштабируемые до триллионов параметров. Эта возможность имеет решающее значение для достижения прорывов в таких сложных областях, как обработка данных, инженерное моделирование, автоматизация электронного проектирования (EDA), автоматизированная разработка лекарств, квантовые вычисления и быстро развивающаяся область генеративного AI.
Архитектура Blackwell представляет несколько ключевых инноваций, направленных на решение огромных вычислительных задач современного AI:
- Она включает в себя шесть революционных технологий, специально разработанных для повышения возможностей ускоренных вычислений для AI, анализа данных и высокопроизводительных вычислений (HPC). К ним относятся такие усовершенствования, как выделенный движок RAS (надежность, доступность, обслуживаемость) для улучшения времени безотказной работы системы и функция Secure AI, обеспечивающая возможности конфиденциальных вычислений.
- Оснащена новыми тензорными ядрами и улучшенным компилятором TensorRT-LLM. Вместе они могут снизить эксплуатационные расходы и энергопотребление для инференса больших языковых моделей (LLM) до 25 раз по сравнению с предыдущим поколением Hopper.
- Платформа уже получила мощную поддержку от крупнейших игроков отрасли, включая Amazon Web Services (AWS), Dell Technologies, Google, Meta, Microsoft, OpenAI, Oracle, Tesla и xAI, что свидетельствует о широком и быстром внедрении в облачном и корпоративном секторах.
Ключевые технологические инновации:
- Трансформационный движок второго поколения использует новую поддержку масштабирования микротензоров и интегрирует передовые алгоритмы управления динамическим диапазоном с новой 4-битной точностью с плавающей запятой (FP4). Это позволяет удвоить вычислительную производительность и возможности размера модели, сохраняя при этом высокую точность, что необходимо для обучения и запуска массивных фундаментальных моделей.
- Включает NVLink пятого поколения от NVIDIA, высокоскоростную технологию межсоединений. Она обеспечивает революционную двунаправленную пропускную способность 1,8 терабайта в секунду (ТБ/с) на GPU. Это обеспечивает бесперебойную высокоскоростную связь между 576 GPU в крупных серверных стойках, подключенных через новую систему NVLink Switch 7.2T, что имеет решающее значение для обучения моделей, превышающих триллионы параметров.
- Выделенный движок декомпрессии ускоряет запросы к базам данных и анализ данных, поддерживая новейшие форматы, что значительно ускоряет задачи обработки данных, которые часто являются узким местом в рабочих процессах AI.
Применение платформы Blackwell:
- DGX SuperPOD™ на базе NVIDIA GB200 Grace Blackwell Superchips представляет собой следующий скачок в инфраструктуре суперкомпьютеров AI. Он специально разработан для обработки триллионно-параметрических генеративных AI-моделей, предлагая огромную производительность, масштабируемость до десятков тысяч GPU и высокую энергоэффективность в конструкции стоечного масштаба с жидкостным охлаждением.
- GB200 Grace Blackwell Superchip сам по себе соединяет два GPU Blackwell B200 с процессором NVIDIA Grace через сверхбыстрое межчиповое соединение со скоростью 900 ГБ/с. Эта тесно связанная конфигурация обещает 30-кратное увеличение производительности для рабочих нагрузок инференса LLM по сравнению с уже мощным GPU H100, а также значительное повышение энергоэффективности.
Платформа NVIDIA Blackwell знаменует собой значительный прогресс в вычислительной технике, предлагая беспрецедентную эффективность, производительность и масштабируемость, разработанные для самых требовательных AI-приложений. Ее одобрение ведущими технологическими компаниями, инновационная чиплетная архитектура, построенная на передовой технологической базе, и ее потенциал для революции в различных отраслях подчеркивают ее важность в продолжающейся эволюции вычислений и искусственного интеллекта.