Nvidia dévoile Blackwell : La plateforme de superchip IA de nouvelle génération
Nvidia, un leader dans le domaine du calcul accéléré et de l'IA, a dévoilé sa plateforme de nouvelle génération très attendue, construite autour du puissant GPU Blackwell. Annoncée lors de la conférence GTC 2024 de l'entreprise, cette nouvelle architecture, nommée en l'honneur du mathématicien David Blackwell, succède à la génération Hopper (H100/H200) qui a marqué son temps. Fait important, Blackwell représente la première incursion de Nvidia dans une conception basée sur des chiplets pour ses GPU de centres de données, intégrant deux grands dies GPU fabriqués à l'aide d'un nœud de processus TSMC 4NP personnalisé.

La plateforme Blackwell permet aux entreprises de construire et d'exécuter des modèles d'IA d'une taille sans précédent, pouvant potentiellement atteindre des milliards de paramètres. Cette capacité est cruciale pour réaliser des avancées dans des domaines complexes tels que le traitement des données, la simulation d'ingénierie, l'automatisation de la conception électronique (EDA), la conception de médicaments assistée par ordinateur, l'informatique quantique et le domaine en évolution rapide de l'IA générative.
L'architecture Blackwell introduit plusieurs innovations clés visant à répondre aux immenses exigences de calcul de l'IA moderne :
- Elle intègre six technologies transformatrices spécialement conçues pour améliorer les capacités de calcul accéléré pour l'IA, l'analyse de données et le calcul haute performance (HPC). Celles-ci comprennent des avancées telles qu'un moteur RAS (Fiabilité, Disponibilité, Maintenabilité) dédié pour améliorer la disponibilité du système et une fonctionnalité Secure AI offrant des capacités de calcul confidentiel.
- Elle est dotée de nouveaux Tensor Cores et d'un compilateur TensorRT-LLM amélioré. Ensemble, ils peuvent réduire le coût opérationnel et la consommation d'énergie pour l'inférence sur les grands modèles linguistiques (LLM) jusqu'à 25 fois par rapport à la génération Hopper précédente.
- La plateforme a déjà recueilli un fort soutien des principaux acteurs de l'industrie, notamment Amazon Web Services (AWS), Dell Technologies, Google, Meta, Microsoft, OpenAI, Oracle, Tesla et xAI, signalant une adoption large et rapide dans les secteurs du cloud et de l'entreprise.
Innovations technologiques clés :
- Un moteur Transformer de deuxième génération utilise une nouvelle prise en charge de la mise à l'échelle micro-tensorielle et intègre des algorithmes avancés de gestion de la plage dynamique avec la nouvelle précision virgule flottante 4 bits (FP4). Cela permet de doubler les performances de calcul et les capacités de taille des modèles tout en conservant une grande précision, essentielle pour l'entraînement et l'exécution de modèles de fondation massifs.
- Comprend la NVLink de cinquième génération de NVIDIA, une technologie d'interconnexion à haut débit. Elle offre un débit bidirectionnel révolutionnaire de 1,8 téraoctet par seconde (To/s) par GPU. Cela permet une communication transparente et à large bande passante entre jusqu'à 576 GPU au sein de racks de serveurs à grande échelle connectés via le nouveau système NVLink Switch 7.2T, crucial pour l'entraînement de modèles dépassant les mille milliards de paramètres.
- Un moteur de décompression dédié accélère les requêtes de base de données et l'analyse de données en prenant en charge les formats les plus récents, accélérant considérablement les tâches de traitement de données qui sont souvent des goulots d'étranglement dans les flux de travail de l'IA.
Applications de la plateforme Blackwell :
- Le DGX SuperPOD™ alimenté par les superchips NVIDIA GB200 Grace Blackwell représente le prochain bond en avant dans l'infrastructure de supercalcul IA. Il est spécifiquement conçu pour traiter des modèles d'IA générative à mille milliards de paramètres, offrant des performances massives, une évolutivité jusqu'à des dizaines de milliers de GPU et une haute efficacité énergétique dans une conception à l'échelle du rack refroidie par liquide.
- Le superchip GB200 Grace Blackwell lui-même connecte deux GPU Blackwell B200 à un CPU NVIDIA Grace via une liaison ultra-rapide puce à puce de 900 Go/s. Cette configuration étroitement couplée promet une augmentation des performances jusqu'à 30 fois pour les charges de travail d'inférence LLM par rapport au GPU H100 déjà puissant, ainsi que des améliorations substantielles de l'efficacité énergétique.
La plateforme NVIDIA Blackwell marque une avancée significative dans la technologie informatique, offrant une efficacité, des performances et une évolutivité sans précédent, adaptées aux applications d'IA les plus exigeantes. Son approbation par les principales entreprises technologiques, son architecture innovante de chiplets construite sur une technologie de processus avancée et son potentiel à révolutionner divers secteurs soulignent son importance dans l'évolution continue du calcul et de l'intelligence artificielle.