Nvidia presenta Blackwell: La plataforma de superchip de IA de próxima generación
Nvidia, líder en computación acelerada e IA, ha presentado su muy esperada plataforma de próxima generación construida en torno a la potente GPU Blackwell. Anunciada en la conferencia GTC 2024 de la compañía, esta nueva arquitectura, nombrada en honor al matemático David Blackwell, sucede a la influyente generación Hopper (H100/H200). Significativamente, Blackwell representa la primera incursión de Nvidia en un diseño basado en chiplets para sus GPU de centros de datos, integrando dos grandes matrices de GPU fabricadas utilizando un nodo de proceso TSMC 4NP personalizado.

La plataforma Blackwell permite a las empresas construir y ejecutar modelos de IA de un tamaño sin precedentes, con una posible escalabilidad a billones de parámetros. Esta capacidad es crucial para lograr avances en áreas complejas como el procesamiento de datos, la simulación de ingeniería, la automatización del diseño electrónico (EDA), el diseño de fármacos asistido por ordenador, la computación cuántica y el campo en rápido avance de la IA generativa.
La arquitectura Blackwell introduce varias innovaciones clave destinadas a abordar las inmensas demandas computacionales de la IA moderna:
- Incorpora seis tecnologías transformadoras diseñadas específicamente para impulsar las capacidades de computación acelerada para la IA, el análisis de datos y la computación de alto rendimiento (HPC). Estas incluyen avances como un motor RAS (Fiabilidad, Disponibilidad, Capacidad de Servicio) dedicado para mejorar el tiempo de actividad del sistema y una función de IA Segura que proporciona capacidades de computación confidencial.
- Presenta nuevos Tensor Cores y un compilador TensorRT-LLM mejorado. Juntos, estos pueden reducir el coste operativo y el consumo de energía para la inferencia en modelos de lenguaje grandes (LLM) hasta 25 veces en comparación con la generación Hopper anterior.
- La plataforma ya ha obtenido un fuerte apoyo de los principales actores de la industria, incluyendo Amazon Web Services (AWS), Dell Technologies, Google, Meta, Microsoft, OpenAI, Oracle, Tesla y xAI, lo que indica una adopción amplia y rápida en los sectores de la nube y empresarial.
Innovaciones Tecnológicas Clave:
- Un motor Transformer de segunda generación utiliza un nuevo soporte de escalado de microtensores e integra algoritmos avanzados de gestión de rango dinámico con la novedosa precisión de punto flotante de 4 bits (FP4). Esto permite duplicar el rendimiento computacional y las capacidades de tamaño del modelo, manteniendo al mismo tiempo una alta precisión, esencial para entrenar y ejecutar modelos fundacionales masivos.
- Incluye NVLink de quinta generación de NVIDIA, una tecnología de interconexión de alta velocidad. Ofrece un rendimiento bidireccional innovador de 1,8 terabytes por segundo (TB/s) por GPU. Esto permite una comunicación fluida y de gran ancho de banda entre hasta 576 GPU dentro de racks de servidores a gran escala conectados a través del nuevo sistema NVLink Switch 7.2T, crucial para entrenar modelos que superan los billones de parámetros.
- Un motor de descompresión dedicado acelera las consultas de bases de datos y el análisis de datos al admitir los formatos más recientes, acelerando significativamente las tareas de procesamiento de datos que a menudo son cuellos de botella en los flujos de trabajo de la IA.
Aplicaciones de la Plataforma Blackwell:
- El DGX SuperPOD™ impulsado por NVIDIA GB200 Grace Blackwell Superchips representa el próximo salto en la infraestructura de supercomputación de IA. Está específicamente diseñado para procesar modelos de IA generativa de billones de parámetros, ofreciendo un rendimiento masivo, escalabilidad hasta decenas de miles de GPU y alta eficiencia energética en un diseño a escala de rack refrigerado por líquido.
- El GB200 Grace Blackwell Superchip en sí conecta dos GPU Blackwell B200 a una CPU NVIDIA Grace a través de un enlace ultrarrápido de chip a chip de 900 GB/s. Esta configuración estrechamente acoplada promete un aumento de rendimiento de hasta 30 veces para las cargas de trabajo de inferencia de LLM en comparación con la ya potente GPU H100, junto con mejoras sustanciales en la eficiencia energética.
La plataforma NVIDIA Blackwell marca un avance significativo en la tecnología de computación, ofreciendo una eficiencia, un rendimiento y una escalabilidad sin precedentes, adaptados a las aplicaciones de IA más exigentes. Su respaldo por parte de las principales empresas tecnológicas, su innovadora arquitectura de chiplets construida sobre tecnología de proceso avanzada y su potencial para revolucionar diversas industrias subrayan su importancia en la evolución continua de la computación y la inteligencia artificial.