NVIDIA desata la locura de la IA en su GTC 2025 con las GPU Vera Rubin, Rubin Ultra y Feynman, CPU Vera, DGX Spark y Station: hasta 576 GPU y 88 Cores por CPU

Lo que puso NVIDIA en el tablero de juego en la tarde de ayer ha sido difícil de digerir para todos sus rivales en el mercado, hasta el punto de que realmente ha desatado la locura con su hardware para IA. Y podía haber sido peor para Intel y AMD, ya que no solamente mostró La entrada NVIDIA desata la locura de la IA en su GTC 2025 con las GPU Vera Rubin, Rubin Ultra y Feynman, CPU Vera, DGX Spark y Station: hasta 576 GPU y 88 Cores por CPU aparece primero en El Chapuzas Informático.

Mar 19, 2025 - 11:19

NVIDIA desata la locura de la IA en su GTC 2025 con las GPU Vera Rubin, Rubin Ultra y Feynman, CPU Vera, DGX Spark y Station: hasta 576 GPU y 88 Cores por CPU

Lo que puso NVIDIA en el tablero de juego en la tarde de ayer ha sido difícil de digerir para todos sus rivales en el mercado, hasta el punto de que realmente ha desatado la locura con su hardware para IA. Y podía haber sido peor para Intel y AMD, ya que no solamente mostró lo que lanzará en 2026 y 2027, sino que dejó claro lo que, de momento, no pueden crear por limitaciones de distinto tipo, pero que llegará en el futuro. Entre tanto, este GTC 2025 muestra las bases de lo que será el hardware de IA de NVIDIA para los dos siguientes años, con Blackwell Ultra, Vera Rubin, Rubin Ultra, Feynman, DGX Spark y DGX Station.

Es un cambio de ritmo tan brutal que realmente no parece ni real. Lo presentado por los verdes, con Huang de nuevo como protagonista vestido con su chupa de cuero, es un salto demencial a las pretensiones de sus rivales, hasta el punto de que Intel podría pensar directamente en salir del mercado.

NVIDIA GTC 2025, el evento más grande de la compañía comenzó fuerte: Blackwell Ultra NVL72 para la segunda mitad de este 2025, hasta 20 TB de HBM3e

Cada GPU de este sistema obtendrá 288 GB de HBM3e, mientras que los sistemas completos, ya filtrados con anterioridad, se llamarán NVL72, así que efectivamente, NVIDIA deja atrás las opciones de menor número de unidades. No nos detendremos demasiado aquí más allá de comentar los datos, puesto que lo sabemos todo desde antes de la presentación.

Tendrá un rendimiento en inferencia realmente brutal con FP4 y en FP8, lo que según NVIDIA elevará el rendimiento en 1,5x frente al GB200 NVL72 con este nuevo sistema GB300, o lo que es igual, es un 50% más rápido en estos términos. Los verdes afirman que habrá nuevas instrucciones para lograr ese rendimiento general donde con ellas se podría llegar a duplicar lo visto con las GB200.

Por si fuese poco, tendrá hasta 20 TB de HBM3e en total y hasta 40 TB de memoria general, y además, tendrá un ancho de banda de 14,4 TB/s para su ConnectX-8 SuperNIC, la tarjeta de red de alto rendimiento de los verdes. Por último, recordemos que Blackwell Ultra tiene un tamaño de retícula de 2 GPU, es decir, NVIDIA ha alcanzado el tamaño máximo permitido por los retículos de fotolitografía de ASML en los escáneres.

Para entender esto, que será definitorio más adelante conforme avancemos en las novedades para este GTC 2025, el llamado Reticle Size no es más que el área máxima que se puede grabar e imprimir en una sola exposición a través de la fotomáscara. En el caso de la GB300 Blackwell Ultra, da para dos unidades interconectadas.

NVIDIA Vera Rubin y Rubin Ultra: NVL144 y NVL576 con CPU Vera, directamente otro nivel

Disruptivo, una vez más, cambio de ritmo y aceleración para dejar atrás a sus rivales. Destinados para la segunda mitad del 2026 y la segunda mitad de 2027, hay que diferenciar dos modelos de sistemas: Vera Rubin y Rubin Ultra.

Vera Rubin llega catalogada con el nombre de NVL144 y será realmente un obús, puesto que los verdes aseguran hasta 3,6 ExaFLOPS en FP4 para inferencia, 1,2 ExaFLOPS para entrenamiento basado en FP8 y un rendimiento general del +330% frente a lo que acabamos de ver con los sistemas GB300 NVL72. Bien es cierto que cuenta con el doble de GPU en su haber y eso condiciona esta métrica, pero no deja de ser impresionante.

Además, NVIDIA afirma que incorporará HBM4 (módulos recién enviados por SK Hynix en pruebas en estos momentos) con hasta 13 TB/s, donde cada GPU Vera Rubin tendrá 288 GB de esta memoria. Por si fuese poco, irá acompañada de hasta 75 TB de DRAM, lo que supone en su conjunto y según Huang una mejora de un 60% en este apartado clave.

No queda la cosa ahí, puesto que presentan NVLink6 con hasta 260 TB/s, logrando un +200% el ancho de banda de la versión actual para Blackwell Ultra, y para rematar, por si esto no fuera ya una locura, Vera Rubin NVL144 tendrá CX9, es decir, ConnectX-9 SuperNIC, con otro +200% de ancho de banda hasta los 28,8 TB/s. Sin duda, NVIDIA juega a otro juego actualmente, y lo peor, es que esto solo acaba de empezar.

En 2027 llegará Rubin Ultra NVL576 para destrozar cualquier esperanza del resto de competidores

Desmoralizador, como poco, para sus rivales, lo que mostró ayer NVIDIA. "No hay palabra en élfico, ni en lengua ent, ni de Mordor, o humana, que pueda describir el horror" que debe haber sido ver la presentación del GTC 2025 como un posible competidor de los verdes.

Y es que el tablero ha volcado con Rubin Ultra NVL576, o lo que es igual, 576 GPU en un mismo sistema. Llegará para la segunda mitad de 2027 y el rendimiento es de película de Hollywood, como poco: hasta 15 ExaFLOPS en FP4 e inferencia, 5 ExaFLOPS en entrenamiento basado en FP8.

Según NVIDIA, esto equivale a multiplicar por 14 el rendimiento visto hoy del GB300 NVL72 para la segunda mitad de este año, o lo que es igual, casi un +1.400% en FP4 y FP8 para inferencia y training, de locos. Es cierto que NVIDIA está comparando 72 GPU contra 576, es decir, 8 veces menos, pero la cifra no deja de ser mareante, aunque podría tener matizaciones.

Terminando con este apartado, tenemos que hablar de la memoria. SK Hynix tendrá en solo dos años la versión HBM4e más avanzada del planeta, y ello supone, según los datos de los verdes, 4,6 PB/s para Rubin Ultra NVL576, y por fin, tendrá un aumento de DRAM hasta los 365 TB por unidad, un aumento en conjunto del +800%, de nuevo, hay que parpadear varias veces para leer la cifra.

Cerramos este bloque con la conectividad: NVLink7 con 1,5 PB/s y CX9 con hasta 115,2 TB/s, aumentos del +1.200% y +800% respectivamente. No olvidamos la CPU Vera, que se mantiene sin cambios con sus 88 Cores Arm, 176 hilos y 1,8 TB/s con NVLink-C2C, pero sí que hay que recalcar otro detalle arriba comentado. Y es que Rubin Ultra llevará el Reticle Size a un nuevo nivel con 4 veces el tamaño de una retícula uniendo en un solo packaging 4 GPU con 16 pilas de HBM4e, o lo que es igual, 100 PF en inferencia para FP4 y 1 TB de HBM4e por cada unidad.

Para entenderlo más fácilmente, NVIDIA y TSMC tienen problemas para escalar en transistores, así que lo que están haciendo es duplicar el área para cada silicio en cada generación, lo que supone una presión enorme para los escáneres de ASML y las fotomáscaras, que si ya son caras, ahora tienen que salirse de la escala. Es llevar al límite la tecnología y la técnica a un ritmo de 1 año para duplicar lo que se hace en el anterior, no es solo pisar el acelerador, es sacar el pie a través de él hasta tocar el asfalto como si fuesen los "picapiedra", es otro nivel.

NVIDIA Feynman, la arquitectura para 2028 que puede acabar con las opciones de AMD, Google, Amazon

Si todos están inmersos en acelerar para atrapar a NVIDIA, incluso creando sus propios chips para adaptarlos a sus necesidades y no depender de los verdes, el ritmo de Huang y los suyos podría acabar por dinamitar las inversiones actuales de AMD, Google, Amazon y otros tantos. Lo siguiente en el roadmap de NVIDIA no es más que una nueva arquitectura, Feynman, para 2028, la cual llegará con HBM5, misma CPU Vera, CX10 y NVLink8 como principales mejoras.

¿Cuáles serán las novedades realmente? Es la gran pregunta, pero como NVIDIA es fanática de escoger los nombres de sus arquitecturas en base al trabajo de grandes matemáticos y físicos, sabiendo la trayectoria del personaje podemos hacer ciertas cábalas sobre hacia dónde quieren ir realmente.

Según podemos ver online, NVIDIA Feynman hará tributo a Richard Phillips Feynman, físico teórico estadounidense que tuvo grandes trabajos, como la formulación de la integral de trayectorias de la mecánica cuántica, la teoría de la electrodinámica cuántica, la física de la superfluidez con helio líquido superenfriado y algunas teorías de físicas de partículas con modelo partónico.

¿Va a introducirse NVIDIA en la mecánica cuántica con sus GPU de IA? ¿Es lo cuántico el futuro de este sector y del gaming? Es posible, y hay algo que sí que sabemos al respecto. Ciertas patentes de hace 3 y 4 años que vimos se plasmaron en el GTC 2025 de ayer, y esto significa que lo que veremos en 2028 realmente ya ha nacido o está muy encaminado, no es "puro humo".

De hecho, NVIDIA ya está en el sector, por ejemplo, con cuQuantum (presentado en 2021 como SDK y actualizado el año pasado), CUDA Quantum (plataforma para QPU, emulación cuántica en GPU y CPU, renombrada el año pasado a CUDA-Q) y DGX Quantum (presentada en 2023 siendo un sistema híbrido entre computación cuántica y clásica).

NVIDIA DGX Spark y DGX Station: de los servidores al escritorio con Grace Blackwell

NVIDIA ha presentado las supercomputadoras personales de IA DGX Spark y DGX Station, basadas en la plataforma Grace Blackwell. Estos sistemas llevan la potencia de la arquitectura Grace Blackwell a computadoras de escritorio, permitiendo a desarrolladores, investigadores y científicos de datos ejecutar modelos de IA localmente o en la nube.

DGX Spark es la supercomputadora de IA más compacta, equipada con el superchip NVIDIA GB10, que incluye una GPU Blackwell con núcleos Tensor de quinta generación y soporte para FP4, alcanzando hasta 1000 billones de operaciones por segundo. Además, incorpora NVLink-C2C, ofreciendo un ancho de banda 5 veces superior a PCIe 5.0, optimizando la transferencia de datos entre CPU y GPU.

DGX Station está diseñada para cargas de trabajo de IA a gran escala e incluye el superchip GB300 Grace Blackwell Ultra, con 784 GB de memoria coherente y conectividad de alto rendimiento mediante NVIDIA ConnectX-8 SuperNIC (hasta 800 Gb/s). Esto permite conectar múltiples estaciones para acelerar la inferencia y el entrenamiento.

Ambos sistemas se integran con la plataforma de IA full-stack de NVIDIA, facilitando la migración de modelos entre escritorio, nube y centros de datos sin cambios de código. DGX Spark ya está disponible para reservas, mientras que DGX Station llegará a finales de año a través de fabricantes como ASUS, Dell, HP y Supermicro.

El futuro es todavía más impresionante: fotónica del silicio (NVIDIA Photonics) y GPU Wafer ya vistas en el GTC 2025

Solo un poco de lo que podría ser, y de momento no es, en cuanto a fabricación de GPU en obleas. Y sí, NVIDIA dijo abiertamente que la intención con Grace Blackwell NVL72 era crear una GPU masiva del tamaño de una oblea de 300 mm, pero por "culpa" de lo comentado con las limitaciones del Reticle Size, el consumo y la imposibilidad de tener un sistema de refrigeración para extraer los vatios del monstruo, no lo han podido fabricar.

El sistema es parecido en concepto al de Cerebras, solo que infinitamente más complejo. Este es el futuro de la compañía en GPU o QPU para IA, veremos si con Feynman se puede llevar a cabo, sobre todo con los escáneres EUV High-NA de ASML y nuevas fotomáscaras. Entre tanto, hay que hablar de NVIDIA Photonics para el sector Silicon Photonics, el cual sin duda es el futuro junto con las QPU.

NVIDIA afirma que su silicio obtiene 1,6T CPO en un chip, es decir, es el primero con 1,6 terabits con Co-Packaged Optics e integra, además, nuevos moduladores microópticos MRM (Micro Ring Modulators). También tiene el honor de ser el primer motor fotónico apilado en 3D gracias a la tecnología de packaging de TSMC, donde se ha usado láseres de alta potencia y eficiencia para mejorar la transmisión de datos.

Habrá dos productos dentro de la gama NVIDIA Photonics para este GTC 2025:

Spectrum-X con fotónica de silicio integrada → Segunda mitad de 2025.
Quantum-X con fotónica de silicio integrada → Segunda mitad de 2026.

Por lo tanto, serán una realidad palpable en breve y seguramente, con Feynman, veamos una unión entre los NVL y estos Photonics de alguna manera que todavía desconocemos. Y hasta aquí el GTC 2025, que ha dejado algunas perlas más, como en el sector del automóvil, la nube y algunos detalles anexos más, pero en cuanto a hardware, por si no ha quedado claro, ha sido una auténtica locura que pone en jaque a la gran mayoría de rivales, y directamente a otros los deja fuera del mercado, al menos, si los datos que han mostrado son ciertos.

La entrada NVIDIA desata la locura de la IA en su GTC 2025 con las GPU Vera Rubin, Rubin Ultra y Feynman, CPU Vera, DGX Spark y Station: hasta 576 GPU y 88 Cores por CPU aparece primero en El Chapuzas Informático.