El Papel de las GPUs en el Sector de la IA

Hace algo más de un mes, todas las alarmas saltaron en Silicon Valley con la aparición de DeepSeek, un modelo IA de código abierto característicamente más eficiente y potente que sus competidores del momento. Más allá de las consecuencias que esto haya podido tener a nivel de diseño o estrategias de desarrollo en el sector de la Inteligencia Artificial, resulta llamativa una de las implicaciones que este nuevo modelo tuvo para los fabricantes de tarjetas gráficas (específicamente NVIDIA), que vieron su stock caer de forma prácticamente inmediata.

Este hecho sirve para demostrar hasta que punto resultan importantes las GPUs (Unidad de Procesamiento Gráfico) para el ámbito de la IA y, de forma complementaria, hasta que punto este sector se ha convertido en una de las principales aplicaciones de esta pieza de hardware.

Para entender el por qué de esta relación, es importante entender algo sobre la forma en la que los modelos de Inteligencia Artificial son diseñados, entrenados y utilizados. Resumiendo y simplificando, las IAs modernas basan su arquitectura en redes neuronales, conjuntos de miles y miles de unidades de computación (las “neuronas”) interconectadas entre sí. Estas neuronas implementa cada una función matemática sencilla, cuyos parámetros pueden ser ajustados. El proceso de entrenamiento, así, consiste en ir pasando miles y miles de datos por esa red, ajustando las neuronas sobre la marcha hasta que se producen, de forma consistente, los resultados deseados.

La importancia de las GPUs para este proceso de entrenamiento reside en su capacidad para realizar miles de operaciones en paralelo (en contraste con las CPUs, más rápidas pero con menos capacidad multitarea), una característica muy adecuada para permitir la activación simultanea de gran cantidad de neuronas, y de la evaluación en paralelo de varios sets datos.

Así, el papel de las GPUs como bloque básico para el trabajo con IAs ha afectado notablemente a la economía de este producto: muchas grandes empresas han optado por acaparar miles de unidades para sus proyectos de desarrollo, y cada vez más Centros de Procesamiento de Datos optan por instalar racks de GPUs, adelantándose a la demanda de un sector en crecimiento.

Está claro que, como siempre, hardware y software van de la mano, y de la misma forma que los avances en el diseño de unidades de computación deberían permitir una aplicación más eficiente y ubicua de la tecnología IA (con la computación cuántica como una de las tecnologías más prometedoras en ese ámbito), el estado del arte en herramientas IA va a tener una influencia clara sobre la dirección que toma el desarrollo de nuevo hardware – así como sobre su disponibilidad.