NVQLink conecta GPUs y QPUs con latencias de microsegundos para mejorar el control cuántico en tiempo real.

NVIDIA presentó NVQLink como una solución de conectividad rápida y de muy baja latencia para unir computadores acelerados con procesadores cuánticos. Bajo este foco, la firma busca resolver las crecientes demandas de corrección de errores y calibración continua necesarias para avanzar hacia sistemas cuánticos tolerantes a fallos.
La siguiente figura corresponde al esquema de arquitectura NVQLink presentado por NVIDIA y resume cómo se organiza la interacción entre el host acelerado, el controlador del sistema cuántico y la QPU física (procesador cuántico) dentro de un entorno de control en tiempo real.
Una QPU es el procesador cuántico donde se manipulan qubits mediante operaciones controladas por pulsos emitidos por el sistema de control, y corresponde al componente físico que ejecuta las puertas cuánticas, recibe las secuencias de calibración y entrega las mediciones, funcionando como el núcleo operativo del hardware cuántico dentro de arquitecturas como NVQLink.
Imagina a una persona mientras arma un rompecabezas extremadamente frágil que debe mantenerse en movimiento constante y, al mismo tiempo, otra persona selecciona y entrega las piezas exactas en el momento preciso por un pasillo completamente despejado, porque si alguna pieza llega tarde, el rompecabezas se desarma y hay que comenzar de nuevo.
La razón por la que NVQLink toma importancia es que organiza la QPU lógica como un sistema que reúne los qubits, su electrónica de control y la capacidad de cálculo que los acompaña, y para que todo funcione sin interrupciones necesita comunicarse de manera estable y muy rápida con el host acelerado, que interactúa con el controlador cuántico a través de RDMA over Converged Ethernet para mantener latencias de microsegundos que permitan que cada operación llegue justo a tiempo.
NVIDIA detalla que el host funciona como un nodo programable mediante CUDA-Q y puede ejecutar funciones en CPU o GPU cuando el núcleo cuántico lo necesita, ya que las llamadas directas en tiempo real permiten incorporar cálculos externos dentro del mismo ciclo cuántico sin pasar por interfaces más lentas, lo que facilita mantener un control más preciso sobre la QPU.
NVIDIA mostró esta arquitectura utilizando un FPGA RFSoC enlazado a una GPU RTX PRO 6000 Blackwell Max-Q y a una tarjeta de red ConnectX-7 mediante Holoscan, y en esa demostración se registró una latencia promedio de 3,84 microsegundos que se mantiene dentro de los rangos necesarios para tareas como la decodificación de síndromes en corrección de errores cuánticos, lo que además permitió observar una variación temporal acotada durante el intercambio de datos.
La siguiente figura muestra el esquema utilizado por NVIDIA para evaluar la latencia extremo a extremo en una prueba de red RoCE, donde un FPGA RFSoC genera y registra marcas de tiempo que se comparan con las recibidas por el sistema host equipado con GPU y red de alta velocidad.
NVIDIA finalmente describe a NVQLink como una plataforma abierta destinada a fabricantes, desarrolladores e investigadores que trabajan en la integración entre cómputo acelerado y hardware cuántico.