Avance de IBM Quantum: Vinculación de chips en tiempo real para expandir la potencia de los cúbits

```html Autores: Almudena Carrera Vazquez Caroline Tornow Diego Ristè Stefan Woerner Maika Takita Daniel J. Egger Resumen Las computadoras cuánticas procesan información utilizando las leyes de la mecánica cuántica. El hardware cuántico actual es ruidoso, solo puede almacenar información durante un corto período de tiempo y está limitado a unos pocos bits cuánticos, es decir, qubits, típicamente dispuestos en una conectividad planar . Sin embargo, muchas aplicaciones de la computación cuántica requieren más conectividad que la red planar que ofrece el hardware en más qubits de los disponibles en una sola unidad de procesamiento cuántico (QPU). La comunidad espera abordar estas limitaciones conectando las QPU mediante comunicación clásica, lo que aún no se ha demostrado experimentalmente. Aquí, realizamos experimentalmente circuitos dinámicos con mitigación de errores y corte de circuitos para crear estados cuánticos que requieren conectividad periódica utilizando hasta 142 qubits que abarcan dos QPU con 127 qubits cada una, conectadas en tiempo real con un enlace clásico. En un circuito dinámico, las puertas cuánticas pueden ser controladas clásicamente por los resultados de mediciones de mitad de circuito dentro del tiempo de ejecución, es decir, dentro de una fracción del tiempo de coherencia de los qubits. Nuestro enlace clásico en tiempo real nos permite aplicar una puerta cuántica en una QPU condicionada al resultado de una medición en otra QPU. Además, el flujo de control con mitigación de errores mejora la conectividad de los qubits y el conjunto de instrucciones del hardware, aumentando así la versatilidad de nuestras computadoras cuánticas. Nuestro trabajo demuestra que podemos utilizar varios procesadores cuánticos como uno solo con circuitos dinámicos con mitigación de errores habilitados por un enlace clásico en tiempo real. 1 Principal Las computadoras cuánticas procesan información codificada en bits cuánticos con operaciones unitarias. Sin embargo, las computadoras cuánticas son ruidosas y la mayoría de las arquitecturas a gran escala organizan los qubits físicos en una red planar. No obstante, los procesadores actuales con mitigación de errores ya pueden simular modelos de Ising nativos del hardware con 127 qubits y medir observables a una escala en la que los enfoques de fuerza bruta con computadoras clásicas comienzan a tener dificultades . La utilidad de las computadoras cuánticas depende de una mayor escalabilidad y de superar su conectividad limitada de qubits. Un enfoque modular es importante para escalar los procesadores cuánticos ruidosos actuales y para lograr el gran número de qubits físicos necesarios para la tolerancia a fallos . Las arquitecturas de iones atrapados y átomos neutros pueden lograr modularidad mediante el transporte físico de los qubits , . A corto plazo, la modularidad en qubits superconductores se logra mediante interconexiones de corto alcance que unen chips adyacentes , . 1 2 3 4 5 6 7 8 A medio plazo, se pueden realizar puertas de largo alcance que operan en el régimen de microondas a través de cables convencionales largos , , . Esto permitiría una conectividad de qubits no planar adecuada para una corrección de errores eficiente . Una alternativa a largo plazo es entrelazar QPU remotas con un enlace óptico que aproveche una transducción de microondas a óptica , que, hasta donde sabemos, aún no se ha demostrado. Además, los circuitos dinámicos amplían el conjunto de operaciones de una computadora cuántica al realizar mediciones de mitad de circuito (MCM) y controlar clásicamente una puerta dentro del tiempo de coherencia de los qubits. Mejoran la calidad algorítmica y la conectividad de los qubits . Como mostraremos, los circuitos dinámicos también permiten la modularidad al conectar QPU en tiempo real a través de un enlace clásico. 9 10 11 3 12 13 14 Adoptamos un enfoque complementario basado en puertas virtuales para implementar interacciones de largo alcance en una arquitectura modular. Conectamos qubits en ubicaciones arbitrarias y creamos las estadísticas de entrelazamiento a través de una descomposición cuasi-probabilística (QPD) , , . Comparamos un esquema solo de Operaciones Locales (LO) [ref. 16] con uno aumentado por Comunicación Clásica (LOCC) [ref. 17]. El esquema LO, demostrado en un entorno de dos qubits [ref. 18], requiere ejecutar múltiples circuitos cuánticos solo con operaciones locales. Por el contrario, para implementar LOCC, consumimos pares de Bell virtuales en un circuito de teletransportación para crear puertas de dos qubits , . En hardware cuántico con conectividad dispersa y planar, la creación de un par de Bell entre qubits arbitrarios requiere una puerta controlada-NO (CNOT) de largo alcance. Para evitar estas puertas, utilizamos una QPD sobre operaciones locales que resulta en pares de Bell cortados que la teletransportación consume. LO no necesita el enlace clásico y, por lo tanto, es más simple de implementar que LOCC. Sin embargo, como LOCC solo requiere un circuito de plantilla parametrizado, es más eficiente de compilar que LO y el costo de su QPD es menor que el costo del esquema LO. 15 16 17 19 20 Nuestro trabajo realiza cuatro contribuciones clave. Primero, presentamos los circuitos cuánticos y la QPD para crear múltiples pares de Bell cortados y realizar las puertas virtuales en ref. 17. Segundo, suprimimos y mitigamos los errores derivados de la latencia del hardware de control clásico en circuitos dinámicos con una combinación de desacoplamiento dinámico y extrapolación de ruido cero . Tercero, aprovechamos estos métodos para diseñar condiciones de contorno periódicas en un estado de grafo de 103 nodos. Cuarto, demostramos una conexión clásica en tiempo real entre dos QPU separadas, demostrando así que un sistema de QPU distribuidas puede operarse como una sola a través de un enlace clásico . Combinado con circuitos dinámicos, esto nos permite operar ambos chips como una sola computadora cuántica, lo que ejemplificamos diseñando un estado de grafo periódico que abarca ambos dispositivos en 142 qubits. Discutimos un camino a seguir para crear puertas de largo alcance y proporcionamos nuestra conclusión. 21 22 23 Corte de circuitos Ejecutamos circuitos cuánticos grandes que pueden no ser ejecutables directamente en nuestro hardware debido a limitaciones en el número de qubits o la conectividad, mediante el corte de puertas. El corte de circuitos descompone un circuito complejo en subcircuitos que pueden ejecutarse individualmente , , , , , . Sin embargo, debemos ejecutar un número mayor de circuitos, lo que llamamos sobrecarga de muestreo. Los resultados de estos subcircuitos se recombinan clásicamente para obtener el resultado del circuito original (Métodos [ref. Sec6]). 15 16 17 24 25 26 Como una de las principales contribuciones de nuestro trabajo es la implementación de puertas virtuales con LOCC, mostramos cómo crear los pares de Bell cortados requeridos con operaciones locales. Aquí, se diseñan múltiples pares de Bell cortados mediante circuitos cuánticos parametrizados, que llamamos una fábrica de pares de Bell cortados (Fig. 1b,c). Cortar múltiples pares al mismo tiempo requiere una menor sobrecarga de muestreo . Como la fábrica de pares de Bell cortados forma dos circuitos cuánticos disjuntos, colocamos cada subcircuito cerca de los qubits que tienen puertas de largo alcance. El recurso resultante se consume luego en un circuito de teletransportación. Por ejemplo, en la Fig. 1b, los pares de Bell cortados se consumen para crear puertas CNOT en los pares de qubits (0, 1) y (2, 3) (ver sección 'Fábricas de pares de Bell cortados' [ref. Sec11]). 17 , Representación de una arquitectura IBM Quantum System Two. Aquí, dos QPU Eagle de 127 qubits están conectadas con un enlace clásico en tiempo real. Cada QPU es controlada por su electrónica en su rack. Sincronizamos estrechamente ambos racks para operar ambas QPU como una sola. , Circuito cuántico de plantilla para implementar puertas CNOT virtuales en pares de qubits ( 0, 1) y ( 2, 3) con LOCC consumiendo pares de Bell cortados en un circuito de teletransportación. Las líneas dobles moradas corresponden al enlace clásico en tiempo real. , Fábricas de pares de Bell cortados 2( ) para dos pares de Bell cortados simultáneamente. La QPD tiene un total de 27 conjuntos de parámetros diferentes . Aquí, . a b q q q q c C θ i θ i Condiciones de contorno periódicas Construimos un estado de grafo | ⟩ con condiciones de contorno periódicas en ibm_kyiv, un procesador Eagle , yendo más allá de los límites impuestos por su conectividad física (ver sección 'Estados de grafo' [ref. Sec13]). Aquí, tiene ∣ ∣ = 103 nodos y requiere cuatro aristas de largo alcance lr = {(1, 95), (2, 98), (6, 102), (7, 97)} entre los qubits superiores e inferiores del procesador Eagle (Fig. 2a). Medimos los estabilizadores de nodo i en cada nodo ∈ y los estabilizadores de arista formados por el producto i j a través de cada arista ( , ) ∈ . A partir de estos estabilizadores, construimos un testigo de entrelazamiento , que es negativo si hay entrelazamiento bipartito a través de la arista ( , ) ∈ (ref. 27) (ver sección 'Testigo de entrelazamiento' [ref. Sec14]). Nos centramos en el entrelazamiento bipartito porque este es el recurso que deseamos recrear con puertas virtuales. Medir testigos de entrelazamiento entre más de dos partes medirá solo la calidad de las puertas y mediciones no virtuales, lo que hace que el impacto de las puertas virtuales sea menos claro. G 1 G V E S i V S S i j E i j E , El grafo pesado hexagonal se pliega sobre sí mismo en forma tubular por las aristas (1, 95), (2, 98), (6, 102) y (7, 97) resaltadas en azul. Cortamos estas aristas. , Los estabilizadores de nodo j (arriba) y los testigos , (abajo), con 1 desviación estándar para los nodos y aristas cercanas a las aristas de largo alcance. Las líneas discontinuas verticales agrupan estabilizadores y testigos por su distancia a las aristas cortadas. , Función de distribución acumulativa de los errores de los estabilizadores. Las estrellas indican estabilizadores de nodo j que tienen una arista implementada por una puerta de largo alcance. En la prueba de arista eliminada (línea rojo discontinua), las puertas de largo alcance no se implementan y los estabilizadores indicados por estrellas, por lo tanto, tienen error unitario. La región gris es la masa de probabilidad correspondiente a los estabilizadores de nodo afectados por los cortes. – , En los diseños bidimensionales, los nodos verdes duplican los nodos 95, 98, 102 y 97 para mostrar las aristas cortadas. Los nodos azules en son recursos de qubits para crear pares de Bell cortados. El color del nodo es el error absoluto ∣ i − 1∣ del estabilizador medido, como se indica en la barra de color. Una arista es negra si se detectan estadísticas de entrelazamiento con un nivel de confianza del 99% y violeta si no. En , las aristas de largo alcance se implementan con puertas SWAP. En , las mismas puertas se implementan con LOCC. En , no se implementan en absoluto. a b S c S d f e i S d e f Preparamos | ⟩ usando tres métodos diferentes. Las aristas nativas del hardware siempre se implementan con puertas CNOT, pero las condiciones de contorno periódicas se implementan con (1) puertas SWAP, (2) LOCC y (3) LO para conectar qubits en toda la red. La principal diferencia entre LOCC y LO es una operación de retroalimentación que consiste en puertas de un solo qubit condicionadas a 2 resultados de medición, donde es el número de cortes. Cada uno de los 22 casos activa una combinación única de puertas y/o en los qubits apropiados. La adquisición de los resultados de la medición, la determinación del caso correspondiente y la actuación basada en él se realiza en tiempo real por el hardware de control, a costa de una latencia adicional fija. Mitigamos y suprimimos los errores resultantes de esta latencia con extrapolación de ruido cero y desacoplamiento dinámico escalonado , (ver sección 'Instrucciones de conmutación de circuitos cuánticos con mitigación de errores' [ref. Sec10]). G n n n X Z 22 21 28 Evaluamos las implementaciones SWAP, LOCC y LO de | ⟩ con un estado de grafo nativo del hardware en ′ = ( , ′) obtenido al eliminar las puertas de largo alcance, es decir, ′ = \ lr. El circuito que prepara | ′⟩ requiere así solo 112 puertas CNOT dispuestas en tres capas siguiendo la topología de hexágono pesado del procesador Eagle. Este circuito informará de grandes errores al medir los estabilizadores de nodo y arista de | ⟩ para nodos en un corte de puerta, ya que está diseñado para implementar | ′⟩. Nos referimos a esta prueba nativa del hardware como la prueba de arista eliminada. El circuito basado en SWAP requiere 262 puertas CNOT adicionales para crear las aristas de largo alcance lr, lo que reduce drásticamente el valor de los estabilizadores medidos (Fig. 2b-d). Por el contrario, la implementación LOCC y LO de las aristas en lr no requiere puertas SWAP. Los errores de sus estabilizadores de nodo y arista para nodos no involucrados en un corte de puerta siguen de cerca la prueba de arista eliminada (Fig. 2b,c). Por el contrario, los estabilizadores que involucran una puerta virtual tienen un error menor que la prueba de arista eliminada y la implementación SWAP (Fig. 2c, marcadores de estrella). Como métrica de calidad general, informamos primero la suma de errores absolutos en los estabilizadores de nodo, es decir, ∑ ∈ ∣ i − 1∣ (Tabla de datos extendida 1). La gran sobrecarga de SWAP es responsable de la suma de error absoluto de 44.3. El error de 13.1 en la prueba de arista eliminada está dominado por los ocho nodos en los cuatro cortes (Fig. 2c, marcadores de estrella). Por el contrario, los errores LO y LOCC se ven afectados por los MCM. Atribuimos el error adicional de 1.9 de LOCC sobre LO a los retrasos y las puertas CNOT en el circuito de teletransportación y los pares de Bell cortados. En los resultados basados en SWAP, no detecta entrelazamiento a través de 35 de las 116 aristas con un nivel de confianza del 99% (Fig. 2b,d). Para la implementación LO y LOCC, observa las estadísticas de entrelazamiento bipartito a través de todas las aristas en con un nivel de confianza del 99% (Fig. 2e). Estas métricas muestran que las puertas virtuales de largo alcance producen estabilizadores con errores menores que su descomposición en SWAP. Además, mantienen la varianza lo suficientemente baja como para verificar las estadísticas de entrelazamiento. G G V E E E E G G G E E i V S G Operación de dos QPU como una sola Ahora combinamos dos QPU Eagle con 127 qubits cada una en una sola QPU a través de una conexión clásica en tiempo real. Operar los dispositivos como un procesador único y más grande consiste en ejecutar circuitos cuánticos que abarcan el registro de qubits más grande. Aparte de las puertas unitarias y las mediciones que se ejecutan simultáneamente en la QPU fusionada, utilizamos circuitos dinámicos para realizar puertas que actúan sobre qubits en ambos dispositivos. Esto es posible gracias a una estricta sincronización y una comunicación clásica rápida entre instrumentos físicamente separados, necesaria para recopilar resultados de medición y determinar el flujo de control en todo el sistema . 29 Probamos esta conexión clásica en tiempo real diseñando un estado de grafo en 134 qubits construido a partir de anillos de hexágono pesado que atraviesan ambas QPU (Fig. 3). Estos anillos se eligieron excluyendo qubits plagados de sistemas de dos niveles y problemas de lectura para garantizar un estado de grafo de alta calidad. Este grafo forma un anillo en tres dimensiones y requiere cuatro puertas de largo alcance que implementamos con LO y LOCC. Como antes, el protocolo LOCC requiere dos qubits adicionales por puerta cortada para los pares de Bell cortados. Como en la sección anterior, evaluamos nuestros resultados con un grafo que no implementa las aristas que abarcan ambas QPU. Como no hay enlace cuántico entre los dos dispositivos, una prueba con puertas SWAP es imposible. Todas las aristas exhiben las estadísticas de entrelazamiento bipartito cuando implementamos el grafo con LO y LOCC con un nivel de confianza del 99%. Además, los estabilizadores LO y LOCC tienen la misma calidad que la prueba de arista eliminada para nodos que no se ven afectados por una puerta de largo alcance (Fig. 3c). Los estabilizadores afectados por puertas de largo alcance tienen una gran reducción en el error en comparación con la prueba de arista eliminada. La suma de errores absolutos en los estabilizadores de nodo ∑ ∈ ∣ i − 1∣ es 21.0, 19.2 y 12.6 para la prueba de arista eliminada, LOCC y LO, respectivamente. Como antes, atribuimos los 6.6 errores adicionales de LOCC sobre LO a los retrasos y las puertas CNOT en el circuito de teletransportación y los pares de Bell cortados. Los resultados de LOCC demuestran cómo un circuito cuántico dinámico en el que dos subcircuitos están conectados por un enlace clásico en tiempo real puede ejecutarse en dos QPU de lo contrario disjuntas. Los resultados de LO podrían obtenerse en un solo dispositivo con 127 qubits a costa de un factor adicional de 2 en el tiempo de ejecución, ya que los subcircuitos se pueden ejecutar sucesivamente. i V S , Estado del grafo con límites periódicos mostrados en tres dimensiones. Las aristas azules son las aristas cortadas. , Mapa de acoplamiento de dos QPU Eagle operadas como un solo dispositivo con 254 qubits. Los nodos morados son los qubits que forman el estado del grafo en y los nodos azules se utilizan para pares de Bell cortados. , , Error absoluto en los estabilizadores ( ) y los testigos de arista ( ) implementados con LOCC (verde sólido) y LO (naranja sólido) y en un grafo de prueba de arista eliminada (rojo discontinuo) para el grafo del estado en . En y , las estrellas muestran estabilizadores y testigos de arista que se ven afectados por los cortes. En y , la región gris es la masa de probabilidad correspondiente a los estabilizadores de nodo y los testigos de arista, respectivamente, afectados por el corte. En y , observamos que la implementación LO supera a la prueba de arista eliminada, lo que atribuimos a mejores condiciones del dispositivo, ya que estos datos se tomaron en un día diferente al de la prueba y los datos de LOCC. a b a c d c d a c d c d c d Discusión y conclusión Implementamos puertas de largo alcance con LO y LOCC. Con estas puertas, diseñamos condiciones de contorno periódicas en una red planar de 103 nodos y conectamos dos procesadores Eagle en tiempo real para crear un estado de grafo en 134 qubits, yendo más allá de las capacidades de un solo chip. Aquí, elegimos implementar estados de grafo como una aplicación para resaltar las propiedades escalables de los circuitos dinámicos. Nuestras fábricas de pares de Bell cortados permiten el esquema LOCC presentado en ref. 17. Tanto los protocolos LO como LOCC ofrecen resultados de alta calidad que coinciden estrechamente con una prueba nativa del hardware. El corte de circuitos aumenta la varianza de los observables medidos. Podemos mantener la varianza bajo control tanto en los esquemas LO como LOCC, como lo indican las pruebas estadísticas de los testigos. Se encuentra una discusión en profundidad de la varianza medida en la Información Suplementaria [ref. MOESM1]. El aumento de la varianza de la QPD es la razón por la cual la investigación ahora se centra en reducir la sobrecarga de muestreo. Se demostró recientemente que cortar múltiples puertas de dos qubits en paralelo da como resultado QPD LO óptimas con la misma sobrecarga de muestreo que LOCC, pero requiere un qubit auxiliar adicional y posiblemente reinicio , . En LOCC, la QPD solo se requiere para cortar los pares de Bell. Esta costosa QPD podría eliminarse, es decir, sin sobrecarga de disparos, distribuyendo el entrelazamiento a través de múltiples chips , . A corto y medio plazo, esto podría hacerse operando puertas en el régimen de microondas a través de cables convencionales , , o, a largo plazo, con una transducción óptico-microondas , , . La distribución de entrelazamiento es típicamente ruidosa y puede resultar en estados no máximamente entrelazados. Sin embargo, la teletransportación de puertas requiere un recurso máximamente entrelazado. No obstante, los estados no máximamente entrelazados podrían reducir el costo de muestreo de la QPD y se podrían destilar múltiples copias de estados no máximamente entrelazados en un estado puro para teletransportación durante la ejecución de un circuito cuántico o posiblemente durante los retrasos entre disparos consecutivos, que pueden ser tan grandes como 250 μs para reinicios . Combinado con estas configuraciones, nuestros circuitos dinámicos con mitigación y supresión de errores permitirían una arquitectura de computación cuántica modular sin la sobrecarga de muestreo del corte de circuitos. 30 31 32 33 10 34 35 36 37 38 39 40 41 En un entorno de aplicaciones, el corte de circuitos podría beneficiar la simulación Hamiltoniana . Aquí, el costo del corte de circuitos es exponencial en la fuerza de los enlaces cortados por el tiempo de evolución. Por lo tanto, este costo puede ser razonable para enlaces débiles y/o tiempos de evolución cortos. Además, el esquema LO presentado en ref. 42 requiere qubits auxiliares en una prueba de Hadamard, lo que requeriría un reinicio a través de un circuito dinámico si el mismo enlace se corta varias veces en una evolución temporal Trotterizada. 42 El corte de circuitos se puede aplicar tanto a hilos como a puertas. Los circuitos cuánticos resultantes tienen una estructura similar, lo que hace que nuestro enfoque sea aplicable a ambos casos. Nuestro enlace clásico en tiempo real implementa puertas de largo alcance y acopla clásicamente procesadores cuánticos disjuntos. Los pares de Bell cortados que presentamos tienen valores más allá de nuestro trabajo. Por ejemplo, estos pares son directamente utilizables para cortar circuitos en computación cuántica basada en mediciones, que se basa en circuitos dinámicos