Autores: Almudena Carrera Vazquez Caroline Tornow Diego Ristè Stefan Woerner Maika Takita Daniel J. Egger Resumo Os computadores cuánticos procesan información coas leis da mecánica cuántica. O hardware cuántico actual é ruidoso, só pode almacenar información durante pouco tempo e está limitado a uns poucos bits cuánticos, é dicer, cúbits, normalmente organizados nunha conectividade planar . Non obstante, moitas aplicacións da computación cuántica requiren máis conectividade que a rede planar que ofrece o hardware en máis cúbits dos dispoñibles nunha única unidade de procesamento cuántico (QPU). A comunidade espera abordar estas limitacións conectando as QPUs mediante comunicación clásica, o que aínda non se demostrou experimentalmente. Aquí realizamos experimentalmente circuítos dinámicos con mitigación de erros e corte de circuítos para crear estados cuánticos que requiren conectividade periódica empregando ata 142 cúbits que abarcan dúas QPUs de 127 cúbits cada unha conectadas en tempo real cunha ligazón clásica. Nun circuíto dinámico, as portas cuánticas poden ser controladas clasicamente polos resultados de medicións dentro do circuíto durante a execución, é dicir, dentro dunha fracción do tempo de coherencia dos cúbits. A nosa ligazón clásica en tempo real permítenos aplicar unha porta cuántica nunha QPU condicionada ao resultado dunha medición noutra QPU. Ademais, o fluxo de control con mitigación de erros mellora a conectividade dos cúbits e o conxunto de instrucións do hardware, aumentando así a versatilidade dos nosos computadores cuánticos. O noso traballo demostra que podemos usar varios procesadores cuánticos como un só con circuítos dinámicos con mitigación de erros habilitados por unha ligazón clásica en tempo real. 1 Principal Os computadores cuánticos procesan información codificada en bits cuánticos con operacións unitarias. Non obstante, os computadores cuánticos son ruidosos e a maioría das arquitecturas a gran escala organizan os cúbits físicos nunha rede planar. Aínda así, os procesadores actuais con mitigación de erros xa poden simular modelos de Ising nativos do hardware con 127 cúbits e medir observables a unha escala onde as aproximacións de forza bruta con ordenadores clásicos comezan a ter dificultades . A utilidade dos computadores cuánticos depende de máis escalado e de superar a súa limitada conectividade de cúbits. Un enfoque modular é importante para escalar os actuais procesadores cuánticos ruidosos e para acadar os grandes números de cúbits físicos necesarios para a tolerencia a fallos . As arquitecturas de iones atrapados e átomos neutros poden acadar modularidade transportando fisicamente os cúbits , . A curto prazo, a modularidade en cúbits supercondutores alcanza mediante interconexións de curto alcance que unen chips adxacentes , . 1 2 3 4 5 6 7 8 A medio prazo, pódense realizar portas de longo alcance operando no réxime de microondas a través de longos cables convencionais , , . Isto permitiría unha conectividade de cúbits non planar adecuada para unha corrección de erros eficiente . Unha alternativa a longo prazo é entrelazar QPUs remotas cunha ligazón óptica aproveitando unha transducion de microondas a óptica , que aínda non se demostrou, que nós saibamos. Ademais, os circuítos dinámicos amplían o conxunto de operacións dun ordenador cuántico realizando medicións dentro do circuíto (MCMs) e controlando clasicamente unha porta dentro do tempo de coherencia dos cúbits. Melloran a calidade algorítmica e a conectividade dos cúbits . Como amosaremos, os circuítos dinámicos tamén permiten a modularidade conectando QPUs en tempo real a través dunha ligazón clásica. 9 10 11 3 12 13 14 Adoptamos un enfoque complementario baseado en portas virtuais para implementar interaccións de longo alcance nunha arquitectura modular. Conectamos cúbits en localizacións arbitrarias e creamos as estatísticas de entrelazamento a través dunha descomposición de cuasi-probabilidade (QPD) , , . Comparamos un esquema soamente de Operacións Locais (LO) cun axudado por Comunicación Clásica (LOCC) . O esquema LO, demostrado nun contexto de dous cúbits , require executar múltiples circuítos cuánticos soamente con operacións locais. Pola contra, para implementar LOCC, consumimos pares de Bell virtuais nun circuíto de teletransporte para crear portas de dous cúbits , . En hardware cuántico con conectividade escasa e planar, crear un par de Bell entre cúbits arbitrarios require unha porta CNOT de longo alcance. Para evitar estas portas, empregamos un QPD sobre operacións locais resultando en pares de Bell cortados que o teletransporte consume. LO non necesita a ligazón clásica e é, polo tanto, máis sinxelo de implementar que LOCC. Non obstante, como LOCC soamente require un circuíto plantilla parametrizado, é máis eficiente de compilar que LO e o custo do seu QPD é menor que o do esquema LO. 15 16 17 16 17 18 19 20 O noso traballo fai catro contribucións clave. Primeiro, presentamos os circuítos cuánticos e o QPD para crear múltiples pares de Bell cortados para implementar as portas virtuais en ref. . Segundo, suprimimos e mitigamos os erros que xorden da latencia do hardware de control clásico en circuítos dinámicos cunha combinación de desacoplamento dinámico e extrapolación de ruído cero . Terceiro, aproveitamos estes métodos para deseñar condicións de contorno periódicas nun estado de grafo de 103 nodos. Cuarto, demostramos unha conexión clásica en tempo real entre dúas QPUs separadas, demostrando así que un sistema de QPUs distribuídas pode operarse como unha soa a través dunha ligazón clásica . Combinado con circuítos dinámicos, isto permítenos operar ambos os chips como un único ordenador cuántico, o que exemplificamos deseñando un estado de grafo periódico que abarca ambos os dispositivos en 142 cúbits. Discutimos un camiño cara adiante para crear portas de longo alcance e proporcionamos a nosa conclusión. 17 21 22 23 Corte de circuítos Executamos grandes circuítos cuánticos que poden non ser directamente executables no noso hardware debido a limitacións no número de cúbits ou conectividade, cortando portas. O corte de circuítos decompón un circuíto complexo en subcircuítos que poden ser executados individualmente , , , , , . Non obstante, debemos executar un número aumentado de circuítos, que chamamos sobrecarga de mostraxe. Os resultados destes subcircuítos combínanse entón clásicamente para obter o resultado do circuíto orixinal (ver ). 15 16 17 24 25 26 Métodos Como unha das principais contribucións do noso traballo é a implementación de portas virtuais con LOCC, mostramos como crear os pares de Bell cortados necesarios con operacións locais. Aquí, múltiples pares de Bell cortados son deseñados por circuítos cuánticos parametrizados, que chamamos unha fábrica de pares de Bell cortados (Fig. ). Cortar múltiples pares ao mesmo tempo require unha menor sobrecarga de mostraxe . Como a fábrica de pares de Bell cortados forma dous circuítos cuánticos disxuntos, situamos cada subcircuíto preto de cúbits que teñen portas de longo alcance. O recurso resultante consómese entón nun circuíto de teletransporte. Por exemplo, na Fig. , os pares de Bell cortados consómense para crear portas CNOT nos pares de cúbits (0, 1) e (2, 3) (ver sección ' '). 1b,c 17 1b Fábricas de pares de Bell cortados , Representación dunha arquitectura IBM Quantum System Two. Aquí, dúas QPUs Eagle de 127 cúbits están conectadas cunha ligazón clásica en tempo real. Cada QPU é controlada pola súa electrónica no seu rack. Sincronizamos estritamente ambos os racks para operar as dúas QPUs como unha soa. , Circuíto cuántico plantilla para implementar portas CNOT virtuais nos pares de cúbits ( 0, 1) e ( 2, 3) con LOCC consumindo pares de Bell cortados nun circuíto de teletransporte. As liñas dobres púrpuras corresponden á ligazón clásica en tempo real. , Fábricas de pares de Bell cortados 2( ) para dous pares de Bell cortados simultaneamente. O QPD ten un total de 27 conxuntos de parámetros diferentes . Aquí, . a b q q q q c C θ i θ i Condicións de contorno periódicas Construímos un estado de grafo | ⟩ con condicións de contorno periódicas en ibm_kyiv, un procesador Eagle , indo máis aló dos límites impostos pola súa conectividade física (ver sección ' '). Aquí, ten ∣ ∣ = 103 nodos e require catro bordos de longo alcance lr = {(1, 95), (2, 98), (6, 102), (7, 97)} entre os cúbits superiores e inferiores do procesador Eagle (Fig. ). Medimos os estabilizadores de nodos en cada nodo ∈ e os estabilizadores de bordos formados polo produto a través de cada bordo ( , ) ∈ . Destes estabilizadores, construímos unha testemuña de entrelazamento , que é negativa se hai entrelazamento bipartito a través do bordo ( , ) ∈ (ref. ) (ver sección ' '). Centrámonos no entrelazamento bipartito porque este é o recurso que desexamos recrear con portas virtuais. Medir testemuñas de entrelazamento entre máis de dúas partes medirá soamente a calidade das portas non virtuais e as medicións, facendo que o impacto das portas virtuais sexa menos claro. G 1 Estados de grafo G V E 2a Si i V SiSj i j E i j E 27 Testemuña de entrelazamento , O grafo hexagonal denso dóbrase sobre si mesmo nunha forma tubular polos bordos (1, 95), (2, 98), (6, 102) e (7, 97) resaltados en azul. Cortamos estes bordos. , Os estabilizadores de nodos (arriba) e as testemuñas , (abaixo), con 1 desviación estándar para os nodos e bordos próximos aos bordos de longo alcance. As liñas descontinuas verticais agrupan estabilizadores e testemuñas pola súa distancia aos bordos cortados. , Función de distribución acumulada dos erros do estabilizador. As estrelas indican estabilizadores de nodos que teñen un bordo implementado por unha porta de longo alcance. No benchmark de bordo caído (liña vermella discontinua), as portas de longo alcance non se implementan e os estabilizadores indicados por estrelas teñen, polo tanto, erro unitario. A rexión gris é a masa de probabilidade correspondente aos estabilizadores de nodos afectados polos cortes. – , Nos deseños bidimensionais, os nodos azuis duplican os nodos 95, 98, 102 e 97 para mostrar os bordos cortados. Os nodos azuis en son recursos de cúbits para crear pares de Bell cortados. A cor do nodo é o erro absoluto ∣ - 1∣ do estabilizador medido, como se indica na barra de cor. Un bordo é negro se se detectan estatísticas de entrelazamento cun nivel de confianza do 99% e violeta se non. En , as portas de longo alcance impéméntanse con portas SWAP. En , as mesmas portas impéméntanse con LOCC. En , non se implementan en absoluto. a b Sj c Sj d f e i Si d e f Preparamos | ⟩ usando tres métodos diferentes. Os bordos nativos do hardware sempre se implementan con portas CNOT, pero as condicións de contorno periódicas impéméntanse con (1) portas SWAP, (2) LOCC e (3) LO para conectar cúbits en toda a rede. A principal diferenza entre LOCC e LO é unha operación de retroalimentación que consiste en portas de un cúbit condicionadas a 2 resultados de medición, onde é o número de cortes. Cada un dos 22 casos activa unha combinación única de portas e/ou nos cúbits apropiados. A adquisición dos resultados de medición, a determinación do caso correspondente e a acción baseada nel realízase en tempo real polo hardware de control, a costa dunha latencia engadida fixa. Mitigamos e suprimimos os erros resultantes desta latencia con extrapolación de ruído cero e desacoplamento dinámico intercalado , (ver sección ' '). G n n n X Z 22 21 28 Instrucións de conmutación de circuítos cuánticos con mitigación de erros Validamos as implementacións SWAP, LOCC e LO de | ⟩ cun estado de grafo nativo do hardware en ′ = ( , ′) obtido eliminando as portas de longo alcance, é dicer, ′ = lr. O circuíto que prepara | ′⟩ require, polo tanto, soamente 112 portas CNOT organizadas en tres capas seguindo a topoloxía hexagonal densa do procesador Eagle. Este circuíto reportará grandes erros ao medir os estabilizadores de nodos e bordos de | ⟩ para os nodos nun bordo cortado, xa que está deseñado para implementar | ′⟩. Referímonos a este benchmark nativo do hardware como o benchmark de bordo caído. O circuíto baseado en SWAP require 262 portas CNOT adicionais para crear os bordos de longo alcance lr, o que reduce drasticamente o valor dos estabilizadores medidos (Fig. ). Pola contra, a implementación LOCC e LO dos bordos en lr non require portas SWAP. Os erros dos seus estabilizadores de nodos e bordos para nodos non involucrados nun bordo cortado seguen de preto o benchmark de bordo caído (Fig. ). Por outra banda, os estabilizadores que involucran unha porta virtual teñen un erro menor que o benchmark de bordo caído e a implementación SWAP (Fig. , marcadores de estrela). Como métrica de calidade xeral, reportamos primeiro a suma de erros absolutos nos estabilizadores de nodos, é dicer, ∑ ∈ ∣ - 1∣ (Táboa de datos estendidos ). A gran sobrecarga de SWAP é responsable do erro absoluto de suma de 44.3. O erro de 13.1 no benchmark de bordo caído está dominado polos oito nodos nos catro cortes (Fig. , marcadores de estrela). Pola contra, os erros de LO e LOCC vense afectados polos MCMs. Atribuímos o erro adicional de 1.9 de LOCC sobre LO aos atrasos e ás portas CNOT no circuíto de teletransporte e nos pares de Bell cortados. Nos resultados baseados en SWAP, non se detecta entrelazamento en 35 dos 116 bordos cun nivel de confianza do 99% (Fig. ). Para a implementación LO e LOCC, testemuña as estatísticas de entrelazamento bipartito en todos os bordos de cun nivel de confianza do 99% (Fig. ). Estas métricas mostran que as portas virtuais de longo alcance producen estabilizadores con erros menores que a súa descomposición en SWAPs. Ademais, manteñen a varianza o suficientemente baixa para verificar as estatísticas de entrelazamento. G G V E E EE G G G E 2b–d E 2b,c 2c i V Si 1 2c 2b,d G 2e Operando dúas QPUs como unha soa Agora combinamos dúas QPUs Eagle con 127 cúbits cada unha nunha única QPU a través dunha conexión clásica en tempo real. Operar os dispositivos como un único procesador máis grande consiste en executar circuítos cuánticos que abarcan o rexistro de cúbits máis grande. Ademais das portas unitarias e medicións que se executan concurrentemente na QPU fusionada, empregamos circuítos dinámicos para realizar portas que actúan sobre cúbits en ambos os dispositivos. Isto é posible grazas a unha estrita sincronización e comunicación clásica rápida entre instrumentos fisicamente separados necesarios para recoller resultados de medición e determinar o fluxo de control en todo o sistema . 29 Probamos esta conexión clásica en tempo real deseñando un estado de grafo en 134 cúbits construído a partir de aneis hexagonais densos que percorren ambas as QPUs (Fig. ). Estes aneis foron escollidos excluindo cúbits afectados por sistemas de dous niveis e problemas de lectura para garantir un estado de grafo de alta calidade. Este grafo forma un anel en tres dimensións e require catro portas de longo alcance que implementamos con LO e LOCC. Como antes, o protocolo LOCC require dous cúbits adicionais por porta cortada para os pares de Bell cortados. Como na sección anterior, validamos os nosos resultados cun grafo que non implementa os bordos que atravesan ambas as QPUs. Como non hai ligazón cuántica entre os dous dispositivos, un benchmark con portas SWAP é imposible. Todos os bordos exhiben as estatísticas de entrelazamento bipartito cando implementamos o grafo con LO e LOCC cun nivel de confianza do 99%. Ademais, os estabilizadores LO e LOCC teñen a mesma calidade que o benchmark de bordo caído para nodos que non se ven afectados por unha porta de longo alcance (Fig. ). Os estabilizadores afectados por portas de longo alcance teñen unha gran redución no erro en comparación co benchmark de bordo caído. A suma de erros absolutos nos estabilizadores de nodos ∑ ∈ ∣ - 1∣, é de 21.0, 19.2 e 12.6 para o benchmark de bordo caído, LOCC e LO, respectivamente. Como antes, atribuímos os 6.6 erros adicionais de LOCC sobre LO aos atrasos e ás portas CNOT no circuíto de teletransporte e nos pares de Bell cortados. Os resultados de LOCC demostran como un circuíto cuántico dinámico no que dous subcircuítos están conectados por unha ligazón clásica en tempo real pode ser executado en dúas QPUs de outro xeito disxuntas. Os resultados de LO poderían obterse nun único dispositivo con 127 cúbits a costa dun factor adicional de 2 en tempo de execución, xa que os subcircuítos poden executarse sucesivamente. 3 3c i V Si , Estado de grafo con contornos periódicos mostrados en tres dimensións. Os bordos azuis son os bordos cortados. , Mapa de acoplamento de dúas QPUs Eagle operadas como un único dispositivo con 254 cúbits. Os nodos púrpuras son os cúbits que forman o estado de grafo en e os nodos azuis úsanse para pares de Bell cortados. , , Erro absoluto nos estabilizadores ( ) e testemuñas de bordos ( ) implementados con LOCC (verde continuo) e LO (laranxa continuo) e nun grafo de benchmark de bordo caído (vermello descontinuo) para o estado de grafo en . En e , as estrelas mostran estabilizadores e testemuñas de bordos que se ven afectados polos cortes. En e , a rexión gris é a masa de probabilidade correspondente aos estabilizadores de nodos e testemuñas de bordos, respectivamente, afectados polo corte. En e , observamos que a implementación LO supera ao benchmark de bordo caído, o que atribuímos a mellores condicións do dispositivo xa que estes datos foron tomados noutro día diferente ao benchmark e aos datos de LOCC. a b a c d c d a c d c d c d Discusión e conclusión Implementamos portas de longo alcance con LO e LOCC. Con estas portas, deseñamos condicións de contorno periódicas nunha rede planar de 103 nodos e conectamos dous procesadores Eagle en tempo real para crear un estado de grafo en 134 cúbits, indo máis aló das capacidades dun único chip. Aquí, eliximos implementar estados de grafo como unha aplicación para destacar as propiedades escalables dos circuítos dinámicos. As nosas fábricas de pares de Bell cortados permiten o esquema LOCC presentado en ref. . Tanto os protocolos LO como LOCC entregan resultados de alta calidade que coinciden de preto cun benchmark nativo do hardware. O corte de circuítos aumenta a varianza dos observables medidos. Podemos manter a varianza baixo control en ambos os esquemas LO e LOCC, como indican as probas estatísticas nas testemuñas. Unha discusión en profundidade da varianza medida atópase na . 17 Información Suplementaria O aumento da varianza do QPD é a razón pola que a investigación se centra agora en reducir a sobrecarga de mostraxe. Demostrouse recentemente que cortar múltiples portas de dous cúbits en paralelo resulta en QPDs óptimos de LO coa mesma sobrecarga de mostraxe que LOCC, pero require un cúbit auxiliar adicional e posiblemente un reinicio , . En LOCC, o QPD só é necesario para cortar os pares de Bell. Este custoso QPD podería ser eliminado, é dicer, sen 30 31