Autores: Almudena Carrera Vazquez Caroline Tornow Diego Ristè Stefan Woerner Maika Takita Daniel J. Egger Resumo Os ordenadores cuánticos procesan información coas leis da mecánica cuántica. O hardware cuántico actual é ruidoso, só pode almacenar información durante un curto período de tempo e está limitado a uns poucos bits cuánticos, é dicir, cúbits, tipicamente arranxados nunha conectividade planar . Non obstante, moitas aplicacións da computación cuántica requiren máis conectividade que a rede planar ofrecida polo hardware en máis cúbits dos dispoñibles nunha única unidade de procesamento cuántico (QPU). A comunidade espera abordar estas limitacións conectando QPUs mediante comunicación clásica, o que aínda non se demostrou experimentalmente. Aquí realizamos experimentalmente circuítos dinámicos con mitigación de erros e corte de circuítos para crear estados cuánticos que requiren conectividade periódica utilizando ata 142 cúbits que abarcan dúas QPUs con 127 cúbits cada unha, conectadas en tempo real cunha ligazón clásica. Nun circuíto dinámico, as portas cuánticas poden ser controladas clásicamente polos resultados de medicións intermedias dentro do tempo de execución, é dicir, dentro dunha fracción do tempo de coherencia dos cúbits. A nosa ligazón clásica en tempo real permítenos aplicar unha porta cuántica nunha QPU condicionada ao resultado dunha medición noutra QPU. Ademais, o fluxo de control con mitigación de erros mellora a conectividade dos cúbits e o conxunto de instrucións do hardware, aumentando así a versatilidade dos nosos ordenadores cuánticos. O noso traballo demostra que podemos usar varios procesadores cuánticos como un só con circuítos dinámicos con mitigación de erros habilitados por unha ligazón clásica en tempo real. 1 Principal Os ordenadores cuánticos procesan a información codificada en bits cuánticos con operacións unitarias. Non obstante, os ordenadores cuánticos son ruidosos e a maioría das arquitecturas a gran escala arranxan os cúbits físicos nunha rede planar. Non obstante, os procesadores actuais con mitigación de erros xa poden simular modelos de Ising nativos do hardware con 127 cúbits e medir observables a unha escala na que os enfoques de forza bruta con ordenadores clásicos comezan a ter dificultades . A utilidade dos ordenadores cuánticos depende de máis escalado e de superar a súa conectividade limitada de cúbits. Un enfoque modular é importante para escalar os procesadores cuánticos ruidosos actuais e para lograr os grandes números de cúbits físicos necesarios para a tolerancia a fallos . As arquitecturas de iones atrapados e átomos neutros poden acadar modularidade transportando fisicamente os cúbits , . A curto prazo, a modularidade en cúbits supercondutores alcánzase mediante interconexións de curto alcance que unen chips adxacentes , . 1 2 3 4 5 6 7 8 A medio prazo, as portas de longo alcance que operan no réxime de microondas poderían realizarse a través de longos cables convencionais , , . Isto permitiría unha conectividade de cúbits non planar axeitada para unha corrección de erros eficiente . Unha alternativa a longo prazo é entrelazar QPUs remotas cunha ligazón óptica aproveitando unha transdución de microondas a óptica , que aínda non se demostrou, ata onde sabemos. Ademais, os circuítos dinámicos amplían o conxunto de operacións dun ordenador cuántico realizando medicións intermedias (MCMs) e controlando clásicamente unha porta dentro do tempo de coherencia dos cúbits. Melloran a calidade algorítmica e a conectividade dos cúbits . Como demostraremos, os circuítos dinámicos tamén permiten a modularidade conectando QPUs en tempo real a través dunha ligazón clásica. 9 10 11 3 12 13 14 Adoptamos un enfoque complementario baseado en portas virtuais para implementar interaccións de longo alcance nunha arquitectura modular. Conectamos cúbits en localizacións arbitrarias e creamos as estatísticas de entrelazamento a través dunha descomposición de cuasi-probabilidade (QPD) , , . Comparamos un esquema só de Operacións Locais (LO) cunha aumentada por Comunicación Clásica (LOCC) . O esquema LO, demostrado nun entorno de dous cúbits , require executar múltiples circuítos cuánticos só con operacións locais. Por contra, para implementar LOCC, consumimos pares de Bell virtuais nun circuíto de teletransportación para crear portas de dous cúbits , . En hardware cuántico con conectividade dispersa e planar, crear un par de Bell entre cúbits arbitrarios require unha porta controlada-non (CNOT) de longo alcance. Para evitar estas portas, usamos un QPD sobre operacións locais que resulta en pares de Bell cortados que a teletransportación consume. LO non necesita a ligazón clásica e, polo tanto, é máis sinxelo de implementar que LOCC. Non obstante, xa que LOCC só require un único circuíto modelo parametrizado, é máis eficiente de compilar que LO e o custo do seu QPD é menor que o do esquema LO. 15 16 17 16 17 18 19 20 O noso traballo fai catro contribucións clave. Primeiro, presentamos os circuítos cuánticos e o QPD para crear múltiples pares de Bell cortados para realizar as portas virtuais na ref. . Segundo, suprimimos e mitigamos os erros que xorden da latencia do hardware de control clásico en circuítos dinámicos cunha combinación de descopamento dinámico e extrapolación de cero ruído . Terceiro, aproveitamos estes métodos para enxeñar condicións de contorno periódicas nun estado de grafo de 103 nós. Cuarto, demostramos unha conexión clásica en tempo real entre dúas QPUs separadas, demostrando así que un sistema de QPUs distribuídas pode operarse como unha soa a través dunha ligazón clásica . Combinado con circuítos dinámicos, isto permítenos operar ambos os chips como un único ordenador cuántico, o que exemplificamos enxeñando un estado de grafo periódico que abarca ambos os dispositivos en 142 cúbits. Discutimos un camiño cara adiante para crear portas de longo alcance e proporcionamos a nosa conclusión. 17 21 22 23 Corte de circuítos Executamos circuítos cuánticos grandes que poden non ser directamente executables no noso hardware debido a limitacións no número de cúbits ou na conectividade, cortando portas. O corte de circuítos descompón un circuíto complexo en subcircuítos que poden ser executados individualmente , , , , , . Non obstante, debemos executar un número incrementado de circuítos, que chamamos sobrecarga de mostraxe. Os resultados destes subcircuítos combínanse clásicamente para obter o resultado do circuíto orixinal ( ). 15 16 17 24 25 26 Métodos Xa que unha das principais contribucións do noso traballo é a implementación de portas virtuais con LOCC, mostramos como crear os pares de Bell cortados requiridos con operacións locais. Aquí, múltiples pares de Bell cortados son enxeñados por circuítos cuánticos parametrizados, que chamamos fábrica de pares de Bell cortados (Fig. ). Cortar varios pares ao mesmo tempo require unha menor sobrecarga de mostraxe . Xa que a fábrica de pares de Bell cortados forma dous circuítos cuánticos desunidos, situamos cada subcircuíto preto de cúbits que teñen portas de longo alcance. O recurso resultante consómese entón nun circuíto de teletransportación. Por exemplo, na Fig. , os pares de Bell cortados consómense para crear portas CNOT nos pares de cúbits (0, 1) e (2, 3) (ver sección ' '). 1b,c 17 1b Fábricas de pares de Bell cortados , Depicción dunha arquitectura IBM Quantum System Two. Aquí, dúas QPUs Eagle de 127 cúbits están conectadas cunha ligazón clásica en tempo real. Cada QPU é controlada polas súas electrónicas no seu rack. Sincronizamos estreitamente ambos os racks para operar ambas as QPUs como unha soa. , Circuíto cuántico modelo para implementar portas CNOT virtuais en pares de cúbits (q0, q1) e (q2, q3) con LOCC consumindo pares de Bell cortados nun circuíto de teletransportación. As liñas dobres púrpuras corresponden á ligazón clásica en tempo real. , Fábricas de pares de Bell cortados C2(θi) para dous pares de Bell cortados simultaneamente. O QPD ten un total de 27 conxuntos de parámetros θi. Aquí, a b c Condicións de contorno periódicas Construímos un estado de grafo |G⟩ con condicións de contorno periódicas en ibm_kyiv, un procesador Eagle , superando os límites impostos pola súa conectividade física (ver sección ' '). Aquí, G ten |V| = 103 nós e require catro arestas de longo alcance E_lr = {(1, 95), (2, 98), (6, 102), (7, 97)} entre os cúbits superior e inferior do procesador Eagle (Fig. ). Medimos os estabilizadores de nó Si en cada nó i ∈ V e os estabilizadores de aresta formados polo produto SiSj a través de cada aresta (i, j) ∈ E. A partir destes estabilizadores, construímos unha testemuña de entrelazamento , que é negativa se hai entrelazamento bipartito a través da aresta (i, j) ∈ E (ref. ) (ver sección ' '). Centrámonos no entrelazamento bipartito porque é o recurso que desexamos recrear con portas virtuais. Medir testemuñas de entrelazamento entre máis de dúas partes medirá só a calidade das portas e medicións non virtuais, facendo que o impacto das portas virtuais sexa menos claro. 1 Estados de grafo 2a 27 Testemuña de entrelazamento , O grafo hexágono-pesado dóbrase sobre si mesmo nunha forma tubular polas arestas (1, 95), (2, 98), (6, 102) e (7, 97) resaltadas en azul. Cortamos estas arestas. , Os estabilizadores de nó Sj (arriba) e testemuñas , (abaixo), con 1 desviación estándar para os nós e arestas próximos ás arestas de longo alcance. As liñas descontinuas verticais agrupan estabilizadores e testemuñas pola súa distancia ás arestas cortadas. , Función de distribución acumulada dos erros dos estabilizadores. As estrelas indican estabilizadores de nó Sj que teñen unha aresta implementada por unha porta de longo alcance. No benchmark de aresta eliminada (liña vermella discontinua), as portas de longo alcance non se implementan e os estabilizadores indicados por estrelas teñen así un erro unitario. A rexión gris é a masa de probabilidade correspondente aos estabilizadores de nó afectados polos cortes. – , Nas disposicións bidimensionais, os nós verdes duplican os nós 95, 98, 102 e 97 para mostrar as arestas cortadas. Os nós azuis en e son recursos de cúbits para crear pares de Bell cortados. A cor do nó i é o erro absoluto |Si − 1| do estabilizador medido, como indica a barra de cor. Unha aresta é negra se se detectan estatísticas de entrelazamento cun nivel de confianza do 99% e violeta se non. En , as arestas de longo alcance impĺementanse con portas SWAP. En , as mesmas portas impĺementanse con LOCC. En , non se impĺementan en absoluto. a b c d f Preparamos |G⟩ usando tres métodos diferentes. As arestas nativas do hardware sempre se impĺementan con portas CNOT, pero as condicións de contorno periódicas impĺementanse con (1) portas SWAP, (2) LOCC e (3) LO para conectar cúbits a través de toda a rede. A principal diferenza entre LOCC e LO é unha operación de feed-forward que consiste en portas de un cúbit condicionadas a 2n resultados de medición, onde n é o número de cortes. Cada un dos 22n casos activa unha combinación única de portas X e/ou Z nos cúbits apropiados. A adquisición dos resultados da medición, a determinación do caso correspondente e a actuación baseada nel realízase en tempo real polo hardware de control, a costa dunha latencia engadida fixa. Mitigamos e suprimimos os erros resultantes desta latencia con extrapolación de cero ruído e descopamento dinámico escalonado , (ver sección ' '). 22 21 28 Instrucións de cambio de circuíto cuántico con mitigación de erros Probamos as implementacións SWAP, LOCC e LO de |G⟩ cun estado de grafo nativo do hardware en G′ = (V, E′) obtido eliminando as portas de longo alcance, é dicir, E′ = EE_lr. O circuíto que prepara |G′⟩ requírelle polo tanto só 112 portas CNOT arranxadas en tres capas seguindo a topoloxía hexágono-pesada do procesador Eagle. Este circuíto reportará grandes erros ao medir os estabilizadores de nó e aresta de |G⟩ para nós nun corte xa que está deseñado para implementar |G′⟩. Referímonos a este benchmark nativo do hardware como o benchmark de aresta eliminada. O circuíto baseado en SWAP require 262 portas CNOT adicionais para crear as arestas de longo alcance Elr, o que reduce drasticamente o valor dos estabilizadores medidos (Fig. ). Por contra, a implementación LOCC e LO das arestas en Elr non require portas SWAP. Os erros dos seus estabilizadores de nó e aresta para nós non implicados nun corte seguen de preto o benchmark de aresta eliminada (Fig. ). Pola contra, os estabilizadores que implican unha porta virtual teñen un erro menor que o benchmark de aresta eliminada e a implementación SWAP (Fig. , marcadores de estrela). Como métrica de calidade xeral, primeiro reportamos a suma de erros absolutos nos estabilizadores de nó, é dicir, ∑i∈V |Si − 1| (Táboa de Datos Extendida ). A gran sobrecarga de SWAP é responsable do erro absoluto de suma de 44.3. O erro de 13.1 no benchmark de aresta eliminada está dominado polos oito nós nas catro cortes (Fig. , marcadores de estrela). Por contra, os erros LO e LOCC vense afectados polos MCMs. Atribuímos o erro adicional de 1.9 de LOCC sobre LO aos atrasos e ás portas CNOT no circuíto de teletransportación e nos pares de Bell cortados. Nos resultados baseados en SWAP, non detecta entrelazamento en 35 das 116 arestas cun nivel de confianza do 99% (Fig. ). Para a implementación LO e LOCC, testemuña as estatísticas de entrelazamento bipartito en todas as arestas de G cun nivel de confianza do 99% (Fig. ). Estas métricas mostran que as portas virtuais de longo alcance producen estabilizadores con erros menores que a súa descomposición en SWAPs. Ademais, manteñen a varianza o suficientemente baixa para verificar as estatísticas de entrelazamento. 2b–d 2b,c 2c 1 2c 2b,d 2e Operando dúas QPU como unha Combinamos agora dúas QPUs Eagle con 127 cúbits cada unha nunha única QPU a través dunha conexión clásica en tempo real. Operar os dispositivos como un procesador único e máis grande consiste en executar circuítos cuánticos que abarquen o rexistro de cúbits máis grande. Ademais das portas unitarias e medicións que se executan concurrentemente na QPU fusionada, usamos circuítos dinámicos para realizar portas que actúan sobre cúbits en ambos os dispositivos. Isto é posible grazas a unha estrita sincronización e comunicación clásica rápida entre instrumentos fisicamente separados necesarios para recoller resultados de medición e determinar o fluxo de control en todo o sistema . 29 Probamos esta conexión clásica en tempo real enxeñando un estado de grafo en 134 cúbits construído a partir de aneis hexágono-pesados que percorren ambas as QPUs (Fig. ). Estes aneis foron escollidos excluindo cúbits afectados por sistemas de dous niveis e problemas de lectura para garantir un estado de grafo de alta calidade. Este grafo forma un anel en tres dimensións e require catro portas de longo alcance que implementamos con LO e LOCC. Como antes, o protocolo LOCC require dous cúbits adicionais por porta cortada para os pares de Bell cortados. Como na sección anterior, comparamos os nosos resultados cun grafo que non implementa as arestas que abarcan ambas as QPUs. Xa que non hai ligazón cuántica entre os dous dispositivos, un benchmark con portas SWAP é imposible. Todas as arestas mostran as estatísticas de entrelazamento bipartito cando implementamos o grafo con LO e LOCC cun nivel de confianza do 99%. Ademais, os estabilizadores LO e LOCC teñen a mesma calidade que o benchmark de aresta eliminada para nós que non se ven afectados por unha porta de longo alcance (Fig. ). Os estabilizadores afectados por portas de longo alcance teñen unha gran redución de erro en comparación co benchmark de aresta eliminada. A suma de erros absolutos nos estabilizadores de nó ∑i∈V |Si − 1|, é de 21.0, 19.2 e 12.6 para o benchmark de aresta eliminada, LOCC e LO, respectivamente. Como antes, atribuímos os 6.6 erros adicionais de LOCC sobre LO aos atrasos e ás portas CNOT no circuíto de teletransportación e nos pares de Bell cortados. Os resultados LOCC demostran como un circuíto cuántico dinámico no que dous subcircuítos están conectados por unha ligazón clásica en tempo real pode executarse en dúas QPUs, doutra forma, desunidas. Os resultados LO poderían obterse nun único dispositivo con 127 cúbits a costa dun factor adicional de 2 no tempo de execución xa que os subcircuítos poden executarse sucesivamente. 3 3c , Estado de grafo con contornos periódicos mostrados en tres dimensións. As arestas azuis son as arestas cortadas. , Mapa de acoplamento de dúas QPUs Eagle operadas como un único dispositivo con 254 cúbits. Os nós púrpuras son os cúbits que forman o estado de grafo en e os nós azuis úsanse para pares de Bell cortados. , , Erro absoluto nos estabilizadores (c) e testemuñas de aresta (d) implementados con LOCC (verde continuo) e LO (laranxa continuo) e nun grafo de benchmark de aresta eliminada (vermello descontinuo) para o grafo en . En c e d, as estrelas mostran estabilizadores e testemuñas de aresta que se ven afectados polos cortes. En c e d, a rexión gris é a masa de probabilidade correspondente aos estabilizadores de nó e testemuñas de aresta, respectivamente, afectados polo corte. En c e d, observamos que a implementación LO supera o benchmark de aresta eliminada, o que atribuímos a mellores condicións do dispositivo xa que estes datos foron tomados nun día diferente do benchmark e dos datos LOCC. a b c d Discusión e conclusión Implementamos portas de longo alcance con LO e LOCC. Con estas portas, enxeñamos condicións de contorno periódicas nunha rede planar de 103 nós e conectamos dous procesadores Eagle en tempo real para crear un estado de grafo en 134 cúbits, superando as capacidades dun único chip. Aquí, escollemos implementar estados de grafo como aplicación para destacar as propiedades escalables dos circuítos dinámicos. As nosas fábricas de pares de Bell cortados permiten o esquema LOCC presentado na ref. . Ambos os protocolos LO e LOCC ofrecen resultados de alta calidade que coinciden de preto cun benchmark nativo do hardware. O corte de circuítos aumenta a varianza dos observables medidos. Podemos manter a varianza baixo control en ambos os esquemas LO e LOCC, como indican as probas estatísticas nas testemuñas. Unha discusión en profundidade da varianza medida atópase na Información Suplementaria ( ). 17 Supplementary Information A varianza aumenta dende o QPD, polo que a investigación céntrase agora en reducir a sobrecarga de mostraxe. Demostrouse recentemente que cortar varios portas de dous cúbits en paralelo resulta en QPDs LO óptimos coa mesma sobrecarga de mostraxe que LOCC pero require un cúbit auxiliar adicional e posiblemente reset , . En LOCC, o QPD só é necesario para cortar os pares de Bell. Este custoso QPD podería eliminarse, é dicir, sen sobrecarga de disparos, distribuíndo entrelazamento entre múltiples chips , . A curto e medio prazo, isto podería facerse operando portas no réxime de microondas a través de cables convencionais , , 30 31 32 33 10 34