Autores: Almudena Carrera Vazquez Caroline Tornow Diego Ristè Stefan Woerner Maika Takita Daniel J. Egger Resumo Os ordenadores cuánticos procesan información coas leis da mecánica cuántica. O hardware cuántico actual é ruidoso, só pode almacenar información durante un curto período de tempo e está limitado a uns poucos bits cuánticos, é dicir, cúbits, normalmente organizados nunha conectividade planar . Non obstante, moitas aplicacións da computación cuántica requiren máis conectividade que a rede planar que ofrece o hardware en máis cúbits dos que hai dispoñibles nunha única unidade de procesamento cuántico (QPU). A comunidade espera abordar estas limitacións conectando as QPU mediante comunicación clásica, o que aínda non se demostrou experimentalmente. Aquí realizamos experimentalmente circuítos dinámicos con mitigación de erros e corte de circuítos para crear estados cuánticos que requiren conectividade periódica utilizando ata 142 cúbits que abranguen dúas QPU con 127 cúbits cada unha conectadas en tempo real cunha ligazón clásica. Nun circuíto dinámico, as portas cuánticas poden ser controladas clásicamente polos resultados de medicións realizadas a metade do circuíto dentro do tempo de execución, é dicir, dentro dunha fracción do tempo de coherencia dos cúbits. A nosa ligazón clásica en tempo real permítenos aplicar unha porta cuántica nunha QPU condicionada ao resultado dunha medición noutra QPU. Ademais, o fluxo de control con mitigación de erros mellora a conectividade dos cúbits e o conxunto de instrucións do hardware, aumentando así a versatilidade dos nosos ordenadores cuánticos. O noso traballo demostra que podemos utilizar varios procesadores cuánticos como un só con circuítos dinámicos con mitigación de erros habilitados por unha ligazón clásica en tempo real. 1 Principal Os ordenadores cuánticos procesan información codificada en bits cuánticos con operacións unitarias. Non obstante, os ordenadores cuánticos son ruidosos e a maioría das arquitecturas a gran escala organizan os cúbits físicos nunha rede planar. Non obstante, os procesadores actuais con mitigación de erros xa poden simular modelos de Ising nativos do hardware con 127 cúbits e medir observables a unha escala na que os enfoques de forza bruta con ordenadores clásicos comezan a ter dificultades . A utilidade dos ordenadores cuánticos depende de unha maior escalabilidade e de superar a súa conectividade limitada de cúbits. Un enfoque modular é importante para escalar os procesadores cuánticos ruidosos actuais e para lograr os grandes números de cúbits físicos necesarios para a corrección de erros . As arquitecturas de ións atrapados e átomos neutros poden acadar modularidade transportando fisicamente os cúbits , . A curto prazo, a modularidade en cúbits superconductores alcánzase mediante interconexións de curto alcance que unen chips adxacentes , . 1 2 3 4 5 6 7 8 A medio prazo, as portas de longo alcance que operan no réxime de microondas poden realizarse a través de cables convencionais longos , , . Isto permitiría unha conectividade de cúbits non planar axeitada para unha corrección de erros eficiente . Unha alternativa a longo prazo é entrelazar QPU remotas cunha ligazón óptica que aproveite unha transdución de microondas a óptica , que aínda non se demostrou, ata onde sabemos. Ademais, os circuítos dinámicos amplían o conxunto de operacións dun ordenador cuántico realizando medicións a metade do circuíto (MCM) e controlando clásicamente unha porta dentro do tempo de coherencia dos cúbits. Melloran a calidade algorítmica e a conectividade dos cúbits . Como veremos, os circuítos dinámicos tamén permiten a modularidade conectando as QPU en tempo real a través dunha ligazón clásica. 9 10 11 3 12 13 14 Adotamos un enfoque complementario baseado en portas virtuais para implementar interaccións de longo alcance nunha arquitectura modular. Conectamos cúbits en localizacións arbitrarias e creamos as estatísticas de entrelazamento mediante unha descomposición de cuasi-probabilidade (QPD) , , . Comparamos un esquema só de Operacións Locais (LO) cun aumentado con Comunicación Clásica (LOCC) . O esquema LO, demostrado nun entorno de dous cúbits , require executar múltiples circuítos cuánticos só con operacións locais. Pola contra, para implementar LOCC, consumimos pares de Bell virtuais nun circuíto de teletransportación para crear portas de dous cúbits , . No hardware cuántico con conectividade dispersa e planar, crear un par de Bell entre cúbits arbitrarios require unha porta controlled-NOT (CNOT) de longo alcance. Para evitar estas portas, utilizamos unha QPD sobre operacións locais que resulta en pares de Bell cortados que a teletransportación consume. LO non necesita a ligazón clásica e, polo tanto, é máis sinxelo de implementar que LOCC. Non obstante, como LOCC só require un único circuíto modelo parametrizado, é máis eficiente de compilar que LO e o custo da súa QPD é menor que o do esquema LO. 15 16 17 16 17 18 19 20 O noso traballo fai catro contribucións clave. En primeiro lugar, presentamos os circuítos cuánticos e a QPD para crear múltiples pares de Bell cortados para realizar as portas virtuais da ref. . En segundo lugar, suprimimos e mitigamos os erros que xorden da latencia do hardware de control clásico en circuítos dinámicos cunha combinación de desacoplamento dinámico e extrapolación de ruído cero . En terceiro lugar, aproveitamos estes métodos para deseñar condicións de contorno periódicas nun estado de grafo de 103 nós. En cuarto lugar, demostramos unha conexión clásica en tempo real entre dúas QPU separadas, demostrando así que un sistema de QPU distribuídas pode operarse como unha soa mediante unha ligazón clásica . Combinado con circuítos dinámicos, isto permítenos operar ambas as fichas como un único ordenador cuántico, o que exemplificamos deseñando un estado de grafo periódico que abrangue ambos os dispositivos en 142 cúbits. Discutimos un camiño a seguir para crear portas de longo alcance e proporcionamos a nosa conclusión. 17 21 22 23 Corte de circuítos Executamos circuítos cuánticos grandes que poden non ser executables directamente no noso hardware debido a limitacións no número de cúbits ou na conectividade, cortando portas. O corte de circuítos descompón un circuíto complexo en subcircuítos que poden executarse individualmente , , , , , . Non obstante, debemos executar un número incrementado de circuítos, que chamamos sobrecarga de mostraxe. Os resultados destes subcircuítos combínanse entón clásicamente para obter o resultado do circuíto orixinal ( ). 15 16 17 24 25 26 Métodos Como unha das principais contribucións do noso traballo é a implementación de portas virtuais con LOCC, mostramos como crear os pares de Bell cortados requiridos con operacións locais. Aquí, créanse múltiples pares de Bell cortados mediante circuítos cuánticos parametrizados, que chamamos fábrica de pares de Bell cortados (Fig. ). Cortar varios pares ao mesmo tempo require unha menor sobrecarga de mostraxe . Como a fábrica de pares de Bell cortados forma dous circuítos cuánticos disxuntos, colocamos cada subcircuíto preto de cúbits que teñen portas de longo alcance. O recurso resultante consómese entón nun circuíto de teletransportación. Por exemplo, na Fig. , consómense os pares de Bell cortados para crear portas CNOT nos pares de cúbits (0, 1) e (2, 3) (ver sección ‘ ’). 1b,c 17 1b Fábricas de pares de Bell cortados , Depictión dunha arquitectura IBM Quantum System Two. Aquí, dúas QPU Eagle de 127 cúbits están conectadas cunha ligazón clásica en tempo real. Cada QPU é controlada pola súa electrónica no seu rack. Sincronizamos estreitamente ambos os racks para operar ambas as QPU como unha soa. , Circuíto cuántico modelo para implementar portas CNOT virtuais en pares de cúbits ( 0, 1) e ( 2, 3) con LOCC consumindo pares de Bell cortados nun circuíto de teletransportación. As liñas dobradas púrpuras corresponden á ligazón clásica en tempo real. , Fábricas de pares de Bell cortados 2( ) para dous pares de Bell cortados simultaneamente. A QPD ten un total de 27 conxuntos de parámetros diferentes . Aquí, . a b q q q q c C θ i θ i Condicións de contorno periódicas Construímos un estado de grafo | ⟩ con condicións de contorno periódicas en ibm_kyiv, un procesador Eagle , indo máis alá dos límites impostos pola súa conectividade física (ver sección ‘ ’). Aquí, ten ∣ ∣ = 103 nós e require catro arestas de longo alcance lr = {(1, 95), (2, 98), (6, 102), (7, 97)} entre os cúbits superiores e inferiores do procesador Eagle (Fig. ). Medimos os estabilizadores de nós en cada nodo ∈ e os estabilizadores de arestas formados polo produto a través de cada aresta ( , ) ∈ . A partir destes estabilizadores, construímos unha testemuña de entrelazamento , que é negativa se hai entrelazamento bipartito a través da aresta ( , ) ∈ (ref. ) (ver sección ‘ ’). Centrámonos no entrelazamento bipartito porque este é o recurso que desexamos recrear con portas virtuais. Medir testemuñas de entrelazamento entre máis de dúas partes só medirá a calidade das portas e medicións non virtuais, o que fai que o impacto das portas virtuais sexa menos claro. G 1 Estados de grafo G V E 2a Si i V SiSj i j E i j E 27 Testemuña de entrelazamento , O grafo pesado hexagonal dóbrase sobre si mesmo en forma tubular polas arestas (1, 95), (2, 98), (6, 102) e (7, 97) resaltadas en azul. Cortamos estas arestas. , Os estabilizadores de nós (arriba) e testemuñas , (abaixo), con 1 desviación estándar para os nós e arestas próximas ás arestas de longo alcance. As liñas descontinuas verticais agrupan estabilizadores e testemuñas pola súa distancia ás arestas cortadas. , Función de distribución acumulada dos erros dos estabilizadores. As estrelas indican estabilizadores de nós que teñen unha aresta implementada por unha porta de longo alcance. Na proba de aresta eliminada (liña de puntos-guión vermella), as portas de longo alcance non se implementan e os estabilizadores indicados por estrelas, polo tanto, teñen erro unitario. A rexión gris é a masa de probabilidade correspondente aos estabilizadores de nós afectados polos cortes. – , Nos deseños bidimensionais, os nós verdes duplican os nós 95, 98, 102 e 97 para mostrar as arestas cortadas. Os nós azuis en son recursos de cúbits para crear pares de Bell cortados. A cor do nodo é o erro absoluto ∣ − 1∣ do estabilizador medido, como se indica na barra de cores. Unha aresta é negra se se detectan estatísticas de entrelazamento cun nivel de confianza do 99% e violeta se non. En , as portas de longo alcance impéméntanse con portas SWAP. En , as mesmas portas impéméntanse con LOCC. En , non se implementan en absoluto. a b Sj c Sj d f e i Si d e f Preparamos | ⟩ usando tres métodos diferentes. As arestas nativas do hardware sempre se implementan con portas CNOT, pero as condicións de contorno periódicas impéméntanse con (1) portas SWAP, (2) LOCC e (3) LO para conectar cúbits a través de toda a rede. A principal diferenza entre LOCC e LO é unha operación de retroalimentación que consiste en portas de un cúbit condicionadas a 2 resultados de medición, onde é o número de cortes. Cada un dos 22 casos activa unha combinación única de portas e/ou nos cúbits apropiados. A adquisición dos resultados de medición, a determinación do caso correspondente e a acción baseada nel realízase en tempo real polo hardware de control, ao custo dunha latencia engadida fixa. Mitigamos e suprimimos os erros resultantes desta latencia con extrapolación de ruído cero e desacoplamento dinámico escalonado , (ver sección ‘ ’). G n n n X Z 22 21 28 Instrucións de conmutación de circuítos cuánticos con mitigación de erros Avaliamos as implementacións SWAP, LOCC e LO de | ⟩ cun estado de grafo nativo do hardware en ′ = ( , ′) obtido eliminando as portas de longo alcance, é dicir, ′ = lr. O circuíto que prepara | ′⟩ requíre entón só 112 portas CNOT organizadas en tres capas seguindo a topoloxía pesada hexagonal do procesador Eagle. Este circuíto reportará erros grandes ao medir os estabilizadores de nós e arestas de | ⟩ para nós nun circuíto cortado, xa que está deseñado para implementar | ′⟩. Referímonos a esta proba nativa do hardware como a proba de aresta eliminada. O circuíto baseado en SWAP require 262 portas CNOT adicionais para crear as arestas de longo alcance lr, o que reduce drasticamente o valor dos estabilizadores medidos (Fig. ). Pola contra, a implementación LOCC e LO das arestas en lr non require portas SWAP. Os erros dos seus estabilizadores de nós e arestas para nós non implicados nunha porta cortada seguen de preto a proba de aresta eliminada (Fig. ). Pola contra, os estabilizadores que implican unha porta virtual teñen un erro menor que a proba de aresta eliminada e a implementación SWAP (Fig. , marcadores de estrelas). Como métrica global de calidade, informamos primeiro da suma de erros absolutos nos estabilizadores de nós, é dicir, ∑ ∈ ∣ − 1∣ (Táboa de Datos Estendidos ). A gran sobrecarga de SWAP é a responsable da suma de erros absolutos de 44.3. O erro de 13.1 na proba de aresta eliminada está dominado polos oito nós nas catro cortes (Fig. , marcadores de estrelas). Pola contra, os erros LO e LOCC vense afectados polos MCM. Atribuímos o erro adicional de 1.9 de LOCC sobre LO aos atrasos e ás portas CNOT no circuíto de teletransportación e aos pares de Bell cortados. Nos resultados baseados en SWAP, non detecta entrelazamento a través de 35 das 116 arestas cun nivel de confianza do 99% (Fig. ). Para a implementación LO e LOCC, testemuña as estatísticas de entrelazamento bipartito a través de todas as arestas en cun nivel de confianza do 99% (Fig. ). Estas métricas mostran que as portas virtuais de longo alcance producen estabilizadores con erros menores que a súa descomposición en SWAPs. Ademais, manteñen a varianza o suficientemente baixa como para verificar as estatísticas de entrelazamento. G G V E E EE G G G E 2b–d E 2b,c 2c i V Si 1 2c 2b,d G 2e Operando dúas QPU como unha Agora combinamos dúas QPU Eagle con 127 cúbits cada unha nunha única QPU a través dunha conexión clásica en tempo real. Operar os dispositivos como un procesador máis grande consiste en executar circuítos cuánticos que abranguen o rexistro de cúbits máis grande. Ademais das portas unitarias e medicións que se executan concurrentemente na QPU fusionada, utilizamos circuítos dinámicos para realizar portas que actúan sobre cúbits en ambos os dispositivos. Isto é posible grazas a unha estrita sincronización e unha comunicación clásica rápida entre instrumentos fisicamente separados, necesaria para recoller resultados de medición e determinar o fluxo de control en todo o sistema . 29 Probamos esta conexión clásica en tempo real deseñando un estado de grafo en 134 cúbits construído a partir de aneis pesados hexagonais que atravesan ambas as QPU (Fig. ). Estes aneis foron escollidos excluindo cúbits afectados por sistemas de dous niveis e problemas de lectura para garantir un estado de grafo de alta calidade. Este grafo forma un anel en tres dimensións e require catro portas de longo alcance que implementamos con LO e LOCC. Como antes, o protocolo LOCC require dous cúbits adicionais por porta cortada para os pares de Bell cortados. Como na sección anterior, avaliamos os nosos resultados fronte a un grafo que non implementa as arestas que abranguen ambas as QPU. Como non hai ligazón cuántica entre os dous dispositivos, unha proba con portas SWAP é imposible. Todas as arestas exhiben as estatísticas de entrelazamento bipartito cando implementamos o grafo con LO e LOCC cun nivel de confianza do 99%. Ademais, os estabilizadores LO e LOCC teñen a mesma calidade que a proba de aresta eliminada para os nós que non se ven afectados por unha porta de longo alcance (Fig. ). Os estabilizadores afectados por portas de longo alcance teñen unha gran redución no erro en comparación coa proba de aresta eliminada. A suma de erros absolutos nos estabilizadores de nós ∑ ∈ ∣ − 1∣, é de 21.0, 19.2 e 12.6 para a proba de aresta eliminada, LOCC e LO, respectivamente. Como antes, atribuímos os 6.6 erros adicionais de LOCC sobre LO aos atrasos e ás portas CNOT no circuíto de teletransportación e aos pares de Bell cortados. Os resultados LOCC demostran como un circuíto cuántico dinámico no que dous subcircuítos están conectados por unha ligazón clásica en tempo real pode executarse en dúas QPU de outro xeito disxuntas. Os resultados LO poderían obterse nun único dispositivo con 127 cúbits ao custo dun factor adicional de 2 no tempo de execución, xa que os subcircuítos poden executarse sucesivamente. 3 3c i V Si , Estado de grafo con condicións de contorno periódicas mostrado en tres dimensións. As arestas azuis son as arestas cortadas. , Mapa de acoplamento de dúas QPU Eagle operadas como un único dispositivo con 254 cúbits. Os nós púrpuras son os cúbits que forman o estado de grafo en e os nós azuis úsanse para pares de Bell cortados. , , Erro absoluto nos estabilizadores ( ) e testemuñas de arestas ( ) implementados con LOCC (verde continuo) e LO (laranxa continuo) e nun grafo de proba de aresta eliminada (punteado-guión vermello) para o estado de grafo en . En e , as estrelas mostran estabilizadores e testemuñas de arestas que se ven afectados polos cortes. En e , a rexión gris é a masa de probabilidade correspondente aos estabilizadores de nós e testemuñas de arestas, respectivamente, afectadas polo corte. En e , observamos que a implementación LO supera á proba de aresta eliminada, o que atribuímos a mellores condicións do dispositivo xa que estes datos se tomaron nun día diferente ao da proba e aos datos LOCC. a b a c d c d a c d c d c d Discusión e conclusión Implementamos portas de longo alcance con LO e LOCC. Con estas portas, deseñamos condicións de contorno periódicas nunha rede planar de 103 nós e conectamos dous procesadores Eagle en tempo real para crear un estado de grafo en 134 cúbits, indo máis alá das capacidades dunha única ficha. Aquí, optamos por implementar estados de grafo como aplicación para destacar as propiedades escalables dos circuítos dinámicos. As nosas fábricas de pares de Bell cortados habilitan o esquema LOCC presentado na ref. . Tanto os protocolos LO como LOCC ofrecen resultados de alta calidade que coinciden estreitamente cunha proba nativa do hardware. O corte de circuítos aumenta a varianza dos observables medidos. Podemos manter a varianza baixo control en ambos os esquemas LO e LOCC, como indican as probas estatísticas das testemuñas. Unha discusión en profundidade da varianza medida atópase na 17