Autores: Almudena Carrera Vazquez Caroline Tornow Diego Ristè Stefan Woerner Maika Takita Daniel J. Egger Resumo Os ordenadores cuánticos procesan información coas leis da mecánica cuántica. O hardware cuántico actual é ruidoso, só pode almacenar información durante pouco tempo e está limitado a uns poucos bits cuánticos, é dicir, cúbits, normalmente organizados nunha conectividade planar . Non obstante, moitas aplicacións da computación cuántica requiren máis conectividade que a rede planar ofrecida polo hardware en máis cúbits dos dispoñibles nunha única unidade de procesamento cuántico (QPU). A comunidade espera abordar estas limitacións conectando as QPU mediante comunicación clásica, o que aínda non se demostrou experimentalmente. Aquí realizamos experimentalmente circuítos dinámicos con mitigación de erros e corte de circuítos para crear estados cuánticos que requiran conectividade periódica utilizando ata 142 cúbits que abarcan dúas QPU con 127 cúbits cada unha conectadas en tempo real cunha ligazón clásica. Nun circuíto dinámico, as portas cuánticas poden ser controladas clásicamente polos resultados de medicións de circuítos intermedios dentro do tempo de execución, é dicir, dentro dunha fracción do tempo de coherencia dos cúbits. A nosa ligazón clásica en tempo real permítenos aplicar unha porta cuántica nunha QPU condicionada ao resultado dunha medición noutra QPU. Ademais, o fluxo de control con mitigación de erros mellora a conectividade dos cúbits e o conxunto de instrucións do hardware, aumentando así a versatilidade dos nosos ordenadores cuánticos. O noso traballo demostra que podemos usar varios procesadores cuánticos como un con circuítos dinámicos con mitigación de erros habilitados por unha ligazón clásica en tempo real. 1 Principal Os ordenadores cuánticos procesan información codificada en bits cuánticos con operacións unitarias. Non obstante, os ordenadores cuánticos son ruidosos e a maioría das arquitecturas a gran escala organizan os cúbits físicos nunha rede planar. Aínda así, os procesadores actuais con mitigación de erros xa poden simular modelos de Ising nativos do hardware con 127 cúbits e medir observables a unha escala na que os enfoques de forza bruta con ordenadores clásicos comezan a ter dificultades . A utilidade dos ordenadores cuánticos depende de seguir escalando e superando a súa limitada conectividade de cúbits. Un enfoque modular é importante para escalar os procesadores cuánticos ruidosos actuais e para acadar os grandes números de cúbits físicos necesarios para a tolerancia a fallos . As arquitecturas de ións atrapados e átomos neutros poden acadar modularidade transportando fisicamente os cúbits , . A curto prazo, a modularidade nos cúbits supercondutores acádase mediante interconexións de curto alcance que ligan chips adxacentes , . 1 2 3 4 5 6 7 8 A medio prazo, poden realizarse portas de longo alcance que operan no réxime de microondas a través de longos cables convencionais , , . Isto permitiría unha conectividade de cúbits non planar adecuada para unha corrección de erros eficiente . Unha alternativa a longo prazo é entrelazar QPU remotas cunha ligazón óptica que aproveite unha transdución de microondas a óptica , que aínda non se demostrou, ata onde sabemos. Ademais, os circuítos dinámicos amplían o conxunto de operacións dun ordenador cuántico realizando medicións inter-circuíto (MCMs) e controlando clásicamente unha porta dentro do tempo de coherencia dos cúbits. Melloran a calidade algorítmica e a conectividade dos cúbits . Como demostraremos, os circuítos dinámicos tamén permiten a modularidade conectando QPU en tempo real a través dunha ligazón clásica. 9 10 11 3 12 13 14 Adoptamos un enfoque complementario baseado en portas virtuais para implementar interaccións de longo alcance nunha arquitectura modular. Conectamos cúbits en localizacións arbitrarias e creamos as estatísticas de entrelazamento mediante unha descomposición de cuasi-probabilidade (QPD) , , . Comparamos un esquema só de Operacións Locais (LO) cun ampliado por Comunicación Clásica (LOCC) . O esquema LO, demostrado nun contorno de dous cúbits , require a execución de múltiples circuítos cuánticos só con operacións locais. Pola contra, para implementar LOCC, consumimos pares de Bell virtuais nun circuíto de teletransportación para crear portas de dous cúbits , . No hardware cuántico con conectividade esparcida e planar, crear un par de Bell entre cúbits arbitrarios require unha porta CNOT de longo alcance. Para evitar estas portas, usamos un QPD sobre operacións locais que resulta en pares de Bell cortados que a teletransportación consume. LO non necesita a ligazón clásica e é, polo tanto, máis sinxelo de implementar que LOCC. Non obstante, como LOCC só require un único circuíto modelo parametrizado, é máis eficiente de compilar que LO e o custo do seu QPD é menor que o do esquema LO. 15 16 17 16 17 18 19 20 O noso traballo fai catro contribucións clave. Primeiro, presentamos os circuítos cuánticos e o QPD para crear múltiples pares de Bell cortados para implementar as portas virtuais en ref. . Segundo, suprimimos e mitigamos os erros que xorden da latencia do hardware de control clásico en circuítos dinámicos cunha combinación de descopamento dinámico e extrapolación de ruído cero . Terceiro, aproveitamos estes métodos para deseñar condicións de contorno periódicas nun estado de grafo de 103 nós. Cuarto, demostramos unha conexión clásica en tempo real entre dúas QPU separadas, demostrando así que un sistema de QPU distribuídas pode operarse como unha soa a través dunha ligazón clásica . Combinado con circuítos dinámicos, isto permítenos operar ambos os chips como un único ordenador cuántico, o que exemplificamos deseñando un estado de grafo periódico que abarca ambos os dispositivos en 142 cúbits. Discutimos un camiño cara adiante para crear portas de longo alcance e proporcionamos a nosa conclusión. 17 21 22 23 Corte de circuítos Executamos grandes circuítos cuánticos que poden non ser executables directamente no noso hardware debido a limitacións no número de cúbits ou conectividade, cortando as portas. O corte de circuítos descompón un circuíto complexo en subcircuítos que poden ser executados individualmente , , , , , . Non obstante, debemos executar un número incrementado de circuítos, que chamamos sobrecarga de mostraxe. Os resultados destes subcircuítos recombínanse clasicamente para obter o resultado do circuíto orixinal ( ). 15 16 17 24 25 26 Métodos Como unha das principais contribucións do noso traballo é a implementación de portas virtuais con LOCC, mostramos como crear os pares de Bell cortados necesarios con operacións locais. Aquí, múltiples pares de Bell cortados son deseñados mediante circuítos cuánticos parametrizados, que chamamos unha fábrica de pares de Bell cortados (Fig. ). Cortar múltiples pares ao mesmo tempo require unha menor sobrecarga de mostraxe . Como a fábrica de pares de Bell cortados forma dous circuítos cuánticos disxuntos, colocamos cada subcircuíto preto de cúbits que teñen portas de longo alcance. O recurso resultante consómese entón nun circuíto de teletransportación. Por exemplo, na Fig. , os pares de Bell cortados consómense para crear portas CNOT nos pares de cúbits (0, 1) e (2, 3) (ver sección ‘ ’). 1b,c 17 1b Fábricas de pares de Bell cortados , Representación dunha arquitectura IBM Quantum System Two. Aquí, dúas QPU Eagle de 127 cúbits están conectadas cunha ligazón clásica en tempo real. Cada QPU é controlada pola súa electrónica no seu rack. Sincronizamos estreitamente ambos os racks para operar ambas as QPU como unha soa. , Circuíto cuántico modelo para implementar portas CNOT virtuais nos pares de cúbits ( 0, 1) e ( 2, 3) con LOCC consumindo pares de Bell cortados nun circuíto de teletransportación. As liñas dobres púrpuras corresponden á ligazón clásica en tempo real. , Fábricas de pares de Bell cortados 2( ) para dous pares de Bell cortados simultaneamente. O QPD ten un total de 27 conxuntos de parámetros diferentes . Aquí, . a b q q q q c C θ i θ i Condicións de contorno periódicas Construímos un estado de grafo | ⟩ con condicións de contorno periódicas en ibm_kyiv, un procesador Eagle , indo máis alá dos límites impostos pola súa conectividade física (ver sección ‘ ’). Aquí, ten ∣ ∣ = 103 nós e require catro ligazóns de longo alcance lr = {(1, 95), (2, 98), (6, 102), (7, 97)} entre os cúbits superiores e inferiores do procesador Eagle (Fig. ). Medimos os estabilizadores de nós en cada nodo ∈ e os estabilizadores de ligazóns formados polo produto a través de cada ligazón ( , ) ∈ . A partir destes estabilizadores, construímos unha testemuña de entrelazamento , que é negativa se hai entrelazamento bipartito a través da ligazón ( , ) ∈ (ref. ) (ver sección ‘ ’). Centrámonos no entrelazamento bipartito porque este é o recurso que desexamos recrear con portas virtuais. Medir testemuñas de entrelazamento entre máis de dúas partes medirá só a calidade das portas e medicións non virtuais, facendo que o impacto das portas virtuais sexa menos claro. G 1 Estados de grafo G V E 2a Si i V SiSj i j E i j E 27 Testemuña de entrelazamento , O grafo hexagonal pesado dóbrase sobre si mesmo en forma tubular polas ligazóns (1, 95), (2, 98), (6, 102) e (7, 97) destacadas en azul. Cortamos estas ligazóns. , Os estabilizadores de nós (arriba) e testemuñas , (abaixo), con 1 desviación estándar para os nós e ligazóns próximos ás ligazóns de longo alcance. As liñas descontinuas verticais agrupan estabilizadores e testemuñas pola súa distancia ás ligazóns cortadas. , Función de distribución acumulada dos erros dos estabilizadores. As estrelas indican estabilizadores de nós que teñen unha ligazón implementada por unha porta de longo alcance. No benchmark de ligazóns caídas (liña vermella de guión-punto), as portas de longo alcance non se implementan e os estabilizadores indicados por estrelas teñen erro unitario. A rexión gris é a masa de probabilidade correspondente aos estabilizadores de nós afectados polos cortes. – , Nos deseños bidimensionais, os nós verdes duplican os nós 95, 98, 102 e 97 para mostrar as ligazóns cortadas. Os nós azuis en son recursos de cúbits para crear pares de Bell cortados. A cor do nodo é o erro absoluto ∣ − 1∣ do estabilizador medido, como indica a barra de cores. Unha ligazón é negra se se detectan estatísticas de entrelazamento cun nivel de confianza do 99% e violeta se non. En , as portas de longo alcance implementanse con portas SWAP. En , as mesmas portas implementanse con LOCC. En , non se implementan en absoluto. a b Sj c Sj d f e i Si d e f Preparamos | ⟩ usando tres métodos diferentes. As ligazóns nativas do hardware sempre se implementan con portas CNOT, pero as condicións de contorno periódicas implementanse con (1) portas SWAP, (2) LOCC e (3) LO para conectar cúbits en toda a rede. A principal diferenza entre LOCC e LO é unha operación de avance que consiste en portas de un só cúbit condicionadas a 2 resultados de medición, onde é o número de cortes. Cada un dos 22 casos activa unha combinación única de portas e/ou nos cúbits apropiados. A adquisición dos resultados das medicións, a determinación do caso correspondente e a actuación baseada nel realízase en tempo real polo hardware de control, a costa dunha latencia engadida fixa. Mitigamos e suprimimos os erros resultantes desta latencia con extrapolación de ruído cero e descopamento dinámico escalonado , (ver sección ‘ ’). G n n n X Z 22 21 28 Instrucións de conmutación de circuítos cuánticos con mitigación de erros Compararmos as implementacións SWAP, LOCC e LO de | ⟩ cun estado de grafo nativo do hardware en ′ = ( , ′) obtido eliminando as portas de longo alcance, é dicir, ′ = lr. O circuíto que prepara | ′⟩ require así só 112 portas CNOT organizadas en tres capas seguindo a topoloxía hexagonal pesada do procesador Eagle. Este circuíto informará de grandes erros ao medir os estabilizadores de nós e ligazóns de | ⟩ para nós nun circuíto cortado xa que está deseñado para implementar | ′⟩. Referímonos a este benchmark nativo do hardware como o benchmark de ligazóns caídas. O circuíto baseado en SWAP require 262 portas CNOT adicionais para crear as ligazóns de longo alcance lr, o que reduce drasticamente o valor dos estabilizadores medidos (Fig. ). Pola contra, a implementación LOCC e LO das ligazóns en lr non require portas SWAP. Os erros dos seus estabilizadores de nós e ligazóns para nós non implicados nunha porta cortada seguen de preto o benchmark de ligazóns caídas (Fig. ). Pola contra, os estabilizadores que implican unha porta virtual teñen un erro menor que o benchmark de ligazóns caídas e a implementación SWAP (Fig. , marcadores de estrela). Como métrica global de calidade, primeiro informamos da suma de erros absolutos nos estabilizadores de nós, é dicir, ∑ ∈ ∣ − 1∣ (Táboa de Datos Estendidos ). A gran sobrecarga de SWAP é responsable do erro absoluto da suma de 44.3. O erro de 13.1 no benchmark de ligazóns caídas está dominado polos oito nós nas catro cortes (Fig. , marcadores de estrela). Pola contra, os erros de LO e LOCC vense afectados polos MCM. Atribuímos o erro adicional de 1.9 de LOCC sobre LO aos retardos e ás portas CNOT no circuíto de teletransportación e nos pares de Bell cortados. Nos resultados baseados en SWAP, non detecta entrelazamento a través de 35 das 116 ligazóns cun nivel de confianza do 99% (Fig. ). Para a implementación LO e LOCC, testemuña as estatísticas de entrelazamento bipartito a través de todas as ligazóns en cun nivel de confianza do 99% (Fig. ). Estas métricas mostran que as portas virtuais de longo alcance producen estabilizadores con erros menores que a súa descomposición en SWAPs. Ademais, manteñen a varianza o suficientemente baixa para verificar as estatísticas de entrelazamento. G G V E E EE G G G E 2b–d E 2b,c 2c i V Si 1 2c 2b,d G 2e Operando dúas QPU como unha Agora combinamos dúas QPU Eagle con 127 cúbits cada unha nunha única QPU a través dunha conexión clásica en tempo real. Operar os dispositivos como un único procesador máis grande consiste en executar circuítos cuánticos que abarcan o rexistro de cúbits máis grande. Ademais das portas unitarias e medicións que se executan concurrentemente na QPU fusionada, usamos circuítos dinámicos para realizar portas que actúan sobre cúbits en ambos os dispositivos. Isto é posible grazas a unha sincronización estreita e unha comunicación clásica rápida entre instrumentos fisicamente separados, necesaria para recoller resultados de medición e determinar o fluxo de control en todo o sistema . 29 Probamos esta conexión clásica en tempo real deseñando un estado de grafo en 134 cúbits construído a partir de aneis hexagonais pesados que serpentean por ambas as QPU (Fig. ). Estes aneis foron escollidos excluindo cúbits afectados por sistemas de dous niveis e problemas de lectura para garantir un estado de grafo de alta calidade. Este grafo forma un anel en tres dimensións e require catro portas de longo alcance que implementamos con LO e LOCC. Como antes, o protocolo LOCC require dous cúbits adicionais por porta cortada para os pares de Bell cortados. Como na sección anterior, comparamos os nosos resultados cun grafo que non implementa as ligazóns que abarcan ambas as QPU. Como non hai ligazón cuántica entre os dous dispositivos, un benchmark con portas SWAP é imposible. Todas as ligazóns exhiben as estatísticas de entrelazamento bipartito cando implementamos o grafo con LO e LOCC cun nivel de confianza do 99%. Ademais, os estabilizadores LO e LOCC teñen a mesma calidade que o benchmark de ligazóns caídas para nós que non están afectados por unha porta de longo alcance (Fig. ). Os estabilizadores afectados por portas de longo alcance teñen unha gran redución de erro en comparación co benchmark de ligazóns caídas. A suma de erros absolutos nos estabilizadores de nós ∑ ∈ ∣ − 1∣, é 21.0, 19.2 e 12.6 para o benchmark de ligazóns caídas, LOCC e LO, respectivamente. Como antes, atribuímos os 6.6 erros adicionais de LOCC sobre LO aos retardos e ás portas CNOT no circuíto de teletransportación e nos pares de Bell cortados. Os resultados de LOCC demostran como un circuíto cuántico dinámico no que dous subcircuítos están conectados por unha ligazón clásica en tempo real pode executarse en dúas QPU, doutra forma disxuntas. Os resultados de LO poderían obterse nun único dispositivo con 127 cúbits a costa dun factor adicional de 2 no tempo de execución, xa que os subcircuítos poden executarse sucesivamente. 3 3c i V Si , Estado de grafo con contornos periódicos mostrados en tres dimensións. As ligazóns azuis son as ligazóns cortadas. , Mapa de acoplamento de dúas QPU Eagle operadas como un único dispositivo con 254 cúbits. Os nós púrpuras son os cúbits que forman o estado de grafo en e os nós azuis úsanse para pares de Bell cortados. , , Erro absoluto nos estabilizadores ( ) e testemuñas de ligazóns ( ) implementados con LOCC (verde continuo) e LO (laranxa continuo) e nun grafo de benchmark de ligazóns caídas (vermello descontinuo) para o estado de grafo en . En e , as estrelas mostran estabilizadores e testemuñas de ligazóns que son afectados polos cortes. En e , a rexión gris é a masa de probabilidade correspondente aos estabilizadores de nós e testemuñas de ligazóns, respectivamente, afectadas polo corte. En e , observamos que a implementación LO supera o benchmark de ligazóns caídas, o que atribuímos a mellores condicións do dispositivo xa que estes datos foron tomados noutro día que os datos de benchmark e LOCC. a b a c d c d a c d c d c d Discusión e conclusión Implementamos portas de longo alcance con LO e LOCC. Con estas portas, deseñamos condicións de contorno periódicas nunha rede planar de 103 nós e conectamos dous procesadores Eagle en tempo real para crear un estado de grafo en 134 cúbits, indo máis alá das capacidades dun único chip. Aquí, escollemos implementar estados de grafo como aplicación para destacar as propiedades escalables dos circuítos dinámicos. As nosas fábricas de pares de Bell cortados permiten o esquema LOCC presentado en ref. . Tanto os protocolos LO como LOCC ofrecen resultados de alta calidade que coinciden de preto cun benchmark nativo do hardware. O corte de circuítos aumenta a varianza dos observables medidos. Podemos manter a varianza baixo control en ambos os esquemas LO e LOCC, como indican as probas estatísticas nas testemuñas. Atópase unha discusión en profundidade da varianza medida na . 17 Información Suplementaria A varianza aumenta a partir do QPD, polo que a investigación céntrase agora en reducir a sobrecarga de mostraxe. Demostrouse recentemente que cortar varios portas de dous cúbits en paralelo resulta en Q