IBM Quantum Breakthrough: Ligando Chips em Tempo Real para Expandir o Poder dos Qubits

Autores: Almudena Carrera Vazquez Caroline Tornow Diego Ristè Stefan Woerner Maika Takita Daniel J. Egger Resumo Os computadores quânticos processam informações com as leis da mecânica quântica. O hardware quântico atual é barulhento, só consegue armazenar informações por um curto período e é limitado a poucos bits quânticos, ou seja, qubits, tipicamente organizados em uma conectividade planar . No entanto, muitas aplicações de computação quântica requerem mais conectividade do que a grade planar oferecida pelo hardware em mais qubits do que está disponível em uma única unidade de processamento quântico (QPU). A comunidade espera lidar com essas limitações conectando QPUs usando comunicação clássica, o que ainda não foi provado experimentalmente. Aqui, realizamos experimentalmente circuitos dinâmicos com mitigação de erros e corte de circuitos para criar estados quânticos que requerem conectividade periódica usando até 142 qubits, abrangendo duas QPUs com 127 qubits cada, conectadas em tempo real com um link clássico. Em um circuito dinâmico, os portões quânticos podem ser controlados classicamente pelos resultados de medições de mid-circuit dentro do tempo de execução, ou seja, dentro de uma fração do tempo de coerência dos qubits. Nosso link clássico em tempo real nos permite aplicar um portão quântico em uma QPU condicionado ao resultado de uma medição em outra QPU. Além disso, o fluxo de controle com mitigação de erros aprimora a conectividade dos qubits e o conjunto de instruções do hardware, aumentando assim a versatilidade de nossos computadores quânticos. Nosso trabalho demonstra que podemos usar vários processadores quânticos como um só, com circuitos dinâmicos com mitigação de erros habilitados por um link clássico em tempo real. 1 Principal Computadores quânticos processam informações codificadas em bits quânticos com operações unitárias. No entanto, os computadores quânticos são barulhentos e a maioria das arquiteturas de grande escala organiza os qubits físicos em uma grade planar. Não obstante, os processadores atuais com mitigação de erros já podem simular modelos Ising nativos do hardware com 127 qubits e medir observáveis em uma escala onde as abordagens de força bruta com computadores clássicos começam a ter dificuldades . A utilidade dos computadores quânticos depende de mais escalabilidade e da superação de sua conectividade limitada de qubits. Uma abordagem modular é importante para escalar os processadores quânticos atuais com ruído e para alcançar os grandes números de qubits físicos necessários para tolerância a falhas . Arquiteturas de íons aprisionados e átomos neutros podem alcançar modularidade transportando fisicamente os qubits , . No curto prazo, a modularidade em qubits supercondutores é alcançada por interconexões de curto alcance que ligam chips adjacentes , . 1 2 3 4 5 6 7 8 A médio prazo, portões de longo alcance operando no regime de micro-ondas podem ser realizados através de cabos convencionais longos , , . Isso permitiria a conectividade de qubits não planar adequada para correção de erros eficiente . Uma alternativa de longo prazo é emaranhar QPUs remotas com um link óptico, aproveitando uma transdutora de micro-ondas para óptica , o que ainda não foi demonstrado, até onde sabemos. Além disso, circuitos dinâmicos ampliam o conjunto de operações de um computador quântico, realizando medições de mid-circuit (MCMs) e controlando classicamente um portão dentro do tempo de coerência dos qubits. Eles aprimoram a qualidade algorítmica e a conectividade dos qubits . Como mostraremos, circuitos dinâmicos também permitem a modularidade, conectando QPUs em tempo real através de um link clássico. 9 10 11 3 12 13 14 Adotamos uma abordagem complementar baseada em portões virtuais para implementar interações de longo alcance em uma arquitetura modular. Conectamos qubits em locais arbitrários e criamos as estatísticas de emaranhamento através de uma decomposição de quasia-probabilidade (QPD) , , . Comparamos um esquema apenas de Operações Locais (LO) com um aumentado por Comunicação Clássica (LOCC) . O esquema LO, demonstrado em um ambiente de dois qubits , requer a execução de múltiplos circuitos quânticos apenas com operações locais. Em contraste, para implementar LOCC, consumimos pares de Bell virtuais em um circuito de teletransporte para criar portões de dois qubits , . Em hardware quântico com conectividade esparsa e planar, criar um par de Bell entre qubits arbitrários requer um portão controlled-NOT (CNOT) de longo alcance. Para evitar esses portões, usamos um QPD sobre operações locais, resultando em pares de Bell cortados que o teletransporte consome. LO não necessita do link clássico e, portanto, é mais simples de implementar do que LOCC. No entanto, como LOCC requer apenas um circuito modelo parametrizado, é mais eficiente de compilar do que LO e o custo de seu QPD é menor do que o custo do esquema LO. 15 16 17 16 17 18 19 20 Nosso trabalho faz quatro contribuições principais. Primeiro, apresentamos os circuitos quânticos e QPD para criar múltiplos pares de Bell cortados para realizar os portões virtuais em ref. . Segundo, suprimimos e mitigamos os erros decorrentes da latência do hardware de controle clássico em circuitos dinâmicos com uma combinação de desacoplamento dinâmico e extrapolação de ruído zero . Terceiro, aproveitamos esses métodos para projetar condições de contorno periódicas em um estado de grafo de 103 nós. Quarto, demonstramos uma conexão clássica em tempo real entre duas QPUs separadas, demonstrando assim que um sistema de QPUs distribuídas pode ser operado como uma só através de um link clássico . Combinado com circuitos dinâmicos, isso nos permite operar ambas as chips como um único computador quântico, o que exemplificamos projetando um estado de grafo periódico que abrange ambos os dispositivos em 142 qubits. Discutimos um caminho para frente para criar portões de longo alcance e fornecemos nossa conclusão. 17 21 22 23 Corte de circuito Executamos grandes circuitos quânticos que podem não ser executáveis diretamente em nosso hardware devido a limitações na contagem de qubits ou conectividade, cortando portões. O corte de circuito decompõe um circuito complexo em subcircuitos que podem ser executados individualmente , , , , , . No entanto, devemos executar um número aumentado de circuitos, que chamamos de sobrecarga de amostragem. Os resultados desses subcircuitos são então combinados classicamente para produzir o resultado do circuito original ( ). 15 16 17 24 25 26 Métodos Como uma das principais contribuições do nosso trabalho é a implementação de portões virtuais com LOCC, mostramos como criar os pares de Bell cortados necessários com operações locais. Aqui, múltiplos pares de Bell cortados são projetados por circuitos quânticos parametrizados, que chamamos de fábrica de pares de Bell cortados (Fig. ). Cortar vários pares simultaneamente requer uma sobrecarga de amostragem menor . Como a fábrica de pares de Bell cortados forma dois circuitos quânticos disjuntos, colocamos cada subcircuito perto de qubits que têm portões de longo alcance. O recurso resultante é então consumido em um circuito de teletransporte. Por exemplo, na Fig. , os pares de Bell cortados são consumidos para criar portões CNOT nos pares de qubits (0, 1) e (2, 3) (ver seção ‘ ’). 1b,c 17 1b Fábricas de pares de Bell cortados , Representação de uma arquitetura IBM Quantum System Two. Aqui, duas QPUs Eagle de 127 qubits são conectadas com um link clássico em tempo real. Cada QPU é controlada por sua eletrônica em seu rack. Sincronizamos estritamente ambos os racks para operar ambas as QPUs como uma só. , Circuito quântico modelo para implementar portões CNOT virtuais em pares de qubits ( 0, 1) e ( 2, 3) com LOCC consumindo pares de Bell cortados em um circuito de teletransporte. As linhas duplas roxas correspondem ao link clássico em tempo real. , Fábricas de pares de Bell cortados 2( ) para dois pares de Bell cortados simultaneamente. O QPD tem um total de 27 conjuntos de parâmetros diferentes . Aqui,. a b q q q q c C θ i θ i Condições de contorno periódicas Construímos um estado de grafo | ⟩ com condições de contorno periódicas no ibm_kyiv, um processador Eagle , indo além dos limites impostos por sua conectividade física (ver seção ‘ ’). Aqui, tem | | = 103 nós e requer quatro arestas de longo alcance lr = {(1, 95), (2, 98), (6, 102), (7, 97)} entre os qubits superior e inferior do processador Eagle (Fig. ). Medimos os estabilizadores de nós em cada nó ∈ e os estabilizadores de arestas formados pelo produto através de cada aresta ( , ) ∈ . A partir desses estabilizadores, construímos uma testemunha de emaranhamento , que é negativa se houver emaranhamento bipartido através da aresta ( , ) ∈ (ref. ) (ver seção ‘ ’). Focamos no emaranhamento bipartido porque este é o recurso que desejamos recriar com portões virtuais. Medir testemunhas de emaranhamento entre mais de duas partes medirá apenas a qualidade dos portões e medições não virtuais, tornando o impacto dos portões virtuais menos claro. G 1 Estados de grafo G V E 2a Si i V SiSj i j E i j E 27 Testemunha de emaranhamento , O grafo heavy-hexagonal é dobrado sobre si mesmo em forma tubular pelas arestas (1, 95), (2, 98), (6, 102) e (7, 97) destacadas em azul. Cortamos essas arestas. , Os estabilizadores de nós (topo) e as testemunhas , (base), com 1 desvio padrão para os nós e arestas próximas às arestas de longo alcance. Linhas pontilhadas verticais agrupam estabilizadores e testemunhas por sua distância das arestas cortadas. , Função de distribuição cumulativa dos erros do estabilizador. As estrelas indicam estabilizadores de nós que têm uma aresta implementada por um portão de longo alcance. No benchmark de aresta descartada (linha tracejada vermelha), os portões de longo alcance não são implementados e os estabilizadores indicados por estrelas têm, portanto, erro unitário. A região cinza é a massa de probabilidade correspondente aos estabilizadores de nós afetados pelos cortes. – , Nos layouts bidimensionais, os nós verdes duplicam os nós 95, 98, 102 e 97 para mostrar as arestas cortadas. Os nós azuis em são recursos de qubit para criar pares de Bell cortados. A cor do nó é o erro absoluto | - 1| do estabilizador medido, como indicado pela barra de cores. Uma aresta é preta se as estatísticas de emaranhamento forem detectadas com um nível de confiança de 99% e violeta se não forem. Em , os portões de longo alcance são implementados com portões SWAP. Em , os mesmos portões são implementados com LOCC. Em , eles não são implementados. a b Sj c Sj d f e i Si d e f Preparamos | ⟩ usando três métodos diferentes. As arestas nativas do hardware são sempre implementadas com portões CNOT, mas as condições de contorno periódicas são implementadas com (1) portões SWAP, (2) LOCC e (3) LO para conectar qubits em toda a grade. A principal diferença entre LOCC e LO é uma operação de feed-forward consistindo em portões de qubit único condicionados a 2 resultados de medição, onde é o número de cortes. Cada um dos 22 casos aciona uma combinação única de portões e/ou nos qubits apropriados. A aquisição dos resultados da medição, a determinação do caso correspondente e a ação com base nele são realizadas em tempo real pelo hardware de controle, ao custo de uma latência adicionada fixa. Mitigamos e suprimimos os erros resultantes dessa latência com extrapolação de ruído zero e desacoplamento dinâmico escalonado , (ver seção ‘ ’). G n n n X Z 22 21 28 Instruções de troca de circuito quântico com mitigação de erro Avaliamos as implementações SWAP, LOCC e LO de | ⟩ com um estado de grafo nativo do hardware em ′ = ( , ′) obtido removendo os portões de longo alcance, ou seja, ′ = lr. O circuito que prepara | ′⟩ requer, portanto, apenas 112 portões CNOT organizados em três camadas seguindo a topologia heavy-hexagonal do processador Eagle. Este circuito relatará grandes erros ao medir os estabilizadores de nó e aresta de | ⟩ para nós em um corte de portão, pois foi projetado para implementar | ′⟩. Referimo-nos a este benchmark nativo do hardware como benchmark de aresta descartada. O circuito baseado em SWAP requer 262 portões CNOT adicionais para criar as arestas de longo alcance lr, o que reduz drasticamente o valor dos estabilizadores medidos (Fig. ). Em contraste, a implementação LOCC e LO das arestas em lr não requer portões SWAP. Os erros de seus estabilizadores de nós e arestas para nós não envolvidos em um corte de portão seguem de perto o benchmark de aresta descartada (Fig. ). Pelo contrário, os estabilizadores que envolvem um portão virtual têm um erro menor do que o benchmark de aresta descartada e a implementação SWAP (Fig. , marcadores estrela). Como métrica geral de qualidade, primeiro relatamos a soma dos erros absolutos nos estabilizadores de nós, ou seja, ∑ ∈ ∣ - 1∣ (Tabela de Dados Estendida ). A grande sobrecarga de SWAP é responsável pelo erro absoluto da soma de 44,3. O erro de 13,1 no benchmark de aresta descartada é dominado pelos oito nós nos quatro cortes (Fig. , marcadores estrela). Em contraste, os erros LOCC e LO são afetados por MCMs. Atribuímos o erro adicional de 1,9 do LOCC sobre o LO aos atrasos e aos portões CNOT no circuito de teletransporte e pares de Bell cortados. Nos resultados baseados em SWAP, não detecta emaranhamento em 35 das 116 arestas com um nível de confiança de 99% (Fig. ). Para a implementação LO e LOCC, testemunha as estatísticas de emaranhamento bipartido em todas as arestas em com um nível de confiança de 99% (Fig. ). Essas métricas mostram que portões virtuais de longo alcance produzem estabilizadores com erros menores do que sua decomposição em SWAPs. Além disso, eles mantêm a variância baixa o suficiente para verificar as estatísticas de emaranhamento. G G V E E EE G G G E 2b–d E 2b,c 2c i V Si 1 2c 2b,d G 2e Operando duas QPUs como uma Combinamos agora duas QPUs Eagle com 127 qubits cada em uma única QPU através de uma conexão clássica em tempo real. Operar os dispositivos como um único processador maior consiste em executar circuitos quânticos que abrangem o registro de qubits maior. Além dos portões unitários e medições executados concorrentemente na QPU mesclada, usamos circuitos dinâmicos para realizar portões que agem sobre qubits em ambos os dispositivos. Isso é habilitado por uma sincronização rígida e comunicação clássica rápida entre instrumentos fisicamente separados, necessária para coletar resultados de medição e determinar o fluxo de controle em todo o sistema . 29 Testamos essa conexão clássica em tempo real projetando um estado de grafo em 134 qubits, construído a partir de anéis heavy-hexagonal que percorrem ambas as QPUs (Fig. ). Esses anéis foram escolhidos excluindo qubits com sistemas de dois níveis e problemas de leitura para garantir um estado de grafo de alta qualidade. Este grafo forma um anel em três dimensões e requer quatro portões de longo alcance que implementamos com LO e LOCC. Como antes, o protocolo LOCC requer dois qubits adicionais por portão cortado para os pares de Bell cortados. Como na seção anterior, avaliamos nossos resultados em comparação com um grafo que não implementa as arestas que abrangem ambas as QPUs. Como não há link quântico entre os dois dispositivos, um benchmark com portões SWAP é impossível. Todas as arestas exibem as estatísticas de emaranhamento bipartido quando implementamos o grafo com LO e LOCC com um nível de confiança de 99%. Além disso, os estabilizadores LO e LOCC têm a mesma qualidade do benchmark de aresta descartada para nós que não são afetados por um portão de longo alcance (Fig. ). Os estabilizadores afetados por portões de longo alcance têm uma grande redução no erro em comparação com o benchmark de aresta descartada. A soma dos erros absolutos nos estabilizadores de nós ∑ ∈ ∣ - 1∣ , é 21,0, 19,2 e 12,6 para o benchmark de aresta descartada, LOCC e LO, respectivamente. Como antes, atribuímos os 6,6 erros adicionais do LOCC sobre o LO aos atrasos e aos portões CNOT no circuito de teletransporte e pares de Bell cortados. Os resultados LOCC demonstram como um circuito quântico dinâmico em que dois subcircuitos são conectados por um link clássico em tempo real pode ser executado em duas QPUs, de outra forma, disjuntas. Os resultados LO poderiam ser obtidos em um único dispositivo com 127 qubits ao custo de um fator adicional de 2 no tempo de execução, pois os subcircuitos podem ser executados sucessivamente. 3 3c i V Si , Estado do grafo com contornos periódicos mostrados em três dimensões. As arestas azuis são as arestas cortadas. , Mapa de acoplamento de duas QPUs Eagle operadas como um único dispositivo com 254 qubits. Os nós roxos são os qubits que formam o estado do grafo em e os nós azuis são usados para pares de Bell cortados. , , Erro absoluto nos estabilizadores ( ) e testemunhas de arestas ( ) implementados com LOCC (verde sólido) e LO (laranja sólido) e em um benchmark de grafo com aresta descartada (tracejado vermelho) para o estado do grafo em . Em e , as estrelas mostram estabilizadores e testemunhas de arestas que são afetados pelos cortes. Em e , a região cinza é a massa de probabilidade correspondente aos estabilizadores de nós e testemunhas de arestas, respectivamente, afetados pelo corte. Em e , observamos que a implementação LO supera o benchmark de aresta descartada, o que atribuímos a melhores condições do dispositivo, pois esses dados foram coletados em um dia diferente do benchmark e dos dados LOCC. a b a c d c d a c d c d c d Discussão e conclusão Implementamos portões de longo alcance com LO e LOCC. Com esses portões, projetamos condições de contorno periódicas em uma grade planar de 103 nós e conectamos dois processadores Eagle em tempo real para criar um estado de grafo em 134 qubits, indo além das capacidades de uma única chip. Aqui, escolhemos implementar estados de grafo como uma aplicação para destacar as propriedades escaláveis de circuitos dinâmicos. Nossas fábricas de pares de Bell cortados permitem o esquema LOCC apresentado em ref. . Ambos os protocolos LO e LOCC entregam resultados de alta qualidade que correspondem de perto a um benchmark nativo do hardware. O corte de circuito aumenta a variância de observáveis medidos. Podemos manter a variância sob controle em ambos os esquemas LO e LOCC, como indicado pelos testes estatísticos nas testemunhas. Uma discussão aprofundada da variância medida está nas . 17 Informações Suplementares O aumento da variância do QPD é o motivo pelo qual a pesquisa agora se concentra em reduzir a sobrecarga de amostragem. Foi recentemente demonstrado que cortar múltiplos portões de dois qubits em paralelo resulta em QPDs LO ideais com a mesma sobrecarga de amostragem que LOCC, mas requer um qubit auxiliar adicional e possivelmente reinicialização , . Em LOCC, o QPD é necessário apenas para cortar os pares de Bell. Este QPD custoso poderia ser removido, ou seja, sem sobrecarga de tiros, distribuindo emaranhamento entre múltiplos chips , . No curto a médio prazo, isso pode ser feito operando portões no regime de micro-ondas através de cabos convencionais 30 31 32 33