Autori: Almudena Carrera Vazquez Caroline Tornow Diego Ristè Stefan Woerner Maika Takita Daniel J. Egger Abstract I computer quantistici elaborano le informazioni secondo le leggi della meccanica quantistica. Gli attuali hardware quantistici sono rumorosi, possono memorizzare informazioni solo per breve tempo e sono limitati a pochi bit quantistici, ovvero qubit, tipicamente disposti in una connettività planare . Tuttavia, molte applicazioni del calcolo quantistico richiedono una connettività maggiore rispetto al reticolo planare offerto dall'hardware su più qubit di quanti ne siano disponibili su una singola unità di elaborazione quantistica (QPU). La comunità spera di affrontare queste limitazioni collegando le QPU utilizzando la comunicazione classica, che non è ancora stata dimostrata sperimentalmente. Qui realizziamo sperimentalmente circuiti dinamici con mitigazione degli errori e circuit cutting per creare stati quantistici che richiedono connettività periodica utilizzando fino a 142 qubit distribuiti su due QPU con 127 qubit ciascuna, collegate in tempo reale con un collegamento classico. In un circuito dinamico, le porte quantistiche possono essere controllate classicamente dagli esiti di misurazioni a metà circuito all'interno del tempo di esecuzione, ovvero entro una frazione del tempo di coerenza dei qubit. Il nostro collegamento classico in tempo reale ci consente di applicare una porta quantistica su una QPU condizionata all'esito di una misurazione su un'altra QPU. Inoltre, il controllo di flusso con mitigazione degli errori migliora la connettività dei qubit e il set di istruzioni dell'hardware, aumentando così la versatilità dei nostri computer quantistici. Il nostro lavoro dimostra che possiamo utilizzare più processori quantistici come uno solo con circuiti dinamici con mitigazione degli errori abilitati da un collegamento classico in tempo reale. 1 Principale I computer quantistici elaborano le informazioni codificate nei bit quantistici con operazioni unitarie. Tuttavia, i computer quantistici sono rumorosi e la maggior parte delle architetture su larga scala dispone i qubit fisici in un reticolo planare. Ciononostante, gli attuali processori con mitigazione degli errori possono già simulare modelli Ising nativi dell'hardware con 127 qubit e misurare osservabili su una scala in cui gli approcci "brute force" con computer classici iniziano a incontrare difficoltà . L'utilità dei computer quantistici dipende da un'ulteriore scalabilità e dal superamento della loro limitata connettività dei qubit. Un approccio modulare è importante per scalare gli attuali processori quantistici rumorosi e per raggiungere il gran numero di qubit fisici necessari per la tolleranza ai guasti . Le architetture con ioni intrappolati e atomi neutri possono raggiungere la modularità trasportando fisicamente i qubit , . Nel breve termine, la modularità nei qubit superconduttori si ottiene tramite interconnessioni a corto raggio che collegano chip adiacenti , . 1 2 3 4 5 6 7 8 Nel medio termine, porte a lungo raggio operanti nel regime delle microonde potrebbero essere eseguite su lunghi cavi convenzionali , , . Ciò consentirebbe una connettività dei qubit non planare adatta a una correzione degli errori efficiente . Un'alternativa a lungo termine consiste nell'entanglement di QPU remote con un collegamento ottico che sfrutta una trasduzione microonde-ottica , che, a nostra conoscenza, non è ancora stata dimostrata. Inoltre, i circuiti dinamici ampliano il set di operazioni di un computer quantistico eseguendo misurazioni a metà circuito (MCM) e controllando classicamente una porta entro il tempo di coerenza dei qubit. Migliorano la qualità algoritmica e la connettività dei qubit . Come vedremo, i circuiti dinamici abilitano anche la modularità collegando le QPU in tempo reale tramite un collegamento classico. 9 10 11 3 12 13 14 Adottiamo un approccio complementare basato su porte virtuali per implementare interazioni a lungo raggio in un'architettura modulare. Colleghiamo qubit in posizioni arbitrarie e creiamo le statistiche dell'entanglement tramite una decomposizione quasi-probabilistica (QPD) , , . Confrontiamo uno schema basato solo su Operazioni Locali (LO) con uno aumentato dalla Comunicazione Classica (LOCC) . Lo schema LO, dimostrato in un contesto a due qubit , richiede l'esecuzione di più circuiti quantistici con sole operazioni locali. Al contrario, per implementare LOCC, consumiamo coppie di Bell virtuali in un circuito di teletrasporto per creare porte a due qubit , . Su hardware quantistico con connettività sparsa e planare, la creazione di una coppia di Bell tra qubit arbitrari richiede una porta CNOT a lungo raggio. Per evitare queste porte, utilizziamo una QPD su operazioni locali che risultano in coppie di Bell tagliate che il teletrasporto consuma. LO non necessita del collegamento classico ed è quindi più semplice da implementare rispetto a LOCC. Tuttavia, poiché LOCC richiede un unico circuito modello parametrizzato, è più efficiente da compilare rispetto a LO e il costo della sua QPD è inferiore al costo dello schema LO. 15 16 17 16 17 18 19 20 Il nostro lavoro fornisce quattro contributi chiave. In primo luogo, presentiamo i circuiti quantistici e la QPD per creare multiple coppie di Bell tagliate per realizzare le porte virtuali nel ref. . In secondo luogo, sopprimiamo e mitigiamo gli errori derivanti dalla latenza dell'hardware di controllo classico nei circuiti dinamici con una combinazione di disaccoppiamento dinamico ed estrapolazione a rumore zero . In terzo luogo, sfruttiamo questi metodi per ingegnerizzare condizioni al contorno periodiche su un grafo di 103 nodi. In quarto luogo, dimostriamo una connessione classica in tempo reale tra due QPU separate, dimostrando così che un sistema di QPU distribuite può essere operato come una sola tramite un collegamento classico . In combinazione con i circuiti dinamici, ciò ci consente di operare entrambi i chip come un singolo computer quantistico, cosa che esemplifichiamo ingegnerizzando uno stato di grafo periodico che si estende su entrambi i dispositivi su 142 qubit. Discutiamo un percorso per creare porte a lungo raggio e forniamo la nostra conclusione. 17 21 22 23 Circuit Cutting Eseguiamo grandi circuiti quantistici che potrebbero non essere direttamente eseguibili sul nostro hardware a causa di limitazioni nel numero di qubit o nella connettività, tagliando le porte. Il circuit cutting scompone circuiti complessi in sottocircuiti che possono essere eseguiti individualmente , , , , , . Tuttavia, dobbiamo eseguire un numero maggiore di circuiti, che chiamiamo overhead di campionamento. I risultati di questi sottocircuiti vengono quindi ricombinati classicamente per fornire il risultato del circuito originale ( ). 15 16 17 24 25 26 Metodi Poiché uno dei principali contributi del nostro lavoro è l'implementazione di porte virtuali con LOCC, mostriamo come creare le coppie di Bell tagliate richieste con operazioni locali. Qui, più coppie di Bell tagliate vengono ingegnerizzate tramite circuiti quantistici parametrizzati, che chiamiamo "cut Bell pair factory" (fabbrica di coppie di Bell tagliate) (Fig. ). Tagliare più coppie contemporaneamente richiede un overhead di campionamento inferiore . Poiché la "cut Bell pair factory" forma due circuiti quantistici disgiunti, posizioniamo ogni sottocircuito vicino ai qubit che hanno porte a lungo raggio. La risorsa risultante viene quindi utilizzata in un circuito di teletrasporto. Ad esempio, nella Fig. , le coppie di Bell tagliate vengono consumate per creare porte CNOT sulle coppie di qubit (0, 1) e (2, 3) (vedere la sezione "Fabbriche di coppie di Bell tagliate" ). 1b,c 17 1b Cut Bell pair factories , Rappresentazione di un'architettura IBM Quantum System Two. Qui, due QPU Eagle da 127 qubit sono collegate con un collegamento classico in tempo reale. Ogni QPU è controllata dalla sua elettronica nel suo rack. Sincronizziamo strettamente entrambi i rack per operare entrambe le QPU come una sola. , Circuito quantistico modello per implementare porte CNOT virtuali sulle coppie di qubit ( 0, 1) e ( 2, 3) con LOCC consumando coppie di Bell tagliate in un circuito di teletrasporto. Le doppie linee viola corrispondono al collegamento classico in tempo reale. , Fabbriche di coppie di Bell tagliate 2( ) per due coppie di Bell tagliate simultaneamente. La QPD ha un totale di 27 diversi set di parametri . Qui, . a b q q q q c C θ i θ i Condizioni al contorno periodiche Costruiamo uno stato grafo | ⟩ con condizioni al contorno periodiche su ibm_kyiv, un processore Eagle , andando oltre i limiti imposti dalla sua connettività fisica (vedere la sezione "Stati Grafo" ). Qui, ha ∣ ∣ = 103 nodi e richiede quattro spigoli a lungo raggio lr = {(1, 95), (2, 98), (6, 102), (7, 97)} tra i qubit superiori e inferiori del processore Eagle (Fig. ). Misuriamo gli stabilizzatori dei nodi su ogni nodo ∈ e gli stabilizzatori degli spigoli formati dal prodotto attraverso ogni spigolo ( , ) ∈ . Da questi stabilizzatori, costruiamo un testimone di entanglement , che è negativo se c'è entanglement bipartito attraverso lo spigolo ( , ) ∈ (ref. ) (vedere la sezione "Testimone di entanglement" ). Ci concentriamo sull'entanglement bipartito perché questa è la risorsa che desideriamo ricreare con porte virtuali. La misurazione di testimoni di entanglement tra più di due parti misurerà solo la qualità delle porte non virtuali e delle misurazioni, rendendo meno chiaro l'impatto delle porte virtuali. G 1 Graph states G V E 2a Si i V SiSj i j E i j E 27 Entanglement witness , Il grafo a esagoni pesanti è ripiegato su se stesso in forma tubolare dagli spigoli (1, 95), (2, 98), (6, 102) e (7, 97) evidenziati in blu. Tagliamo questi spigoli. , Gli stabilizzatori dei nodi (in alto) e i testimoni , (in basso), con deviazione standard per i nodi e gli spigoli vicini agli spigoli a lungo raggio. Le linee tratteggiate verticali raggruppano stabilizzatori e testimoni in base alla loro distanza dagli spigoli tagliati. , Funzione di distribuzione cumulativa degli errori degli stabilizzatori. Le stelle indicano gli stabilizzatori dei nodi che hanno uno spigolo implementato da una porta a lungo raggio. Nel benchmark "dropped edge" (linea tratteggiata rossa), le porte a lungo raggio non sono implementate e gli stabilizzatori indicati dalle stelle hanno quindi errore unitario. La regione grigia è la massa di probabilità corrispondente agli stabilizzatori dei nodi influenzati dai tagli. – , Nei layout bidimensionali, i nodi verdi duplicano i nodi 95, 98, 102 e 97 per mostrare gli spigoli tagliati. I nodi blu in sono risorse di qubit per creare coppie di Bell tagliate. Il colore del nodo è l'errore assoluto ∣ − 1∣ dello stabilizzatore misurato, come indicato dalla barra dei colori. Uno spigolo è nero se le statistiche di entanglement vengono rilevate con un livello di confidenza del 99% e viola se non vengono rilevate. In , le porte a lungo raggio sono implementate con porte SWAP. In , le stesse porte sono implementate con LOCC. In , non sono implementate affatto. a b Sj c Sj d f e i Si d e f Prepariamo | ⟩ utilizzando tre metodi diversi. Gli spigoli nativi dell'hardware sono sempre implementati con porte CNOT, ma le condizioni al contorno periodiche sono implementate con (1) porte SWAP, (2) LOCC e (3) LO per collegare i qubit attraverso l'intero reticolo. La differenza principale tra LOCC e LO è un'operazione di "feed-forward" costituita da porte a singolo qubit condizionate da 2 risultati di misurazione, dove è il numero di tagli. Ciascuno dei 22 casi attiva una combinazione unica di porte e/o sui qubit appropriati. L'acquisizione dei risultati di misurazione, la determinazione del caso corrispondente e l'azione in base ad esso vengono eseguite in tempo reale dall'hardware di controllo, al costo di una latenza aggiunta fissa. Mitighiamo e sopprimiamo gli errori derivanti da questa latenza con estrapolazione a rumore zero e disaccoppiamento dinamico sfalsato , (vedere la sezione "Istruzioni di commutazione di circuiti quantistici con mitigazione degli errori" ). G n n n X Z 22 21 28 Error-mitigated quantum circuit switch instructions Benchiamo le implementazioni SWAP, LOCC e LO di | ⟩ con uno stato grafo nativo dell'hardware su ′ = ( , ′) ottenuto rimuovendo le porte a lungo raggio, ovvero ′ = lr. Il circuito che prepara | ′⟩ richiede quindi solo 112 porte CNOT disposte in tre strati seguendo la topologia a esagoni pesanti del processore Eagle. Questo circuito riporterà grandi errori quando si misurano gli stabilizzatori dei nodi e degli spigoli di | ⟩ per i nodi su un taglio, poiché è progettato per implementare | ′⟩. Ci riferiamo a questo benchmark nativo dell'hardware come benchmark "dropped edge". Il circuito basato su SWAP richiede 262 porte CNOT aggiuntive per creare gli spigoli a lungo raggio lr, che riduce drasticamente il valore degli stabilizzatori misurati (Fig. ). Al contrario, l'implementazione LOCC e LO degli spigoli in lr non richiede porte SWAP. Gli errori dei loro stabilizzatori di nodi e spigoli per i nodi non coinvolti in una porta di taglio seguono da vicino il benchmark "dropped edge" (Fig. ). Al contrario, gli stabilizzatori che coinvolgono una porta virtuale hanno un errore inferiore rispetto al benchmark "dropped edge" e all'implementazione SWAP (Fig. , indicatori a stella). Come metrica di qualità complessiva, riportiamo innanzitutto la somma degli errori assoluti sugli stabilizzatori dei nodi, ovvero ∑ ∈ ∣ − 1∣ (Tabella dati estesa ). Il grande overhead di SWAP è responsabile della somma degli errori assoluti di 44,3. L'errore di 13,1 nel benchmark "dropped edge" è dominato dagli otto nodi sui quattro tagli (Fig. , indicatori a stella). Al contrario, gli errori LO e LOCC sono influenzati dalle MCM. Attribuiamo l'errore aggiuntivo di 1,9 di LOCC rispetto a LO ai ritardi e alle porte CNOT nel circuito di teletrasporto e nelle coppie di Bell tagliate. Nei risultati basati su SWAP, non rileva entanglement su 35 dei 116 spigoli con un livello di confidenza del 99% (Fig. ). Per l'implementazione LO e LOCC, verifica le statistiche di entanglement bipartito su tutti gli spigoli in con un livello di confidenza del 99% (Fig. ). Queste metriche dimostrano che le porte virtuali a lungo raggio producono stabilizzatori con errori inferiori rispetto alla loro decomposizione in SWAP. Inoltre, mantengono la varianza sufficientemente bassa da verificare le statistiche di entanglement. G G V E E EE G G G E 2b–d E 2b,c 2c i V Si 1 2c 2b,d G 2e Operare due QPU come una Ora combiniamo due QPU Eagle con 127 qubit ciascuna in un'unica QPU tramite una connessione classica in tempo reale. Operare i dispositivi come un singolo processore più grande consiste nell'eseguire circuiti quantistici che si estendono sul registro di qubit più grande. Oltre alle porte unitarie e alle misurazioni eseguite contemporaneamente sulla QPU unita, utilizziamo circuiti dinamici per eseguire porte che agiscono su qubit su entrambi i dispositivi. Ciò è reso possibile da una stretta sincronizzazione e da una rapida comunicazione classica tra strumenti fisicamente separati, necessari per raccogliere i risultati delle misurazioni e determinare il flusso di controllo sull'intero sistema . 29 Testiamo questa connessione classica in tempo reale ingegnerizzando uno stato grafo su 134 qubit costruito da anelli a esagoni pesanti che si snodano attraverso entrambe le QPU (Fig. ). Questi anelli sono stati scelti escludendo i qubit affetti da sistemi a due livelli e problemi di lettura per garantire uno stato grafo di alta qualità. Questo grafo forma un anello in tre dimensioni e richiede quattro porte a lungo raggio che implementiamo con LO e LOCC. Come prima, il protocollo LOCC richiede due qubit aggiuntivi per porta tagliata per le coppie di Bell tagliate. Come nella sezione precedente, confrontiamo i nostri risultati con un grafo che non implementa gli spigoli che si estendono su entrambe le QPU. Poiché non esiste un collegamento quantistico tra i due dispositivi, un benchmark con porte SWAP è impossibile. Tutti gli spigoli esibiscono le statistiche di entanglement bipartito quando implementiamo il grafo con LO e LOCC con un livello di confidenza del 99%. Inoltre, gli stabilizzatori LO e LOCC hanno la stessa qualità del benchmark "dropped edge" per i nodi che non sono interessati da una porta a lungo raggio (Fig. ). Gli stabilizzatori interessati dalle porte a lungo raggio mostrano una grande riduzione dell'errore rispetto al benchmark "dropped edge". La somma degli errori assoluti sugli stabilizzatori dei nodi ∑ ∈ ∣ − 1∣ è 21,0, 19,2 e 12,6 per il benchmark "dropped edge", LOCC e LO, rispettivamente. Come prima, attribuiamo i 6,6 errori aggiuntivi di LOCC rispetto a LO ai ritardi e alle porte CNOT nel circuito di teletrasporto e nelle coppie di Bell tagliate. I risultati LOCC dimostrano come un circuito quantistico dinamico in cui due sottocircuiti sono collegati da un collegamento classico in tempo reale possa essere eseguito su due QPU altrimenti disgiunte. I risultati LO potrebbero essere ottenuti su un singolo dispositivo con 127 qubit al costo di un fattore 2 aggiuntivo nel tempo di esecuzione, poiché i sottocircuiti possono essere eseguiti successivamente. 3 3c i V Si , Stato grafo con bordi periodici mostrato in tre dimensioni. Gli spigoli blu sono gli spigoli tagliati. , Mappa di accoppiamento di due QPU Eagle operate come un unico dispositivo con 254 qubit. I nodi viola sono i qubit che formano lo stato grafo in e i nodi blu sono utilizzati per le coppie di Bell tagliate. , , Errore assoluto sugli stabilizzatori ( ) e sui testimoni degli spigoli ( ) implementati con LOCC (verde pieno) e LO (arancione pieno) e su un benchmark "dropped edge" graph (tratteggiato rosso) per lo stato grafo in . In e , le stelle indicano stabilizzatori e testimoni degli spigoli che sono interessati dai tagli. In e , la regione grigia è la massa di probabilità corrispondente agli stabilizzatori dei nodi e ai testimoni degli spigoli, rispettivamente, interessati dal taglio. In e , osserviamo che l'implementazione LO supera il benchmark "dropped edge", cosa che attribuiamo a migliori condizioni del dispositivo poiché questi dati sono stati raccolti in un giorno diverso da quello del benchmark e dei dati LOCC. a b a c d c d a c d c d c d Discussione e conclusione Implementiamo porte a lungo raggio con LO e LOCC. Con queste porte, ingegnerizziamo condizioni al contorno periodiche su un reticolo planare di 103 nodi e colleghiamo due processori Eagle in tempo reale per creare uno stato grafo su 134 qubit, andando oltre le capacità di un singolo chip. Qui, abbiamo scelto di implementare stati grafo come applicazione per evidenziare le proprietà scalabili dei circuiti dinamici. Le nostre fabbriche di coppie di Bell tagliate abilitano lo schema LOCC presentato nel ref. . Sia i protocolli LO che LOCC forniscono risultati di alta qualità che corrispondono strettamente a un benchmark nativo dell'hardware. Il circuit cutting aumenta la varianza delle osservabili misurate. Possiamo mantenere la varianza sotto controllo sia negli schemi LO che LOCC, come indicato dai test statistici sui testimoni. Una discussione approfondita sulla varianza misurata si trova nelle . 17 Informazioni Supplementari L'aumento della varianza dalla QPD è il motivo per cui la ricerca si concentra ora sulla riduzione dell'overhead di campionamento. È