Autori: Almudena Carrera Vazquez Caroline Tornow Diego Ristè Stefan Woerner Maika Takita Daniel J. Egger Abstract Calculatoarele cuantice procesează informații cu legile mecanicii cuantice. Hardware-ul cuantic actual este zgomotos, poate stoca informații doar pentru scurt timp și este limitat la câteva biți cuantici, adică qubiți, aranjați tipic într-o conectivitate planară . Cu toate acestea, multe aplicații ale calculului cuantic necesită o conectivitate mai mare decât rețeaua planară oferită de hardware pe mai mulți qubiți decât este disponibil pe o singură unitate de procesare cuantică (QPU). Comunitatea speră să abordeze aceste limitări prin conectarea QPU-urilor folosind comunicații clasice, ceea ce nu a fost încă dovedit experimental. Aici realizăm experimental circuite dinamice cu atenuarea erorilor și tăierea circuitelor pentru a crea stări cuantice care necesită conectivitate periodică folosind până la 142 de qubiți, cuprinzând două QPU-uri cu câte 127 de qubiți, conectate în timp real printr-o legătură clasică. Într-un circuit dinamic, porțile cuantice pot fi controlate clasic de rezultatele măsurătorilor în mijlocul circuitului în timpul execuției, adică într-o fracțiune din timpul de coerență al qubiților. Legătura noastră clasică în timp real ne permite să aplicăm o poartă cuantică pe un QPU condiționată de rezultatul unei măsurători pe un alt QPU. Mai mult, fluxul de control cu atenuarea erorilor îmbunătățește conectivitatea qubiților și setul de instrucțiuni al hardware-ului, crescând astfel versatilitatea calculatoarelor noastre cuantice. Lucrarea noastră demonstrează că putem folosi mai mulți procesoare cuantice ca unul singur, cu circuite dinamice cu atenuarea erorilor, activate de o legătură clasică în timp real. 1 Principal Calculatoarele cuantice procesează informații codificate în biți cuantici cu operațiuni unitare. Cu toate acestea, calculatoarele cuantice sunt zgomotoase, iar majoritatea arhitecturilor la scară largă aranjează qubiții fizici într-o rețea planară. Cu toate acestea, procesoarele actuale cu atenuarea erorilor pot deja simula modele Ising native hardware cu 127 de qubiți și pot măsura observabile la o scară la care abordările brute cu calculatoare clasice încep să întâmpine dificultăți . Utilitatea calculatoarelor cuantice depinde de scalarea ulterioară și de depășirea conectivității limitate a qubiților. O abordare modulară este importantă pentru scalarea procesoarelor cuantice zgomotoase actuale și pentru atingerea unui număr mare de qubiți fizici necesari pentru toleranța la erori . Arhitecturile cu ioni prinși și atomi neutri pot realiza modularitatea prin transportul fizic al qubiților , . Pe termen scurt, modularitatea în qubiții supraconductori este realizată prin interconectări pe distanță scurtă care leagă cipuri adiacente , . 1 2 3 4 5 6 7 8 Pe termen mediu, porțile pe distanță lungă care operează în regimul microundelor pot fi efectuate prin cabluri convenționale lungi , , . Acest lucru ar permite o conectivitate a qubiților non-planară, potrivită pentru o corecție eficientă a erorilor . O alternativă pe termen lung este de a încurca QPU-uri la distanță cu o legătură optică, valorificând o transducție microunde-optic , care, din câte știm, nu a fost încă demonstrată. Mai mult, circuitele dinamice extind setul de operațiuni al unui calculator cuantic prin efectuarea de măsurători în mijlocul circuitului (MCM) și prin controlarea clasică a unei porți în timpul de coerență al qubiților. Ele îmbunătățesc calitatea algoritmilor și conectivitatea qubiților . Așa cum vom arăta, circuitele dinamice permit, de asemenea, modularitatea prin conectarea QPU-urilor în timp real printr-o legătură clasică. 9 10 11 3 12 13 14 Adoptăm o abordare complementară bazată pe porți virtuale pentru a implementa interacțiuni pe distanță lungă într-o arhitectură modulară. Conectăm qubiți în locații arbitrare și creăm statisticile de încurcare printr-o descompunere quasi-probabilistică (QPD) , , . Comparăm un schemă doar cu Operații Locale (LO) cu una augmentată de Comunicații Clasice (LOCC) . Schema LO, demonstrată într-un cadru cu doi qubiți , necesită executarea mai multor circuite cuantice doar cu operațiuni locale. În contrast, pentru a implementa LOCC, consumăm perechi Bell virtuale într-un circuit de teleportare pentru a crea porți cu doi qubiți , . Pe hardware cuantic cu conectivitate rară și planară, crearea unei perechi Bell între qubiți arbitrare necesită o poartă controlată-NOT (CNOT) pe distanță lungă. Pentru a evita aceste porți, folosim un QPD peste operațiuni locale, rezultând în perechi Bell tăiate pe care teleportarea le consumă. LO nu necesită legătura clasică și este, prin urmare, mai simplu de implementat decât LOCC. Cu toate acestea, deoarece LOCC necesită doar un singur circuit șablon parametrizat, este mai eficient de compilat decât LO, iar costul QPD-ului său este mai mic decât costul schemei LO. 15 16 17 16 17 18 19 20 Lucrarea noastră aduce patru contribuții cheie. În primul rând, prezentăm circuitele cuantice și QPD-ul pentru a crea multiple perechi Bell tăiate pentru a realiza porțile virtuale din ref. . În al doilea rând, suprimăm și atenuăm erorile care apar din latența hardware-ului de control clasic în circuitele dinamice cu o combinație de decuplare dinamică și extrapolarea la zgomot zero (zero-noise extrapolation) . În al treilea rând, utilizăm aceste metode pentru a proiecta condiții de frontieră periodice pe un grafic de 103 noduri. În al patrulea rând, demonstrăm o conexiune clasică în timp real între două QPU-uri separate, demonstrând astfel că un sistem de QPU-uri distribuite poate fi operat ca unul singur printr-o legătură clasică . Combinat cu circuite dinamice, acest lucru ne permite să operăm ambele cipuri ca un singur calculator cuantic, ceea ce exemplificăm prin proiectarea unui grafic periodic care se extinde pe ambele dispozitive pe 142 de qubiți. Discutăm o cale de urmat pentru a crea porți pe distanță lungă și oferim concluzia noastră. 17 21 22 23 Tăierea circuitelor Executăm circuite cuantice mari care s-ar putea să nu fie direct executabile pe hardware-ul nostru din cauza limitărilor în numărul de qubiți sau conectivitate, prin tăierea porților. Tăierea circuitelor descompune un circuit complex în subcircuite care pot fi executate individual , , , , , . Cu toate acestea, trebuie să executăm un număr crescut de circuite, pe care le numim supraîncărcare de eșantionare (sampling overhead). Rezultatele acestor subcircuite sunt apoi combinate clasic pentru a obține rezultatul circuitului original ( ). 15 16 17 24 25 26 Metode Deoarece una dintre contribuțiile principale ale lucrării noastre este implementarea porților virtuale cu LOCC, arătăm cum să creăm perechile Bell tăiate necesare cu operațiuni locale. Aici, multiple perechi Bell tăiate sunt proiectate prin circuite cuantice parametrizate, pe care le numim fabrică de perechi Bell tăiate (Fig. ). Tăierea mai multor perechi în același timp necesită o supraîncărcare de eșantionare mai mică . Deoarece fabrica de perechi Bell tăiate formează două circuite cuantice disjuncte, plasăm fiecare subcircuit aproape de qubiți care au porți pe distanță lungă. Resursa rezultată este apoi consumată într-un circuit de teleportare. De exemplu, în Fig. , perechile Bell tăiate sunt consumate pentru a crea porți CNOT pe perechile de qubiți (0, 1) și (2, 3) (vezi secțiunea „ ”). 1b,c 17 1b Fabrici de perechi Bell tăiate , Reprezentarea unei arhitecturi IBM Quantum System Two. Aici, două QPU-uri Eagle cu 127 de qubiți sunt conectate cu o legătură clasică în timp real. Fiecare QPU este controlat de electronica sa din rack-ul său. Sincronizăm strâns ambele rack-uri pentru a opera ambele QPU-uri ca unul singur. , Circuit cuantic șablon pentru a implementa porți CNOT virtuale pe perechile de qubiți ( 0, 1) și ( 2, 3) cu LOCC prin consumarea perechilor Bell tăiate într-un circuit de teleportare. Liniile duble mov corespund legăturii clasice în timp real. , Fabrici de perechi Bell tăiate 2( ) pentru două perechi Bell tăiate simultan. QPD are un total de 27 de seturi de parametri diferite . Aici, . a b q q q q c C θ i θ i Condiții de frontieră periodice Construim o stare grafică | ⟩ cu condiții de frontieră periodice pe ibm_kyiv, un procesor Eagle , depășind limitele impuse de conectivitatea sa fizică (vezi secțiunea „ ”). Aici, are | | = 103 noduri și necesită patru muchii pe distanță lungă lr = {(1, 95), (2, 98), (6, 102), (7, 97)} între qubiții de sus și de jos ai procesorului Eagle (Fig. ). Măsurăm stabilizatorii nodurilor la fiecare nod ∈ și stabilizatorii muchiilor formați prin produsul de-a lungul fiecărei muchii ( , ) ∈ . Din acești stabilizatori, construim un martor de încurcare , care este negativ dacă există încurcare bipartită de-a lungul muchiei ( , ) ∈ (ref. ) (vezi secțiunea „ ”). Ne concentrăm pe încurcarea bipartită, deoarece aceasta este resursa pe care dorim să o recreăm cu porți virtuale. Măsurarea martorilor de încurcare între mai mult de două părți măsoară doar calitatea porților non-virtuale și a măsurătorilor, făcând impactul porților virtuale mai puțin clar. G 1 Stări grafice G V E 2a Si i V SiSj i j E i j E 27 Martor de încurcare , Graficul greu-hexagonal este pliat pe sine într-o formă tubulară prin muchiile (1, 95), (2, 98), (6, 102) și (7, 97) evidențiate în albastru. Tăiem aceste muchii. , Stabilizatorii nodurilor (sus) și martorii , (jos), cu 1 deviație standard pentru nodurile și muchiile apropiate de muchiile pe distanță lungă. Liniile punctate verticale grupează stabilizatorii și martorii în funcție de distanța lor față de muchiile tăiate. , Funcția de distribuție cumulativă a erorilor stabilizatorilor. Stelele indică stabilizatorii nodurilor care au o muchie implementată de o poartă pe distanță lungă. În benchmark-ul cu muchii tăiate (linie punctată roșie), porțile pe distanță lungă nu sunt implementate, iar stabilizatorii indicați de stele au, prin urmare, eroare unitară. Regiunea gri este masa de probabilitate corespunzătoare stabilizatorilor nodurilor afectați de tăieturi. – , În layout-urile bidimensionale, nodurile verzi duplicatează nodurile 95, 98, 102 și 97 pentru a arăta muchiile tăiate. Nodurile albastre din sunt resurse de qubiți pentru a crea perechi Bell tăiate. Culoarea nodului este eroarea absolută | − 1| a stabilizatorului măsurat, așa cum este indicat de bara de culoare. O muchie este neagră dacă statisticile de încurcare sunt detectate la un nivel de confidență de 99% și violetă dacă nu. În , porțile pe distanță lungă sunt implementate cu porți SWAP. În , aceleași porți sunt implementate cu LOCC. În , acestea nu sunt implementate deloc. a b Sj c Sj d f e i Si d e f Pregătim | ⟩ folosind trei metode diferite. Muchiile native hardware sunt întotdeauna implementate cu porți CNOT, dar condițiile de frontieră periodice sunt implementate cu (1) porți SWAP, (2) LOCC și (3) LO pentru a conecta qubiți pe întreaga rețea. Principala diferență între LOCC și LO este o operațiune de feed-forward constând din porți cu un singur qubit condiționate de 2 rezultate de măsurare, unde este numărul de tăieturi. Fiecare dintre cele 22 cazuri declanșează o combinație unică de porți și/sau pe qubiții corespunzători. Achiziționarea rezultatelor măsurătorilor, determinarea cazului corespunzător și acțiunea pe baza acestuia sunt efectuate în timp real de hardware-ul de control, cu prețul unei latențe fixe suplimentare. Atenuăm și suprimăm erorile rezultate din această latență cu extrapolarea la zgomot zero și decuplarea dinamică intercalată , (vezi secțiunea „ ”). G n n n X Z 22 21 28 Instrucțiuni de comutare a circuitelor cuantice cu atenuarea erorilor Benchmark-ăm implementările SWAP, LOCC și LO ale lui | ⟩ cu o stare grafică nativă hardware pe ′ = ( , ′) obținută prin eliminarea porților pe distanță lungă, adică, ′ = lr. Circuitul care pregătește | ′⟩ necesită, prin urmare, doar 112 porți CNOT aranjate în trei straturi, urmând topologia heavy-hexagonală a procesorului Eagle. Acest circuit va raporta erori mari la măsurarea stabilizatorilor nodurilor și muchiilor lui | ⟩ pentru nodurile de pe o muchie tăiată, deoarece este proiectat pentru a implementa | ′⟩. Ne referim la acest benchmark nativ hardware ca fiind benchmark-ul cu muchii tăiate. Circuitul bazat pe SWAP necesită 262 de porți CNOT suplimentare pentru a crea muchiile pe distanță lungă lr, ceea ce reduce drastic valoarea stabilizatorilor măsurați (Fig. ). În contrast, implementarea LOCC și LO a muchiilor din lr nu necesită porți SWAP. Erorile stabilizatorilor lor pentru nodurile care nu sunt implicate într-o poartă tăiată urmăresc îndeaproape benchmark-ul cu muchii tăiate (Fig. ). Dimpotrivă, stabilizatorii care implică o poartă virtuală au o eroare mai mică decât benchmark-ul cu muchii tăiate și implementarea SWAP (Fig. , markeri stea). Ca metrică generală de calitate, raportăm mai întâi suma erorilor absolute pe stabilizatorii nodurilor, adică, ∑ ∈ ∣ − 1∣ (Tabelul Extins al Datelor ). Supraîncărcarea mare de SWAP este responsabilă pentru eroarea sumă absolută de 44,3. Eroarea de 13,1 pe benchmark-ul cu muchii tăiate este dominată de cele opt noduri de pe cele patru tăieturi (Fig. , markeri stea). În contrast, erorile LO și LOCC sunt afectate de MCM. Atribuim eroarea suplimentară de 1,3 a LOCC peste LO latențelor și porților CNOT din circuitul de teleportare și perechile Bell tăiate. În rezultatele bazate pe SWAP, nu detectează încurcare pe 35 din cele 116 muchii la nivel de confidență de 99% (Fig. ). Pentru implementarea LO și LOCC, martorii de încurcare detectează statisticile încurcării bipartite pe toate muchiile din la nivel de confidență de 99% (Fig. ). Aceste metrici arată că porțile virtuale pe distanță lungă produc stabilizatori cu erori mai mici decât descompunerea lor în SWAP-uri. Mai mult, ele mențin varianța suficient de mică pentru a verifica statisticile de încurcare. G G V E E EE G G G E 2b–d E 2b,c 2c i V Si 1 2c 2b,d G 2e Operarea a două QPU ca unul singur Acum combinăm două QPU-uri Eagle cu câte 127 de qubiți într-un singur QPU printr-o conexiune clasică în timp real. Operarea dispozitivelor ca un procesor unic, mai mare, constă în executarea circuitelor cuantice care se extind pe registrul de qubiți mai mare. Pe lângă porțile unitare și măsurătorile care rulează concurent pe QPU-ul fuzionat, folosim circuite dinamice pentru a efectua porți care acționează pe qubiți de pe ambele dispozitive. Acest lucru este posibil printr-o sincronizare strânsă și o comunicație clasică rapidă între instrumente fizic separate, necesară pentru a colecta rezultatele măsurătorilor și a determina fluxul de control pe întregul sistem . 29 Testăm această conexiune clasică în timp real prin proiectarea unei stări grafice pe 134 de qubiți, construită din inele heavy-hexagonal care se încolăcesc prin ambele QPU-uri (Fig. ). Aceste inele au fost alese prin excluderea qubiților afectați de sistemele cu două niveluri și probleme de citire, pentru a asigura o stare grafică de înaltă calitate. Acest grafic formează un inel în trei dimensiuni și necesită patru porți pe distanță lungă pe care le implementăm cu LO și LOCC. Ca și înainte, protocolul LOCC necesită doi qubiți suplimentari per poartă tăiată pentru perechile Bell tăiate. Ca și în secțiunea precedentă, benchmark-ăm rezultatele noastre cu un grafic care nu implementează muchiile care se extind pe ambele QPU-uri. Deoarece nu există o legătură cuantică între cele două dispozitive, un benchmark cu porți SWAP este imposibil. Toate muchiile prezintă statisticile de încurcare bipartită atunci când implementăm graficul cu LO și LOCC la un nivel de confidență de 99%. Mai mult, stabilizatorii LO și LOCC au aceeași calitate ca benchmark-ul cu muchii tăiate pentru nodurile care nu sunt afectate de o poartă pe distanță lungă (Fig. ). Stabilizatorii afectați de porțile pe distanță lungă au o reducere semnificativă a erorii în comparație cu benchmark-ul cu muchii tăiate. Suma erorilor absolute pe stabilizatorii nodurilor ∑ ∈ ∣ − 1∣, este 21.0, 19.2 și 12.6 pentru benchmark-ul cu muchii tăiate, LOCC și LO, respectiv. Ca și înainte, atribuim cele 6.6 erori suplimentare ale LOCC peste LO latențelor și porților CNOT din circuitul de teleportare și perechilor Bell tăiate. Rezultatele LOCC demonstrează cum un circuit cuantic dinamic în care două subcircuite sunt conectate printr-o legătură clasică în timp real poate fi executat pe două QPU-uri altfel disjuncte. Rezultatele LO ar putea fi obținute pe un singur dispozitiv cu 127 de qubiți, cu prețul unui factor suplimentar de 2 în timpul de execuție, deoarece subcircuitele pot fi rulate succesiv. 3 3c i V Si , Stare grafică cu frontiere periodice arătată în trei dimensiuni. Muchiile albastre sunt muchiile tăiate. , Harta de cuplare a două QPU-uri Eagle operate ca un singur dispozitiv cu 254 de qubiți. Nodurile mov sunt qubiții care formează starea grafică din , iar nodurile albastre sunt folosite pentru perechile Bell tăiate. , , Eroare absolută pe stabilizatori ( ) și martori de muchie ( ) implementați cu LOCC (verde continuu) și LO (portocaliu continuu) și pe un grafic benchmark cu muchii tăiate (roșu punctat-linie) pentru starea grafică din . În a b a c d c d a