```html Forfattere: Almudena Carrera Vazquez Caroline Tornow Diego Ristè Stefan Woerner Maika Takita Daniel J. Egger Abstrakt Kvantemekaniske computere behandler information med kvantemekanikkens love. Nuværende kvantehardware er støjende, kan kun gemme information i kort tid og er begrænset til få kvantebits, dvs. qubits, typisk arrangeret i en plan konnektivitet . Mange anvendelser af kvanteberegning kræver dog mere konnektivitet end det plane gitter, som hardwaren tilbyder på flere qubits, end hvad der er tilgængeligt på en enkelt kvantebehandlingsenhed (QPU). Samfundet håber at tackle disse begrænsninger ved at forbinde QPUs ved hjælp af klassisk kommunikation, hvilket endnu ikke er bevist eksperimentelt. Her realiserer vi eksperimentelt fejltolerante dynamiske kredsløb og kredsløbsskæring for at skabe kvantetilstande, der kræver periodisk konnektivitet ved hjælp af op til 142 qubits fordelt på to QPUs med 127 qubits hver, forbundet i realtid med et klassisk link. I et dynamisk kredsløb kan kvanteporter kontrolleres klassisk af resultaterne af mid-kredsløbsmålinger inden for kørselstid, dvs. inden for en brøkdel af qubitternes kohærenstid. Vores klassiske link i realtid gør os i stand til at anvende en kvantepost på den ene QPU betinget af resultatet af en måling på den anden QPU. Desuden forbedrer den fejltolerante kontrolstrøm qubitkonnektiviteten og instruktionssættet for hardwaren, hvilket øger alsidigheden af vores kvantecomputere. Vores arbejde demonstrerer, at vi kan bruge flere kvanteprocessorer som én med fejltolerante dynamiske kredsløb muliggjort af et klassisk link i realtid. 1 Hovedindhold Kvantemekaniske computere behandler information kodet i kvantebits med unitære operationer. Kvantemekaniske computere er dog støjende, og de fleste storskalaarkitekturer arrangerer de fysiske qubits i et plant gitter. Ikke desto mindre kan nuværende processorer med fejltolerance simulere hardware-native Ising-modeller med 127 qubits og måle observerbare i en skala, hvor brute-force-metoder med klassiske computere begynder at kæmpe . Nytten af kvantemekaniske computere afhænger af yderligere skalering og overvindelse af deres begrænsede qubit-konnektivitet. En modulær tilgang er vigtig for skalering af nuværende støjende kvanteprocessorer og for at opnå de store antal fysiske qubits, der er nødvendige for fejltolerance . Fangede ion- og neutrale atomarkitekturer kan opnå modularitet ved fysisk at transportere qubits , . På kort sigt opnås modularitet i superledende qubits ved hjælp af kortrækkende forbindelser, der forbinder tilstødende chips , . 1 2 3 4 5 6 7 8 På mellemlang sigt kan langtrækkende gates, der opererer i mikrobølgeområdet, udføres over lange konventionelle kabler , , . Dette ville muliggøre ikke-plan konnektivitet af qubits, der er egnet til effektiv fejlkontrol . Et langsigtet alternativ er at sammenfiltre fjerne QPUs med et optisk link, der udnytter en mikrobølge-til-optisk transduktion , hvilket så vidt vi ved, endnu ikke er demonstreret. Desuden udvider dynamiske kredsløb sættet af operationer for en kvantecomputer ved at udføre mid-kredsløbsmålinger (MCMs) og klassisk styre en gate inden for qubitternes kohærenstid. De forbedrer algoritmisk kvalitet og qubitkonnektivitet . Som vi vil vise, muliggør dynamiske kredsløb også modularitet ved at forbinde QPUs i realtid via et klassisk link. 9 10 11 3 12 13 14 Vi tager en komplementær tilgang baseret på virtuelle gates til at implementere langtrækkende interaktioner i en modulær arkitektur. Vi forbinder qubits på vilkårlige placeringer og skaber statistikken for sammenfiltring gennem en kvasi-sandsynlighedsdekomponering (QPD) , , . Vi sammenligner et rent Local Operations (LO) skema med et udvidet med Classical Communication (LOCC) . LO-skemaet, demonstreret i en to-qubit-indstilling , kræver udførelse af flere kvantekredsløb med kun lokale operationer. Derimod, for at implementere LOCC, forbruger vi virtuelle Bell-par i et teleporteringskredsløb for at skabe to-qubit gates , . På kvantehardware med sparsom og plan konnektivitet kræver skabelse af et Bell-par mellem vilkårlige qubits en langtrækkende controlled-NOT (CNOT) gate. For at undgå disse gates bruger vi en QPD over lokale operationer, hvilket resulterer i afskårne Bell-par, som teleporteringen forbruger. LO behøver ikke det klassiske link og er derfor enklere at implementere end LOCC. Da LOCC dog kun kræver et enkelt parametriseret skabelonkredsløb, er det mere effektivt at kompilere end LO, og omkostningen ved dets QPD er lavere end omkostningen ved LO-skemaet. 15 16 17 16 17 18 19 20 Vores arbejde yder fire centrale bidrag. For det første præsenterer vi kvantekredsløbene og QPD til at skabe flere afskårne Bell-par for at realisere de virtuelle gates i ref. . For det andet undertrykker og afhjælper vi fejl, der opstår fra latenstiden for den klassiske kontrolhardware i dynamiske kredsløb med en kombination af dynamisk afkobling og nul-støj-ekstrapolation . For det tredje udnytter vi disse metoder til at konstruere periodiske grænsebetingelser på en 103-knuds graf tilstand. For det fjerde demonstrerer vi en realtids klassisk forbindelse mellem to separate QPUs, og viser dermed, at et system af distribuerede QPUs kan opereres som én via et klassisk link . Kombineret med dynamiske kredsløb gør dette os i stand til at operere begge chips som en enkelt kvantecomputer, hvilket vi eksemplificerer ved at konstruere en periodisk graf tilstand, der spænder over begge enheder på 142 qubits. Vi diskuterer en vej frem for at skabe langtrækkende gates og giver vores konklusion. 17 21 22 23 Kredsløbsskæring Vi kører store kvantekredsløb, der muligvis ikke kan udføres direkte på vores hardware på grund af begrænsninger i qubitantal eller konnektivitet ved at skære gates. Kredsløbsskæring dekomponerer et komplekst kredsløb i underkredsløb, der kan udføres individuelt , , , , , . Vi skal dog køre et øget antal kredsløb, hvilket vi kalder sampling-overhead. Resultaterne fra disse underkredsløb samles derefter klassisk for at give resultatet af det originale kredsløb ( ). 15 16 17 24 25 26 Metoder Da et af de primære bidrag i vores arbejde er implementeringen af virtuelle gates med LOCC, viser vi, hvordan man skaber de krævede afskårne Bell-par med lokale operationer. Her konstrueres flere afskårne Bell-par af parametriserede kvantekredsløb, som vi kalder en afskåret Bell-parfabrik (fig. ). Afskæring af flere par samtidigt kræver en lavere sampling-overhead . Da den afskårne Bell-parfabrik danner to disjunkte kvantekredsløb, placerer vi hvert underkredsløb tæt på qubits, der har langtrækkende gates. Den resulterende ressource forbruges derefter i et teleporteringskredsløb. For eksempel, i fig. , forbruges de afskårne Bell-par til at skabe CNOT-gates på qubit-parrene (0, 1) og (2, 3) (se sektion ' '). 1b,c 17 1b Afskårne Bell-parfabrikker , Afbildning af en IBM Quantum System Two-arkitektur. Her er to 127-qubit Eagle QPUs forbundet med et klassisk link i realtid. Hver QPU styres af sin elektronik i sit rack. Vi synkroniserer begge racks tæt for at operere begge QPUs som én. , Skabelon kvantekredsløb til at implementere virtuelle CNOT-gates på qubit-parrene ( 0, 1) og ( 2, 3) med LOCC ved at forbruge afskårne Bell-par i et teleporteringskredsløb. De lilla dobbeltlinjer svarer til det klassiske link i realtid. , Afskårne Bell-parfabrikker 2( ) for to samtidigt afskårne Bell-par. QPD'en har i alt 27 forskellige parameter-sæt . Her, . a b q q q q c C θ i θ i Periodiske grænsebetingelser Vi konstruerer en graf-tilstand | ⟩ med periodiske grænsebetingelser på ibm_kyiv, en Eagle-processor , og går ud over grænserne pålagt af dens fysiske konnektivitet (se sektion ' '). Her har antallet af knuder ∣ ∣ = 103 og kræver fire langtrækkende kanter lr = {(1, 95), (2, 98), (6, 102), (7, 97)} mellem de øverste og nederste qubits på Eagle-processoren (fig. ). Vi måler knudestabilisatorerne ved hver knude ∈ og kantstabilisatorerne dannet af produktet på tværs af hver kant ( , ) ∈ . Fra disse stabilisatorer bygger vi et sammenfiltrings-vidne , som er negativt, hvis der er bipartit sammenfiltring på tværs af kanten ( , ) ∈ (ref. ) (se sektion ' '). Vi fokuserer på bipartit sammenfiltring, da dette er den ressource, vi ønsker at genskabe med virtuelle gates. Måling af vidner om sammenfiltring mellem mere end to parter vil kun måle kvaliteten af de ikke-virtuelle gates og målinger, hvilket gør effekten af de virtuelle gates mindre klar. G 1 Graf-tilstande G V E 2a Si i V SiSj i j E i j E 27 Sammenfiltrings-vidne , Den tunge-sekskantede graf foldes på sig selv til en rørformet form af kanterne (1, 95), (2, 98), (6, 102) og (7, 97) fremhævet i blåt. Vi skærer disse kanter. , Knudestabilisatorerne (øverst) og vidnerne , (nederst), med 1 standardafvigelse for knuderne og kanterne tæt på de langtrækkende kanter. Lodrette stiplede linjer grupperer stabilisatorer og vidner efter deres afstand til afskårne kanter. , Kumulativ fordelingsfunktion for stabilisatorfejlene. Stjernerne indikerer knudestabilisatorer , der har en kant implementeret af en langtrækkende gate. I benchmark for faldne kanter (stiplet rød linje) er de langtrækkende gates ikke implementeret, og de stjerneindikerende stabilisatorer har dermed enhedsstøj. Den grå region er sandsynlighedsmasse, der svarer til knudestabilisatorer påvirket af afskæringerne. – , I de todimensionelle layouts duplikerer de grønne knuder knuderne 95, 98, 102 og 97 for at vise de afskårne kanter. De blå knuder i er qubitressourcer til at skabe afskårne Bell-par. Farven på knude er den absolutte fejl ∣ − 1∣ af den målte stabilisator, som angivet af farvebjælken. En kant er sort, hvis sammenfiltringsstatistikker detekteres med 99 % konfidensniveau, og violet, hvis ikke. I implementeres de langtrækkende gates med SWAP-gates. I implementeres de samme gates med LOCC. I implementeres de slet ikke. a b Sj c Sj d f e i Si d e f Vi forbereder | ⟩ ved hjælp af tre forskellige metoder. Hardware-native kanter implementeres altid med CNOT-gates, men de periodiske grænsebetingelser implementeres med (1) SWAP-gates, (2) LOCC og (3) LO til at forbinde qubits på tværs af hele gitteret. Den primære forskel mellem LOCC og LO er en feed-forward operation, der består af enkelt-qubit gates betinget af 2 målingsresultater, hvor er antallet af afskæringer. Hvert af de 22 tilfælde udløser en unik kombination af - og/eller -gates på de relevante qubits. Indsamling af målingsresultaterne, bestemmelse af den tilsvarende sag og handling baseret herpå udføres i realtid af kontrolhardwaren, til omkostningen af en fast tilføjet latenstid. Vi afhjælper og undertrykker de fejl, der resulterer fra denne latenstid, med nul-støj-ekstrapolation og forskudt dynamisk afkobling , (se sektion ' '). G n n n X Z 22 21 28 Fejltolerante kvantekredsløb skifteinstruktioner Vi benchmark-tester SWAP-, LOCC- og LO-implementeringerne af | ⟩ med en hardware-native graf-tilstand på ′ = ( , ′) opnået ved at fjerne de langtrækkende gates, dvs. ′ = lr. Kredsløbet, der forbereder | ′⟩, kræver derfor kun 112 CNOT-gates arrangeret i tre lag efter den tunge-sekskantede topologi af Eagle-processoren. Dette kredsløb vil rapportere store fejl ved måling af knude- og kantstabilisatorerne af | ⟩ for knuder på en afskåret gate, da det er designet til at implementere | ′⟩. Vi refererer til dette hardware-native benchmark som benchmark for faldne kanter. Kredsløbet baseret på SWAP kræver yderligere 262 CNOT-gates for at skabe de langtrækkende kanter lr, hvilket drastisk reducerer værdien af de målte stabilisatorer (fig. ). I modsætning hertil kræver LOCC- og LO-implementeringen af kanterne i lr ingen SWAP-gates. Fejlene på deres knude- og kantstabilisatorer for knuder, der ikke er involveret i en afskåret gate, følger tæt benchmark for faldne kanter (fig. ). Omvendt har stabilisatorerne, der involverer en virtuel gate, en lavere fejl end benchmark for faldne kanter og SWAP-implementeringen (fig. , stjernemarkører). Som en overordnet kvalitetsmetrik rapporterer vi først summen af absolutte fejl på knudestabilisatorerne, dvs. ∑ ∈ ∣ − 1∣ (Udvidet Datatabel ). Den store SWAP-overhead er ansvarlig for den absolutte fejlsum på 44,3. Fejlen på 13,1 i benchmark for faldne kanter domineres af de otte knuder på de fire afskæringer (fig. , stjernemarkører). Derimod påvirkes LO- og LOCC-fejlene af MCMs. Vi tilskriver den yderligere fejl på 1,9 ved LOCC over LO forsinkelserne og CNOT-gates i teleporteringskredsløbet og afskårne Bell-par. I SWAP-baserede resultater detekterer ikke sammenfiltring på tværs af 35 af de 116 kanter med 99 % konfidensniveau (fig. ). For LO- og LOCC-implementeringen vidner om statistikken for bipartit sammenfiltring på tværs af alle kanter i med 99 % konfidensniveau (fig. ). Disse metrikker viser, at virtuelle langtrækkende gates producerer stabilisatorer med mindre fejl end deres dekomponering i SWAPs. Desuden holder de variansen lav nok til at verificere sammenfiltringsstatistikkerne. G G V E E EE G G G E 2b–d E 2b,c 2c i V Si 1 2c 2b,d G 2e Drift af to QPUs som én Vi kombinerer nu to Eagle QPUs med 127 qubits hver til en enkelt QPU via en realtids klassisk forbindelse. Drift af enhederne som en enkelt, større processor består i at udføre kvantekredsløb, der spænder over det større qubitregister. Bortset fra unitære gates og målinger, der kører samtidigt på den sammensmeltede QPU, bruger vi dynamiske kredsløb til at udføre gates, der virker på qubits på begge enheder. Dette muliggøres af tæt synkronisering og hurtig klassisk kommunikation mellem fysisk separate instrumenter, der er nødvendige for at indsamle målingsresultater og bestemme kontrolstrømmen på tværs af hele systemet . 29 Vi tester denne realtids klassiske forbindelse ved at konstruere en graf-tilstand på 134 qubits bygget af tunge-sekskantede ringe, der snor sig gennem begge QPUs (fig. ). Disse ringe blev valgt ved at udelukke qubits, der var plaget af to-niveau-systemer og aflæsningsproblemer, for at sikre en graf-tilstand af høj kvalitet. Denne graf danner en ring i tre dimensioner og kræver fire langtrækkende gates, som vi implementerer med LO og LOCC. Som før kræver LOCC-protokollen derfor to ekstra qubits pr. afskåret gate for de afskårne Bell-par. Som i den foregående sektion benchmark-tester vi vores resultater mod en graf, der ikke implementerer kanterne, der spænder over begge QPUs. Da der ikke er noget kvantemekanisk link mellem de to enheder, er et benchmark med SWAP-gates umuligt. Alle kanter udviser sammenfiltringsstatistikker for bipartit sammenfiltring, når vi implementerer grafen med LO og LOCC med 99 % konfidensniveau. Desuden har LO- og LOCC-stabilisatorerne samme kvalitet som benchmark for faldne kanter for knuder, der ikke er påvirket af en langtrækkende gate (fig. ). Stabilisatorer påvirket af langtrækkende gates har en stor reduktion i fejl sammenlignet med benchmark for faldne kanter. Summen af absolutte fejl på knudestabilisatorerne ∑ ∈ ∣ − 1∣ er 21,0, 19,2 og 12,6 for henholdsvis benchmark for faldne kanter, LOCC og LO. Som før tilskriver vi de 6,6 yderligere fejl ved LOCC over LO forsinkelserne og CNOT-gates i teleporteringskredsløbet og afskårne Bell-par. LOCC-resultaterne demonstrerer, hvordan et dynamisk kvantekredsløb, hvor to underkredsløb er forbundet af et klassisk link i realtid, kan udføres på to ellers adskilte QPUs. LO-resultaterne kunne opnås på en enkelt enhed med 127 qubits til omkostningen af en yderligere faktor 2 i kørselstid, da underkredsløbene kan køres successivt. 3 3c i V Si , Graf-tilstand med periodiske grænser vist i tre dimensioner. De blå kanter er de afskårne kanter. , Koblingskort over to Eagle QPUs, der opereres som en enkelt enhed med 254 qubits. De lilla knuder er de qubits, der danner graf-tilstanden i , og de blå knuder bruges til afskårne Bell-par. , , Absolut fejl på stabilisatorerne ( ) og kantvidnerne ( ) implementeret med LOCC (solid grøn) og LO (solid orange) og på en graf for benchmark med faldne kanter (stiplet rød) for graf-tilstanden i& a b a c d c d