Autoren: Almudena Carrera Vazquez Caroline Tornow Diego Ristè Stefan Woerner Maika Takita Daniel J. Egger Zusammenfassung Quantencomputer verarbeiten Informationen nach den Gesetzen der Quantenmechanik. Aktuelle Quantenhardware ist fehlerbehaftet, kann Informationen nur für kurze Zeit speichern und ist auf wenige Qubits, d.h. Qubits, beschränkt, die typischerweise in einer planaren Konnektivität angeordnet sind . Viele Anwendungen des Quantencomputings erfordern jedoch eine stärkere Konnektivität als das planare Gitter, das die Hardware auf mehr Qubits bietet, als auf einem einzelnen Quantenprozessoreinheit (QPU) verfügbar sind. Die Community hofft, diese Einschränkungen durch die Verbindung von QPUs über klassische Kommunikation zu überwinden, was experimentell noch nicht bewiesen wurde. Hier realisieren wir experimentell fehlergeminderte dynamische Schaltungen und Schaltungsschnitte, um Quantenzustände zu erzeugen, die eine periodische Konnektivität mit bis zu 142 Qubits erfordern, die sich über zwei QPUs mit jeweils 127 Qubits erstrecken und in Echtzeit mit einem klassischen Link verbunden sind. In einer dynamischen Schaltung können Quantengatter klassisch durch die Ergebnisse von Mid-Circuit-Messungen zur Laufzeit gesteuert werden, d.h. innerhalb eines Bruchteils der Kohärenzzeit der Qubits. Unser klassischer Echtzeit-Link ermöglicht es uns, ein Quantengatter auf einer QPU anzuwenden, das auf dem Ergebnis einer Messung auf einer anderen QPU basiert. Darüber hinaus verbessert die fehlergeminderte Ablaufsteuerung die Qubit-Konnektivität und den Befehlssatz der Hardware und erhöht somit die Vielseitigkeit unserer Quantencomputer. Unsere Arbeit zeigt, dass wir mehrere Quantenprozessoren als einen mit fehlergeminderten dynamischen Schaltungen nutzen können, die durch einen klassischen Echtzeit-Link ermöglicht werden. 1 Hauptteil Quantencomputer verarbeiten Informationen, die in Qubits kodiert sind, mit unitären Operationen. Quantencomputer sind jedoch fehlerbehaftet, und die meisten groß angelegten Architekturen ordnen die physischen Qubits in einem planaren Gitter an. Nichtsdestotrotz können aktuelle Prozessoren mit Fehlerreduzierung bereits hardware-native Ising-Modelle mit 127 Qubits simulieren und Observablen in einem Umfang messen, bei dem brute-force-Ansätze mit klassischen Computern an ihre Grenzen stoßen . Die Nützlichkeit von Quantencomputern hängt von weiterer Skalierung und der Überwindung ihrer begrenzten Qubit-Konnektivität ab. Ein modularer Ansatz ist für die Skalierung aktueller fehlerbehafteter Quantenprozessoren wichtig und für das Erreichen der großen Anzahl an physischen Qubits, die für Fehlertoleranz erforderlich sind . Gefangen-Ionen- und Neutralatom-Architekturen können Modularität erreichen, indem sie die Qubits physisch transportieren , . Kurzfristig wird die Modularität bei supraleitenden Qubits durch Kurzstreckenverbindungen erreicht, die benachbarte Chips verbinden , . 1 2 3 4 5 6 7 8 Mittelfristig können Langstrecken-Gatter im Mikrowellenbereich über lange konventionelle Kabel durchgeführt werden , , . Dies würde eine nicht-planare Qubit-Konnektivität ermöglichen, die für eine effiziente Fehlerkorrektur geeignet ist . Eine langfristige Alternative ist die Verschränkung entfernter QPUs mit einem optischen Link, der eine Mikrowellen-zu-Optik-Transduktion nutzt , die unseres Wissens noch nicht demonstriert wurde. Darüber hinaus erweitern dynamische Schaltungen den Satz von Operationen eines Quantencomputers, indem sie Mid-Circuit-Messungen (MCMs) durchführen und klassisch ein Gatter innerhalb der Kohärenzzeit der Qubits steuern. Sie verbessern die algorithmische Qualität und die Qubit-Konnektivität . Wie wir zeigen werden, ermöglichen dynamische Schaltungen auch Modularität, indem sie QPUs in Echtzeit über einen klassischen Link verbinden. 9 10 11 3 12 13 14 Wir verfolgen einen komplementären Ansatz, der auf virtuellen Gattern zur Implementierung von Langstreckenwechselwirkungen in einer modularen Architektur basiert. Wir verbinden Qubits an beliebigen Orten und erzeugen die Statistik der Verschränkung durch eine quasi-Wahrscheinlichkeitszerlegung (QPD) , , . Wir vergleichen ein reines Local Operations (LO) Schema mit einem, das durch Classical Communication (LOCC) erweitert wurde . Das LO-Schema, das in einer Zwei-Qubit-Einstellung demonstriert wurde , erfordert die Ausführung mehrerer Quantenschaltungen nur mit lokalen Operationen. Im Gegensatz dazu verbrauchen wir für die Implementierung von LOCC virtuelle Bell-Paare in einer Teleportationsschaltung, um Zwei-Qubit-Gatter zu erzeugen , . Auf Quantenhardware mit spärlicher und planarer Konnektivität erfordert die Erzeugung eines Bell-Paares zwischen beliebigen Qubits ein Langstrecken-Controlled-NOT (CNOT)-Gatter. Um diese Gatter zu vermeiden, verwenden wir eine QPD über lokale Operationen, was zu geschnittenen Bell-Paaren führt, die die Teleportation verbraucht. LO benötigt keine klassische Verbindung und ist daher einfacher zu implementieren als LOCC. Da LOCC jedoch nur eine einzige parametrisierte Schaltungsvorlage benötigt, ist es effizienter zu kompilieren als LO, und die Kosten seiner QPD sind geringer als die des LO-Schemas. 15 16 17 16 17 18 19 20 Unsere Arbeit leistet vier wichtige Beiträge. Erstens stellen wir die Quantenschaltungen und die QPD zur Erzeugung mehrerer geschnittener Bell-Paare vor, um die virtuellen Gatter in ref. zu implementieren. Zweitens unterdrücken und mindern wir die Fehler, die aus der Latenz der klassischen Steuerungs-Hardware in dynamischen Schaltungen resultieren , mit einer Kombination aus dynamischer Entkopplung und Null-Rausch-Extrapolation . Drittens nutzen wir diese Methoden, um periodische Randbedingungen auf einem 103-Knoten-Graph-Zustand zu erzeugen. Viertens demonstrieren wir eine klassische Echtzeitverbindung zwischen zwei separaten QPUs und zeigen damit, dass ein System verteilter QPUs über einen klassischen Link als eines betrieben werden kann . In Kombination mit dynamischen Schaltungen ermöglicht uns dies, beide Chips als einen einzigen Quantencomputer zu betreiben, was wir durch die Erzeugung eines periodischen Graph-Zustands, der sich über beide Geräte auf 142 Qubits erstreckt, veranschaulichen. Wir diskutieren einen Weg nach vorn zur Erzeugung von Langstrecken-Gattern und geben unsere Schlussfolgerung. 17 21 22 23 Schaltungsschnitt Wir führen große Quantenschaltungen aus, die aufgrund von Einschränkungen bei der Qubit-Anzahl oder Konnektivität möglicherweise nicht direkt auf unserer Hardware ausführbar sind, indem wir Gatter schneiden. Schaltungsschnitte zerlegen eine komplexe Schaltung in Unterabschnitte, die einzeln ausgeführt werden können , , , , , . Wir müssen jedoch eine erhöhte Anzahl von Schaltungen ausführen, die wir als Sampling-Overhead bezeichnen. Die Ergebnisse dieser Unterabschnitte werden dann klassisch rekombiniert, um das Ergebnis der ursprünglichen Schaltung zu erzielen ( ). 15 16 17 24 25 26 Methoden Da einer der Hauptbeiträge unserer Arbeit die Implementierung virtueller Gatter mit LOCC ist, zeigen wir, wie die erforderlichen geschnittenen Bell-Paare mit lokalen Operationen erzeugt werden können. Hier werden mehrere geschnittene Bell-Paare durch parametrisierte Quantenschaltungen erzeugt, die wir als geschnittene Bell-Paar-Fabrik bezeichnen (Abb. ). Das gleichzeitige Schneiden mehrerer Paare erfordert einen geringeren Sampling-Overhead . Da die geschnittene Bell-Paar-Fabrik zwei disjunkte Quantenschaltungen bildet, platzieren wir jede Unterabschnitt in der Nähe von Qubits, die Langstreckengatter aufweisen. Die resultierende Ressource wird dann in einer Teleportationsschaltung verbraucht. Zum Beispiel werden in Abb. die geschnittenen Bell-Paare verwendet, um CNOT-Gatter auf den Qubit-Paaren (0, 1) und (2, 3) zu erzeugen (siehe Abschnitt „ “). 1b,c 17 1b Cut Bell pair factories , Darstellung einer IBM Quantum System Two-Architektur. Hier sind zwei 127-Qubit-Eagle-QPUs mit einem klassischen Echtzeit-Link verbunden. Jede QPU wird von ihrer Elektronik in ihrem Rack gesteuert. Wir synchronisieren beide Racks eng, um beide QPUs als eine zu betreiben. , Vorlagenschaltung zur Implementierung virtueller CNOT-Gatter auf Qubit-Paaren ( 0, 1) und ( 2, 3) mit LOCC durch Verbrauch von geschnittenen Bell-Paaren in einer Teleportationsschaltung. Die violetten Doppellinien entsprechen dem klassischen Echtzeit-Link. , Geschnittene Bell-Paar-Fabriken 2( ) für zwei gleichzeitig geschnittene Bell-Paare. Die QPD hat insgesamt 27 verschiedene Parametersätze . Hier, . a b q q q q c C θ i θ i Periodische Randbedingungen Wir konstruieren einen Graph-Zustand | ⟩ mit periodischen Randbedingungen auf ibm_kyiv, einem Eagle-Prozessor , der über die Grenzen seiner physischen Konnektivität hinausgeht (siehe Abschnitt „ “). Hier hat 103 Knoten und erfordert vier Langstreckenkanten lr = {(1, 95), (2, 98), (6, 102), (7, 97)} zwischen den oberen und unteren Qubits des Eagle-Prozessors (Abb. ). Wir messen die Knoten-Stabilisatoren an jedem Knoten ∈ und die Kanten-Stabilisatoren, die aus dem Produkt über jede Kante ( , ) ∈ gebildet werden. Aus diesen Stabilisatoren bauen wir eine Verschränkungs-Zeugin , die negativ ist, wenn eine bipartitäre Verschränkung über die Kante ( , ) ∈ vorliegt (ref. ) (siehe Abschnitt „ “). Wir konzentrieren uns auf bipartitäre Verschränkung, da dies die Ressource ist, die wir mit virtuellen Gattern nachbilden wollen. Das Messen von Zeugen für Verschränkungen zwischen mehr als zwei Parteien misst nur die Qualität der nicht-virtuellen Gatter und Messungen, wodurch die Auswirkung der virtuellen Gatter weniger klar wird. G 1 Graph states G E 2a Si i V SiSj i j E i j E 27 Entanglement witness , Der schwere-hexagonale Graph wird durch die Kanten (1, 95), (2, 98), (6, 102) und (7, 97), die blau hervorgehoben sind, zu einer Röhrenform gefaltet. Wir schneiden diese Kanten. , Die Knoten-Stabilisatoren (oben) und Zeugen , (unten), mit 1 Standardabweichung für die Knoten und Kanten nahe den Langstreckenkanten. Vertikale gestrichelte Linien gruppieren Stabilisatoren und Zeugen nach ihrer Entfernung zu geschnittenen Kanten. , Kumulative Verteilungsfunktion der Stabilisatorfehler. Die Sterne kennzeichnen Knoten-Stabilisatoren , die eine durch ein Langstrecken-Gatter implementierte Kante haben. Im Benchmark mit fallengelassener Kante (strichpunktierte rote Linie) werden die Langstrecken-Gatter nicht implementiert und die sterngekennzeichneten Stabilisatoren haben somit einen Fehler von eins. Der graue Bereich ist die Wahrscheinlichkeitsmasse, die den vom Schnitt betroffenen Knoten-Stabilisatoren entspricht. – , In den zweidimensionalen Layouts duplizieren die grünen Knoten die Knoten 95, 98, 102 und 97, um die geschnittenen Kanten zu zeigen. Die blauen Knoten in sind Qubit-Ressourcen zur Erzeugung geschnittener Bell-Paare. Die Farbe des Knotens ist der absolute Fehler ∣ − 1∣ des gemessenen Stabilisators, wie durch die Farbleiste angezeigt. Eine Kante ist schwarz, wenn Verschränkungsstatistiken auf einem 99%-Konfidenzniveau erkannt werden, und violett, wenn nicht. In werden die Langstrecken-Gatter mit SWAP-Gattern implementiert. In werden dieselben Gatter mit LOCC implementiert. In werden sie gar nicht implementiert. a b Sj c Sj d f e i Si d e f Wir bereiten | ⟩ mit drei verschiedenen Methoden vor. Die hardware-nativen Kanten werden immer mit CNOT-Gattern implementiert, aber die periodischen Randbedingungen werden mit (1) SWAP-Gattern, (2) LOCC und (3) LO implementiert, um Qubits über das gesamte Gitter zu verbinden. Der Hauptunterschied zwischen LOCC und LO ist eine Feed-Forward-Operation, die aus Ein-Qubit-Gattern besteht, die auf 2 Messergebnissen basieren, wobei die Anzahl der Schnitte ist. Jeder der 22 Fälle löst eine eindeutige Kombination von - und/oder -Gattern auf den entsprechenden Qubits aus. Das Erfassen der Messergebnisse, die Bestimmung des entsprechenden Falls und das Handeln danach erfolgt in Echtzeit durch die Steuerungs-Hardware, was mit einer festen zusätzlichen Latenz verbunden ist. Wir mindern und unterdrücken die Fehler, die aus dieser Latenz resultieren, mit Null-Rausch-Extrapolation und gestaffelter dynamischer Entkopplung , (siehe Abschnitt „ “). G n n n X Z 22 21 28 Error-mitigated quantum circuit switch instructions Wir benchmarken die SWAP-, LOCC- und LO-Implementierungen von | ⟩ mit einem hardware-nativen Graph-Zustand auf ′ = ( , ′), der durch Entfernen der Langstrecken-Gatter erhalten wird, d.h. ′ = lr. Die Schaltung zur Vorbereitung von | ′⟩ erfordert somit nur 112 CNOT-Gatter, die in drei Schichten gemäß der Heavy-Hexagonal-Topologie des Eagle-Prozessors angeordnet sind. Diese Schaltung wird große Fehler bei der Messung der Knoten- und Kanten-Stabilisatoren von | ⟩ für Knoten eines geschnittenen Gatters melden, da sie für die Implementierung von | ′⟩ konzipiert ist. Wir bezeichnen dieses hardware-native Benchmark als Benchmark mit fallengelassener Kante. Die SWAP-basierte Schaltung erfordert zusätzliche 262 CNOT-Gatter zur Erzeugung der Langstreckenkanten lr, was den Wert der gemessenen Stabilisatoren drastisch reduziert (Abb. ). Im Gegensatz dazu erfordert die LOCC- und LO-Implementierung der Kanten in lr keine SWAP-Gatter. Die Fehler ihrer Knoten- und Kanten-Stabilisatoren für Knoten, die nicht an einem geschnittenen Gatter beteiligt sind, folgen eng dem Benchmark mit fallengelassener Kante (Abb. ). Umgekehrt haben die Stabilisatoren, die ein virtuelles Gatter beinhalten, einen geringeren Fehler als der Benchmark mit fallengelassener Kante und die SWAP-Implementierung (Abb. , Sternchenmarkierungen). Als Gesamtqualitätsmetrik berichten wir zunächst die Summe der absoluten Fehler an den Knoten-Stabilisatoren, d.h. ∑ ∈ ∣ − 1∣ (Erweiterte Datentabelle ). Der hohe SWAP-Overhead ist verantwortlich für den absoluten Fehler von 44,3 in der Summe. Der Fehler von 13,1 im Benchmark mit fallengelassener Kante wird von den acht Knoten an den vier Schnitten dominiert (Abb. , Sternchenmarkierungen). Im Gegensatz dazu sind die LO- und LOCC-Fehler von MCMs betroffen. Wir schreiben den zusätzlichen Fehler von 1,9 von LOCC gegenüber LO den Verzögerungen und den CNOT-Gattern in der Teleportationsschaltung und den geschnittenen Bell-Paaren zu. In den SWAP-basierten Ergebnissen erkennt keine Verschränkung über 35 der 116 Kanten mit einer Wahrscheinlichkeit von 99% (Abb. ). Für die LO- und LOCC-Implementierung bestätigt die Statistik der bipartitären Verschränkung über alle Kanten in mit einer Wahrscheinlichkeit von 99% (Abb. ). Diese Metriken zeigen, dass virtuelle Langstrecken-Gatter Stabilisatoren mit geringeren Fehlern erzeugen als ihre Zerlegung in SWAPs. Darüber hinaus halten sie die Varianz niedrig genug, um die Statistik der Verschränkung zu überprüfen. G G V E E EE G G G E 2b–d E 2b,c 2c i V Si 1 2c 2b,d G 2e Betrieb von zwei QPUs als eine Wir kombinieren nun zwei Eagle QPUs mit jeweils 127 Qubits zu einer einzigen QPU über eine klassische Echtzeitverbindung. Der Betrieb der Geräte als ein einziger, größerer Prozessor besteht darin, Quantenschaltungen auszuführen, die sich über das größere Qubitregister erstrecken. Abgesehen von unitären Gattern und Messungen, die gleichzeitig auf der zusammengeführten QPU laufen, verwenden wir dynamische Schaltungen, um Gatter auszuführen, die auf Qubits auf beiden Geräten wirken. Dies wird durch eine enge Synchronisation und schnelle klassische Kommunikation zwischen physisch getrennten Instrumenten ermöglicht, die erforderlich ist, um Messergebnisse zu sammeln und den Kontrollfluss über das gesamte System zu bestimmen . 29 Wir testen diese klassische Echtzeitverbindung durch die Erzeugung eines Graph-Zustands auf 134 Qubits, der aus Heavy-Hexagonal-Ringen aufgebaut ist, die sich durch beide QPUs schlängeln (Abb. ). Diese Ringe wurden durch Ausschluss von Qubits gewählt, die von Zweipunkt-Systemen und Ausleseproblemen betroffen waren, um einen hochwertigen Graph-Zustand zu gewährleisten. Dieser Graph bildet einen Ring in drei Dimensionen und erfordert vier Langstrecken-Gatter, die wir mit LO und LOCC implementieren. Wie zuvor erfordert das LOCC-Protokoll zwei zusätzliche Qubits pro geschnittenem Gatter für die geschnittenen Bell-Paare. Wie im vorherigen Abschnitt benchmarken wir unsere Ergebnisse mit einem Graphen, der die Kanten, die beide QPUs überspannen, nicht implementiert. Da es keine Quantenverbindung zwischen den beiden Geräten gibt, ist ein Benchmark mit SWAP-Gattern unmöglich. Alle Kanten weisen die Statistik der bipartitären Verschränkung auf, wenn wir den Graphen mit LO und LOCC mit einer Wahrscheinlichkeit von 99% implementieren. Darüber hinaus haben die LO- und LOCC-Stabilisatoren die gleiche Qualität wie der Benchmark mit fallengelassener Kante für Knoten, die nicht von einem Langstrecken-Gatter betroffen sind (Abb. ). Stabilisatoren, die von Langstrecken-Gattern betroffen sind, weisen eine starke Fehlerreduzierung im Vergleich zum Benchmark mit fallengelassener Kante auf. Die Summe der absoluten Fehler an den Knoten-Stabilisatoren ∑ ∈ ∣ − 1∣ beträgt 21,0, 19,2 und 12,6 für den Benchmark mit fallengelassener Kante, LOCC bzw. LO. Wie zuvor schreiben wir die 6,6 zusätzlichen Fehler von LOCC gegenüber LO den Verzögerungen und den CNOT-Gattern in der Teleportationsschaltung und den geschnittenen Bell-Paaren zu. Die LOCC-Ergebnisse zeigen, wie eine dynamische Quantenschaltung, bei der zwei Unterabschnitte durch einen klassischen Echtzeit-Link verbunden sind, auf zwei ansonsten getrennten QPUs ausgeführt werden kann. Die LO-Ergebnisse könnten auf einem einzigen Gerät mit 127 Qubits mit zusätzlichen Kosten des Zweifachen der Laufzeit erzielt werden, da die Unterabschnitte nacheinander ausgeführt werden können. 3 3c i V Si , Graph-Zustand mit periodischen Rändern in drei Dimensionen gezeigt. Die blauen Kanten sind die geschnittenen Kanten. , Kopplungs-Map von zwei Eagle QPUs, die als ein Gerät mit 254 Qubits betrieben werden. Die violetten Knoten sind die Qubits, die den Graph-Zustand in bilden, und die blauen Knoten werden für geschnittene Bell-Paare verwendet. , , Absoluter Fehler an den Stabilisatoren ( ) und Kantenzeugen ( ) implementiert mit LOCC (durchgezogen grün) und LO (durchgezogen orange) und auf einem Benchmark-Graphen mit fallengelassener Kante (punktiert-gestrichelt rot) für den Graph-Zustand in . In und zeigen die Sterne Stabilisatoren und Kantenzeugen, die von den Schnitten betroffen sind. In und ist der graue Bereich die Wahrscheinlichkeitsmasse, die den betroffenen Knoten-Stabilisatoren und Kantenzeugen entspricht. In und beobachten wir, dass die LO-Implementierung den Benchmark mit fallengelassener Kante übertrifft, was wir besseren Gerätebedingungen zuschreiben, da diese Daten an einem anderen Tag als die Benchmark- und LOCC-Daten aufgenommen wurden. a b a c d c d a c d c d c d Diskussion und Fazit Wir implementieren Langstrecken-Gatter mit LO und LOCC. Mit diesen Gattern erzeugen wir periodische Randbedingungen auf einem planaren Gitter mit