Autoren: Almudena Carrera Vazquez Caroline Tornow Diego Ristè Stefan Woerner Maika Takita Daniel J. Egger Zusammenfassung Quantencomputer verarbeiten Informationen mit den Gesetzen der Quantenmechanik. Aktuelle Quantenhardware ist fehlerbehaftet, kann Informationen nur für kurze Zeit speichern und ist auf wenige Quantenbits, also Qubits, beschränkt, die typischerweise in einer planaren Konnektivität angeordnet sind . Viele Anwendungen des Quantencomputings erfordern jedoch eine höhere Konnektivität als das planare Gitter, das von der Hardware auf mehr Qubits angeboten wird, als auf einer einzelnen Quantenprozessoreinheit (QPU) verfügbar sind. Die Community hofft, diese Einschränkungen durch die Verbindung von QPUs über klassische Kommunikation zu überwinden, was experimentell noch nicht bewiesen wurde. Hier realisieren wir experimentell fehlergeminderte dynamische Schaltungen und Schaltungsschneiden, um Quantenzustände zu erstellen, die eine periodische Konnektivität erfordern, und verwenden bis zu 142 Qubits, die sich über zwei QPUs mit jeweils 127 Qubits erstrecken und in Echtzeit über eine klassische Verbindung verbunden sind. In einer dynamischen Schaltung können Quantengatter klassisch durch die Ergebnisse von Mid-Circuit-Messungen während der Laufzeit gesteuert werden, d. h. innerhalb eines Bruchteils der Kohärenzzeit der Qubits. Unsere klassische Echtzeitverbindung ermöglicht es uns, einen Quantengatter auf einer QPU anzuwenden, der vom Ergebnis einer Messung auf einer anderen QPU abhängt. Darüber hinaus verbessern die fehlergeminderte Ablaufsteuerung die Qubit-Konnektivität und den Befehlssatz der Hardware und erhöhen somit die Vielseitigkeit unserer Quantencomputer. Unsere Arbeit zeigt, dass wir mehrere Quantenprozessoren als einen einzigen mit fehlergeminderten dynamischen Schaltungen, die durch eine klassische Echtzeitverbindung ermöglicht werden, nutzen können. 1 Hauptteil Quantencomputer verarbeiten Informationen, die in Quantenbits kodiert sind, mit unitären Operationen. Quantencomputer sind jedoch fehlerbehaftet, und die meisten groß angelegten Architekturen ordnen die physischen Qubits in einem planaren Gitter an. Dennoch können aktuelle Prozessoren mit Fehlerunterdrückung bereits hardware-native Ising-Modelle mit 127 Qubits simulieren und Observablen in einem Maßstab messen, bei dem brute-force-Ansätze mit klassischen Computern an ihre Grenzen stoßen . Die Nützlichkeit von Quantencomputern hängt von weiterer Skalierung und der Überwindung ihrer begrenzten Qubit-Konnektivität ab. Ein modularer Ansatz ist wichtig für die Skalierung aktueller fehleranfälliger Quantenprozessoren und für das Erreichen der großen Anzahl physischer Qubits, die für Fehlertoleranz erforderlich sind . Fallen-Ionen- und Neutralatom-Architekturen können Modularität durch physischen Transport der Qubits erreichen , . Kurzfristig wird die Modularität bei supraleitenden Qubits durch Kurzstreckenverbindungen erreicht, die benachbarte Chips verbinden , . 1 2 3 4 5 6 7 8 Mittelfristig können Weitbereichsgatter im Mikrowellenbereich über konventionelle Kabel durchgeführt werden , , . Dies würde eine nicht-planare Qubit-Konnektivität ermöglichen, die für eine effiziente Fehlerkorrektur geeignet ist . Eine langfristige Alternative ist die Verschränkung entfernter QPUs mit einem optischen Link, der eine Mikrowellen-zu-optischer-Transduktion nutzt , was unseres Wissens noch nicht demonstriert wurde. Darüber hinaus erweitern dynamische Schaltungen den Satz von Operationen eines Quantencomputers durch Durchführung von Mid-Circuit-Messungen (MCMs) und klassische Steuerung eines Gatters innerhalb der Kohärenzzeit der Qubits. Sie verbessern die algorithmische Qualität und die Qubit-Konnektivität . Wie wir zeigen werden, ermöglichen dynamische Schaltungen auch Modularität durch Echtzeitverbindung von QPUs über eine klassische Verbindung. 9 10 11 3 12 13 14 Wir verfolgen einen komplementären Ansatz, der auf virtuellen Gattern basiert, um Weitbereichs-Wechselwirkungen in einer modularen Architektur zu implementieren. Wir verbinden Qubits an beliebigen Stellen und erzeugen die Verschränkungsstatistik durch eine quasi-Wahrscheinlichkeitszerlegung (QPD) , , . Wir vergleichen ein reines Local Operations (LO) Schema mit einem, das durch Classical Communication (LOCC) ergänzt wird . Das LO-Schema, das in einem Zwei-Qubit-Setting demonstriert wurde , erfordert die Ausführung mehrerer Quantenschaltungen nur mit lokalen Operationen. Im Gegensatz dazu verbrauchen wir für die Implementierung von LOCC virtuelle Bell-Paare in einer Teleportationsschaltung, um Zwei-Qubit-Gatter zu erzeugen , . Auf Quantenhardware mit spärlicher und planarer Konnektivität erfordert die Erzeugung eines Bell-Paares zwischen beliebigen Qubits ein Weitbereichs-Controlled-NOT (CNOT)-Gatter. Um diese Gatter zu vermeiden, verwenden wir eine QPD über lokale Operationen, was zu geschnittenen Bell-Paaren führt, die die Teleportation verbraucht. LO benötigt keine klassische Verbindung und ist daher einfacher zu implementieren als LOCC. Da LOCC jedoch nur eine einzige parametrisierte Schablonenschaltung benötigt, ist es effizienter zu kompilieren als LO und die Kosten seiner QPD sind geringer als die des LO-Schemas. 15 16 17 16 17 18 19 20 Unsere Arbeit leistet vier wesentliche Beiträge. Erstens stellen wir die Quantenschaltungen und die QPD vor, um mehrere geschnittene Bell-Paare zu erzeugen, die die virtuellen Gatter in Ref. implementieren. Zweitens unterdrücken und mindern wir die Fehler, die aus der Latenz der klassischen Steuerhardware in dynamischen Schaltungen resultieren , mit einer Kombination aus dynamischer Entkopplung und Null-Rausch-Extrapolation . Drittens nutzen wir diese Methoden, um periodische Randbedingungen auf einem 103-Knoten-Graphzustand zu realisieren. Viertens demonstrieren wir eine Echtzeit-Klassikverbindung zwischen zwei separaten QPUs, was beweist, dass ein System verteilter QPUs über eine klassische Verbindung als ein einziges betrieben werden kann . In Kombination mit dynamischen Schaltungen ermöglicht uns dies, beide Chips als einen einzigen Quantencomputer zu betreiben, was wir durch die Realisierung eines periodischen Graphzustands, der sich über beide Geräte auf 142 Qubits erstreckt, veranschaulichen. Wir diskutieren einen Weg zur Erzeugung von Weitbereichsgattern und geben unsere Schlussfolgerung an. 17 21 22 23 Schaltungsschneiden Wir führen große Quantenschaltungen aus, die aufgrund von Einschränkungen bei der Qubit-Anzahl oder Konnektivität möglicherweise nicht direkt auf unserer Hardware ausführbar sind, indem wir Gatter schneiden. Das Schaltungsschneiden zerlegt eine komplexe Schaltung in Teil-Schaltungen, die einzeln ausgeführt werden können , , , , , . Wir müssen jedoch eine erhöhte Anzahl von Schaltungen ausführen, was wir als Sampling-Overhead bezeichnen. Die Ergebnisse dieser Teil-Schaltungen werden dann klassisch kombiniert, um das Ergebnis der ursprünglichen Schaltung zu liefern ( ). 15 16 17 24 25 26 Methoden Da einer der Hauptbeiträge unserer Arbeit die Implementierung virtueller Gatter mit LOCC ist, zeigen wir, wie die erforderlichen geschnittenen Bell-Paare mit lokalen Operationen erstellt werden. Hier werden mehrere geschnittene Bell-Paare durch parametrisierte Quantenschaltungen, die wir als geschnittene Bell-Paar-Fabrik bezeichnen, erzeugt (Abb. ). Das gleichzeitige Schneiden mehrerer Paare erfordert einen geringeren Sampling-Overhead . Da die geschnittene Bell-Paar-Fabrik zwei disjunkte Quantenschaltungen bildet, platzieren wir jede Teil-Schaltung in der Nähe von Qubits, die Weitbereichsgatter aufweisen. Die resultierende Ressource wird dann in einer Teleportationsschaltung verbraucht. Beispielsweise werden in Abb. die geschnittenen Bell-Paare zum Erzeugen von CNOT-Gattern auf den Qubit-Paaren (0, 1) und (2, 3) verwendet (siehe Abschnitt ' '). 1b,c 17 1b Cut Bell pair factories , Darstellung einer IBM Quantum System Two-Architektur. Hier sind zwei Eagle QPUs mit 127 Qubits über eine klassische Echtzeitverbindung verbunden. Jede QPU wird von ihrer Elektronik in ihrem Rack gesteuert. Wir synchronisieren beide Racks eng, um beide QPUs als eine zu betreiben. , Schablonen-Quantenschaltung zur Implementierung virtueller CNOT-Gatter auf den Qubit-Paaren ( 0, 1) und ( 2, 3) mit LOCC durch Verbrauch von geschnittenen Bell-Paaren in einer Teleportationsschaltung. Die violetten Doppellinien entsprechen der klassischen Echtzeitverbindung. , Geschnittene Bell-Paar-Fabriken 2( ) für zwei gleichzeitig geschnittene Bell-Paare. Die QPD hat insgesamt 27 verschiedene Parametersätze . Hier. a b q q q q c C θ i θ i Periodische Randbedingungen Wir konstruieren einen Graphzustand | ⟩ mit periodischen Randbedingungen auf ibm_kyiv, einem Eagle-Prozessor , der über die Grenzen seiner physischen Konnektivität hinausgeht (siehe Abschnitt ' '). Hier hat ∣ ∣ = 103 Knoten und erfordert vier Weitbereichskanten lr = {(1, 95), (2, 98), (6, 102), (7, 97)} zwischen den oberen und unteren Qubits des Eagle-Prozessors (Abb. ). Wir messen die Knotenstabilisatoren an jedem Knoten ∈ und die Kantenstabilisatoren, die sich aus dem Produkt über jede Kante ( , ) ∈ bilden. Aus diesen Stabilisatoren bauen wir eine Verschränkungs-Zeugin , die negativ ist, wenn Verschränkung über die Kante ( , ) ∈ vorliegt (Ref. ) (siehe Abschnitt ' '). Wir konzentrieren uns auf bipolare Verschränkung, da dies die Ressource ist, die wir mit virtuellen Gattern wiederherstellen wollen. Das Messen von Zeuginnen für Verschränkung zwischen mehr als zwei Parteien misst nur die Qualität der nicht-virtuellen Gatter und Messungen, was die Auswirkung der virtuellen Gatter weniger klar macht. G 1 Graph states G V E 2a Si i V SiSj i j E i j E 27 Entanglement witness , Der schwer-hexagonalen Graph wird durch die Kanten (1, 95), (2, 98), (6, 102) und (7, 97), die blau hervorgehoben sind, zu einer röhrenförmigen Form gefaltet. Wir schneiden diese Kanten. , Die Knotenstabilisatoren (oben) und Zeuginnen , (unten) mit 1 Standardabweichung für die Knoten und Kanten nahe den Weitbereichskanten. Vertikale gestrichelte Linien gruppieren Stabilisatoren und Zeuginnen nach ihrer Entfernung zu geschnittenen Kanten. , Kumulative Verteilungsfunktion der Stabilisatorfehler. Die Sterne zeigen Knotenstabilisatoren an, die eine durch ein Weitbereichsgatter implementierte Kante haben. Im Benchmark mit wegfallender Kante (gestrichelt-punktierte rote Linie) sind die Weitbereichsgatter nicht implementiert und die sternchen-gekennzeichneten Stabilisatoren weisen somit Einheitsfehler auf. Der graue Bereich ist die Wahrscheinlichkeitsmasse, die den von den Schnitten betroffenen Knotenstabilisatoren entspricht. – , In den zweidimensionalen Layouts duplizieren die grünen Knoten die Knoten 95, 98, 102 und 97, um die geschnittenen Kanten darzustellen. Die blauen Knoten in sind Qubit-Ressourcen zur Erzeugung geschnittener Bell-Paare. Die Farbe des Knotens ist der absolute Fehler ∣ − 1∣ des gemessenen Stabilisators, wie durch die Farbskala angezeigt. Eine Kante ist schwarz, wenn Verschränkungsstatistiken auf einem 99%-Konfidenzniveau erkannt werden, und violett, wenn nicht. In werden die Weitbereichsgatter mit SWAP-Gattern implementiert. In werden dieselben Gatter mit LOCC implementiert. In werden sie überhaupt nicht implementiert. a b Sj c Sj d f e i Si d e f Wir bereiten | ⟩ mit drei verschiedenen Methoden vor. Die hardware-nativen Kanten werden immer mit CNOT-Gattern implementiert, aber die periodischen Randbedingungen werden mit (1) SWAP-Gattern, (2) LOCC und (3) LO implementiert, um Qubits über das gesamte Gitter zu verbinden. Der Hauptunterschied zwischen LOCC und LO ist eine Feed-Forward-Operation, die aus Ein-Qubit-Gattern besteht, die von 2 Messergebnissen abhängen, wobei die Anzahl der Schnitte ist. Jeder der 22 Fälle löst eine eindeutige Kombination von - und/oder -Gattern auf den entsprechenden Qubits aus. Die Erfassung der Messergebnisse, die Bestimmung des entsprechenden Falls und das Handeln darauf basierend erfolgen in Echtzeit durch die Steuerhardware, was mit einer festen zusätzlichen Latenz verbunden ist. Wir mindern und unterdrücken die Fehler, die aus dieser Latenz resultieren, mit Null-Rausch-Extrapolation und gestaffelter dynamischer Entkopplung , (siehe Abschnitt ' '). G n n n X Z 22 21 28 Error-mitigated quantum circuit switch instructions Wir vergleichen die SWAP-, LOCC- und LO-Implementierungen von | ⟩ mit einem hardware-nativen Graphzustand auf ′ = ( , ′), der durch Entfernen der Weitbereichskanten, d.h. von ′ = lr, erhalten wird. Die Schaltung, die | ′⟩ erzeugt, erfordert somit nur 112 CNOT-Gatter, die in drei Schichten angeordnet sind und der schwer-hexagonalen Topologie des Eagle-Prozessors folgen. Diese Schaltung wird große Fehler bei der Messung der Knoten- und Kantenstabilisatoren von | ⟩ für Knoten an einem Schnitt melden, da sie zur Implementierung von | ′⟩ entwickelt wurde. Wir bezeichnen dieses hardware-native Benchmark als Dropped-Edge-Benchmark. Die Swap-basierte Schaltung erfordert zusätzliche 262 CNOT-Gatter, um die Weitbereichskanten lr zu erzeugen, was den Wert der gemessenen Stabilisatoren drastisch reduziert (Abb. ). Im Gegensatz dazu erfordert die LOCC- und LO-Implementierung der Kanten in lr keine SWAP-Gatter. Die Fehler ihrer Knoten- und Kantenstabilisatoren für Knoten, die nicht an einem Schnitt beteiligt sind, folgen eng dem Dropped-Edge-Benchmark (Abb. ). Umgekehrt weisen die Stabilisatoren, die ein virtuelles Gatter betreffen, einen geringeren Fehler als der Dropped-Edge-Benchmark und die Swap-Implementierung auf (Abb. , Sternchen-Markierungen). Als Gesamtqualitätsmetrik berichten wir zunächst die Summe der absoluten Fehler auf den Knotenstabilisatoren, d.h. ∑ ∈ ∣ − 1∣ (Erweiterte Datentabelle ). Der hohe SWAP-Overhead ist für den absoluten Summenfehler von 44,3 verantwortlich. Der Fehler von 13,1 im Dropped-Edge-Benchmark wird von den acht Knoten an den vier Schnitten dominiert (Abb. , Sternchen-Markierungen). Im Gegensatz dazu werden die LO- und LOCC-Fehler durch MCMs beeinflusst. Wir führen den zusätzlichen Fehler von 1,9 bei LOCC gegenüber LO auf die Verzögerungen und die CNOT-Gatter in der Teleportationsschaltung und den geschnittenen Bell-Paaren zurück. In den Swap-basierten Ergebnissen erkennt keine Verschränkung über 35 der 116 Kanten mit einer Wahrscheinlichkeit von 99% (Abb. ). Für die LO- und LOCC-Implementierung bezeugt die Statistik der bipolaren Verschränkung über alle Kanten in mit 99%iger Wahrscheinlichkeit (Abb. ). Diese Metriken zeigen, dass virtuelle Weitbereichsgatter Stabilisatoren mit geringeren Fehlern erzeugen als ihre Zerlegung in SWAPs. Darüber hinaus halten sie die Varianz niedrig genug, um die Verschränkungsstatistiken zu verifizieren. G G V E E EE G G G E 2b–d E 2b,c 2c i V Si 1 2c 2b,d G 2e Betrieb zweier QPUs als eine Wir kombinieren nun zwei Eagle QPUs mit jeweils 127 Qubits zu einer einzigen QPU über eine klassische Echtzeitverbindung. Der Betrieb der Geräte als ein einziger, größerer Prozessor besteht darin, Quantenschaltungen auszuführen, die sich über das größere Qubit-Register erstrecken. Abgesehen von unitären Gattern und Messungen, die gleichzeitig auf der zusammengeführten QPU laufen, verwenden wir dynamische Schaltungen, um Gatter auszuführen, die auf Qubits auf beiden Geräten wirken. Dies wird durch eine enge Synchronisation und schnelle klassische Kommunikation zwischen physisch getrennten Instrumenten ermöglicht, die erforderlich sind, um Messergebnisse zu sammeln und den Kontrollfluss über das gesamte System zu bestimmen . 29 Wir testen diese klassische Echtzeitverbindung, indem wir einen Graphzustand auf 134 Qubits erstellen, der aus schwer-hexagonalen Ringen aufgebaut ist, die sich durch beide QPUs winden (Abb. ). Diese Ringe wurden ausgewählt, indem Qubits ausgeschlossen wurden, die von Zweizustandssystemen und Auslesefehlern betroffen waren, um einen qualitativ hochwertigen Graphzustand zu gewährleisten. Dieser Graph bildet einen Ring in drei Dimensionen und erfordert vier Weitbereichsgatter, die wir mit LO und LOCC implementieren. Wie zuvor erfordert das LOCC-Protokoll somit zwei zusätzliche Qubits pro geschnittenem Gatter für die geschnittenen Bell-Paare. Wie im vorherigen Abschnitt vergleichen wir unsere Ergebnisse mit einem Graphen, der die Kanten, die beide QPUs überspannen, nicht implementiert. Da keine Quantenverbindung zwischen den beiden Geräten besteht, ist ein Benchmark mit SWAP-Gattern unmöglich. Alle Kanten weisen mit 99%iger Wahrscheinlichkeit die Statistik bipolare Verschränkung auf, wenn wir den Graphen mit LO und LOCC implementieren. Darüber hinaus weisen die LO- und LOCC-Stabilisatoren die gleiche Qualität wie der Dropped-Edge-Benchmark für Knoten auf, die nicht von einem Weitbereichsgatter betroffen sind (Abb. ). Stabilisatoren, die von Weitbereichsgattern betroffen sind, zeigen eine erhebliche Fehlerreduzierung im Vergleich zum Dropped-Edge-Benchmark. Die Summe der absoluten Fehler auf den Knotenstabilisatoren ∑ ∈ ∣ − 1∣ beträgt 21,0, 19,2 und 12,6 für den Dropped-Edge-Benchmark, LOCC bzw. LO. Wie zuvor führen wir die 6,6 zusätzlichen Fehler von LOCC gegenüber LO auf die Verzögerungen und die CNOT-Gatter in der Teleportationsschaltung und den geschnittenen Bell-Paaren zurück. Die LOCC-Ergebnisse zeigen, wie eine dynamische Quantenschaltung, bei der zwei Teil-Schaltungen durch eine klassische Echtzeitverbindung verbunden sind, auf zwei ansonsten getrennten QPUs ausgeführt werden kann. Die LO-Ergebnisse könnten auf einem einzigen Gerät mit 127 Qubits zu den Kosten eines zusätzlichen Faktors 2 in der Laufzeit erzielt werden, da die Teil-Schaltungen nacheinander ausgeführt werden können. 3 3c i V Si , Graphzustand mit periodischen Rändern in drei Dimensionen dargestellt. Die blauen Kanten sind die geschnittenen Kanten. , Kopplungsabbildung von zwei Eagle QPUs, die als ein einziges Gerät mit 254 Qubits betrieben werden. Die violetten Knoten sind die Qubits, die den Graphzustand in bilden, und die blauen Knoten werden für geschnittene Bell-Paare verwendet. , , Absoluter Fehler bei den Stabilisatoren ( ) und Kantenzeuginnen ( ), die mit LOCC (durchgezogenes Grün) und LO (durchgezogenes Orange) und auf einem Dropped-Edge-Benchmark-Graphen (gestrichelt-punktiert Rot) für den Graphzustand in implementiert sind. In und zeigen die Sterne Stabilisatoren und Kantenzeuginnen an, die von den Schnitten betroffen sind. In und ist der graue Bereich die Wahrscheinlichkeitsmasse, die den Knotenstabilisatoren bzw. Kantenzeuginnen entspricht, die vom Schnitt betroffen sind. In und beobachten wir, dass die LO-Implementierung den Dropped-Edge-Benchmark übertrifft, was wir besseren Gerätebedingungen zuschreiben, da diese Daten an einem anderen Tag als die Benchmark- und LOCC-Daten aufgenommen wurden. a b a c d c d a c d c d c d Diskussion und Schlussfolgerung Wir implementieren Weitbereichsgatter mit LO und LOCC. Mit diesen Gattern realisieren wir periodische Randbedingungen auf einem 103-Knoten-Planargitter und verbinden zwei Eagle-Prozessoren in Echtzeit, um einen Graphzustand auf 134 Qubits