Autoren: Almudena Carrera Vazquez Caroline Tornow Diego Ristè Stefan Woerner Maika Takita Daniel J. Egger Zusammenfassung Quantencomputer verarbeiten Informationen mithilfe der Gesetze der Quantenmechanik. Aktuelle Quantenhardware ist fehlerbehaftet, kann Informationen nur für kurze Zeit speichern und ist auf wenige Quantenbits, d.h. Qubits, beschränkt, die typischerweise in einer planaren Konnektivität angeordnet sind . Viele Anwendungen des Quantencomputings erfordern jedoch eine höhere Konnektivität als das planare Gitter, das von der Hardware auf mehr Qubits geboten wird, als auf einer einzelnen Quantenprozessoreinheit (QPU) verfügbar sind. Die Community hofft, diese Einschränkungen durch die Verbindung von QPUs über klassische Kommunikation zu überwinden, was experimentell noch nicht nachgewiesen wurde. Hier realisieren wir experimentell fehlergemilderte dynamische Schaltungen und Schaltungsschnitte, um Quantenzustände zu erstellen, die eine periodische Konnektivität erfordern, unter Verwendung von bis zu 142 Qubits, die sich über zwei QPUs mit jeweils 127 Qubits erstrecken und in Echtzeit mit einem klassischen Link verbunden sind. In einer dynamischen Schaltung können Quantengatter klassisch durch die Ergebnisse von Messungen während der Schaltung gesteuert werden, d.h. innerhalb eines Bruchteils der Kohärenzzeit der Qubits. Unser klassischer Echtzeit-Link ermöglicht es uns, ein Quantengatter auf einer QPU basierend auf dem Ergebnis einer Messung auf einer anderen QPU anzuwenden. Darüber hinaus verbessert die fehlergemilderte Steuerung die Qubit-Konnektivität und den Befehlssatz der Hardware und erhöht somit die Vielseitigkeit unserer Quantencomputer. Unsere Arbeit zeigt, dass wir mehrere Quantenprozessoren als einen einzigen mit fehlergemilderten dynamischen Schaltungen betreiben können, die durch einen klassischen Echtzeit-Link ermöglicht werden. 1 Hauptteil Quantencomputer verarbeiten Informationen, die in Quantenbits kodiert sind, mit unitären Operationen. Quantencomputer sind jedoch fehlerbehaftet, und die meisten groß angelegten Architekturen ordnen die physikalischen Qubits in einem planaren Gitter an. Nichtsdestotrotz können aktuelle Prozessoren mit Fehlerkorrektur native Ising-Modelle mit 127 Qubits simulieren und Beobachtungsgrößen in einem Maßstab messen, bei dem Brute-Force-Ansätze mit klassischen Computern zu kämpfen beginnen . Der Nutzen von Quantencomputern hängt von weiterer Skalierung und der Überwindung ihrer begrenzten Qubit-Konnektivität ab. Ein modularer Ansatz ist für die Skalierung aktueller fehleranfälliger Quantenprozessoren und für die Erzielung der großen Anzahl von physikalischen Qubits, die für Fehlertoleranz erforderlich sind , wichtig. Gefangene Ionen- und Neutralatom-Architekturen können Modularität durch physikalischen Transport der Qubits erreichen , . Kurzfristig wird Modularität in supraleitenden Qubits durch kurzreichweitige Verbindungen erreicht, die benachbarte Chips verbinden , . 1 2 3 4 5 6 7 8 Mittelfristig können langreichweitige Gatter im Mikrowellenbereich über lange herkömmliche Kabel , , durchgeführt werden. Dies würde eine nicht-planare Qubit-Konnektivität ermöglichen, die für eine effiziente Fehlerkorrektur geeignet ist . Eine langfristige Alternative ist die Verschränkung entfernter QPUs mit einem optischen Link, der eine Mikrowellen-zu-optische-Transduktion nutzt , die unseres Wissens noch nicht demonstriert wurde. Darüber hinaus erweitern dynamische Schaltungen den Satz von Operationen eines Quantencomputers durch Messungen während der Schaltung (MCMs) und die klassische Steuerung eines Gatters innerhalb der Kohärenzzeit der Qubits. Sie verbessern die algorithmische Qualität und die Qubit-Konnektivität . Wie wir zeigen werden, ermöglichen dynamische Schaltungen auch Modularität, indem sie QPUs in Echtzeit über einen klassischen Link verbinden. 9 10 11 3 12 13 14 Wir verfolgen einen komplementären Ansatz, der auf virtuellen Gattern basiert, um langreichweitige Wechselwirkungen in einer modularen Architektur zu implementieren. Wir verbinden Qubits an beliebigen Stellen und erzeugen die Entanglement-Statistik durch eine Quasi-Wahrscheinlichkeitszerlegung (QPD) , , . Wir vergleichen ein reines Lokale-Operationen (LO)-Schema mit einem, das durch Klassische-Kommunikation (LOCC) erweitert wurde . Das LO-Schema, das in einer Zwei-Qubit-Einstellung demonstriert wurde , erfordert die Ausführung mehrerer Quantenschaltungen nur mit lokalen Operationen. Im Gegensatz dazu verbrauchen wir für die Implementierung von LOCC virtuelle Bell-Paare in einer Teleportationsschaltung, um Zwei-Qubit-Gatter zu erzeugen , . Auf Quantenhardware mit spärlicher und planarer Konnektivität erfordert die Erzeugung eines Bell-Paares zwischen beliebigen Qubits ein langreichweitiges Controlled-NOT (CNOT)-Gatter. Um diese Gatter zu vermeiden, verwenden wir eine QPD über lokale Operationen, was zu geschnittenen Bell-Paaren führt, die die Teleportation verbraucht. LO benötigt den klassischen Link nicht und ist daher einfacher zu implementieren als LOCC. Da LOCC jedoch nur eine einzige parametrisierte Vorlagenschaltung erfordert, ist sie effizienter zu kompilieren als LO und die Kosten ihrer QPD sind niedriger als die des LO-Schemas. 15 16 17 16 17 18 19 20 Unsere Arbeit leistet vier wichtige Beiträge. Erstens präsentieren wir die Quantenschaltungen und QPD, um mehrere geschnittene Bell-Paare zu erstellen und die virtuellen Gatter in Ref. zu realisieren. Zweitens unterdrücken und mildern wir die Fehler, die aus der Latenz der klassischen Steuerhardware in dynamischen Schaltungen resultieren , durch eine Kombination aus dynamischer Entkopplung und Null-Rausch-Extrapolation . Drittens nutzen wir diese Methoden, um periodische Randbedingungen auf einem 103-Knoten-Graphzustand zu entwickeln. Viertens demonstrieren wir eine Echtzeit-Klassische-Verbindung zwischen zwei separaten QPUs und zeigen damit, dass ein System verteilter QPUs über einen klassischen Link als ein einziges betrieben werden kann . Kombiniert mit dynamischen Schaltungen ermöglicht uns dies, beide Chips als einen einzigen Quantencomputer zu betreiben, was wir durch die Entwicklung eines periodischen Graphzustands, der sich über beide Geräte auf 142 Qubits erstreckt, veranschaulichen. Wir diskutieren einen Weg zur Erzeugung langreichweitiger Gatter und geben unsere Schlussfolgerung. 17 21 22 23 Schaltungsschnitt Wir führen große Quantenschaltungen aus, die aufgrund von Einschränkungen bei der Qubit-Anzahl oder -Konnektivität möglicherweise nicht direkt auf unserer Hardware ausführbar sind, indem wir Gatter schneiden. Das Schaltungsschneiden zerlegt eine komplexe Schaltung in Teilschaltungen, die einzeln ausgeführt werden können , , , , , . Wir müssen jedoch eine erhöhte Anzahl von Schaltungen ausführen, die wir als Sampling-Overhead bezeichnen. Die Ergebnisse dieser Teilschaltungen werden dann klassisch neu kombiniert, um das Ergebnis der ursprünglichen Schaltung zu erzielen ( ). 15 16 17 24 25 26 Methoden Da einer der Hauptbeiträge unserer Arbeit die Implementierung virtueller Gatter mit LOCC ist, zeigen wir, wie die erforderlichen geschnittenen Bell-Paare mit lokalen Operationen erstellt werden. Hier werden mehrere geschnittene Bell-Paare durch parametrisierte Quantenschaltungen erzeugt, die wir als geschnittenen Bell-Paar-Fabrik bezeichnen (Abb. ). Das gleichzeitige Schneiden mehrerer Paare erfordert einen geringeren Sampling-Overhead . Da die geschnittene Bell-Paar-Fabrik zwei disjunkte Quantenschaltungen bildet, platzieren wir jede Teilschaltung in der Nähe von Qubits, die langreichweitige Gatter aufweisen. Die resultierende Ressource wird dann in einer Teleportationsschaltung verbraucht. Zum Beispiel werden in Abb. die geschnittenen Bell-Paare verwendet, um CNOT-Gatter auf den Qubit-Paaren (0, 1) und (2, 3) zu erzeugen (siehe Abschnitt „ “). 1b,c 17 1b Geschnittene Bell-Paar-Fabriken , Darstellung einer IBM Quantum System Two Architektur. Hier sind zwei 127-Qubit-Eagle-QPUs mit einem Echtzeit-Klassik-Link verbunden. Jede QPU wird von ihrer Elektronik in ihrem Rack gesteuert. Wir synchronisieren beide Racks eng, um beide QPUs als eine zu betreiben. , Vorlagenschaltung zur Implementierung virtueller CNOT-Gatter auf Qubit-Paaren ( 0, 1) und ( 2, 3) mit LOCC durch Verbrauch geschnittener Bell-Paare in einer Teleportationsschaltung. Die violetten Doppellinien entsprechen dem Echtzeit-Klassik-Link. , Geschnittene Bell-Paar-Fabriken 2( ) für zwei gleichzeitig geschnittene Bell-Paare. Die QPD hat insgesamt 27 verschiedene Parametersätze . Hierbei gilt. a b q q q q c C θ i θ i Periodische Randbedingungen Wir konstruieren einen Graphenzustand | ⟩ mit periodischen Randbedingungen auf ibm_kyiv, einem Eagle-Prozessor , der über die Grenzen seiner physikalischen Konnektivität hinausgeht (siehe Abschnitt „ “). Hier hat Knoten und erfordert vier langreichweitige Kanten lr = {(1, 95), (2, 98), (6, 102), (7, 97)} zwischen den oberen und unteren Qubits des Eagle-Prozessors (Abb. ). Wir messen die Knotenstabilisatoren an jedem Knoten ∈ und die Kantenstabilisatoren, die sich aus dem Produkt über jede Kante ( , ) ∈ bilden. Aus diesen Stabilisatoren bauen wir eine Entanglement-Zeugin , die negativ ist, wenn eine bipartitionierte Verschränkung über die Kante ( , ) ∈ vorliegt (Ref. ) (siehe Abschnitt „ “). Wir konzentrieren uns auf die bipartitionierte Verschränkung, da dies die Ressource ist, die wir mit virtuellen Gattern neu erzeugen wollen. Die Messung von Zeuginnen der Verschränkung zwischen mehr als zwei Parteien misst nur die Qualität der nicht-virtuellen Gatter und Messungen, wodurch die Auswirkung der virtuellen Gatter weniger klar wird. G 1 Graphzustände G n E 2a Si i V SiSj i j E i j E 27 Entanglement-Zeugin , Der schwer-hexagonale Graph wird durch die Kanten (1, 95), (2, 98), (6, 102) und (7, 97) in blau hervorgehoben, zu einer Röhrenform gefaltet. Wir schneiden diese Kanten. , Die Knotenstabilisatoren (oben) und Zeuginnen , (unten), mit 1 Standardabweichung für die Knoten und Kanten nahe den langreichweitigen Kanten. Vertikale gestrichelte Linien gruppieren Stabilisatoren und Zeuginnen nach ihrer Entfernung zu geschnittenen Kanten. , Kumulative Verteilungsfunktion der Stabilisatorfehler. Die Sterne zeigen Knotenstabilisatoren an, die eine Kante haben, die durch ein langreichweitiges Gatter implementiert wird. Im „Dropped Edge“-Benchmark (gestrichelt-rote Linie) werden die langreichweitigen Gatter nicht implementiert und die sterngekennzeichneten Stabilisatoren haben daher einen Fehler von eins. Der graue Bereich ist die Wahrscheinlichkeitsmasse, die den Knotenstabilisatoren entspricht, die von den Schnitten betroffen sind. – , In den zweidimensionalen Layouts duplizieren die grünen Knoten die Knoten 95, 98, 102 und 97, um die geschnittenen Kanten darzustellen. Die blauen Knoten in sind Qubit-Ressourcen zur Erzeugung geschnittener Bell-Paare. Die Farbe des Knotens ist der absolute Fehler ∣ − 1∣ des gemessenen Stabilisators, wie durch die Farbleiste angezeigt. Eine Kante ist schwarz, wenn Entanglement-Statistiken mit einer Konfidenz von 99 % erkannt werden, und violett, wenn nicht. In werden die langreichweitigen Gatter mit SWAP-Gattern implementiert. In werden dieselben Gatter mit LOCC implementiert. In werden sie überhaupt nicht implementiert. a b Sj c Sj d f e i Si d e f Wir bereiten | ⟩ mit drei verschiedenen Methoden vor. Die hardware-nativen Kanten werden immer mit CNOT-Gattern implementiert, aber die periodischen Randbedingungen werden mit (1) SWAP-Gattern, (2) LOCC und (3) LO über das gesamte Gitter verbunden implementiert. Der Hauptunterschied zwischen LOCC und LO ist eine Feed-Forward-Operation, die aus Ein-Qubit-Gattern besteht, die von 2 Messergebnissen abhängen, wobei die Anzahl der Schnitte ist. Jeder der 22 Fälle löst eine eindeutige Kombination von - und/oder -Gattern auf den entsprechenden Qubits aus. Die Erfassung der Messergebnisse, die Bestimmung des entsprechenden Falls und die darauf basierende Aktion werden in Echtzeit von der Steuerhardware durchgeführt, was mit einer festen zusätzlichen Latenz verbunden ist. Wir mildern und unterdrücken die Fehler, die sich aus dieser Latenz ergeben, mit Null-Rausch-Extrapolation und gestaffelter dynamischer Entkopplung , (siehe Abschnitt „ “). G n n n X Z 22 21 28 Fehlergemilderte Quantenschaltungs-Switch-Anweisungen Wir benchmarken die SWAP-, LOCC- und LO-Implementierungen von | ⟩ mit einem hardware-nativen Graphzustand auf ′ = ( , ′), der durch Entfernen der langreichweitigen Gatter erhalten wird, d.h. ′ = lr. Die Schaltung zur Vorbereitung von | ′⟩ erfordert somit nur 112 CNOT-Gatter, die in drei Schichten angeordnet sind und der schwer-hexagonale Topologie des Eagle-Prozessors folgen. Diese Schaltung wird große Fehler bei der Messung der Knoten- und Kantenstabilisatoren von | ⟩ für Knoten an einem Schnitt melden, da sie zur Implementierung von | ′⟩ entwickelt wurde. Wir bezeichnen diesen hardware-nativen Benchmark als „Dropped Edge“-Benchmark. Die SWAP-basierte Schaltung erfordert zusätzliche 262 CNOT-Gatter zur Erzeugung der langreichweitigen Kanten lr, was den Wert der gemessenen Stabilisatoren drastisch reduziert (Abb. ). Im Gegensatz dazu erfordert die LOCC- und LO-Implementierung der Kanten in lr keine SWAP-Gatter. Die Fehler ihrer Knoten- und Kantenstabilisatoren für Knoten, die nicht an einem geschnittenen Gatter beteiligt sind, folgen eng dem „Dropped Edge“-Benchmark (Abb. ). Umgekehrt haben die Stabilisatoren, die ein virtuelles Gatter betreffen, einen geringeren Fehler als der „Dropped Edge“-Benchmark und die SWAP-Implementierung (Abb. , Sternchenmarkierungen). Als allgemeine Qualitätsmetrik berichten wir zuerst die Summe der absoluten Fehler auf den Knotenstabilisatoren, d.h. ∑ ∈ ∣ − 1∣ (Erweiterte Datentabelle ). Der hohe SWAP-Overhead ist für den absoluten Fehler von 44,3 verantwortlich. Der Fehler von 13,1 im „Dropped Edge“-Benchmark wird von den acht Knoten an den vier Schnitten dominiert (Abb. , Sternchenmarkierungen). Im Gegensatz dazu werden die LO- und LOCC-Fehler durch MCMs beeinflusst. Wir schreiben den zusätzlichen Fehler von 1,9 von LOCC gegenüber LO den Verzögerungen und den CNOT-Gattern in der Teleportationsschaltung und den geschnittenen Bell-Paaren zu. Bei den SWAP-basierten Ergebnissen erkennt keine Verschränkung über 35 der 116 Kanten mit einer Konfidenz von 99 % (Abb. ). Für die LO- und LOCC-Implementierung bestätigt die Statistik der bipartitionierten Verschränkung über alle Kanten in mit einer Konfidenz von 99 % (Abb. ). Diese Metriken zeigen, dass virtuelle langreichweitige Gatter Stabilisatoren mit geringeren Fehlern erzeugen als ihre Zerlegung in SWAPs. Darüber hinaus halten sie die Varianz niedrig genug, um die Statistik der Verschränkung zu überprüfen. G G V E E EE G G G E 2b–d E 2b,c 2c i V Si 1 2c 2b,d G 2e Betrieb von zwei QPUs als eine Wir kombinieren nun zwei Eagle QPUs mit jeweils 127 Qubits zu einer einzigen QPU über eine Echtzeit-Klassik-Verbindung. Der Betrieb der Geräte als ein einziger, größerer Prozessor besteht darin, Quantenschaltungen auszuführen, die sich über das größere Qubit-Register erstrecken. Abgesehen von unitären Gattern und Messungen, die parallel auf der zusammengeführten QPU laufen, verwenden wir dynamische Schaltungen, um Gatter auszuführen, die auf Qubits auf beiden Geräten wirken. Dies wird durch eine enge Synchronisation und schnelle klassische Kommunikation zwischen physisch getrennten Instrumenten ermöglicht, die erforderlich ist, um Messergebnisse zu sammeln und den Kontrollfluss im gesamten System zu bestimmen . 29 Wir testen diese Echtzeit-Klassik-Verbindung, indem wir einen Graphzustand auf 134 Qubits erstellen, der aus schwer-hexagonalen Ringen aufgebaut ist, die beide QPUs durchlaufen (Abb. ). Diese Ringe wurden durch Ausschluss von Qubits ausgewählt, die von Zweizustandssystemen und Ausleseproblemen betroffen waren, um einen qualitativ hochwertigen Graphzustand zu gewährleisten. Dieser Graph bildet einen Ring in drei Dimensionen und erfordert vier langreichweitige Gatter, die wir mit LO und LOCC implementieren. Wie zuvor erfordert das LOCC-Protokoll zwei zusätzliche Qubits pro Schnittgatter für die geschnittenen Bell-Paare. Wie im vorherigen Abschnitt benchmarken wir unsere Ergebnisse mit einem Graphen, der die Kanten nicht implementiert, die beide QPUs überspannen. Da es keine Quantenverbindung zwischen den beiden Geräten gibt, ist ein Benchmark mit SWAP-Gattern unmöglich. Alle Kanten weisen die Statistik der bipartitionierten Verschränkung auf, wenn wir den Graphen mit LO und LOCC mit einer Konfidenz von 99 % implementieren. Darüber hinaus weisen die LO- und LOCC-Stabilisatoren die gleiche Qualität wie der „Dropped Edge“-Benchmark für Knoten auf, die nicht von einem langreichweitigen Gatter betroffen sind (Abb. ). Stabilisatoren, die von langreichweitigen Gattern betroffen sind, weisen eine erhebliche Fehlerreduzierung im Vergleich zum „Dropped Edge“-Benchmark auf. Die Summe der absoluten Fehler auf den Knotenstabilisatoren ∑ ∈ ∣ − 1∣ beträgt 21,0, 19,2 und 12,6 für den „Dropped Edge“-Benchmark, LOCC und LO. Wie zuvor schreiben wir die zusätzlichen Fehler von 6,6 von LOCC gegenüber LO den Verzögerungen und den CNOT-Gattern in der Teleportationsschaltung und den geschnittenen Bell-Paaren zu. Die LOCC-Ergebnisse demonstrieren, wie eine dynamische Quantenschaltung, bei der zwei Teilschaltungen durch einen Echtzeit-Klassik-Link verbunden sind, auf zwei ansonsten getrennten QPUs ausgeführt werden kann. Die LO-Ergebnisse könnten auf einem einzigen Gerät mit 127 Qubits zu den Kosten eines zusätzlichen Faktors 2 bei der Laufzeit erzielt werden, da die Teilschaltungen nacheinander ausgeführt werden können. 3 3c i V Si , Graphzustand mit periodischen Grenzen in drei Dimensionen dargestellt. Die blauen Kanten sind die geschnittenen Kanten. , Kopplungsdiagramm von zwei Eagle QPUs, die als ein einziges Gerät mit 254 Qubits betrieben werden. Die violetten Knoten sind die Qubits, die den Graphzustand in bilden, und die blauen Knoten werden für geschnittene Bell-Paare verwendet. , , Absoluter Fehler auf den Stabilisatoren ( ) und Kantenzeuginnen ( ), die mit LOCC (durchgezogenes Grün) und LO (durchgezogenes Orange) implementiert wurden, und auf einem „Dropped Edge“-Benchmark-Graphen (gestrichelt-punktierte rote Linie) für den Graphzustand in . In und zeigen die Sterne Stabilisatoren und Kantenzeuginnen an, die von den Schnitten betroffen sind. In und ist der graue Bereich die Wahrscheinlichkeitsmasse, die den Knotenstabilisatoren bzw. Kantenzeuginnen entspricht, die vom Schnitt betroffen sind. In und beobachten wir, dass die LO-Implementierung den „Dropped Edge“-Benchmark übertrifft, was wir auf bessere Gerätebedingungen zurückführen, da diese Daten an einem anderen Tag als die Benchmark- und LOCC-Daten aufgenommen wurden. a b a c d c d a c d c d c d Diskussion und Schlussfolgerung Wir implementieren langreichweitige Gatter mit LO und LOCC. Mit diesen Gattern entwickeln wir periodische Randbedingungen auf einem 103-Knot