Autoren: Almudena Carrera Vazquez Caroline Tornow Diego Ristè Stefan Woerner Maika Takita Daniel J. Egger Abstrakt Quantencomputer verarbeiten Informationen nach den Gesetzen der Quantenmechanik. Aktuelle Quantenhardware ist verrauscht, kann Informationen nur für kurze Zeit speichern und ist auf wenige Qubits, d.h. Qubits, beschränkt, die typischerweise in einer planaren Konnektivität angeordnet sind . Viele Anwendungen des Quantencomputings erfordern jedoch mehr Konnektivität als das planare Gitter, das von der Hardware auf mehr Qubits angeboten wird, als auf einer einzelnen Quantenprozessoreinheit (QPU) verfügbar sind. Die Community hofft, diese Einschränkungen durch die Verbindung von QPUs über klassische Kommunikation zu überwinden, was bisher experimentell noch nicht nachgewiesen wurde. Hier realisieren wir experimentell fehlergeminderte dynamische Schaltungen und Schaltungsschnitte, um Quantenzustände zu erzeugen, die eine periodische Konnektivität unter Verwendung von bis zu 142 Qubits erfordern, die sich über zwei QPUs mit jeweils 127 Qubits erstrecken und in Echtzeit mit einem klassischen Link verbunden sind. In einer dynamischen Schaltung können Quantengatter klassisch durch die Ergebnisse von Mid-Circuit-Messungen innerhalb der Laufzeit, d.h. innerhalb eines Bruchteils der Kohärenzzeit der Qubits, gesteuert werden. Unser klassischer Echtzeit-Link ermöglicht es uns, ein Quantengatter auf einer QPU basierend auf dem Ergebnis einer Messung auf einer anderen QPU anzuwenden. Darüber hinaus verbessert die fehlergeminderte Ablaufsteuerung die Qubit-Konnektivität und den Befehlssatz der Hardware und erhöht somit die Vielseitigkeit unserer Quantencomputer. Unsere Arbeit zeigt, dass wir mehrere Quantenprozessoren durch fehlergeminderte dynamische Schaltungen, die durch einen klassischen Echtzeit-Link ermöglicht werden, als einen einzigen nutzen können. 1 Hauptteil Quantencomputer verarbeiten Informationen, die in Qubits kodiert sind, mit unitären Operationen. Quantencomputer sind jedoch verrauscht, und die meisten groß angelegten Architekturen ordnen die physikalischen Qubits in einem planaren Gitter an. Nichtsdestotrotz können aktuelle Prozessoren mit Fehlerkompensation bereits hardwarenahe Ising-Modelle mit 127 Qubits simulieren und Observablen in einem Maßstab messen, bei dem klassische Brute-Force-Ansätze zu kämpfen beginnen . Die Nützlichkeit von Quantencomputern hängt von weiterer Skalierung und der Überwindung ihrer begrenzten Qubit-Konnektivität ab. Ein modularer Ansatz ist wichtig für die Skalierung aktueller rauschbehafteter Quantenprozessoren und für die Erzielung der für Fehlertoleranz erforderlichen großen Anzahl von physikalischen Qubits . Gefangene Ionen- und Neutralatomarchitekturen können Modularität erreichen, indem sie die Qubits physisch transportieren , . In naher Zukunft wird die Modularität bei supraleitenden Qubits durch kurzreichweitige Verbindungen erreicht, die benachbarte Chips verbinden , . 1 2 3 4 5 6 7 8 Mittelfristig könnten langreichweitige Gatter im Mikrowellenbereich über lange herkömmliche Kabel ausgeführt werden , , . Dies würde eine nicht-planare Qubit-Konnektivität ermöglichen, die für eine effiziente Fehlerkorrektur geeignet ist . Eine langfristige Alternative ist die Verschränkung entfernter QPUs mit einem optischen Link, der eine Mikrowellen-zu-Optik-Transduktion nutzt , die unseres Wissens nach noch nicht demonstriert wurde. Darüber hinaus erweitern dynamische Schaltungen den Satz von Operationen eines Quantencomputers, indem sie Mid-Circuit-Messungen (MCMs) durchführen und klassisch ein Gatter innerhalb der Kohärenzzeit der Qubits steuern. Sie verbessern die algorithmische Qualität und die Qubit-Konnektivität . Wie wir zeigen werden, ermöglichen dynamische Schaltungen auch Modularität, indem sie QPUs in Echtzeit über einen klassischen Link verbinden. 9 10 11 3 12 13 14 Wir verfolgen einen komplementären Ansatz, der auf virtuellen Gattern basiert, um langreichweitige Wechselwirkungen in einer modularen Architektur zu implementieren. Wir verbinden Qubits an beliebigen Stellen und erzeugen die Statistik der Verschränkung durch eine Quasi-Wahrscheinlichkeits-Zerlegung (QPD) , , . Wir vergleichen ein reines Local Operations (LO)-Schema mit einem, das durch Classical Communication (LOCC) erweitert wurde. Das LO-Schema, das in einer Zwei-Qubit-Einstellung demonstriert wurde , erfordert die Ausführung mehrerer Quantenschaltungen nur mit lokalen Operationen. Im Gegensatz dazu verbrauchen wir zur Implementierung von LOCC virtuelle Bell-Paare in einer Teleportationsschaltung, um Zwei-Qubit-Gatter zu erzeugen , . Auf Quantenhardware mit spärlicher und planarer Konnektivität erfordert die Erzeugung eines Bell-Paares zwischen beliebigen Qubits ein langreichweitiges controlled-NOT (CNOT)-Gatter. Um diese Gatter zu vermeiden, verwenden wir eine QPD über lokale Operationen, was zu geschnittenen Bell-Paaren führt, die die Teleportation verbraucht. LO benötigt keinen klassischen Link und ist daher einfacher zu implementieren als LOCC. Da LOCC jedoch nur eine einzige parametrisierte Schaltungsschablone benötigt, ist es effizienter zu kompilieren als LO und die Kosten seiner QPD sind niedriger als die des LO-Schemas. 15 16 17 16 17 18 19 20 Unsere Arbeit leistet vier wichtige Beiträge. Erstens stellen wir die Quantenschaltungen und die QPD zur Erzeugung mehrerer geschnittener Bell-Paare vor, um die virtuellen Gatter in Ref. zu realisieren. Zweitens unterdrücken und mindern wir die Fehler, die aus der Latenz der klassischen Steuerungs-Hardware in dynamischen Schaltungen resultieren , mit einer Kombination aus dynamischer Entkopplung und Null-Rausch-Extrapolation . Drittens nutzen wir diese Methoden, um periodische Randbedingungen auf einem 103-Knoten-Graphzustand zu erzeugen. Viertens demonstrieren wir eine Echtzeit-klassische Verbindung zwischen zwei separaten QPUs und zeigen damit, dass ein System verteilter QPUs über einen klassischen Link als ein einziger betrieben werden kann . In Kombination mit dynamischen Schaltungen ermöglicht uns dies, beide Chips als einen einzigen Quantencomputer zu betreiben, was wir am Beispiel der Erzeugung eines periodischen Graphzustands, der sich über beide Geräte auf 142 Qubits erstreckt, demonstrieren. Wir diskutieren einen Weg zur Erzeugung langreichweitiger Gatter und geben unsere Schlussfolgerung an. 17 21 22 23 Schaltungsschnitt Wir führen große Quantenschaltungen aus, die aufgrund von Einschränkungen bei der Qubit-Anzahl oder Konnektivität möglicherweise nicht direkt auf unserer Hardware ausführbar sind, indem wir Gatter schneiden. Schaltungsschnitt zerlegt eine komplexe Schaltung in Unterschaltungen, die einzeln ausgeführt werden können , , , , , . Wir müssen jedoch eine erhöhte Anzahl von Schaltungen ausführen, die wir als Sampling-Overhead bezeichnen. Die Ergebnisse dieser Unterschaltungen werden dann klassisch kombiniert, um das Ergebnis der ursprünglichen Schaltung zu liefern (siehe ). 15 16 17 24 25 26 Methoden Da einer der Hauptbeiträge unserer Arbeit die Implementierung virtueller Gatter mit LOCC ist, zeigen wir, wie die erforderlichen geschnittenen Bell-Paare mit lokalen Operationen erzeugt werden können. Hier werden mehrere geschnittene Bell-Paare durch parametrisierte Quantenschaltungen erzeugt, die wir als geschnittenen Bell-Paar-Fabrik bezeichnen (Abb. ). Das gleichzeitige Schneiden mehrerer Paare erfordert einen geringeren Sampling-Overhead . Da die geschnittene Bell-Paar-Fabrik zwei disjunkte Quantenschaltungen bildet, platzieren wir jede Unterschaltung nahe an Qubits mit langreichweitigen Gattern. Die resultierende Ressource wird dann in einer Teleportationsschaltung verbraucht. In Abb. werden beispielsweise die geschnittenen Bell-Paare verwendet, um CNOT-Gatter auf den Qubit-Paaren (0, 1) und (2, 3) zu erzeugen (siehe Abschnitt ' '). 1b,c 17 1b Geschnittene Bell-Paar-Fabriken , Darstellung einer IBM Quantum System Two-Architektur. Hier sind zwei 127-Qubit-Eagle-QPUs mit einem klassischen Echtzeit-Link verbunden. Jede QPU wird von ihrer Elektronik in ihrem Rack gesteuert. Wir synchronisieren beide Racks eng, um beide QPUs als eine zu betreiben. , Vorlagenschaltung zur Implementierung virtueller CNOT-Gatter auf den Qubit-Paaren ( 0, 1) und ( 2, 3) mit LOCC durch Verbrauch geschnittener Bell-Paare in einer Teleportationsschaltung. Die violetten Doppellinien entsprechen dem klassischen Echtzeit-Link. , Geschnittene Bell-Paar-Fabriken 2( ) für zwei gleichzeitig geschnittene Bell-Paare. Die QPD hat insgesamt 27 verschiedene Parametersätze . Hier. a b q q q q c C θ i θ i Periodische Randbedingungen Wir konstruieren einen Graphzustand | ⟩ mit periodischen Randbedingungen auf ibm_kyiv, einem Eagle-Prozessor , der über die durch seine physikalische Konnektivität gesetzten Grenzen hinausgeht (siehe Abschnitt ' '). Hier hat ∣ ∣ = 103 Knoten und erfordert vier langreichweitige Kanten lr = {(1, 95), (2, 98), (6, 102), (7, 97)} zwischen den oberen und unteren Qubits des Eagle-Prozessors (Abb. ). Wir messen die Knotensubtraktoren an jedem Knoten ∈ und die Kanten-Subtraktoren, die sich aus dem Produkt über jede Kante ( , ) ∈ ergeben. Aus diesen Subtraktoren bauen wir eine Verschränkungs-Zeugin , die negativ ist, wenn eine bipolare Verschränkung über die Kante ( , ) ∈ vorliegt (Ref. ) (siehe Abschnitt ' '). Wir konzentrieren uns auf bipolare Verschränkung, da dies die Ressource ist, die wir mit virtuellen Gattern nachbilden wollen. Das Messen von Zeugen der Verschränkung zwischen mehr als zwei Parteien misst nur die Qualität der nicht-virtuellen Gatter und Messungen, wodurch die Auswirkung der virtuellen Gatter weniger klar wird. G 1 Graphzustände G V E 2a Si i V SiSj i j E i j E 27 Verschränkungs-Zeugin , Der schwere-hexagonale Graph wird durch die Kanten (1, 95), (2, 98), (6, 102) und (7, 97) in blauer Farbe hervorgehoben, zu einer schlauchförmigen Form gefaltet. Wir schneiden diese Kanten. , Die Knoten-Subtraktoren (oben) und die Zeugen , (unten), mit 1 Standardabweichung für die Knoten und Kanten nahe den langreichweitigen Kanten. Vertikale gestrichelte Linien gruppieren Subtraktoren und Zeugen nach ihrer Entfernung zu geschnittenen Kanten. , Kumulative Verteilungsfunktion der Subtraktorfehler. Die Sterne kennzeichnen Knoten-Subtraktoren , bei denen eine Kante durch ein langreichweitiges Gatter implementiert ist. Im Benchmark für die entfernte Kante (strichpunktierte rote Linie) sind die langreichweitigen Gatter nicht implementiert und die sterngekennzeichneten Subtraktoren haben daher den Fehler eins. Der graue Bereich ist die Wahrscheinlichkeitsmasse, die den durch die Schnitte beeinflussten Knoten-Subtraktoren entspricht. – , In den zweidimensionalen Layouts duplizieren die grünen Knoten die Knoten 95, 98, 102 und 97, um die geschnittenen Kanten zu zeigen. Die blauen Knoten in sind Qubit-Ressourcen zur Erzeugung geschnittener Bell-Paare. Die Farbe des Knotens ist der absolute Fehler ∣ − 1∣ des gemessenen Subtraktors, wie durch die Farbleiste angezeigt. Eine Kante ist schwarz, wenn Verschränkungsstatistiken mit einer Konfidenz von 99 % erkannt werden, und violett, wenn nicht. In werden die langreichweitigen Gatter mit SWAP-Gattern implementiert. In werden dieselben Gatter mit LOCC implementiert. In werden sie überhaupt nicht implementiert. a b Sj c Sj d f e i Si d e f Wir bereiten | ⟩ mit drei verschiedenen Methoden vor. Die hardwarenahen Kanten werden immer mit CNOT-Gattern implementiert, aber die periodischen Randbedingungen werden mit (1) SWAP-Gattern, (2) LOCC und (3) LO implementiert, um Qubits im gesamten Gitter zu verbinden. Der Hauptunterschied zwischen LOCC und LO ist eine Feed-Forward-Operation, die aus Ein-Qubit-Gattern besteht, die auf 2 Messergebnissen basieren, wobei die Anzahl der Schnitte ist. Jeder der 22 Fälle löst eine eindeutige Kombination von - und/oder -Gattern auf den entsprechenden Qubits aus. Das Sammeln der Messergebnisse, die Bestimmung des entsprechenden Falls und das darauf basierende Handeln werden in Echtzeit von der Steuerungshardware durchgeführt, was mit einer festen zusätzlichen Latenz verbunden ist. Wir mindern und unterdrücken die Fehler, die aus dieser Latenz resultieren, mit Null-Rausch-Extrapolation und gestaffelter dynamischer Entkopplung , (siehe Abschnitt ' '). G n n n X Z 22 21 28 Fehlergeminderte Quantenschaltungs-Switch-Instruktionen Wir vergleichen die SWAP-, LOCC- und LO-Implementierungen von | ⟩ mit einem hardwarenahen Graphzustand auf ′ = ( , ′), der durch Entfernen der langreichweitigen Gatter erhalten wird, d.h. ′ = lr. Die Schaltung, die | ′⟩ vorbereitet, erfordert daher nur 112 CNOT-Gatter, die in drei Schichten angeordnet sind und der heavy-hexagonalen Topologie des Eagle-Prozessors folgen. Diese Schaltung liefert große Fehler bei der Messung der Knoten- und Kanten-Subtraktoren von | ⟩ für Knoten an einem Schnitt, da sie für die Implementierung von | ′⟩ konzipiert ist. Wir bezeichnen dieses hardwarenahe Benchmark als "dropped edge benchmark". Die SWAP-basierte Schaltung erfordert zusätzliche 262 CNOT-Gatter zur Erzeugung der langreichweitigen Kanten lr, was den Wert der gemessenen Subtraktoren drastisch reduziert (Abb. ). Im Gegensatz dazu erfordert die LOCC- und LO-Implementierung der Kanten in lr keine SWAP-Gatter. Die Fehler ihrer Knoten- und Kanten-Subtraktoren für Knoten, die nicht an einem Schnitt beteiligt sind, folgen eng dem "dropped edge benchmark" (Abb. ). Umgekehrt weisen die Subtraktoren, die ein virtuelles Gatter beinhalten, einen geringeren Fehler auf als der "dropped edge benchmark" und die SWAP-Implementierung (Abb. , Sternchen-Marker). Als allgemeine Qualitätsmetrik berichten wir zuerst über die Summe der absoluten Fehler bei den Knoten-Subtraktoren, d.h. ∑ ∈ ∣ − 1∣ (Erweiterte Datentabelle ). Der große SWAP-Overhead ist für die absolute Summenabweichung von 44,3 verantwortlich. Der Fehler von 13,1 beim "dropped edge benchmark" wird durch die acht Knoten an den vier Schnitten dominiert (Abb. , Sternchen-Marker). Im Gegensatz dazu werden die LO- und LOCC-Fehler durch MCMs beeinflusst. Wir führen den zusätzlichen Fehler von 1,9 von LOCC gegenüber LO auf die Verzögerungen und die CNOT-Gatter in der Teleportationsschaltung und den geschnittenen Bell-Paaren zurück. Bei den SWAP-basierten Ergebnissen erkennt keine Verschränkung über 35 der 116 Kanten mit einer Konfidenz von 99 % (Abb. ). Für die LO- und LOCC-Implementierung zeigt die Statistik der bipolaren Verschränkung über alle Kanten in mit einer Konfidenz von 99 % (Abb. ). Diese Metriken zeigen, dass virtuelle langreichweitige Gatter Subtraktoren mit geringeren Fehlern erzeugen als ihre Zerlegung in SWAPs. Außerdem halten sie die Varianz niedrig genug, um die Statistik der Verschränkung zu verifizieren. G G V E E EE G G G E 2b–d E 2b,c 2c i V Si 1 2c 2b,d G 2e Betrieb von zwei QPUs als eine Wir kombinieren nun zwei Eagle QPUs mit jeweils 127 Qubits zu einer einzigen QPU über eine klassische Echtzeitverbindung. Der Betrieb der Geräte als ein einzelner, größerer Prozessor besteht in der Ausführung von Quantenschaltungen, die sich über das größere Qubit-Register erstrecken. Abgesehen von unitären Gattern und Messungen, die gleichzeitig auf der zusammengeführten QPU laufen, verwenden wir dynamische Schaltungen, um Gatter auszuführen, die auf Qubits auf beiden Geräten wirken. Dies wird durch eine enge Synchronisation und schnelle klassische Kommunikation zwischen physisch getrennten Instrumenten ermöglicht, die erforderlich sind, um Messergebnisse zu sammeln und den Kontrollfluss für das gesamte System zu bestimmen . 29 Wir testen diese klassische Echtzeitverbindung, indem wir einen Graphzustand auf 134 Qubits erzeugen, der aus heavy-hexagonalen Ringen aufgebaut ist, die sich durch beide QPUs schlängeln (Abb. ). Diese Ringe wurden ausgewählt, indem Qubits ausgeschlossen wurden, die von Zweizustandssystemen und Ausleseproblemen geplagt waren, um einen qualitativ hochwertigen Graphzustand zu gewährleisten. Dieser Graph bildet einen Ring in drei Dimensionen und erfordert vier langreichweitige Gatter, die wir mit LO und LOCC implementieren. Wie zuvor erfordert das LOCC-Protokoll zwei zusätzliche Qubits pro geschnittenem Gatter für die geschnittenen Bell-Paare. Wie im vorherigen Abschnitt vergleichen wir unsere Ergebnisse mit einem Graphen, der die Kanten, die beide QPUs überspannen, nicht implementiert. Da es keine Quantenverbindung zwischen den beiden Geräten gibt, ist ein Benchmark mit SWAP-Gattern unmöglich. Alle Kanten zeigen die Statistik der bipolaren Verschränkung, wenn wir den Graphen mit LO und LOCC mit einer Konfidenz von 99 % implementieren. Darüber hinaus haben die LO- und LOCC-Subtraktoren die gleiche Qualität wie das "dropped edge benchmark" für Knoten, die nicht von einem langreichweitigen Gatter betroffen sind (Abb. ). Die von langreichweitigen Gattern betroffenen Subtraktoren weisen eine starke Fehlerreduzierung im Vergleich zum "dropped edge benchmark" auf. Die Summe der absoluten Fehler bei den Knoten-Subtraktoren ∑ ∈ ∣ − 1∣ beträgt 21,0, 19,2 und 12,6 für den "dropped edge benchmark", LOCC und LO. Wie zuvor führen wir die zusätzlichen 6,6 Fehler von LOCC gegenüber LO auf die Verzögerungen und die CNOT-Gatter in der Teleportationsschaltung und den geschnittenen Bell-Paaren zurück. Die LOCC-Ergebnisse zeigen, wie eine dynamische Quantenschaltung, bei der zwei Unterschaltungen durch einen klassischen Echtzeit-Link verbunden sind, auf zwei ansonsten getrennten QPUs ausgeführt werden kann. Die LO-Ergebnisse könnten auf einem einzigen Gerät mit 127 Qubits zu den Kosten eines zusätzlichen Faktors 2 in der Laufzeit erzielt werden, da die Unterschaltungen nacheinander ausgeführt werden können. 3 3c i V Si , Graphzustand mit periodischen Rändern in drei Dimensionen dargestellt. Die blauen Kanten sind die geschnittenen Kanten. , Kopplungskarte von zwei Eagle QPUs, die als ein Gerät mit 254 Qubits betrieben werden. Die violetten Knoten sind die Qubits, die den Graphzustand in bilden, und die blauen Knoten werden für geschnittene Bell-Paare verwendet. , , Absoluter Fehler bei den Subtraktoren ( ) und Kanten-Zeugen ( ) , die mit LOCC (durchgezogene grüne Linie) und LO (durchgezogene orange Linie) implementiert wurden, und auf einem "dropped edge benchmark"-Graphen (punktgestrichelte rote Linie) für den Graphzustand in . In und zeigen die Sterne Subtraktoren und Kanten-Zeugen, die von den Schnitten betroffen sind. In und ist der graue Bereich die Wahrscheinlichkeitsmasse, die den Knoten-Subtraktoren bzw. den Kanten-Zeugen entspricht, die vom Schnitt betroffen sind. In und beobachten wir, dass die LO-Implementierung die "dropped edge benchmark" übertrifft, was wir besseren Gerätebedingungen zuschreiben, da diese Daten an einem anderen Tag als die Benchmark- und LOCC-Daten aufgenommen wurden. a b a c d c d a c d c d c d Diskussion und Fazit Wir implementieren langreichweitige Gatter mit LO und LOCC. Mit diesen Gattern er