Autoren: Almudena Carrera Vazquez Caroline Tornow Diego Ristè Stefan Woerner Maika Takita Daniel J. Egger Zusammenfassung Quantencomputer verarbeiten Informationen mithilfe der Gesetze der Quantenmechanik. Aktuelle Quantenhardware ist fehlerbehaftet, kann Informationen nur für kurze Zeit speichern und ist auf wenige Qubits, d. h. Quantenbits, beschränkt, die typischerweise in einer planaren Konnektivität angeordnet sind . Viele Anwendungen des Quantencomputings erfordern jedoch eine höhere Konnektivität als das planare Gitter, das die Hardware auf mehr Qubits bietet, als auf einer einzigen Quantenprozessoreinheit (QPU) verfügbar sind. Die Community hofft, diese Einschränkungen durch die Verbindung von QPUs über klassische Kommunikation zu überwinden, was noch nicht experimentell bewiesen wurde. Hier realisieren wir experimentell fehlergeminderte dynamische Schaltungen und Schaltungsschneiden, um Quantenzustände zu erzeugen, die eine periodische Konnektivität erfordern, und verwenden bis zu 142 Qubits, die sich über zwei QPUs mit jeweils 127 Qubits erstrecken und in Echtzeit mit einem klassischen Link verbunden sind. In einer dynamischen Schaltung können Quantengatter klassisch durch die Ergebnisse von Mid-Circuit-Messungen zur Laufzeit gesteuert werden, d. h. innerhalb eines Bruchteils der Kohärenzzeit der Qubits. Unser klassischer Echtzeit-Link ermöglicht es uns, ein Quantengatter auf einer QPU zuapply, das auf dem Ergebnis einer Messung auf einer anderen QPU basiert. Darüber hinaus verbessert die fehlergeminderte Ablaufsteuerung die Qubit-Konnektivität und den Befehlssatz der Hardware und erhöht somit die Vielseitigkeit unserer Quantencomputer. Unsere Arbeit zeigt, dass wir mehrere Quantenprozessoren mit fehlergeminderten dynamischen Schaltungen, die durch einen klassischen Echtzeit-Link ermöglicht werden, als einen einzigen nutzen können. 1 Hauptteil Quantencomputer verarbeiten Informationen, die in Quantenbits kodiert sind, mit unitären Operationen. Quantencomputer sind jedoch fehlerbehaftet und die meisten großskaligen Architekturen ordnen die physischen Qubits in einem planaren Gitter an. Dennoch können aktuelle Prozessoren mit Fehlerkorrektur native Ising-Modelle mit 127 Qubits simulieren und Observablen in einem Maßstab messen, bei dem brute-force-Ansätze mit klassischen Computern anfangen, Schwierigkeiten zu haben . Die Nützlichkeit von Quantencomputern hängt von weiterer Skalierung und der Überwindung ihrer begrenzten Qubit-Konnektivität ab. Ein modularer Ansatz ist wichtig für die Skalierung aktueller fehlerbehafteter Quantenprozessoren und für das Erreichen der großen Anzahl physischer Qubits, die für Fehlertoleranz erforderlich sind . Eingefangene Ionen- und neutrale Atomarchitekturen können Modularität durch physischen Transport der Qubits erreichen , . In naher Zukunft wird Modularität in supraleitenden Qubits durch kurzreichweitige Verbindungen erreicht, die benachbarte Chips verbinden , . 1 2 3 4 5 6 7 8 Mittelfristig können langreichweitige Gatter im Mikrowellenbereich über lange konventionelle Kabel durchgeführt werden , , . Dies würde nicht-planare Qubit-Konnektivität ermöglichen, die für eine effiziente Fehlerkorrektur geeignet ist . Eine langfristige Alternative besteht darin, entfernte QPUs mit einem optischen Link zu verschränken, der eine Mikrowellen-zu-Optik-Transduktion nutzt , die unseres Wissens nach noch nicht demonstriert wurde. Darüber hinaus erweitern dynamische Schaltungen den Satz von Operationen eines Quantencomputers, indem sie Mid-Circuit-Messungen (MCMs) durchführen und klassisch ein Gatter innerhalb der Kohärenzzeit der Qubits steuern. Sie verbessern die algorithmische Qualität und die Qubit-Konnektivität . Wie wir zeigen werden, ermöglichen dynamische Schaltungen auch Modularität, indem sie QPUs in Echtzeit über einen klassischen Link verbinden. 9 10 11 3 12 13 14 Wir verfolgen einen komplementären Ansatz, der auf virtuellen Gattern basiert, um langreichweitige Wechselwirkungen in einer modularen Architektur zu implementieren. Wir verbinden Qubits an beliebigen Stellen und erzeugen die Statistik der Verschränkung durch eine Quasi-Wahrscheinlichkeits-Zerlegung (QPD) , , . Wir vergleichen ein reines Lokale Operationen (LO)-Schema mit einem, das durch Klassische Kommunikation (LOCC) erweitert wurde. Das LO-Schema, das in einer Zwei-Qubit-Einstellung demonstriert wurde , erfordert die Ausführung mehrerer Quantenschaltungen nur mit lokalen Operationen. Im Gegensatz dazu verbrauchen wir zur Implementierung von LOCC virtuelle Bell-Paare in einer Teleportationsschaltung, um Zwei-Qubit-Gatter zu erzeugen , . Auf Quantenhardware mit spärlicher und planarer Konnektivität erfordert die Erzeugung eines Bell-Paares zwischen beliebigen Qubits ein langreichweitiges Controlled-NOT (CNOT)-Gatter. Um diese Gatter zu vermeiden, verwenden wir eine QPD über lokale Operationen, was zu geschnittenen Bell-Paaren führt, die die Teleportation verbraucht. LO benötigt keinen klassischen Link und ist daher einfacher zu implementieren als LOCC. Da LOCC jedoch nur eine einzige parametrisierte Schaltungsschablone benötigt, ist es effizienter zu kompilieren als LO, und die Kosten seiner QPD sind geringer als die des LO-Schemas. 15 16 17 16 17 18 19 20 Unsere Arbeit leistet vier wichtige Beiträge. Erstens präsentieren wir die Quantenschaltungen und die QPD zur Erzeugung mehrerer geschnittener Bell-Paare zur Realisierung der virtuellen Gatter in Ref. . Zweitens unterdrücken und mindern wir die Fehler, die aus der Latenz der klassischen Steuerungs-Hardware in dynamischen Schaltungen entstehen , durch eine Kombination aus dynamischer Entkopplung und Null-Rausch-Extrapolation . Drittens nutzen wir diese Methoden, um periodische Randbedingungen auf einem 103-Knoten-Graphzustand zu erzeugen. Viertens demonstrieren wir eine klassische Echtzeitverbindung zwischen zwei separaten QPUs und zeigen damit, dass ein System verteilter QPUs über einen klassischen Link als ein einziges betrieben werden kann . Kombiniert mit dynamischen Schaltungen ermöglicht uns dies, beide Chips als einen einzigen Quantencomputer zu betreiben, was wir durch die Erzeugung eines periodischen Graphzustands, der sich über beide Geräte auf 142 Qubits erstreckt, veranschaulichen. Wir diskutieren einen Weg nach vorne, um langreichweitige Gatter zu erzeugen, und geben unsere Schlussfolgerung. 17 21 22 23 Schaltungsschneiden Wir führen große Quantenschaltungen aus, die aufgrund von Einschränkungen bei der Qubit-Anzahl oder Konnektivität möglicherweise nicht direkt auf unserer Hardware ausführbar sind, indem wir Gatter schneiden. Schaltungsschneiden zerlegt eine komplexe Schaltung in Teilschaltungen, die einzeln ausgeführt werden können , , , , , . Wir müssen jedoch eine erhöhte Anzahl von Schaltungen ausführen, die wir als Sampling-Overhead bezeichnen. Die Ergebnisse dieser Teilschaltungen werden dann klassisch rekombiniert, um das Ergebnis der ursprünglichen Schaltung zu liefern ( ). 15 16 17 24 25 26 Methoden Da einer der Hauptbeiträge unserer Arbeit die Implementierung von virtuellen Gattern mit LOCC ist, zeigen wir, wie die erforderlichen geschnittenen Bell-Paare mit lokalen Operationen erzeugt werden. Hier werden mehrere geschnittene Bell-Paare durch parametrisierte Quantenschaltungen erzeugt, die wir als geschnittene Bell-Paar-Fabrik bezeichnen (Abb. ). Das gleichzeitige Schneiden mehrerer Paare erfordert einen geringeren Sampling-Overhead . Da die geschnittene Bell-Paar-Fabrik zwei getrennte Quantenschaltungen bildet, platzieren wir jede Teilschaltung in der Nähe von Qubits, die langreichweitige Gatter haben. Die resultierende Ressource wird dann in einer Teleportationsschaltung verbraucht. Zum Beispiel werden in Abb. die geschnittenen Bell-Paare zur Erzeugung von CNOT-Gattern an den Qubit-Paaren (0, 1) und (2, 3) verwendet (siehe Abschnitt ‚ ‘). 1b,c 17 1b Geschnittene Bell-Paar-Fabriken , Darstellung einer IBM Quantum System Two-Architektur. Hier sind zwei 127-Qubit-Eagle-QPUs mit einem klassischen Echtzeit-Link verbunden. Jede QPU wird von ihrer Elektronik in ihrem Rack gesteuert. Wir synchronisieren beide Racks eng, um beide QPUs als eine zu betreiben. , Vorlagenschaltung zur Implementierung virtueller CNOT-Gatter an Qubit-Paaren ( 0, 1) und ( 2, 3) mit LOCC durch Verbrauch von geschnittenen Bell-Paaren in einer Teleportationsschaltung. Die violetten Doppellinien entsprechen dem klassischen Echtzeit-Link. , Geschnittene Bell-Paar-Fabriken 2( ) für zwei gleichzeitig geschnittene Bell-Paare. Die QPD hat insgesamt 27 verschiedene Parametersätze . Hier . a b q q q q c C θ i θ i Periodische Randbedingungen Wir konstruieren einen Graphzustand | ⟩ mit periodischen Randbedingungen auf ibm_kyiv, einem Eagle-Prozessor , der über die Grenzen seiner physikalischen Konnektivität hinausgeht (siehe Abschnitt ‚ ‘). Hier hat 103 Knoten ∣ ∣ und erfordert vier langreichweitige Kanten lr = {(1, 95), (2, 98), (6, 102), (7, 97)} zwischen den oberen und unteren Qubits des Eagle-Prozessors (Abb. ). Wir messen die Knotenspezifizierer an jedem Knoten ∈ und die Kanten-Spezifizierer, die sich aus dem Produkt über jede Kante ( , ) ∈ ergeben. Aus diesen Spezifizierern bauen wir eine Verschränkungs-Zeugin , die negativ ist, wenn eine bipartitäre Verschränkung über die Kante ( , ) ∈ vorliegt (Ref. ) (siehe Abschnitt ‚ ‘). Wir konzentrieren uns auf bipartitäre Verschränkung, da dies die Ressource ist, die wir mit virtuellen Gattern nachbilden wollen. Das Messen von Zeugen der Verschränkung zwischen mehr als zwei Parteien misst nur die Qualität der nicht-virtuellen Gatter und Messungen, wodurch die Auswirkung der virtuellen Gatter weniger klar wird. G 1 Graphzustände G V E 2a Si i V SiSj i j E i j E 27 Verschränkungs-Zeugin , Der schwere-hexagonale Graph wird durch die Kanten (1, 95), (2, 98), (6, 102) und (7, 97), die blau hervorgehoben sind, zu einer rohrförmigen Form gefaltet. Wir schneiden diese Kanten. , Die Knotenspezifizierer (oben) und Zeugen , (unten) mit 1 Standardabweichung für die Knoten und Kanten in der Nähe der langreichweitigen Kanten. Vertikale gestrichelte Linien gruppieren Spezifizierer und Zeugen nach ihrer Entfernung zu geschnittenen Kanten. , Kumulative Verteilungsfunktion der Spezifiziererfehler. Die Sterne kennzeichnen Knotenspezifizierer , für die ein Gatter mit einem langreichweitigen Gatter implementiert ist. In der Benchmark mit fallen gelassener Kante (punktierte rote Linie) werden die langreichweitigen Gatter nicht implementiert und die sterngekennzeichneten Spezifizierer haben daher einen Einheitsfehler. Der graue Bereich ist die Wahrscheinlichkeitsmasse, die den durch die Schnitte beeinflussten Knotenspezifizierern entspricht. – , In den zweidimensionalen Layouts duplizieren die grünen Knoten die Knoten 95, 98, 102 und 97, um die geschnittenen Kanten zu zeigen. Die blauen Knoten in sind Qubit-Ressourcen zur Erzeugung von geschnittenen Bell-Paaren. Die Farbe des Knotens ist der absolute Fehler ∣ − 1∣ des gemessenen Spezifizierers, wie durch die Farbleiste angezeigt. Eine Kante ist schwarz, wenn Verschränkungsstatistiken mit einer Konfidenz von 99 % erkannt werden, und violett, wenn nicht. In werden die langreichweitigen Gatter mit SWAP-Gattern implementiert. In werden dieselben Gatter mit LOCC implementiert. In werden sie gar nicht implementiert. a b Sj c Sj d f e i Si d e f Wir bereiten | ⟩ mit drei verschiedenen Methoden vor. Die hardware-nativen Kanten werden immer mit CNOT-Gattern implementiert, aber die periodischen Randbedingungen werden mit (1) SWAP-Gattern, (2) LOCC und (3) LO implementiert, um Qubits über das gesamte Gitter zu verbinden. Der Hauptunterschied zwischen LOCC und LO ist eine Feed-Forward-Operation, die aus Ein-Qubit-Gattern besteht, die auf 2 Messergebnissen basieren, wobei die Anzahl der Schnitte ist. Jeder der 22 Fälle löst eine eindeutige Kombination von - und/oder -Gattern auf den entsprechenden Qubits aus. Das Erfassen der Messergebnisse, das Bestimmen des entsprechenden Falls und das Handeln danach wird in Echtzeit durch die Steuerungs-Hardware durchgeführt, allerdings mit einer festen zusätzlichen Latenz. Wir mildern und unterdrücken die Fehler, die sich aus dieser Latenz ergeben, mit Null-Rausch-Extrapolation und gestaffelter dynamischer Entkopplung , (siehe Abschnitt ‚ ‘). G n n n X Z 22 21 28 Fehlergeminderte Quantenschaltungs-Switch-Anweisungen Wir benchmarken die SWAP-, LOCC- und LO-Implementierungen von | ⟩ mit einem hardware-nativen Graphzustand auf ′ = ( , ′), der durch Entfernen der langreichweitigen Gatter, d. h. ′ = lr, erhalten wird. Die Schaltung zur Vorbereitung von | ′⟩ erfordert daher nur 112 CNOT-Gatter, die in drei Schichten angeordnet sind und der schweren-hexagonale Topologie des Eagle-Prozessors folgen. Diese Schaltung meldet große Fehler bei der Messung der Knoten- und Kanten-Spezifizierer von | ⟩ für Knoten an einem Schnitt, da sie zur Implementierung von | ′⟩ entwickelt wurde. Wir bezeichnen diese hardware-native Benchmark als "dropped edge benchmark". Die SWAP-basierte Schaltung erfordert zusätzliche 262 CNOT-Gatter zur Erzeugung der langreichweitigen Kanten lr, was den Wert der gemessenen Spezifizierer drastisch reduziert (Abb. ). Im Gegensatz dazu erfordert die LOCC- und LO-Implementierung der Kanten in lr keine SWAP-Gatter. Die Fehler ihrer Knoten- und Kanten-Spezifizierer für Knoten, die nicht an einem Schnitt beteiligt sind, folgen eng der "dropped edge benchmark" (Abb. ). Umgekehrt haben die Spezifizierer, die ein virtuelles Gatter beinhalten, einen geringeren Fehler als die "dropped edge benchmark" und die SWAP-Implementierung (Abb. , Sternmarkierungen). Als übergreifende Qualitätsmetrik berichten wir zunächst die Summe der absoluten Fehler auf den Knotenspezifizierern, d. h. ∑ ∈ ∣ − 1∣ (Erweiterte Datentabelle ). Der große SWAP-Overhead ist für die Summe der absoluten Fehler von 44,3 verantwortlich. Der Fehler von 13,1 bei der "dropped edge benchmark" wird von den acht Knoten an den vier Schnitten dominiert (Abb. , Sternmarkierungen). Im Gegensatz dazu sind die LO- und LOCC-Fehler von MCMs betroffen. Wir führen den zusätzlichen Fehler von 1,9 von LOCC gegenüber LO auf die Verzögerungen und die CNOT-Gatter in der Teleportationsschaltung und den geschnittenen Bell-Paaren zurück. In den SWAP-basierten Ergebnissen erkennt keine Verschränkung über 35 der 116 Kanten mit einer Konfidenz von 99 % (Abb. ). Für die LO- und LOCC-Implementierung zeigt die Statistik der bipartitären Verschränkung über alle Kanten in mit einer Konfidenz von 99 % (Abb. ). Diese Metriken zeigen, dass virtuelle langreichweitige Gatter Spezifizierer mit geringeren Fehlern erzeugen als ihre Zerlegung in SWAPs. Darüber hinaus halten sie die Varianz niedrig genug, um die Statistik der Verschränkung zu überprüfen. G G V E E EE G G G E 2b–d E 2b,c 2c i V Si 1 2c 2b,d G 2e Betrieb von zwei QPUs als eine Wir kombinieren nun zwei Eagle QPUs mit jeweils 127 Qubits zu einer einzigen QPU über eine klassische Echtzeitverbindung. Der Betrieb der Geräte als ein einziger, größerer Prozessor besteht in der Ausführung von Quantenschaltungen, die sich über das größere Qubitregister erstrecken. Abgesehen von unitären Gattern und Messungen, die gleichzeitig auf der zusammengeführten QPU laufen, verwenden wir dynamische Schaltungen, um Gatter auszuführen, die auf Qubits auf beiden Geräten wirken. Dies wird durch eine enge Synchronisation und schnelle klassische Kommunikation zwischen physikalisch getrennten Instrumenten ermöglicht, die erforderlich ist, um Messergebnisse zu sammeln und den Kontrollfluss über das gesamte System zu bestimmen . 29 Wir testen diese klassische Echtzeitverbindung, indem wir einen Graphzustand auf 134 Qubits erzeugen, der aus schweren-hexagonalen Ringen aufgebaut ist, die sich durch beide QPUs schlängeln (Abb. ). Diese Ringe wurden gewählt, indem Qubits ausgeschlossen wurden, die von Zweiniveausystemen und Ausleseproblemen betroffen waren, um einen hochwertigen Graphzustand zu gewährleisten. Dieser Graph bildet einen Ring in drei Dimensionen und erfordert vier langreichweitige Gatter, die wir mit LO und LOCC implementieren. Wie zuvor erfordert das LOCC-Protokoll zwei zusätzliche Qubits pro Schnitt für die geschnittenen Bell-Paare. Wie im vorherigen Abschnitt benchmarken wir unsere Ergebnisse mit einem Graphen, der die Kanten, die beide QPUs überspannen, nicht implementiert. Da es keine Quantenverbindung zwischen den beiden Geräten gibt, ist ein Benchmark mit SWAP-Gattern unmöglich. Alle Kanten zeigen die Statistik der bipartitären Verschränkung, wenn wir den Graphen mit LO und LOCC mit einer Konfidenz von 99 % implementieren. Darüber hinaus haben die LO- und LOCC-Spezifizierer die gleiche Qualität wie die "dropped edge benchmark" für Knoten, die nicht von einem langreichweitigen Gatter betroffen sind (Abb. ). Spezifizierer, die von langreichweitigen Gattern betroffen sind, weisen eine starke Fehlerreduzierung im Vergleich zur "dropped edge benchmark" auf. Die Summe der absoluten Fehler auf den Knotenspezifizierern ∑ ∈ ∣ − 1∣ beträgt 21,0, 19,2 und 12,6 für die "dropped edge benchmark", LOCC bzw. LO. Wie zuvor führen wir die 6,6 zusätzlichen Fehler von LOCC gegenüber LO auf die Verzögerungen und die CNOT-Gatter in der Teleportationsschaltung und den geschnittenen Bell-Paaren zurück. Die LOCC-Ergebnisse zeigen, wie eine dynamische Quantenschaltung, bei der zwei Teilschaltungen durch einen klassischen Echtzeit-Link verbunden sind, auf zwei ansonsten getrennten QPUs ausgeführt werden kann. Die LO-Ergebnisse könnten auf einem einzigen Gerät mit 127 Qubits zu den Kosten eines zusätzlichen Faktors 2 in der Laufzeit erzielt werden, da die Teilschaltungen nacheinander ausgeführt werden können. 3 3c i V Si , Graphzustand mit periodischen Rändern, dreidimensional dargestellt. Die blauen Kanten sind die geschnittenen Kanten. , Kopplungsplan zweier Eagle QPUs, die als ein einziges Gerät mit 254 Qubits betrieben werden. Die violetten Knoten sind die Qubits, die den Graphzustand in bilden, und die blauen Knoten werden für geschnittene Bell-Paare verwendet. , , Absoluter Fehler der Spezifizierer ( ) und Kanten-Zeugen ( ), die mit LOCC (durchgezogen grün) und LO (durchgezogen orange) implementiert wurden, sowie bei einem "dropped edge benchmark"-Graphen (punktiert-gestrichelt rot) für den Graphzustand in . In und zeigen die Sterne Spezifizierer und Kanten-Zeugen, die von den Schnitten betroffen sind. In und ist der graue Bereich die Wahrscheinlichkeitsverteilung, die den Knotenspezifizierern und Kanten-Zeugen entspricht, die vom Schnitt betroffen sind. In und beobachten wir, dass die LO-Implementierung die "dropped edge benchmark" übertrifft, was wir auf bessere Gerätebedingungen zurückführen, da diese Daten an einem anderen Tag als die Benchmark- und LOCC-Daten aufgenommen wurden. a b a c d c d a c d c d c d Diskussion und Schlussfolgerung Wir implementieren langreichweitige Gatter mit LO und LOCC. Mit diesen Gattern erzeugen wir periodische Randbedingungen auf einem 103-Knoten-Plan