Diese laute Quantencomputer liefert verlässliche Ergebnisse, die klassisch nicht zu simulieren sind

Autoren: Youngseok Kim Andrew Eddins Sajant Anand Ken Xuan Wei Ewout van den Berg Sami Rosenblatt Hasan Nayfeh Yantao Wu Michael Zaletel Kristan Temme Abhinav Kandala Zusammenfassung Quantencomputing verspricht für bestimmte Probleme erhebliche Geschwindigkeitssteigerungen gegenüber seinem klassischen Gegenstück. Die größte Hürde für die Realisierung seines vollen Potenzials sind jedoch inhärente Störungen in diesen Systemen. Die allgemein anerkannte Lösung für diese Herausforderung ist die Implementierung fehlertoleranter Quantenschaltkreise, die für aktuelle Prozessoren noch unerreichbar sind. Hier berichten wir über Experimente mit einem verrauschten 127-Qubit-Prozessor und demonstrieren die Messung genauer Erwartungswerte für Schaltungsvolumina, die über die brute-force-klassische Berechnung hinausgehen. Wir argumentieren, dass dies ein Beweis für den Nutzen des Quantencomputings in der Ära vor der Fehlertoleranz ist. Diese experimentellen Ergebnisse werden durch Fortschritte in der Kohärenz und Kalibrierung eines supraleitenden Prozessors dieser Größenordnung sowie durch die Fähigkeit, Rauschen auf einem so großen Gerät zu charakterisieren und kontrolliert zu manipulieren, ermöglicht. Wir stellen die Genauigkeit der gemessenen Erwartungswerte fest, indem wir sie mit der Ausgabe exakt verifizierbarer Schaltungen vergleichen. Im Regime starker Verschränkung liefert der Quantencomputer korrekte Ergebnisse, für die führende klassische Näherungen wie reine Zustands-basierte 1D- (Matrixproduktzustände, MPS) und 2D- (isometrische Tensornetzwerkzustände, isoTNS) Tensornetzwerkmethoden , versagen. Diese Experimente stellen ein grundlegendes Werkzeug für die Realisierung von Near-Term-Quantenanwendungen dar , . 1 2 3 4 5 Hauptteil Es ist fast allgemein anerkannt, dass fortgeschrittene Quantenalgorithmen wie Faktorisierung oder Phasenschätzung Quantenfehlerkorrektur erfordern werden. Es ist jedoch stark umstritten, ob die derzeit verfügbaren Prozessoren ausreichend zuverlässig gemacht werden können, um andere Quantenschaltkreise mit kürzerer Tiefe in einer Größenordnung auszuführen, die einen Vorteil für praktische Probleme bieten könnten. An diesem Punkt ist die konventionelle Erwartung, dass die Implementierung selbst einfacher Quantenschaltkreise mit dem Potenzial, klassische Fähigkeiten zu übertreffen, warten muss, bis fortgeschrittenere, fehlertolerante Prozessoren verfügbar sind. Trotz des enormen Fortschritts in der Quantenhardware in den letzten Jahren unterstützen einfache Fidelitätsgrenzen diese düstere Prognose; eine Schätzung besagt, dass eine Quantenschaltung von 100 Qubits Breite und 100 Gate-Schichten Tiefe, die mit 0,1% Gate-Fehler ausgeführt wird, eine Zustandsfidelität von weniger als 5 × 10−4 ergibt. Nichtsdestotrotz bleibt die Frage, ob Eigenschaften des idealen Zustands auch bei solch geringen Fidelitäten zugänglich sind. Der Ansatz der Fehlerabschwächung , für Near-Term-Quantenvorteile auf verrauschten Geräten adressiert genau diese Frage, nämlich dass man genaue Erwartungswerte aus mehreren verschiedenen Läufen der verrauschten Quantenschaltung unter Verwendung klassischer Nachbearbeitung erzeugen kann. 6 7 8 9 10 Quanten-Advantage kann in zwei Schritten erreicht werden: Erstens durch den Nachweis der Fähigkeit bestehender Geräte, genaue Berechnungen in einer Größenordnung durchzuführen, die über die klassische Simulation im Brute-Force-Verfahren hinausgeht, und zweitens durch die Identifizierung von Problemen mit zugehörigen Quantenschaltungen, die aus diesen Geräten einen Vorteil ziehen. Hier konzentrieren wir uns auf den ersten Schritt und zielen nicht darauf ab, Quantenschaltungen für Probleme mit nachgewiesenen Geschwindigkeitssteigerungen zu implementieren. Wir verwenden einen supraleitenden Quantenprozessor mit 127 Qubits, um Quantenschaltungen mit bis zu 60 Schichten von Zwei-Qubit-Gates auszuführen, insgesamt 2.880 CNOT-Gates. Allgemeine Quantenschaltungen dieser Größe liegen außerhalb dessen, was mit klassischen Brute-Force-Methoden machbar ist. Wir konzentrieren uns daher zunächst auf spezifische Testfälle von Schaltungen, die eine exakte klassische Verifizierung der gemessenen Erwartungswerte ermöglichen. Anschließend wenden wir uns Schaltungsregimen und Beobachtungsgrößen zu, bei denen die klassische Simulation schwierig wird, und vergleichen die Ergebnisse mit denen moderner approximativer klassischer Methoden. Unsere Benchmark-Schaltung ist die Trotterisierte Zeitevolution eines 2D-Transversalfeld-Ising-Modells, das die Topologie des Qubit-Prozessors teilt (Abb. 1a). Das Ising-Modell taucht in verschiedenen Bereichen der Physik auf und hat kreative Erweiterungen in jüngsten Simulationen gefunden, die Quanten-Vielteilchenphänomene wie Zeitkristalle , , Quanten-Narben und Majorana-Randmoden erforschen. Als Test für die Nützlichkeit der Quantenberechnung ist die Zeitevolution des 2D-Transversalfeld-Ising-Modells jedoch im Grenzwert des großen Verschränkungswachstums am relevantesten, bei dem skalierbare klassische Näherungen Schwierigkeiten haben. 11 12 13 14 , Jeder Trotter-Schritt der Ising-Simulation enthält einzelne Qubit- - und Zwei-Qubit- -Rotationen. Zufällige Pauli-Gates werden eingefügt, um das Rauschen jeder CNOT-Schicht zu drehen (Spiralen) und kontrolliert zu skalieren. Der Dagger kennzeichnet die Konjugation durch die ideale Schicht. , Drei CNOT-Gate-Schichten der Tiefe 1 reichen aus, um Wechselwirkungen zwischen allen benachbarten Paaren auf ibm_kyiv zu realisieren. , Charakterisierungsexperimente lernen effizient die lokalen Pauli-Fehlerraten , (Farbskalen), die den gesamten Pauli-Kanal Λ ausmachen, der mit der -ten gedrehten CNOT-Schicht verbunden ist. (Abbildung erweitert in den ergänzenden Informationen IV.A). , Pauli-Fehler, die proportional eingefügt werden, können verwendet werden, um das intrinsische Rauschen entweder zu kompensieren (PEC) oder zu verstärken (ZNE). a X ZZ b c λl i l l d Insbesondere betrachten wir die Zeitdynamik des Hamiltonians, in dem > 0 die Kopplung von nächstgelegenen Spins mit < und das globale transversale Feld ist. Die Spindynamik aus einem Anfangszustand kann mittels erster Ordnung Trotter-Zerlegung des Zeitentwicklungsoperators simuliert werden, J i j h in dem die Evolutionszeit in / Trotter-Schritte und und Rotationsgates sind, bzw. . Wir interessieren uns nicht für den Modellfehler aufgrund der Trotterisierung und nehmen daher die trotterisierte Schaltung als ideal für jeden klassischen Vergleich an. Zur experimentellen Vereinfachung konzentrieren wir uns auf den Fall = −2 = −π/2, so dass die -Rotation nur einen CNOT erfordert, T T δt θJ Jδt ZZ wobei die Gleichheit bis auf eine globale Phase gilt. In der resultierenden Schaltung (Abb. 1a) entspricht jeder Trotter-Schritt einer Schicht von Einzel-Qubit-Rotationen, R ( h), gefolgt von kommutierenden Schichten parallelisierter Zwei-Qubit-Rotationen, R ( ). X θ ZZ θJ Für die experimentelle Implementierung verwendeten wir hauptsächlich den IBM Eagle Prozessor ibm_kyiv, der aus 127 Festfrequenz-Transmon-Qubits mit Heavy-Hex-Konnektivität und mittleren 1- und 2-Zeiten von 288 μs bzw. 127 μs besteht. Diese Kohärenzzeiten sind für supraleitende Prozessoren dieser Größenordnung beispiellos und ermöglichen die in dieser Arbeit untersuchten Schaltungstiefen. Die Zwei-Qubit-CNOT-Gates zwischen Nachbarn werden durch Kalibrierung der Kreuzresonanzwechselwirkung realisiert. Da jedes Qubit höchstens drei Nachbarn hat, können alle -Wechselwirkungen in drei Schichten parallelisierter CNOT-Gates durchgeführt werden (Abb. 1b). Die CNOT-Gates innerhalb jeder Schicht werden für eine optimale simultane Operation kalibriert (siehe Methoden für weitere Details). 15 T T 16 ZZ Nun sehen wir, dass diese Verbesserungen der Hardware-Leistung es ermöglichen, auch größere Probleme erfolgreich mit Fehlerabschwächung auszuführen, verglichen mit früheren Arbeiten , auf dieser Plattform. Probabilistische Fehlerkorrektur (PEC) hat sich als sehr effektiv erwiesen, um unverzerrte Schätzungen von Observablen zu liefern. Bei PEC wird ein repräsentatives Rauschmodell erlernt und effektiv invertiert, indem aus einer Verteilung von verrauschten Schaltungen, die mit dem erlernten Modell zusammenhängen, abgetastet wird. Für die aktuellen Fehlerraten auf unserem Gerät bleibt jedoch der Abtastaufwand für die in dieser Arbeit betrachteten Schaltungsvolumina einschränkend, wie weiter unten erläutert. 1 17 9 Daher wenden wir uns der Null-Rausch-Extrapolation (ZNE) , , , zu, die einen verzerrten Schätzer bei potenziell viel geringerem Abtastaufwand liefert. ZNE ist entweder eine polynomiale , oder exponentielle Extrapolationsmethode für verrauschte Erwartungswerte als Funktion eines Rauschparameters. Dies erfordert die kontrollierte Verstärkung des intrinsischen Hardware-Rauschens um einen bekannten Gewinnfaktor , um auf das ideale Ergebnis für = 0 zu extrapolieren. ZNE wurde weit verbreitet, teils weil Rauschverstärkungsschemata auf Basis von Pulsdehnung , , oder Unterkreislaufwiederholung , , die Notwendigkeit einer präzisen Rauschermittlung umgangen haben, während sie sich auf vereinfachende Annahmen über das Geräte-Rauschen stützen. Eine präzisere Rauschverstärkung kann jedoch erhebliche Reduzierungen der Verzerrung des extrapolierten Schätzers ermöglichen, wie wir hier zeigen. 9 10 17 18 9 10 19 G G 9 17 18 20 21 22 Das in Ref. 1 vorgeschlagene sparse Pauli-Lindblad-Rauschmodell eignet sich besonders gut für die Rauschformung in ZNE. Das Modell hat die Form , in der ein Lindbladian ist, der Pauli-Sprungoperatoren mit Raten umfasst. Es wurde in Ref. 1 gezeigt, dass die Beschränkung auf Sprungoperatoren, die auf lokalen Qubit-Paaren wirken, ein sparsames Rauschmodell ergibt, das effizient gelernt werden kann und das, trotz seiner Einfachheit, das Rauschen erfasst, das mit Schichten von Zwei-Qubit-Clifford-Gates verbunden ist, einschließlich Übersprechen, wenn es mit zufälligen Pauli-Twirls , kombiniert wird. Die verrauschte Schicht von Gates wird als eine Reihe von idealen Gates modelliert, denen ein Rauschkanal Λ vorausgeht. Somit erzeugt die Anwendung von Λ vor der verrauschten Schicht einen gesamten Rauschkanal Λ mit Gewinn = + 1. Angesichts der exponentiellen Form des Pauli-Lindblad-Rauschmodells wird die Abbildung durch einfaches Multiplizieren der Pauli-Raten mit erhalten. Die resultierende Pauli-Abbildung kann abgetastet werden, um entsprechende Schaltungsinstanzen zu erhalten; für ≥ 0 ist die Abbildung ein Pauli-Kanal, der direkt abgetastet werden kann, während für < 0 eine quasi-probabilistische Abtastung mit einem Abtastaufwand von −2 für ein modellspezifisches erforderlich ist. Bei PEC wählen wir = −1, um ein Rauschniveau mit Gesamtauf-gewinn von Null zu erhalten. Bei ZNE verstärken wir stattdessen das Rauschen , , , auf verschiedene Gewinnstufen und schätzen die Null-Rausch-Grenze mittels Extrapolation. Für praktische Anwendungen müssen wir die Stabilität des erlernten Rauschmodells im Laufe der Zeit berücksichtigen (ergänzende Informationen III.A), beispielsweise aufgrund von Qubit-Wechselwirkungen mit fluktuierenden mikroskopischen Defekten, die als Zweiniveausysteme bekannt sind . 23 24 α G G α λi α α α γ α γ α 10 25 26 27 28 Clifford-Schaltungen dienen als nützliche Benchmarks für Schätzungen, die durch Fehlerabschwächung erzeugt werden, da sie klassisch effizient simuliert werden können . Insbesondere wird die gesamte Ising-Trotter-Schaltung zu einer Clifford-Schaltung, wenn h ein Vielfaches von π/2 ist. Als erstes Beispiel setzen wir daher das transversale Feld auf Null (R (0) = ) und entwickeln den Anfangszustand |0⟩⊗127 (Abb. 1a). Die CNOT-Gates lassen diesen Zustand nominal unverändert, sodass die idealen Gewicht-1-Observablen alle den Erwartungswert 1 haben; aufgrund der Pauli-Twirling jeder Schicht beeinflussen die reinen CNOTs den Zustand. Für jedes Trotter-Experiment charakterisieren wir zunächst die Rauschmodelle Λ für die drei Pauli-gedrehten CNOT-Schichten (Abb. 1c) und verwenden dann diese Modelle, um Trotter-Schaltungen mit Rauschgewinnstufen ∈ {1, 1.2, 1.6} zu implementieren. Abbildung 2a illustriert die Schätzung von ⟨ 106⟩ nach vier Trotter-Schritten (12 CNOT-Schichten). Für jedes erzeugen wir 2.000 Schaltungsinstanzen, bei denen wir vor jeder Schicht Produkte von Einzel- und Zwei-Qubit-Pauli-Fehlern aus mit Wahrscheinlichkeiten einfügen und jede Instanz 64 Mal ausführen, was insgesamt 384.000 Ausführungen ergibt. Mit zunehmender Anzahl von Schaltungsinstanzen konvergieren die Schätzungen von ⟨ 106⟩ , die den verschiedenen Gewinnen entsprechen, zu unterschiedlichen Werten. Die verschiedenen Schätzungen werden dann durch eine Extrapolationsfunktion in angepasst, um den idealen Wert ⟨ 106⟩0 zu schätzen. Die Ergebnisse in Abb. 2a zeigen die reduzierte Verzerrung durch exponentielle Extrapolation im Vergleich zur linearen Extrapolation. Nichtsdestotrotz kann die exponentielle Extrapolation Instabilitäten aufweisen, zum Beispiel wenn Erwartungswerte ununterscheidbar nahe bei Null liegen, und in solchen Fällen stufen wir die Komplexität des Extrapolationsmodells iterativ herab (siehe ergänzende Informationen II.B). Das in Abb. 2a skizzierte Verfahren wurde auf die Messergebnisse jedes Qubits angewendet, um alle = 127 Pauli-Erwartungswerte ⟨ ⟩0 zu schätzen. Die Variation der ungemilderten und gemilderten Beobachtungsgrößen in Abb. 2b zeigt die Nicht-Uniformität der Fehlerraten im gesamten Prozessor an. Wir berichten über die globale Magnetisierung entlang , , für zunehmende Tiefe in Abb. 2c. Obwohl das ungemilderte Ergebnis einen allmählichen Abfall von 1 mit zunehmender Abweichung für tiefere Schaltungen zeigt, verbessert ZNE die Übereinstimmung, wenn auch mit einer kleinen Verzerrung, mit dem idealen Wert selbst bis zu 20 Trotter-Schritten oder 60 CNOT-Tiefen erheblich. Bemerkenswert ist, dass die hier verwendete Anzahl von Stichproben viel geringer ist als die geschätzte Abtastlast, die für eine naive PEC-Implementierung benötigt würde (siehe ergänzende Informationen IV.B). Grundsätzlich kann diese Disparität durch fortschrittlichere PEC-Implementierungen, die Light-Cone-Tracing verwenden, oder durch Verbesserungen der Hardware-Fehlerraten erheblich reduziert werden. Da zukünftige Hardware- und Softwareentwicklungen die Abtastkosten senken, kann PEC bevorzugt werden, wenn dies erschwinglich ist, um die potenziell verzerrte Natur von ZNE zu vermeiden. 29 θ X I Zq l G Z G l i Z G G G Z 19 q N Zq 30 Abgemilderte Erwartungswerte von Trotter-Schaltungen unter Clifford-Bedingung h = 0. , Konvergenz von ungemilderten ( = 1), rauschverstärkten ( > 1) und rauschabgemilderten (ZNE) Schätzungen von ⟨ 106⟩ nach vier Trotter-Schritten. In allen Tafeln zeigen Fehlerbalken 68% Konfidenzintervalle, die mittels Perzentil-Bootstrap gewonnen wurden. Die exponentielle Extrapolation (exp, dunkelblau) übertrifft tendenziell die lineare Extrapolation (linear, hellblau), wenn die Unterschiede zwischen den konvergierten Schätzungen von ⟨ 106⟩ ≠0 gut aufgelöst sind. , Die Magnetisierung (große Marker) wird als Mittelwert der einzelnen Schätzungen von ⟨ ⟩ für alle Qubits (kleine Marker) berechnet. , Mit zunehmender Schaltungstiefe fallen die ungemilderten Schätzungen von monoton vom idealen Wert 1 ab. ZNE verbessert die Schätzungen erheblich, selbst nach 20 Trotter-Schritten (siehe ergänzende Informationen II für ZNE-Details). θ a G G Z Z G b Zq c Mz Als Nächstes testen wir die Wirksamkeit unserer Methoden für Nicht-Clifford-Schaltungen und den Clifford-Punkt h = π/2 mit nicht-trivialer verschränkender Dynamik im Vergleich zu den in Abb. 2 diskutierten identitätsäquivalenten Schaltungen. Die Nicht-Clifford-Schaltungen sind von besonderer Bedeutung, da die Gültigkeit der exponentiellen Extrapolation nicht mehr garantiert ist (siehe ergänzende Informationen V und Ref. 31). Wir beschränken die Schaltungstiefe auf fünf Trotter-Schritte (15 CNOT-Schichten) und wählen gezielt Beobachtungsgrößen aus, die exakt verifizierbar sind. Abbildung 3 zeigt die Ergebnisse, wenn h zwischen 0 und π/2 für drei solche Beobachtungsgrößen zunehmenden Gewichts durchlaufen wird. Abbildung 3a zeigt wie zuvor, einen Durchschnitt von Gewicht-1 ⟨ ⟩-Observablen, während Abb. 3b,c Gewicht-10 und Gewicht-17-Observablen zeigen. Letztere Operatoren sind Stabilisatoren der Clifford-Schaltung bei h = π/2, die durch die Entwicklung der Anfangsstabilisatoren 13 und 58 bzw. von |0⟩⊗127 für fünf Trotter-Schritte gewonnen werden, was nicht-verschwindende Erwartungswerte im stark verschränkenden Regime von besonderem Interesse sicherstellt. Obwohl die gesamte 127-Qubit-Schaltung experimentell ausgeführt wird, ermöglichen Light-Cone- und Tiefe-reduzierte (LCDR) Schaltungen die Brute-Force-klassische Simulation der Magnetisierung und der Gewicht-10-Größe bei dieser Tiefe (siehe ergänzende Informationen VII). Über den gesamten Bereich des h-Durchlaufs zeigen die fehlerabgemilderten Observablen eine gute Übereinstimmung mit der exakten Entwicklung (siehe Abb. 3a,b). Für die Gewicht-17-Größe expandiert der Light-Cone auf 68 Qubits, eine Skala jenseits der Brute-Force-klassischen Simulation, sodass wir auf Tensornetzwerkmethoden zurückgreifen. θ θ Mz Z θ Z Z θ Erwartungswert-Schätzungen für h-Durchläufe bei fester Tiefe von fünf Trotter-Schritten für die Schaltung in Abb. 1a. Die betrachteten Schaltungen sind Nicht-Clifford, außer bei h = 0, π/2. Light-Cone- und Tiefenreduktionen der jeweiligen Schaltungen ermöglichen eine exakte klassische Simulation der Observablen für alle h. Bei allen drei dargestellten Größen (Panel-Titel) folgen die abgemilderten experimentellen Ergebnisse (blau) eng dem exakten Verhalten (grau). In allen Tafeln zeigen Fehlerbalken 68% Konfidenzintervalle, die mittels Perzentil-Bootstrap gewonnen wurden. Die Gewicht-10- und Gewicht-17-Observablen in und sind Stabilisatoren der Schaltung bei h = π/2 mit den jeweiligen Eigenwerten +1 und −1; alle Werte in wurden zur visuellen Vereinfachung negiert. Der untere inset in zeigt die Variation von ⟨ ⟩ bei h = 0.2 über das Gerät vor und nach der Abmilderung und vergleicht sie mit exakten Ergebnissen. Obere insets in allen Tafeln illustrieren kausale Lichtkegel, die in Blau die gemessenen End-Qubits (oben) und die nominelle Menge der Anfangs-Qubits, die den Zustand der End-Qubits beeinflussen können (unten), anzeigen. hängt auch von 126 weiteren Kegeln ab, die nicht im Beispiel gezeigt sind. Obwohl in allen Tafeln exakte Ergebnisse aus Simulationen von nur kausalen Qubits erzielt werden, schließen wir Tensornetzwerk-Simulationen aller 127 Qubits (MPS, isoTNS) ein, um den Gültigkeitsbereich dieser Techniken zu bewerten, wie im Haupttext diskutiert. isoTNS-Ergebnisse für die Gewicht-17-Größe in sind mit aktuellen Methoden nicht zugänglich (siehe ergänzende Informationen VI). Alle Experimente wurden für = 1, 1.2, 1.6 durchgeführt und wie in den ergänzenden Informationen II.B extrapoliert. Für jedes erzeugten wir 1.800–2.000 zufällige Schaltungsinstanzen für und und 2.500–3.000 Instanzen für . θ θ θ b c θ c a Zq θ Mz c G G a b c Tensornetzwerke werden häufig verwendet, um Quantenzustandsvektoren zu approximieren und zu komprimieren, die bei der Untersuchung von niedrigenergetischen Eigenzuständen und der Zeitentwicklung lokaler Hamiltonians , , entstehen, und in jüngerer Zeit erfolgreich zur Simulation von verrauschten Quantenschaltungen mit geringer Tiefe eingesetzt wurden , , . Die Simulationsgenauigkeit kann durch Erhöhung der Bindungsdimension verbessert werden, die die Verschränkung des dargestellten Quantenzustands begrenzt, mit einer Rechenkosten-Skalierung polynomial mit . Da die Verschränkung ( 2 32 33 34 35 36 χ χ