Autoren: Youngseok Kim Andrew Eddins Sajant Anand Ken Xuan Wei Ewout van den Berg Sami Rosenblatt Hasan Nayfeh Yantao Wu Michael Zaletel Kristan Temme Abhinav Kandala Abstrakt Quantencomputing verspricht erhebliche Geschwindigkeitssteigerungen gegenüber seinem klassischen Gegenstück für bestimmte Probleme. Die größte Hürde für die Ausschöpfung seines vollen Potenzials sind jedoch inhärente Geräusche in diesen Systemen. Die allgemein anerkannte Lösung für diese Herausforderung ist die Implementierung fehlertoleranter Quantenschaltungen, die für aktuelle Prozessoren noch außer Reichweite ist. Hier berichten wir über Experimente mit einem verrauschten 127-Qubit-Prozessor und demonstrieren die Messung genauer Erwartungswerte für Schaltungsvolumina, die über die Brute-Force-klassische Berechnung hinausgehen. Wir argumentieren, dass dies ein Beweis für den Nutzen des Quantencomputings in einer Ära vor der Fehlertoleranz darstellt. Diese experimentellen Ergebnisse werden durch Fortschritte bei der Kohärenz und Kalibrierung eines supraleitenden Prozessors dieses Ausmaßes sowie durch die Fähigkeit, Geräusche über ein solch großes Gerät hinweg zu charakterisieren und kontrolliert zu manipulieren, ermöglicht. Wir etablieren die Genauigkeit der gemessenen Erwartungswerte, indem wir sie mit den Ergebnissen exakt verifizierbarer Schaltungen vergleichen. Im Bereich starker Verschränkung liefert der Quantencomputer korrekte Ergebnisse, für die führende klassische Näherungen wie reine zustandsbasierte 1D- (Matrixproduktzustände, MPS) und 2D- (isometrische Tensornetzwerkzustände, isoTNS) Tensornetzwerkmethoden , zusammenbrechen. Diese Experimente demonstrieren ein grundlegendes Werkzeug für die Realisierung von Quantenanwendungen für die nahe Zukunft , . 1 2 3 4 5 Hauptteil Es ist fast allgemein anerkannt, dass fortgeschrittene Quantenalgorithmen wie das Faktorisieren oder die Phasenabschätzung eine Quantenfehlerkorrektur erfordern werden. Es ist jedoch sehr umstritten, ob die derzeit verfügbaren Prozessoren ausreichend zuverlässig gemacht werden können, um andere Quantenschaltungen mit kürzerer Tiefe in einem Umfang auszuführen, der einen Vorteil für praktische Probleme bieten könnte. An dieser Stelle besteht die konventionelle Erwartung, dass die Implementierung selbst einfacher Quantenschaltungen mit dem Potenzial, klassische Fähigkeiten zu übertreffen, warten muss, bis fortgeschrittenere, fehlertolerante Prozessoren verfügbar sind. Trotz des enormen Fortschritts der Quantenhardware in den letzten Jahren unterstützen einfache Fidelitätsgrenzen diese düstere Prognose; man schätzt, dass eine Quantenschaltung von 100 Qubits Breite und 100 Gate-Ebenen Tiefe mit 0,1% Gate-Fehler eine Zustandsfidelität von weniger als 5 × 10⁻⁴ ergibt. Nichtsdestotrotz bleibt die Frage, ob Eigenschaften des idealen Zustands auch bei solch geringen Fidelitäten zugänglich sind. Der Ansatz der Fehlerminderung , für einen kurzfristigen Quantenvorteil auf verrauschten Geräten adressiert genau diese Frage, d. h., dass man genaue Erwartungswerte aus mehreren verschiedenen Durchläufen der verrauschten Quantenschaltung unter Verwendung klassischer Nachbearbeitung erzeugen kann. 6 7 8 9 10 Ein Quantenvorteil kann in zwei Schritten erreicht werden: Erstens durch den Nachweis der Fähigkeit bestehender Geräte, genaue Berechnungen in einem Umfang durchzuführen, der über die Brute-Force-klassische Simulation hinausgeht, und zweitens durch das Finden von Problemen mit zugehörigen Quantenschaltungen, die aus diesen Geräten einen Vorteil ziehen. Hier konzentrieren wir uns auf den ersten Schritt und zielen nicht darauf ab, Quantenschaltungen für Probleme mit nachgewiesenen Geschwindigkeitssteigerungen zu implementieren. Wir verwenden einen supraleitenden Quantenprozessor mit 127 Qubits, um Quantenschaltungen mit bis zu 60 Schichten von Zwei-Qubit-Gates auszuführen, insgesamt 2.880 CNOT-Gates. Allgemeine Quantenschaltungen dieser Größe gehen über das hinaus, was mit Brute-Force-klassischen Methoden machbar ist. Wir konzentrieren uns daher zunächst auf spezifische Testfälle von Schaltungen, die eine exakte klassische Verifizierung der gemessenen Erwartungswerte ermöglichen. Anschließend wenden wir uns Schaltungsregimen und Beobachtbaren zu, bei denen die klassische Simulation schwierig wird, und vergleichen mit Ergebnissen von modernsten approximativen klassischen Methoden. Unsere Benchmark-Schaltung ist die Trotterisierung der Zeitentwicklung eines 2D-transversalen Ising-Modells, das die Topologie des Qubit-Prozessors teilt (Abb. 1a). Das Ising-Modell tritt in verschiedenen Bereichen der Physik extensiv auf und hat kreative Erweiterungen in jüngsten Simulationen erfahren, die Quanten-Vielteilchenphänomene untersuchen, wie z. B. Zeitkristalle , , Quanten-Scars und Majorana-Randmoden . Als Test für die Nützlichkeit der Quantenberechnung ist jedoch die Zeitentwicklung des 2D-transversalen Ising-Modells im Grenzfall des großen Verschränkungswachstums am relevantesten, bei dem skalierbare klassische Näherungen Schwierigkeiten haben. 11 12 13 14 , Jeder Trotter-Schritt der Ising-Simulation umfasst einzelne Qubit- - und Zwei-Qubit- -Rotationen. Zufällige Pauli-Gates werden eingefügt, um das Rauschen jeder CNOT-Schicht zu verzwirbeln (Spiralen) und kontrolliert zu skalieren. Der Apostroph kennzeichnet die Konjugation durch die ideale Schicht. , Drei CNOT-Gate-Schichten der Tiefe 1 reichen aus, um Wechselwirkungen zwischen allen benachbarten Paaren auf ibm_kyiv zu realisieren. , Charakterisierungsexperimente lernen effizient die lokalen Pauli-Fehlerraten , (Farbskalen), die den gesamten Pauli-Kanal Λ umfassen, der mit der -ten verzwirbelten CNOT-Schicht assoziiert ist. (Abbildung erweitert in den ergänzenden Informationen IV.A). , Pauli-Fehler, die mit proportionalen Raten eingefügt werden, können verwendet werden, um das intrinsische Rauschen entweder zu kompensieren (PEC) oder zu verstärken (ZNE). a X ZZ b c λl i l l d Insbesondere betrachten wir die Zeitdynamik des Hamiltonians, wobei > 0 die Kopplung benachbarter Spins mit < und das globale transversale Feld ist. Die Spindynamik aus einem Anfangszustand kann mittels erster Trotter-Zerlegung des Zeitentwicklungsoperators simuliert werden, J i j h wobei die Evolutionszeit in / Trotter-Schritte diskretisiert wird und und die - bzw. -Rotations-Gates sind. Wir sind nicht an dem Modellfehler aufgrund der Trotterisierung interessiert und betrachten daher die trotterisierte Schaltung als ideal für jeden klassischen Vergleich. Aus Gründen der experimentellen Einfachheit konzentrieren wir uns auf den Fall = −2 = −π/2, so dass die -Rotation nur ein CNOT erfordert, T T δt ZZ X θJ Jδt ZZ wobei die Gleichheit bis auf eine globale Phase gilt. In der resultierenden Schaltung (Abb. 1a) besteht jeder Trotter-Schritt aus einer Schicht von Ein-Qubit-Rotationen, R ( ), gefolgt von kommutierenden Schichten von parallelisierten Zwei-Qubit-Rotationen, R ( ). X θh ZZ θJ Für die experimentelle Implementierung verwendeten wir hauptsächlich den IBM Eagle-Prozessor ibm_kyiv, der aus 127 festfrequenten Transmon-Qubits mit Heavy-Hex-Konnektivität und Median- 1- und 2-Zeiten von 288 μs bzw. 127 μs besteht. Diese Kohärenzzeiten sind für supraleitende Prozessoren dieser Größe beispiellos und ermöglichen die in dieser Arbeit angesprochenen Schaltungstiefen. Die Zwei-Qubit-CNOT-Gates zwischen Nachbarn werden durch Kalibrierung der Cross-Resonance-Wechselwirkung realisiert. Da jedes Qubit höchstens drei Nachbarn hat, können alle -Wechselwirkungen in drei Schichten parallelisierter CNOT-Gates durchgeführt werden (Abb. 1b). Die CNOT-Gates in jeder Schicht werden für optimale simultane Operation kalibriert (siehe Methoden für weitere Details). 15 T T 16 ZZ Nun sehen wir, dass diese Verbesserungen der Hardware-Leistung die Ausführung noch größerer Probleme mit Fehlerminderung ermöglichen, im Vergleich zu neueren Arbeiten , auf dieser Plattform. Probabilistische Fehlerkompensation (PEC) wurde gezeigt als sehr effektiv zur Bereitstellung unverzerrter Schätzungen von Beobachtbaren. Bei PEC wird ein repräsentatives Rauschmodell gelernt und effektiv invertiert, indem aus einer Verteilung von verrauschten Schaltungen, die mit dem gelernten Modell zusammenhängen, abgetastet wird. Für die aktuellen Fehlerraten auf unserem Gerät bleibt jedoch der Abtastaufwand für die in dieser Arbeit betrachteten Schaltungsvolumina restriktiv, wie unten weiter erörtert. 1 17 9 1 Daher wenden wir uns der Null-Rausch-Extrapolation (ZNE) , , , zu, die einen verzerrten Schätzer mit potenziell viel geringeren Abtastkosten liefert. ZNE ist entweder eine polynomiale , oder exponentielle > Extrapolationsmethode für verrauschte Erwartungswerte als Funktion eines Rauschparameters. Dies erfordert die kontrollierte Verstärkung des intrinsischen Hardware-Rauschens um einen bekannten Verstärkungsfaktor , um zum idealen = 0 Ergebnis zu extrapolieren. ZNE wurde teilweise weit verbreitet, da Rauschverstärkungsschemata, die auf Pulsdehnung , , oder Unter-Schaltungs-Wiederholung , , basieren, die Notwendigkeit einer präzisen Rauschermittlung umgangen haben, während sie sich auf vereinfachende Annahmen über das Geräte-Rauschen stützen. Präzisere Rauschverstärkung kann jedoch erhebliche Reduzierungen der Verzerrung des extrapolierten Schätzers ermöglichen, wie wir hier demonstrieren. 9 10 17 18 9 10 19 G G 9 17 18 20 21 22 Das in Ref. 1 vorgeschlagene dünnbesetzte Pauli-Lindblad-Rauschmodell erweist sich für die Rauschformung in ZNE als besonders gut geeignet. Das Modell hat die Form , wobei ein Lindbladian ist, der Pauli-Sprungoperatoren mit Raten umfasst. Es wurde in Ref. 1 gezeigt, dass die Beschränkung auf Sprungoperatoren, die auf lokale Qubit-Paare wirken, ein dünnbesetztes Rauschmodell ergibt, das für viele Qubits effizient gelernt werden kann und das Rauschen, das mit Schichten von Zwei-Qubit-Clifford-Gates verbunden ist, einschließlich Nebensprechen, genau erfasst, wenn es mit zufälligen Pauli-Twirls , kombiniert wird. Die verrauschte Schicht von Gates wird als eine Reihe von idealen Gates modelliert, denen ein Rauschkanal Λ vorangeht. Somit erzeugt die Anwendung von Λ vor der verrauschten Schicht einen Gesamt-Rauschkanal Λ mit Verstärkung = + 1. Angesichts der exponentiellen Form des Pauli-Lindblad-Rauschmodells wird die Abbildung durch einfaches Multiplizieren der Pauli-Raten mit erhalten. Die resultierende Pauli-Abbildung kann abgetastet werden, um geeignete Schaltungsinstanzen zu erhalten; für ≥ 0 ist die Abbildung ein Pauli-Kanal, der direkt abgetastet werden kann, während für < 0 eine quasi-probabilistische Abtastung mit einem Abtastaufwand von ⁻²ᵃ für ein modellabhängiges benötigt wird. Bei PEC wählen wir = −1, um ein Gesamt-Null-Verstärkungs-Rauschlevel zu erhalten. Bei ZNE verstärken wir stattdessen das Rauschen , , , auf verschiedene Verstärkungsfaktoren und schätzen das Null-Rausch-Limit mittels Extrapolation. Für praktische Anwendungen müssen wir die Stabilität des gelernten Rauschmodells im Laufe der Zeit berücksichtigen (ergänzende Informationen III.A), z. B. aufgrund von Qubit-Wechselwirkungen mit fluktuierenden mikroskopischen Defekten, die als Zwei-Niveau-Systeme bekannt sind. Pi λi 23 24 α G G α λi α α α γ γ α 10 25 26 27 28 Clifford-Schaltungen dienen als nützliche Benchmarks für Schätzungen, die durch Fehlerminderung erzeugt werden, da sie klassisch effizient simuliert werden können . Bemerkenswerterweise wird die gesamte Ising-Trotter-Schaltung zu einer Clifford-Schaltung, wenn h als Vielfaches von π/2 gewählt wird. Als erstes Beispiel setzen wir daher das transversale Feld auf Null (R (0) = ) und entwickeln den Anfangszustand |0⟩⊗¹²⁷ (Abb. 1a). Die CNOT-Gates verändern diesen Zustand nominal nicht, sodass die idealen Gewicht-1-Beobachtbaren alle einen Erwartungswert von 1 haben; aufgrund der Pauli-Verzwirbelung jeder Schicht beeinflussen die bloßen CNOTs den Zustand. Für jedes Trotter-Experiment haben wir zunächst die Rauschmodelle Λ für die drei Pauli-verzwirbelten CNOT-Schichten charakterisiert (Abb. 1c) und dann diese Modelle verwendet, um Trotter-Schaltungen mit Rauschverstärkungsfaktoren ∈ {1, 1.2, 1.6} zu implementieren. Abbildung 2a veranschaulicht die Schätzung von ⟨ ₁₀₆⟩ nach vier Trotter-Schritten (12 CNOT-Schichten). Für jedes haben wir 2.000 Schaltungsinstanzen generiert, bei denen wir vor jeder Schicht Produkte von Ein-Qubit- und Zwei-Qubit-Pauli-Fehlern aus eingefügt haben, die mit Wahrscheinlichkeiten gezogen wurden, und jede Instanz 64 Mal ausgeführt haben, was insgesamt 384.000 Ausführungen ergibt. Mit zunehmender Anhäufung von Schaltungsinstanzen konvergieren die Schätzungen von ⟨ ₁₀₆⟩ , die den verschiedenen Verstärkungsfaktoren entsprechen, zu unterschiedlichen Werten. Die verschiedenen Schätzungen werden dann durch eine extrapolierende Funktion von angepasst, um den idealen Wert ⟨ ₁₀₆⟩₀ zu schätzen. Die Ergebnisse in Abb. 2a heben die reduzierte Verzerrung durch exponentielle Extrapolation im Vergleich zur linearen Extrapolation hervor. Dennoch kann die exponentielle Extrapolation Instabilitäten aufweisen, z. B. wenn Erwartungswerte ununterscheidbar nahe bei Null liegen, und in solchen Fällen stufen wir die Komplexität des Extrapolationsmodells iterativ herab (siehe ergänzende Informationen II.B). Das in Abb. 2a skizzierte Verfahren wurde auf die Messergebnisse jedes Qubits angewendet, um alle = 127 Pauli-Erwartungswerte ⟨ ⟩₀ zu schätzen. Die Variation der unverminderten und verminderten Beobachtbaren in Abb. 2b deutet auf die Ungleichmäßigkeit der Fehlerraten über den gesamten Prozessor hin. Wir berichten über die globale Magnetisierung entlang , , für zunehmende Tiefe in Abb. 2c. Obwohl das unverminderte Ergebnis einen allmählichen Abfall von 1 mit zunehmender Abweichung für tiefere Schaltungen zeigt, verbessert ZNE die Übereinstimmung erheblich, wenn auch mit einer kleinen Verzerrung, mit dem idealen Wert, selbst bis zu 20 Trotter-Schritten oder 60 CNOT-Tiefen. Bemerkenswerterweise ist die hier verwendete Anzahl von Stichproben viel geringer als die geschätzte Stichprobenbelastung, die bei einer naiven PEC-Implementierung erforderlich wäre (siehe ergänzende Informationen IV.B). Grundsätzlich kann diese Diskrepanz durch fortschrittlichere PEC-Implementierungen unter Verwendung von Lichtkegel-Tracing oder durch Verbesserungen der Hardware-Fehlerraten stark reduziert werden. Da zukünftige Hardware- und Softwareentwicklungen die Abtastkosten senken, kann PEC bevorzugt werden, wenn es erschwinglich ist, um die potenziell verzerrte Natur von ZNE zu vermeiden. 29 θ X I Zq l G Z G l i Z G G G Z 19 q N Zq 30 Abgemilderte Erwartungswerte von Trotter-Schaltungen unter Clifford-Bedingung h = 0. , Konvergenz von unverminderten ( = 1), rausverstärkten ( > 1) und rauschabgemilderten (ZNE) Schätzungen von ⟨ ₁₀₆⟩ nach vier Trotter-Schritten. In allen Tafeln geben die Fehlerbalken 68% Konfidenzintervalle an, die mittels Perzentil-Bootstrap erhalten wurden. Die exponentielle Extrapolation (exp, dunkelblau) übertrifft tendenziell die lineare Extrapolation (linear, hellblau), wenn die Unterschiede zwischen den konvergierten Schätzungen von ⟨ ₁₀₆⟩ ≠0 gut aufgelöst sind. , Die Magnetisierung (große Marker) wird als Mittelwert der einzelnen Schätzungen von ⟨ ⟩ für alle Qubits (kleine Marker) berechnet. , Mit zunehmender Schaltungstiefe fallen die unverminderten Schätzungen von monoton vom idealen Wert von 1 ab. ZNE verbessert die Schätzungen erheblich, selbst nach 20 Trotter-Schritten (siehe ergänzende Informationen II für ZNE-Details). θ a G G Z Z G b Zq c Mz Als nächstes testen wir die Wirksamkeit unserer Methoden für Nicht-Clifford-Schaltungen und den Clifford-Punkt h = π/2 mit nicht-trivialer verschränkender Dynamik im Vergleich zu den in Abb. 2 diskutierten identitätsäquivalenten Schaltungen. Die Nicht-Clifford-Schaltungen sind von besonderer Bedeutung zum Testen, da die Gültigkeit der exponentiellen Extrapolation nicht mehr garantiert ist (siehe ergänzende Informationen V und Ref. 31). Wir beschränken die Schaltungstiefe auf fünf Trotter-Schritte (15 CNOT-Schichten) und wählen sorgfältig Beobachtbare, die exakt verifizierbar sind. Abbildung 3 zeigt die Ergebnisse, wenn h zwischen 0 und π/2 für drei solche Beobachtbaren steigenden Gewichts durchlaufen wird. Abb. 3a zeigt wie zuvor, einen Durchschnitt von Gewicht-1-⟨ ⟩-Beobachtbaren, während Abb. 3b,c Gewicht-10- und Gewicht-17-Beobachtbare zeigen. Letztere Operatoren sind Stabilisatoren der Clifford-Schaltung bei h = π/2, erhalten durch die Entwicklung der Anfangsstabilisatoren ₁₃ und ₅₈ von |0⟩⊗¹²⁷ über fünf Trotter-Schritte, was nicht verschwindende Erwartungswerte im stark verschränkenden Bereich von besonderem Interesse sicherstellt. Obwohl die gesamte 127-Qubit-Schaltung experimentell ausgeführt wird, ermöglichen Lichtkegel- und Tiefenreduzierte (LCDR)-Schaltungen die Brute-Force-klassische Simulation der Magnetisierung und des Gewicht-10-Operators bei dieser Tiefe (siehe ergänzende Informationen VII). Über den gesamten Bereich des h-Durchlaufs zeigen die abgemilderten Beobachtbaren eine gute Übereinstimmung mit der exakten Entwicklung (siehe Abb. 3a,b). Bei dem Gewicht-17-Operator erweitert sich jedoch der Lichtkegel auf 68 Qubits, ein Maßstab jenseits der Brute-Force-klassischen Simulation, sodass wir uns Tensornetzwerk-Methoden zuwenden. θ θ Mz Z θ Z Z θ Erwartungswertschätzungen für h-Durchläufe bei einer festen Tiefe von fünf Trotter-Schritten für die Schaltung in Abb. 1a. Die betrachteten Schaltungen sind Nicht-Clifford, außer bei h = 0, π/2. Lichtkegel- und Tiefenreduktionen der jeweiligen Schaltungen ermöglichen eine exakte klassische Simulation der Beobachtbaren für alle h. Für alle drei dargestellten Größen (Panel-Titel) folgen die abgemilderten experimentellen Ergebnisse (blau) eng dem exakten Verhalten (grau). In allen Tafeln geben Fehlerbalken 68% Konfidenzintervalle an, die mittels Perzentil-Bootstrap erhalten wurden. Die Gewicht-10- und Gewicht-17-Beobachtbaren in und sind Stabilisatoren der Schaltung bei h = π/2 mit den Eigenwerten +1 bzw. −1; alle Werte in wurden zur visuellen Vereinfachung negiert. Der untere Einblick in zeigt die Variation von ⟨ ⟩ bei h = 0,2 über das Gerät vor und nach der Abmilderung und vergleicht sie mit exakten Ergebnissen. Obere Einblicke in allen Tafeln veranschaulichen kausale Lichtkegel, die in Blau die gemessenen End-Qubits (oben) und die nominale Menge der Anfangs-Qubits anzeigen, die den Zustand der End-Qubits beeinflussen können (unten). hängt auch von 126 anderen Kegeln ab, abgesehen von dem gezeigten Beispiel. Obwohl in allen Tafeln exakte Ergebnisse aus Simulationen von nur kausalen Qubits erzielt werden, schließen wir Tensornetzwerk-Simulationen aller 127 Qubits (MPS, isoTNS) ein, um die Gültigkeitsdomäne für diese Techniken zu beurteilen, wie im Haupttext erörtert. isoTNS-Ergebnisse für den Gewicht-17-Operator in sind mit aktuellen Methoden nicht zugänglich (siehe ergänzende Informationen VI). Alle Experimente wurden für = 1, 1.2, 1.6 durchgeführt und wie in ergänzenden Informationen II.B extrapoliert. Für jedes haben wir 1.800–2.000 Zufallsschaltungsinstanzen für und und 2.500–3.000 Instanzen für generiert. θ θ θ b c θ c a Zq θ Mz c G G a b c Tensornetzwerke werden seit langem zur Approximation und Kompression von Quantenzustandsvektoren verwendet, die