Autorzy: Youngseok Kim Andrew Eddins Sajant Anand Ken Xuan Wei Ewout van den Berg Sami Rosenblatt Hasan Nayfeh Yantao Wu Michael Zaletel Kristan Temme Abhinav Kandala Streszczenie Obliczenia kwantowe obiecują znaczące przyspieszenie w porównaniu z klasycznymi odpowiednikami dla pewnych problemów. Jednak największą przeszkodą w pełnym wykorzystaniu ich potencjału są szumy, które są nieodłączne dla tych systemów. Powszechnie akceptowanym rozwiązaniem tego wyzwania jest implementacja odpornych na błędy obwodów kwantowych, co jest poza zasięgiem obecnych procesorów. Tutaj przedstawiamy wyniki eksperymentów na szumiącym procesorze 127-kubitowym i demonstrujemy pomiar dokładnych wartości oczekiwanych dla objętości obwodów w skali wykraczającej poza obliczenia klasyczne metodą brute-force. Argumentujemy, że stanowi to dowód użyteczności obliczeń kwantowych w erze przed-odpornej na błędy. Te wyniki eksperymentalne są możliwe dzięki postępom w koherencji i kalibracji nadprzewodzącego procesora w tej skali oraz możliwości scharakteryzowania i kontrolowanego manipulowania szumami w tak dużym urządzeniu. Dokładność zmierzonych wartości oczekiwanych ustalamy, porównując je z wynikami dokładnie weryfikowalnych obwodów. W reżimie silnego splątania komputer kwantowy dostarcza prawidłowych wyników, dla których wiodące klasyczne aproksymacje, takie jak metody sieci tensorowych opartych na stanach czystych (stany produktu macierzowego, MPS) i 2D (izometryczne stany sieci tensorowych, isoTNS) , zawodzą. Te eksperymenty demonstrują fundamentalne narzędzie do realizacji zastosowań kwantowych w krótkim terminie , . 1 2 3 4 5 Główne Prawie powszechnie przyjmuje się, że zaawansowane algorytmy kwantowe, takie jak faktoryzacja lub estymacja fazy , będą wymagały kwantowej korekcji błędów. Jednakże ostro dyskutuje się, czy dostępne obecnie procesory mogą być wystarczająco niezawodne do uruchamiania innych, krótszych obwodów kwantowych o mniejszej głębokości, w skali, która mogłaby zapewnić przewagę w praktycznych problemach. W tym momencie konwencjonalne oczekiwania są takie, że implementacja nawet prostych obwodów kwantowych, które mają potencjał przewyższenia możliwości klasycznych, będzie musiała poczekać na nadejście bardziej zaawansowanych, odpornych na błędy procesorów. Pomimo ogromnego postępu sprzętu kwantowego w ostatnich latach, proste granice wierności potwierdzają tę ponurą prognozę; szacuje się, że obwód kwantowy o szerokości 100 kubitów i głębokości 100 warstw bramek, wykonany z błędem bramki 0,1%, daje wierność stanu mniejszą niż 5 × 10−4. Niemniej jednak pozostaje pytanie, czy właściwości idealnego stanu można uzyskać nawet przy tak niskich wiernościach. Podejście oparte na redukcji błędów , do osiągnięcia przewagi kwantowej w krótkim terminie na szumiących urządzeniach dokładnie odpowiada na to pytanie, tj. że można uzyskać dokładne wartości oczekiwane z kilku różnych przebiegów szumiącego obwodu kwantowego przy użyciu klasycznego przetwarzania końcowego. 6 7 8 9 10 Do przewagi kwantowej można zbliżyć się w dwóch krokach: po pierwsze, demonstrując zdolność istniejących urządzeń do wykonywania dokładnych obliczeń w skali, która wykracza poza symulację klasyczną metodą brute-force, a po drugie, znajdując problemy z powiązanymi obwodami kwantowymi, które czerpią korzyści z tych urządzeń. Tutaj skupiamy się na pierwszym kroku i nie dążymy do implementacji obwodów kwantowych dla problemów z udowodnionymi przyspieszeniami. Używamy nadprzewodzącego procesora kwantowego z 127 kubitami do uruchamiania obwodów kwantowych z maksymalnie 60 warstwami dwukubitowych bramek, co daje łącznie 2880 bramek CNOT. Ogólne obwody kwantowe tego rozmiaru wykraczają poza możliwości metod klasycznych brute-force. W związku z tym najpierw skupiamy się na specyficznych przypadkach testowych obwodów, które pozwalają na dokładne klasyczne weryfikacje zmierzonych wartości oczekiwanych. Następnie przechodzimy do reżimów obwodów i obserwabli, w których symulacja klasyczna staje się wyzwaniem i porównujemy z wynikami najnowocześniejszych przybliżonych metod klasycznych. Naszym benchmarkowym obwodem jest Trotteryzowana ewolucja czasowa dwuwymiarowego modelu Isinga z polem poprzecznym, dzieląca topologię procesora kubitowego (Rys. ). Model Isinga pojawia się szeroko w wielu dziedzinach fizyki i znalazł kreatywne rozszerzenia w ostatnich symulacjach eksplorujących kwantowe zjawiska wielociałowe, takie jak kryształy czasowe , , blizny kwantowe i mody brzegowe Majarany . Jednakże jako test użyteczności obliczeń kwantowych, ewolucja czasowa dwuwymiarowego modelu Isinga z polem poprzecznym jest najbardziej istotna w granicy wzrostu splątania na dużą skalę, w której skalowalne aproksymacje klasyczne napotykają trudności. 1a 11 12 13 14 , Każdy krok Trottera symulacji Isinga zawiera jednokubitowe obroty *X* i dwukubitowe obroty *ZZ*. Losowe bramki Pauliego są wstawiane w celu skręcania (spirale) i kontrolowanego skalowania szumów każdej warstwy CNOT. Dagger oznacza sprzężenie przez idealną warstwę. , Trzy warstwy CNOT o głębokości 1 wystarczają do realizacji interakcji między wszystkimi sąsiadującymi parami na ibm_kyiv. , Eksperymenty charakteryzacyjne efektywnie uczą lokalnych współczynników błędu Pauliego *λl,i* (skala kolorów) stanowiących ogólny kanał Pauliego Λl związany z l-tą skręconą warstwą CNOT. (Rysunek rozszerzony w Informacjach Dodatkowych ). , Błędy Pauliego wprowadzane w proporcjonalnych szybkościach mogą być używane do anulowania (PEC) lub wzmacniania (ZNE) wewnętrznych szumów. a b c IV.A d W szczególności rozważamy dynamikę czasową Hamiltonianu, w którym *J* > 0 jest sprzężeniem najbliższych sąsiadów spinów z *i* < *j*, a *h* jest globalnym polem poprzecznym. Dynamikę spinów ze stanu początkowego można symulować za pomocą dekompozycji Trottera pierwszego rzędu operatora ewolucji czasowej, gdzie czas ewolucji *T* jest dyskretyzowany na *T*/*δt* kroków Trottera, a i są bramkami obrotu *ZZ* i *X*, odpowiednio. Nie przejmujemy się błędem modelu wynikającym z Trotteryzacji i traktujemy obwód Trotteryzowany jako idealny do wszelkich porównań klasycznych. Dla uproszczenia eksperymentalnego skupiamy się na przypadku *θJ* = −2*Jδt* = −π/2, tak aby obrót *ZZ* wymagał tylko jednego CNOT, gdzie równość zachodzi z dokładnością do globalnej fazy. W wynikowym obwodzie (Rys. ), każdy krok Trottera odpowiada warstwie jednokubitowych obrotów, R*X*(θh), po których następują przemienne warstwy równoległych dwukubitowych obrotów, R*ZZ*(θJ). 1a Do implementacji eksperymentalnej użyliśmy głównie procesora IBM Eagle ibm_kyiv, składającego się ze 127 kubitów transmonowych o stałej częstotliwości z połączeniem w kształcie ciężkiej heksagony i medianowymi czasami *T*1 i *T*2 wynoszącymi odpowiednio 288 μs i 127 μs. Te czasy koherencji są bezprecedensowe dla nadprzewodzących procesorów tej skali i pozwalają na osiągnięcie głębokości obwodów dostępnych w tej pracy. Dwukubitowe bramki CNOT między sąsiadami są realizowane przez kalibrację interakcji z krzyżową rezonansem . Ponieważ każdy kubit ma co najwyżej trzech sąsiadów, wszystkie interakcje *ZZ* można wykonać w trzech warstwach równoległych bramek CNOT (Rys. ). Bramki CNOT w każdej warstwie są kalibrowane dla optymalnej jednoczesnej pracy (więcej szczegółów w ). 15 16 1b Metody Widzimy teraz, że te ulepszenia wydajności sprzętu umożliwiają udane wykonanie jeszcze większych problemów z redukcją błędów, w porównaniu z niedawnymi pracami , na tej platformie. Wykazano , że probabilistyczna anulacja błędów (PEC) jest bardzo skuteczna w dostarczaniu nieobciążonych oszacowań obserwabli. W PEC model szumu reprezentatywnego jest uczony i efektywnie odwracany poprzez próbkowanie z rozkładu szumiących obwodów powiązanych z nauczonym modelem. Jednakże dla obecnych stawek błędów na naszym urządzeniu, narzut próbkowania dla objętości obwodów rozważanych w tej pracy pozostaje restrykcyjny, co omówiono dalej. 1 17 1 Dlatego też zwracamy się do ekstrapolacji zerowego szumu (ZNE) , , , , która dostarcza obciążonego estymatora przy potencjalnie znacznie niższym koszcie próbkowania. ZNE jest metodą ekstrapolacji wielomianową , lub wykładniczą dla szumiących wartości oczekiwanych jako funkcji parametru szumu. Wymaga to kontrolowanego wzmocnienia wewnętrznego szumu sprzętowego przez znany współczynnik wzmocnienia *G*, aby ekstrapolować do idealnej wartości *G* = 0. ZNE jest szeroko stosowane częściowo dlatego, że schematy wzmacniania szumu oparte na rozciąganiu impulsów , , lub powtarzaniu podukładów , , ominęły potrzebę precyzyjnego uczenia się szumów, opierając się na uproszczonych założeniach dotyczących szumu urządzenia. Jednakże dokładniejsze wzmacnianie szumów może pozwolić na znaczną redukcję obciążenia estymatora ekstrapolowanego, co demonstrujemy tutaj. 9 10 17 18 9 10 19 9 17 18 20 21 22 Spiro-Pauli-Lindblad model szumu zaproponowany w ref. okazuje się szczególnie dobrze dopasowany do kształtowania szumów w ZNE. Model ma postać , w której jest Lindbladianem składającym się z operatorów skoków Pauliego *Pi* ważonych przez współczynniki *λi*. Pokazano w ref. , że ograniczenie do operatorów skoków działających na lokalnych parach kubitów daje rzadki model szumu, który można efektywnie nauczyć dla wielu kubitów i który dokładnie odzwierciedla szum związany z warstwami dwukubitowych bramek Clifforda, w tym przesłuchy, gdy jest połączony z losowymi skręceniami Pauliego , . Szumiąca warstwa bramek jest modelowana jako zbiór idealnych bramek poprzedzonych pewnym kanałem szumu Λ. Zatem zastosowanie Λ*α* przed szumiącą warstwą daje ogólny kanał szumu Λ*G* o wzmocnieniu *G* = *α* + 1. Biorąc pod uwagę wykładniczą postać modelu szumu Pauli–Lindblad, mapę otrzymuje się poprzez proste pomnożenie współczynników Pauliego *λi* przez *α*. Wynikowa mapa Pauliego może być próbkowana w celu uzyskania odpowiednich instancji obwodu; dla *α* ≥ 0, mapa jest kanałem Pauliego, który można próbować bezpośrednio, podczas gdy dla *α* < 0, potrzebne jest próbkowanie quasi-probabilistyczne z narzutem próbkowania *γ*−2*α* dla pewnego modelu specyficznego *γ*. W PEC wybieramy *α* = −1, aby uzyskać ogólny poziom szumu o zerowym wzmocnieniu. W ZNE zamiast tego wzmacniamy szum , , , do różnych poziomów wzmocnienia i szacujemy granicę zerowego szumu przy użyciu ekstrapolacji. W przypadku praktycznych zastosowań musimy wziąć pod uwagę stabilność nauczonego modelu szumu w czasie (Informacje Dodatkowe ), na przykład z powodu interakcji kubitów z fluktuującymi mikroskopijnymi defektami znanymi jako systemy dwupoziomowe . 1 1 23 24 10 25 26 27 III.A 28 Obwody Clifforda służą jako użyteczne punkty odniesienia dla oszacowań generowanych przez redukcję błędów, ponieważ mogą być efektywnie symulowane klasycznie . Warto zauważyć, że cały obwód Trottera Isinga staje się Clifforda, gdy *θh* jest wielokrotnością π/2. Jako pierwszy przykład, ustawiamy więc pole poprzeczne na zero (R*X*(0) = *I*) i ewoluujemy stan początkowy |0⟩⊗127 (Rys. ). Bramki CNOT nominalnie nie zmieniają tego stanu, więc surowe obserwabli wagi 1 *Zq* mają wartość oczekiwaną 1; ze względu na skręcanie Paula każdej warstwy, gołe CNOTy wpływają na stan. Dla każdego eksperymentu Trottera najpierw scharakteryzowaliśmy modele szumu Λ*l* dla trzech warstw CNOT skręconych Pauliego (Rys. ), a następnie użyliśmy tych modeli do implementacji obwodów Trottera z poziomami wzmocnienia szumu *G* ∈ {1, 1.2, 1.6}. Rysunek ilustruje oszacowanie ⟨*Z*106⟩ po czterech krokach Trottera (12 warstwach CNOT). Dla każdego *G* wygenerowaliśmy 2000 instancji obwodu, w których przed każdą warstwą *l* wstawiliśmy produkty jednokubitowych i dwukubitowych błędów Pauliego *i* z losowanych z prawdopodobieństwem i wykonaliśmy każdą instancję 64 razy, co daje łącznie 384 000 wykonań. W miarę gromadzenia kolejnych instancji obwodu, oszacowania ⟨*Z*106⟩*G*, odpowiadające różnym wzmocnieniom *G*, zbiegają się do odrębnych wartości. Różne oszacowania są następnie dopasowywane przez funkcję ekstrapolującą względem *G*, aby oszacować idealną wartość ⟨*Z*106⟩0. Wyniki na Rys. podkreślają zmniejszone obciążenie wynikające z ekstrapolacji wykładniczej w porównaniu z ekstrapolacją liniową. Niemniej jednak ekstrapolacja wykładnicza może wykazywać niestabilności, na przykład gdy wartości oczekiwane są nierozróżnialnie bliskie zeru, a w takich przypadkach iteracyjnie obniżamy złożoność modelu ekstrapolacji (patrz Informacje Dodatkowe ). Procedura opisana na Rys. została zastosowana do wyników pomiarów z każdego kubitu *q*, aby oszacować wszystkie *N* = 127 oczekiwań Pauliego ⟨*Zq*⟩0. Zmienność w niezmitygowanych i zmitygowanych obserwabli na Rys. jest oznaką niejednorodności stawek błędów w całym procesorze. Raportujemy globalną magnetyzację wzdłuż , , dla zwiększającej się głębokości na Rys. . Chociaż niezmitygowany wynik wykazuje stopniowy spadek z 1 ze zwiększającym się odchyleniem dla głębszych obwodów, ZNE znacznie poprawia zgodność, choć z niewielkim obciążeniem, z idealną wartością nawet do 20 kroków Trottera, czyli 60 głębokości CNOT. Warto zauważyć, że liczba użytych próbek jest znacznie mniejsza niż szacowany narzut próbkowania, który byłby potrzebny w naiwnej implementacji PEC (patrz Informacje Dodatkowe ). W zasadzie ta różnica może zostać znacznie zmniejszona przez bardziej zaawansowane implementacje PEC wykorzystujące śledzenie stożka światła lub przez poprawę stawek błędów sprzętu. W miarę jak przyszły rozwój sprzętu i oprogramowania obniży koszty próbkowania, PEC może być preferowane, gdy będzie stać na nią, aby uniknąć potencjalnie obciążonej natury ZNE. 29 1a 1c 2a 2a 19 II.B 2a 2b 2c IV.B 30 Zmitygowane wartości oczekiwane z obwodów Trottera przy warunku Clifforda *θh* = 0. , Zbieżność niemitygowanych (G = 1), wzmacnianych szumem (G > 1) i łagodzonych szumem (ZNE) oszacowań ⟨*Z*106⟩ po czterech krokach Trottera. We wszystkich panelach, paski błędu wskazują 68% przedziały ufności uzyskane metodą bootstrapu percentylowego. Ekstrapolacja wykładnicza (exp, ciemnoniebieski) zazwyczaj przewyższa ekstrapolację liniową (linear, jasnoniebieski), gdy różnice między zbieżnymi oszacowaniami ⟨*Z*106⟩*G*≠0 są dobrze rozróżnione. , Magnetyzacja (duże znaczniki) jest obliczana jako średnia indywidualnych oszacowań ⟨*Zq*⟩ dla wszystkich kubitów (małe znaczniki). , Wraz ze wzrostem głębokości obwodu, niemitygowane oszacowania *Mz* maleją monotonicznie z idealnej wartości 1. ZNE znacznie poprawia oszacowania nawet po 20 krokach Trottera (szczegóły ZNE w Informacjach Dodatkowych ). a b c II Następnie testujemy skuteczność naszych metod dla obwodów nie-Clifforda i punktu Clifforda *θh* = π/2, z nietrywialną dynamiką splątującą w porównaniu z obwodami równoważnymi tożsamości omówionymi na Rys. . Obwody nie-Clifforda są szczególnie ważne do przetestowania, ponieważ ważność ekstrapolacji wykładniczej nie jest już gwarantowana (patrz Informacje Dodatkowe i ref. ). Ograniczamy głębokość obwodu do pięciu kroków Trottera (15 warstw CNOT) i rozważnie wybieramy obserwabli, które są dokładnie weryfikowalne. Rysunek pokazuje wyniki, gdy *θh* jest zmieniany między 0 a π/2 dla trzech takich obserwabli o rosnącej wadze. Rysunek pokazuje *Mz* jak wcześniej, średnią z obserwabli wagi 1 ⟨*Z*⟩, podczas gdy Rys. pokazują obserwabli wagi 10 i 17. Te ostatnie operatory są stabilizatorami obwodu Clifforda przy *θh* = π/2, uzyskane przez ewolucję początkowych stabilizatorów *Z*13 i *Z*58, odpowiednio, stanu |0⟩⊗127 przez pięć kroków Trottera, co zapewnia nie-zanikające wartości oczekiwane w silnie splątanym reżimie szczególnego zainteresowania. Chociaż cały 127-kubitowy obwód jest wykonywany eksperymentalnie, obwody zredukowane do stożka światła i 2 V 31 3 3a 3b,c