Autorzy: Youngseok Kim Andrew Eddins Sajant Anand Ken Xuan Wei Ewout van den Berg Sami Rosenblatt Hasan Nayfeh Yantao Wu Michael Zaletel Kristan Temme Abhinav Kandala Abstrakt Obliczenia kwantowe obiecują znaczące przyspieszenie w porównaniu z klasycznymi odpowiednikami dla pewnych problemów. Jednak największą przeszkodą w realizacji ich pełnego potencjału jest szum, który jest nieodłączny dla tych systemów. Powszechnie akceptowanym rozwiązaniem tego wyzwania jest implementacja obwodów kwantowych odpornych na błędy, która jest poza zasięgiem obecnych procesorów. Tutaj raportujemy eksperymenty na hałaśliwym procesorze 127-kubitowym i demonstrujemy pomiar dokładnych wartości oczekiwanych dla objętości obwodów na skalę wykraczającą poza brutalną klasyczną komputację. Twierdzimy, że stanowi to dowód na użyteczność obliczeń kwantowych w erze przedodpornej na błędy. Te wyniki eksperymentalne są możliwe dzięki postępom w koherencji i kalibracji nadprzewodzącego procesora w tej skali oraz zdolności do charakteryzacji i kontrolowanej manipulacji szumem na tak dużym urządzeniu. Dokładność zmierzonych wartości oczekiwanych ustaliliśmy, porównując je z wynikami dokładnie weryfikowalnych obwodów. W reżimie silnego splątania komputer kwantowy dostarcza poprawnych wyników, dla których wiodące klasyczne przybliżenia, takie jak metody sieci tensorowych opartych na stanach czystych (stany iloczynowe macierzy, MPS) i 2D (izometryczne sieci tensorowe, isoTNS) , , zawodzą. Te eksperymenty demonstrują fundamentalne narzędzie do realizacji zastosowań kwantowych w najbliższym czasie , . 1 2 3 4 5 Główne Powszechnie uważa się, że zaawansowane algorytmy kwantowe, takie jak faktoryzacja czy estymacja fazy , będą wymagać kwantowej korekcji błędów. Jednakże ostro debatowano, czy dostępne obecnie procesory mogą być wystarczająco niezawodne do uruchamiania innych, krótszych obwodów kwantowych w skali, która mogłaby zapewnić przewagę dla praktycznych problemów. W tym momencie konwencjonalne oczekiwanie jest takie, że implementacja nawet prostych obwodów kwantowych z potencjałem przekroczenia możliwości klasycznych będzie musiała poczekać na przybycie bardziej zaawansowanych, odpornych na błędy procesorów. Pomimo ogromnego postępu w sprzęcie kwantowym w ostatnich latach, proste granice wierności potwierdzają tę ponurą prognozę; szacuje się, że obwód kwantowy o szerokości 100 kubitów i głębokości 100 warstw bramek wykonany z błędem bramki 0,1% daje wierność stanu mniejszą niż 5 × 10−4. Niemniej jednak pozostaje pytanie, czy właściwości idealnego stanu mogą być osiągnięte nawet przy tak niskich wiernościach. Podejście do łagodzenia błędów , do bliskoterminowej przewagi kwantowej na hałaśliwych urządzeniach dokładnie odpowiada na to pytanie, tj. że można uzyskać dokładne wartości oczekiwane z kilku różnych przebiegów hałaśliwego obwodu kwantowego przy użyciu klasycznego przetwarzania końcowego. 6 7 8 9 10 Do przewagi kwantowej można podejść w dwóch krokach: po pierwsze, wykazując zdolność istniejących urządzeń do wykonywania dokładnych obliczeń w skali wykraczającej poza symulację klasyczną metodą brute-force, a po drugie, znajdując problemy z powiązanymi obwodami kwantowymi, które czerpią przewagę z tych urządzeń. Tutaj skupiamy się na wykonaniu pierwszego kroku i nie dążymy do implementacji obwodów kwantowych dla problemów z udowodnionymi przyspieszeniami. Używamy nadprzewodzącego procesora kwantowego z 127 kubitami do uruchamiania obwodów kwantowych z maksymalnie 60 warstwami dwukubitowych bramek, co daje łącznie 2880 bramek CNOT. Ogólne obwody kwantowe tej wielkości wykraczają poza możliwości metod klasycznych typu brute-force. Skupiamy się zatem najpierw na specyficznych przypadkach testowych obwodów umożliwiających dokładne klasyczne sprawdzenie zmierzonych wartości oczekiwanych. Następnie przechodzimy do reżimów obwodów i obserwablów, w których symulacja klasyczna staje się trudna, i porównujemy z wynikami najnowocześniejszych przybliżonych metod klasycznych. Naszym wzorcem obwodu jest ewolucja czasowa modelu Isinga z polem poprzecznym 2D uzyskana metodą Trottera, dzieląca topologię procesora kubitowego (Rys. 1a). Model Isinga występuje powszechnie w różnych obszarach fizyki i znalazł kreatywne zastosowania w niedawnych symulacjach eksplorujących zjawiska kwantowe wielu ciał, takie jak kryształy czasu , , blizny kwantowe i mody brzegowe Majorana . Jako test użyteczności obliczeń kwantowych, ewolucja czasowa dwuwymiarowego modelu Isinga z polem poprzecznym jest jednak najbardziej istotna w granicy dużego wzrostu splątania, w której skalowalne przybliżenia klasyczne napotykają trudności. 11 12 13 14 , Każdy krok Trottera symulacji Isinga obejmuje jednokubitowe obroty i dwukubitowe obroty . Losowe bramki Pauliego są wstawiane w celu skręcania (spirale) i kontrolowanego skalowania szumu każdej warstwy CNOT. Dagger oznacza sprzężenie sprzężone przez idealną warstwę. , Trzy warstwy CNOT głębokości 1 wystarczają do realizacji interakcji między wszystkimi parami sąsiadów na ibm_kyiv. , Eksperymenty charakteryzacyjne efektywnie uczą lokalne współczynniki błędu Pauliego , (skale kolorów) stanowiące całkowity kanał Pauliego Λ związany z -tą warstwą CNOT poddaną skręcaniu. (Rysunek rozszerzony w Informacjach Dodatkowych IV.A). , Błędy Pauliego wstawione w proporcjonalnych szybkościach mogą być używane do anulowania (PEC) lub wzmacniania (ZNE) wewnętrznego szumu. a X ZZ b c λl i l l d W szczególności rozważamy dynamikę czasową Hamiltonianu, w którym > 0 jest sprzężeniem najbliższych sąsiadów spinów z < , a jest globalnym polem poprzecznym. Dynamikę spinów ze stanu początkowego można symulować za pomocą dekompozycji Trottera pierwszego rzędu operatora ewolucji czasowej, J i j h w którym czas ewolucji jest dyskretyzowany na / kroków Trottera, a i są bramkami obrotowymi i , odpowiednio. Nie interesuje nas błąd modelu wynikający z Trotteryzacji, więc traktujemy obwód Trotteryzowany jako idealny do wszelkich porównań klasycznych. Dla prostoty eksperymentalnej skupiamy się na przypadku = −2 = −π/2, tak aby obrót wymagał tylko jednego CNOT, T T δt ZZ X θJ Jδt ZZ gdzie równość zachodzi z dokładnością do globalnej fazy. W wynikowym obwodzie (Rys. 1a) każdy krok Trottera odpowiada warstwie jednokubitowych obrotów, R ( h), po której następują współbieżne warstwy równoległych dwukubitowych obrotów, R ( ). X θ ZZ θJ Do implementacji eksperymentalnej głównie wykorzystaliśmy nadprzewodzący procesor kwantowy IBM Eagle ibm_kyiv, składający się ze 127 kubitów o stałej częstotliwości transmon z ciężką topologią heksagonalną i medianowymi czasami i wynoszącymi odpowiednio 288 μs i 127 μs. Te czasy koherencji są bezprecedensowe dla nadprzewodzących procesorów tej skali i pozwalają na dostęp do głębokości obwodów rozważanych w tej pracy. Dwukubitowe bramki CNOT między sąsiadami są realizowane przez kalibrację interakcji między rezonansem krzyżowym . Ponieważ każdy kubit ma co najwyżej trzech sąsiadów, wszystkie interakcje mogą być wykonane w trzech warstwach równoległych bramek CNOT (Rys. 1b). Bramki CNOT w każdej warstwie są kalibrowane do optymalnego jednoczesnego działania (więcej szczegółów w sekcji Metody). 15 T1 T2 16 ZZ Widzimy teraz, że te usprawnienia wydajności sprzętu umożliwiają wykonanie jeszcze większych problemów z łagodzeniem błędów, w porównaniu z niedawnymi pracami , na tej platformie. Wykazano, że probabilistyczna anulacja błędów (PEC) jest bardzo skuteczna w dostarczaniu bezstronnych estymat obserwabli. W PEC uczy się reprezentatywny model szumu i skutecznie go odwraca poprzez próbkowanie z rozkładu hałaśliwych obwodów związanych z nauczonym modelem. Jednakże, przy obecnych wskaźnikach błędów na naszym urządzeniu, narzut próbkowania dla objętości obwodów rozważanych w tej pracy pozostaje ograniczający, jak omówiono dalej. 1 17 9 Dlatego zwracamy się do ekstrapolacji zerowego szumu (ZNE) , , , , która dostarcza obciążonego estymatora przy potencjalnie znacznie niższym koszcie próbkowania. ZNE jest metodą ekstrapolacji wielomianową , lub wykładniczą dla hałaśliwych wartości oczekiwanych jako funkcji parametru szumu. Wymaga to kontrolowanego wzmocnienia wewnętrznego szumu sprzętowego przez znany współczynnik wzmocnienia , aby ekstrapolować do idealnej wartości przy = 0. ZNE zostało szeroko przyjęte po części dlatego, że schematy wzmacniania szumu oparte na rozciąganiu impulsów , , lub powtarzaniu podobwodów , , ominęły potrzebę precyzyjnego uczenia się szumu, opierając się na uproszczonych założeniach dotyczących szumu urządzenia. Jednakże dokładniejsze wzmacnianie szumu może umożliwić znaczące zmniejszenie obciążenia estymatora ekstrapolowanego, co demonstrujemy tutaj. 9 10 17 18 9 10 19 G G 9 17 18 20 21 22 Model szumu rzadkiego Pauliego–Lindblada zaproponowany w ref. 1 okazuje się być szczególnie dobrze dopasowany do kształtowania szumu w ZNE. Model ma postać , gdzie jest generatorem Lindblada składającym się z operatorów skoków Pauliego ważonych przez współczynniki . W ref. 1 pokazano, że ograniczenie do operatorów skoków działających na lokalne pary kubitów prowadzi do rzadkiego modelu szumu, który można efektywnie nauczyć dla wielu kubitów i który dokładnie opisuje szum związany z warstwami dwukubitowych bramek Clifforda, w tym przesłuchy, gdy jest połączony z losowym skręcaniem Pauliego , . Hałaśliwa warstwa bramek jest modelowana jako zbiór idealnych bramek poprzedzonych pewnym kanałem szumu Λ. Zatem zastosowanie Λ przed hałaśliwą warstwą daje całkowity kanał szumu Λ ze wzmocnieniem = + 1. Biorąc pod uwagę wykładniczą postać modelu szumu Pauliego–Lindblada, odwzorowanie jest uzyskiwane przez proste mnożenie współczynników Pauliego przez . Wynikowe odwzorowanie Pauliego można próbować, aby uzyskać odpowiednie instancje obwodu; dla ≥ 0, odwzorowanie jest kanałem Pauliego, który można próbować bezpośrednio, podczas gdy dla < 0 potrzebne jest próbkowanie quasi-probabilistyczne z narzutem próbkowania −2 dla pewnego specyficznego dla modelu. W PEC wybieramy = −1, aby uzyskać całkowity poziom szumu zerowego. W ZNE zamiast tego wzmacniamy szum , , , do różnych poziomów wzmocnienia i estymujemy granicę zerowego szumu za pomocą ekstrapolacji. W praktycznych zastosowaniach musimy rozważyć stabilność nauczonego modelu szumu w czasie (Informacje Dodatkowe III.A), na przykład z powodu interakcji kubitów z fluktuującymi defektami mikroskopowymi znanymi jako systemy dwupoziomowe . Pi λi 23 24 α G G α λi α α α γ α γ α 10 25 26 27 28 Obwody Clifforda służą jako przydatne punkty odniesienia dla estymat uzyskanych w wyniku łagodzenia błędów, ponieważ mogą być efektywnie symulowane klasycznie . W szczególności cały obwód Trottera Isinga staje się Clifforda, gdy jest wybierane jako wielokrotność π/2. Jako pierwszy przykład, ustawiamy pole poprzeczne na zero (R (0) = ) i ewoluujemy stan początkowy |0⟩⊗127 (Rys. 1a). Bramki CNOT nominalnie pozostawiają ten stan niezmieniony, więc surowe obserwabele wagi 1 wszystkie mają wartość oczekiwaną równą 1; ze względu na skręcanie Pauliego każdej warstwy, surowe CNOTy wpływają na stan. Dla każdego eksperymentu Trottera najpierw scharakteryzowaliśmy modele szumu Λ dla trzech warstw CNOT poddanych skręcaniu Pauliego (Rys. 1c), a następnie użyliśmy tych modeli do implementacji obwodów Trottera z poziomami wzmocnienia szumu ∈ {1, 1.2, 1.6}. Rysunek 2a ilustruje estymację ⟨ ⟩ po czterech krokach Trottera (12 warstw CNOT). Dla każdego wygenerowaliśmy 2000 instancji obwodu, w których przed każdą warstwą wstawiliśmy produkty jednokubitowych i dwukubitowych błędów Pauliego z rozkładu , pobrane z prawdopodobieństwami , i wykonaliśmy każdą instancję 64 razy, co daje łącznie 384 000 wykonań. W miarę gromadzenia większej liczby instancji obwodu, estymaty ⟨ ⟩ , odpowiadające różnym wzmocnieniom , zbiegają się do odrębnych wartości. Różne estymaty są następnie dopasowywane przez funkcję ekstrapolującą względem w celu oszacowania wartości idealnej ⟨ ⟩0. Wyniki na Rys. 2a podkreślają zmniejszone obciążenie wynikające z ekstrapolacji wykładniczej w porównaniu z ekstrapolacją liniową. Niemniej jednak ekstrapolacja wykładnicza może wykazywać niestabilności, na przykład gdy wartości oczekiwane są nierozróżnialnie bliskie zeru, i w takich przypadkach iteracyjnie obniżamy złożoność modelu ekstrapolacji (patrz Informacje Dodatkowe II.B). Procedura opisana na Rys. 2a została zastosowana do wyników pomiarów z każdego kubitu w celu oszacowania wszystkich = 127 oczekiwanych wartości Pauliego ⟨ ⟩0. Zmienność w niezmitygowanych i zmitygowanych obserwabach na Rys. 2b wskazuje na nierównomierność szybkości błędów w całym procesorze. Globalną magnetyzację wzdłuż , , dla rosnącej głębokości przedstawiamy na Rys. 2c. Chociaż niezmitygowany wynik pokazuje stopniowy spadek od 1 z rosnącym odchyleniem dla głębszych obwodów, ZNE znacznie poprawia zgodność, choć z niewielkim obciążeniem, z wartością idealną nawet do 20 kroków Trottera, czyli 60 głębokości CNOT. Warto zauważyć, że liczba użytych próbek jest znacznie mniejsza niż szacowany narzut próbkowania, który byłby potrzebny w naiwnej implementacji PEC (patrz Informacje Dodatkowe IV.B). W zasadzie ta dysproporcja może być znacznie zmniejszona przez bardziej zaawansowane implementacje PEC wykorzystujące śledzenie stożka światła lub przez poprawę szybkości błędów sprzętowych. Gdy przyszły rozwój sprzętu i oprogramowania obniży koszty próbkowania, PEC może być preferowane, gdy jest opłacalne, aby uniknąć potencjalnie obciążonego charakteru ZNE. 29 θh X I Zq l G Z106 G l i Z106 G G G Z106 19 q N Zq 30 Zmitigowane wartości oczekiwane z obwodów Trottera przy warunku Clifforda = 0. , Zbieżność niezmitygowanych ( = 1), wzmocnionych szumem ( > 1) i zmitigowanych szumem (ZNE) estymat ⟨ ⟩ po czterech krokach Trottera. We wszystkich panelach błędy wskazują 68% przedziały ufności uzyskane metodą bootstrapu procentowego. Ekstrapolacja wykładnicza (exp, ciemnoniebieski) zazwyczaj przewyższa ekstrapolację liniową (linear, jasnoniebieski), gdy różnice między zbieżnymi estymatami ⟨ ⟩ ≠0 są dobrze rozróżnialne. , Magnetyzacja (duże znaczniki) jest obliczana jako średnia indywidualnych estymat ⟨ ⟩ dla wszystkich kubitów (małe znaczniki). , W miarę wzrostu głębokości obwodu, niezmitygowane estymaty monotonicznie spadają od wartości idealnej 1. ZNE znacznie poprawia estymaty nawet po 20 krokach Trottera (szczegóły ZNE w Informacjach Dodatkowych II). θh a G G Z106 Z106 G b Zq c Mz Następnie testujemy skuteczność naszych metod dla obwodów nie Clifforda i punktu Clifforda = π/2, z nietrywialną dynamiką splątania w porównaniu z obwodami równoważnymi tożsamości omawianymi na Rys. 2. Obwody nie Clifforda są szczególnie ważne do przetestowania, ponieważ ważność ekstrapolacji wykładniczej nie jest już gwarantowana (patrz Informacje Dodatkowe V i ref. 31). Ograniczamy głębokość obwodu do pięciu kroków Trottera (15 warstw CNOT) i rozważnie wybieramy obserwabele, które można dokładnie zweryfikować. Rysunek 3 pokazuje wyniki w miarę przemiatania między 0 a π/2 dla trzech takich obserwabli o rosnącej wadze. Rysunek 3a pokazuje jak poprzednio, średnią obserwabli wagi 1 ⟨ ⟩, podczas gdy Rysunek 3b,c pokazuje obserwabele wagi 10 i 17. Te ostatnie operatory są stabilizatorami obwodu Clifforda przy = π/2, uzyskane przez ewolucję początkowych stabilizatorów i , odpowiednio, stanu |0⟩⊗127 przez pięć kroków Trottera, zapewniając niezerowe wartości oczekiwane w silnie splątanym reżimie o szczególnym zainteresowaniu. Chociaż cały 127-kubitowy obwód jest wykonywany eksperymentalnie, obwody zredukowane do stożka światła i głębokości (LCDR) umożliwiają symulację brute-force magnetyzacji i operatora wagi 10 metodą klasyczną (patrz Informacje Dodatkowe VII). W pełnym zakresie przemiatania , zmitigowane obserwabele wykazują dobrą zgodność z dokładną ewolucją (patrz Rys. 3a,b). Jednakże dla operatora wagi 17, stożek światła rozszerza się do 68 kubitów, czyli skali wykraczającej poza symulację klasyczną metodą brute-force, dlatego zwracamy się do metod sieci tensorowych. θh θh Mz Z θh Z13 Z58 θh Estymaty wartości oczekiwanych dla przemiatania przy stałej głębokości pięciu kroków Trottera dla obwodu na Rys. 1a. Rozważane obwody są nie Clifforda, z wyjątkiem punktów = 0, π/2. Redukcje stożka światła i głębokości odpowiednich obwodów umożliwiają dokładną symulację klasyczną obserwabli dla wszystkich . Dla wszystkich trzech wykresów (tytuły paneli), zmitigowane wyniki eksperymentalne (niebieski) ściśle śledzą dokładne zachowanie (szary). We wszystkich panelach błędy wskazują 68% przedziały ufności uzyskane metodą bootstrapu procentowego. Obserwabele wagi 10 i 17 w panelach i są stabilizatorami obwodu przy = π/2 z odpowiednimi wartościami własnymi +1 i −1; wszystkie wartości w panelu zostały zanegowane dla uproszczenia wizualnego. Dolne wstawki w panelu przedstawiają zmienność ⟨ ⟩ przy = 0.2 w całym urządzeniu przed i po mitigacji oraz porównują z dokładnymi wynikami. Górne wstawki we wszystkich panelach ilustrują przyczynowe stożki światła, wskazując na niebiesko końcowe mierzone kubity (góra) i nominalny zbiór początkowych kubitów, które mogą wpływać na stan końcowych kubitów (dół). zależy również od 126 innych stożków oprócz pokazanego przykładu. Chociaż we wszystkich panelach dokładne wyniki pochodzą z symulacji tylko przyczynowych kubitów, dołączamy symulacje sieci tensorowych wszystkich 127 kubitów (MPS, isoTNS), aby pomóc ocenić domenę ważności tych technik, jak omówiono w głównym tekście. Wyniki isoTNS dla operatora wagi 17 w panelu nie są dostępne przy obecnych metodach (patrz Informacje Dodatkowe VI). Wszystkie eksperymenty przeprowadzono dla = 1, 1.2, 1.6 i ekstrapolowano zgodnie z Informacjami Dodatkowymi II.B. Dla każdego wygenerowano θh θh θh b c θh c a Zq θh Mz c G G