Autorzy: Almudena Carrera Vazquez Caroline Tornow Diego Ristè Stefan Woerner Maika Takita Daniel J. Egger Abstrakt Komputery kwantowe przetwarzają informacje zgodnie z prawami mechaniki kwantowej. Obecny sprzęt kwantowy jest zawodny, może przechowywać informacje tylko przez krótki czas i jest ograniczony do kilku bitów kwantowych, czyli kubitów, zazwyczaj ułożonych w płaską łączność . Jednak wiele zastosowań obliczeń kwantowych wymaga większej łączności niż płaska siatka oferowana przez sprzęt na większej liczbie kubitów, niż jest dostępna w pojedynczej jednostce przetwarzania kwantowego (QPU). Społeczność ma nadzieję rozwiązać te ograniczenia, łącząc QPU za pomocą komunikacji klasycznej, co nie zostało jeszcze udowodnione eksperymentalnie. Tutaj eksperymentalnie realizujemy dynamiczne obwody z łagodzeniem błędów i cięciem obwodów w celu tworzenia stanów kwantowych wymagających okresowej łączności przy użyciu do 142 kubitów obejmujących dwie QPU po 127 kubitów każda, połączone w czasie rzeczywistym za pomocą łącza klasycznego. W dynamicznym obwodzie bramki kwantowe mogą być sterowane klasycznie na podstawie wyników pomiarów w trakcie obwodu, to jest w ułamku czasu koherencji kubitów. Nasze łącze klasyczne w czasie rzeczywistym umożliwia nam zastosowanie bramki kwantowej na jednej QPU warunkowo od wyniku pomiaru na innej QPU. Ponadto, sterowanie przepływem z łagodzeniem błędów zwiększa łączność kubitów i zestaw instrukcji sprzętu, zwiększając tym samym wszechstronność naszych komputerów kwantowych. Nasza praca pokazuje, że możemy używać kilku procesorów kwantowych jako jednego za pomocą dynamicznych obwodów z łagodzeniem błędów, które są włączone dzięki łączeniu klasycznemu w czasie rzeczywistym. 1 Główne Komputery kwantowe przetwarzają informacje zakodowane w kubitach za pomocą operacji unitarnych. Jednak komputery kwantowe są zawodne, a większość wielkoskalowych architektur układa fizyczne kubity w płaską siatkę. Niemniej jednak, obecne procesory z łagodzeniem błędów mogą już symulować natywne sprzętowo modele Isinga z 127 kubitami i mierzyć obserwabele w skali, w której podejścia brutalnej siły za pomocą komputerów klasycznych zaczynają sprawiać trudności . Użyteczność komputerów kwantowych zależy od dalszego skalowania i przezwyciężenia ich ograniczonej łączności kubitów. Podejście modularne jest ważne dla skalowania obecnych zawodnych procesorów kwantowych i dla osiągnięcia dużej liczby fizycznych kubitów potrzebnych do tolerancji na błędy . Architektury jonów uwięzionych i atomów neutralnych mogą osiągnąć modularność poprzez fizyczne przenoszenie kubitów , . W najbliższej przyszłości modularność w kubitach nadprzewodzących jest osiągana za pomocą krótkodystansowych interkonektów łączących sąsiednie układy scalone , . 1 2 3 4 5 6 7 8 W średniej perspektywie, bramki dalekiego zasięgu działające w reżimie mikrofalowym mogą być realizowane za pomocą długich kabli konwencjonalnych , , . Umożliwiłoby to nieliniową łączność kubitów, odpowiednią dla efektywnej korekcji błędów . Alternatywą długoterminową jest splątanie odległych QPU za pomocą łącza optycznego wykorzystującego transdukcję mikrofalowo-optyczną , czego, o ile nam wiadomo, jeszcze nie zademonstrowano. Ponadto, dynamiczne obwody poszerzają zestaw operacji komputera kwantowego poprzez przeprowadzanie pomiarów w trakcie obwodu (MCM) i klasyczne sterowanie bramką w czasie koherencji kubitów. Poprawiają one jakość algorytmów i łączność kubitów . Jak pokażemy, dynamiczne obwody umożliwiają również modularność poprzez łączenie QPU w czasie rzeczywistym za pomocą łącza klasycznego. 9 10 11 3 12 13 14 Przyjmujemy komplementarne podejście oparte na bramkach wirtualnych do implementacji interakcji dalekiego zasięgu w architekturze modularnej. Łączymy kubity w dowolnych lokalizacjach i tworzymy statystykę splątania poprzez quasi-probabilistyczny rozkład (QPD) , , . Porównujemy schemat oparty wyłącznie na operacjach lokalnych (LO) z jednym wzbogaconym o komunikację klasyczną (LOCC) . Schemat LO, zademonstrowany w ustawieniu dwukubitowym , wymaga wykonania wielu obwodów kwantowych wyłącznie za pomocą operacji lokalnych. Natomiast do implementacji LOCC zużywamy wirtualne pary Bella w obwodzie teleportacji w celu utworzenia dwukubitowych bramek , . Na sprzęcie kwantowym o rzadkiej i płaskiej łączności utworzenie pary Bella między dowolnymi kubitami wymaga bramki CNOT dalekiego zasięgu. Aby uniknąć tych bramek, stosujemy QPD na operacjach lokalnych, co prowadzi do pociętych par Bella, które są zużywane w teleportacji. LO nie wymaga łącza klasycznego i jest tym samym prostsze w implementacji niż LOCC. Jednakże, ponieważ LOCC wymaga tylko jednego parametryzowanego obwodu szablonowego, jest ono wydajniejsze w kompilacji niż LO, a koszt jego QPD jest niższy niż koszt schematu LO. 15 16 17 16 17 18 19 20 Nasza praca wnosi cztery kluczowe wkłady. Po pierwsze, przedstawiamy obwody kwantowe i QPD do tworzenia wielu pociętych par Bella w celu realizacji bramek wirtualnych z ref. . Po drugie, tłumimy i łagodzimy błędy wynikające z opóźnienia klasycznego sprzętu sterującego w dynamicznych obwodach za pomocą kombinacji tłumienia dynamicznego i ekstrapolacji przy zerowym szumie . Po trzecie, wykorzystujemy te metody do inżynierii warunków brzegowych periodycznych na grafie stanu o 103 węzłach. Po czwarte, demonstrujemy połączenie klasyczne w czasie rzeczywistym między dwiema oddzielnymi QPU, co pokazuje, że system rozproszonych QPU może być obsługiwany jako jeden za pomocą łącza klasycznego . W połączeniu z dynamicznymi obwodami pozwala nam to na obsługę obu układów jako pojedynczego komputera kwantowego, co ilustrujemy inżynierią okresowego grafu stanu obejmującego oba urządzenia na 142 kubitach. Dyskutujemy o drodze naprzód w celu tworzenia bramek dalekiego zasięgu i przedstawiamy nasze wnioski. 17 21 22 23 Cięcie obwodów Uruchamiamy duże obwody kwantowe, które mogą nie być bezpośrednio wykonalne na naszym sprzęcie z powodu ograniczeń liczby kubitów lub łączności, poprzez cięcie bramek. Cięcie obwodów rozkłada złożony obwód na podobwody, które można indywidualnie wykonać , , , , , . Musimy jednak uruchomić zwiększoną liczbę obwodów, którą nazywamy narzutem próbkowania. Wyniki z tych podobwodów są następnie rekombinowane klasycznie, aby uzyskać wynik pierwotnego obwodu ( ). 15 16 17 24 25 26 Metody Ponieważ jednym z głównych wkładów naszej pracy jest implementacja bramek wirtualnych z LOCC, pokazujemy, jak tworzyć wymagane pocięte pary Bella za pomocą operacji lokalnych. Tutaj wiele pociętych par Bella jest inżynierowanych przez parametryczne obwody kwantowe, które nazywamy fabryką pociętych par Bella (Rys. ). Cięcie wielu par jednocześnie wymaga niższego narzutu próbkowania . Ponieważ fabryka pociętych par Bella tworzy dwa rozłączne obwody kwantowe, umieszczamy każdy podobwód blisko kubitów, które mają bramki dalekiego zasięgu. Powstały zasób jest następnie zużywany w obwodzie teleportacji. Na przykład, na rysunku , pocięte pary Bella są zużywane do tworzenia bramek CNOT na parach kubitów (0, 1) i (2, 3) (patrz sekcja „ ”). 1b,c 17 1b Fabryki pociętych par Bella , Schemat architektury systemu IBM Quantum System Two. Tutaj dwie QPU Eagle z 127 kubitami są połączone łącze klasycznym w czasie rzeczywistym. Każda QPU jest sterowana przez swoją elektronikę w swoim stelażu. Dokładnie synchronizujemy oba stelaże, aby obsługiwać obie QPU jako jedną. , Kwantowy obwód szablonowy do implementacji wirtualnych bramek CNOT na parach kubitów ( 0, 1) i ( 2, 3) za pomocą LOCC, zużywając pocięte pary Bella w obwodzie teleportacji. Fioletowe podwójne linie odpowiadają łącza klasycznemu w czasie rzeczywistym. , Fabryki pociętych par Bella 2( ) dla dwóch jednocześnie pociętych par Bella. QPD ma łącznie 27 różnych zestawów parametrów . Tutaj, . a b q q q q c C θ i θ i Warunki brzegowe periodyczne Konstruujemy graf stanu | ⟩ z warunkami brzegowymi periodycznymi na ibm_kyiv, procesorze Eagle , wykraczając poza ograniczenia narzucone przez jego fizyczną łączność (patrz sekcja „ ”). Tutaj, ma ∣ ∣ = 103 węzłów i wymaga czterech krawędzi dalekiego zasięgu lr = {(1, 95), (2, 98), (6, 102), (7, 97)} między górnymi i dolnymi kubitami procesora Eagle (Rys. ). Mierzymy stabilizatory węzłów w każdym węźle ∈ oraz stabilizatory krawędzi utworzone przez iloczyn wzdłuż każdej krawędzi ( , ) ∈ . Z tych stabilizatorów budujemy dowód splątania , który jest ujemny, jeśli istnieje splątanie bipartcyjne wzdłuż krawędzi ( , ) ∈ (ref. ) (patrz sekcja „ ”). Skupiamy się na splątaniu bipartcyjnym, ponieważ jest to zasób, który chcemy odtworzyć za pomocą bramek wirtualnych. Pomiar dowodów splątania między więcej niż dwiema parami mierzy tylko jakość bramek nie-wirtualnych i pomiarów, co czyni wpływ bramek wirtualnych mniej jasnym. G 1 Grafy stanów G V E 2a Si i V SiSj i j E i j E 27 Dowód splątania , Ciężki graf sześciokątny jest zgięty na siebie w formie tubularnej przez krawędzie (1, 95), (2, 98), (6, 102) i (7, 97) zaznaczone na niebiesko. Ciemy te krawędzie. , Stabilizatory węzłów (na górze) i dowody , (na dole), z 1 odchyleniem standardowym dla węzłów i krawędzi blisko krawędzi dalekiego zasięgu. Pionowe linie przerywane grupują stabilizatory i dowody według ich odległości od pociętych krawędzi. , Funkcja dystrybucji skumulowanej błędów stabilizatora. Gwiazdki wskazują stabilizatory węzłów , które mają krawędź zaimplementowaną przez bramkę dalekiego zasięgu. W benchmarku pociętych krawędzi (linia czerwona przerywana) bramki dalekiego zasięgu nie są implementowane, a wskazane przez gwiazdki stabilizatory mają jednostkowy błąd. Szary obszar to masa prawdopodobieństwa odpowiadająca stabilizatorom węzłów, na które wpływają cięcia. – , W dwuwymiarowych układach zielone węzły duplikują węzły 95, 98, 102 i 97, aby pokazać pocięte krawędzie. Niebieskie węzły na są zasobami kubitowymi do tworzenia pociętych par Bella. Kolor węzła to błąd absolutny ∣ − 1∣ zmierzony stabilizator, jak wskazano przez pasek kolorów. Krawędź jest czarna, jeśli statystyka splątania jest wykryta na poziomie ufności 99%, a fioletowa, jeśli nie. Na , bramki dalekiego zasięgu są implementowane za pomocą bramek SWAP. Na , te same bramki są implementowane za pomocą LOCC. Na , nie są one wcale implementowane. a b Sj c Sj d f e i Si d e f Przygotowujemy | ⟩ za pomocą trzech różnych metod. Natywne sprzętowo krawędzie są zawsze implementowane za pomocą bramek CNOT, ale warunki brzegowe periodyczne są implementowane za pomocą (1) bramek SWAP, (2) LOCC i (3) LO do łączenia kubitów w całej siatce. Główna różnica między LOCC a LO polega na operacji sprzężenia zwrotnego składającej się z jedno-kubitowych bramek warunkowych na podstawie 2 wyników pomiarów, gdzie jest liczbą cięć. Każdy z 22 przypadków wyzwala unikalną kombinację bramek i/lub na odpowiednich kubitach. Uzyskiwanie wyników pomiarów, określanie odpowiadającego przypadku i działanie w oparciu o niego odbywa się w czasie rzeczywistym przez sprzęt sterujący, kosztem stałego dodanego opóźnienia. Łagodzimy i tłumimy błędy wynikające z tego opóźnienia za pomocą ekstrapolacji przy zerowym szumie i rozmieszczonego tłumienia dynamicznego , (patrz sekcja „ ”). G n n n X Z 22 21 28 Instrukcje przełączania obwodów kwantowych z łagodzeniem błędów Porównujemy implementacje | ⟩ za pomocą SWAP, LOCC i LO z natywnym sprzętowo grafem stanu na ′ = ( , ′) uzyskanym przez usunięcie bramek dalekiego zasięgu, to jest ′ = lr. Obwód przygotowujący | ′⟩ wymaga zatem tylko 112 bramek CNOT ułożonych w trzech warstwach zgodnie z ciężką sześciokątną topologią procesora Eagle. Obwód ten zgłosi duże błędy przy pomiarze stabilizatorów węzłów i krawędzi | ⟩ dla węzłów na pociętej bramce, ponieważ jest zaprojektowany do implementacji | ′⟩. Nazywamy ten natywny sprzętowo benchmark benchmarkiem pociętych krawędzi. Obwód oparty na SWAP wymaga dodatkowych 262 bramek CNOT do utworzenia krawędzi dalekiego zasięgu lr, co drastycznie zmniejsza wartość zmierzonych stabilizatorów (Rys. ). W przeciwieństwie do tego, implementacja LOCC i LO krawędzi w lr nie wymaga bramek SWAP. Błędy ich stabilizatorów węzłów i krawędzi dla węzłów niezaangażowanych w pociętą bramkę ściśle podążają za benchmarkiem pociętych krawędzi (Rys. ). Wręcz przeciwnie, stabilizatory obejmujące bramkę wirtualną mają niższy błąd niż benchmark pociętych krawędzi i implementacja SWAP (Rys. , znaczniki gwiazdek). Jako ogólną metrykę jakości, najpierw raportujemy sumę błędów absolutnych na stabilizatorach węzłów, tj. ∑ ∈ ∣ − 1∣ (Tabela Danych Rozszerzonych ). Duży narzut SWAP jest odpowiedzialny za sumę błędów absolutnych 44,3. Błąd 13,1 w benchmarku pociętych krawędzi jest zdominowany przez osiem węzłów na czterech cięciach (Rys. , znaczniki gwiazdek). Natomiast błędy LO i LOCC są dotknięte przez MCM. Przypisujemy 1,9 dodatkowego błędu LOCC nad LO do opóźnień i bramek CNOT w obwodzie teleportacji i pociętych parach Bella. W wynikach opartych na SWAP, nie wykrywa splątania na 35 ze 116 krawędzi na poziomie ufności 99% (Rys. ). Dla implementacji LO i LOCC, obserwuje statystykę splątania bipartcyjnego na wszystkich krawędziach w na poziomie ufności 99% (Rys. ). Metryki te pokazują, że wirtualne bramki dalekiego zasięgu generują stabilizatory z mniejszymi błędami niż ich rozkład na SWAPy. Ponadto, utrzymują one wariancję na wystarczająco niskim poziomie, aby zweryfikować statystykę splątania. G G V E E EE G G G E 2b–d E 2b,c 2c i V Si 1 2c 2b,d G 2e Obsługa dwóch QPU jako jednej Łączymy teraz dwie QPU Eagle z 127 kubitami każda w jedną QPU za pomocą połączenia klasycznego w czasie rzeczywistym. Obsługa urządzeń jako pojedynczego, większego procesora polega na wykonywaniu obwodów kwantowych obejmujących większy rejestr kubitów. Oprócz bramek unitarnych i pomiarów działających równolegle na połączonej QPU, używamy dynamicznych obwodów do wykonywania bramek, które działają na kubitach na obu urządzeniach. Jest to możliwe dzięki ścisłej synchronizacji i szybkiej komunikacji klasycznej między fizycznie oddzielnymi instrumentami, wymaganymi do zbierania wyników pomiarów i określania przepływu sterowania w całym systemie . 29 Testujemy to połączenie klasyczne w czasie rzeczywistym, inżynierując graf stanu na 134 kubitach zbudowany z ciężkich sześciokątnych pierścieni, które przechodzą przez obie QPU (Rys. ). Pierścienie te zostały wybrane przez wykluczenie kubitów dotkniętych systemami dwupoziomowymi i problemami z odczytem, aby zapewnić wysokiej jakości graf stanu. Graf ten tworzy pierścień w trzech wymiarach i wymaga czterech bramek dalekiego zasięgu, które implementujemy za pomocą LO i LOCC. Jak poprzednio, protokół LOCC wymaga dwóch dodatkowych kubitów na bramkę ciętą dla pociętych par Bella. Podobnie jak w poprzedniej sekcji, porównujemy nasze wyniki z grafem, który nie implementuje krawędzi rozciągających się na obie QPU. Ponieważ nie ma połączenia kwantowego między dwoma urządzeniami, benchmark za pomocą bramek SWAP jest niemożliwy. Wszystkie krawędzie wykazują statystykę splątania bipartcyjnego, gdy implementujemy graf za pomocą LO i LOCC na poziomie ufności 99%. Ponadto, stabilizatory LO i LOCC mają taką samą jakość jak benchmark pociętych krawędzi dla węzłów, na które nie wpływa bramka dalekiego zasięgu (Rys. ). Stabilizatory dotknięte bramkami dalekiego zasięgu mają duże zmniejszenie błędu w porównaniu z benchmarkiem pociętych krawędzi. Suma błędów absolutnych na stabilizatorach węzłów ∑ ∈ ∣ − 1∣ wynosi 21,0, 19,2 i 12,6 dla benchmarku pociętych krawędzi, LOCC i LO, odpowiednio. Jak poprzednio, przypisujemy 6,6 dodatkowych błędów LOCC nad LO opóźnieniom i bramkom CNOT w obwodzie teleportacji i pociętych parach Bella. Wyniki LOCC pokazują, jak dynamiczny obwód kwantowy, w którym dwa podobwody są połączone łącze klasycznym w czasie rzeczywistym, może być wykonywany na dwóch, inaczej rozłącznych QPU. Wyniki LO można było uzyskać na pojedynczym urządzeniu z 127 kubitami kosztem dodatkowego współczynnika 2 w czasie wykonania, ponieważ podobwody można uruchamiać sekwencyjnie. 3 3c i V Si , Graf stanu z okresowymi granicami pokazany w trzech wymiarach. Niebieskie krawędzie to pocięte krawędzie a