```html Autorzy: Almudena Carrera Vazquez Caroline Tornow Diego Ristè Stefan Woerner Maika Takita Daniel J. Egger Abstrakt Komputery kwantowe przetwarzają informacje zgodnie z prawami mechaniki kwantowej. Obecny sprzęt kwantowy jest podatny na szumy, może przechowywać informacje tylko przez krótki czas i jest ograniczony do kilku kubitów kwantowych, czyli kubitów, zazwyczaj rozmieszczonych w połączeniu płaszczyznowym . Jednak wiele zastosowań obliczeń kwantowych wymaga większej łączności niż siatka płaszczyznowa oferowana przez sprzęt na większej liczbie kubitów, niż jest dostępna w pojedynczej jednostce przetwarzania kwantowego (QPU). Społeczność ma nadzieję rozwiązać te ograniczenia, łącząc QPU za pomocą komunikacji klasycznej, co nie zostało jeszcze udowodnione eksperymentalnie. Tutaj eksperymentalnie realizujemy dynamiczne obwody z ograniczonymi błędami i cięcie obwodów, aby tworzyć stany kwantowe wymagające okresowej łączności przy użyciu do 142 kubitów obejmujących dwie QPU po 127 kubitów każda, połączone w czasie rzeczywistym za pomocą łącza klasycznego. W dynamicznym obwodzie bramki kwantowe mogą być sterowane klasycznie przez wyniki pomiarów w połowie obwodu w czasie wykonywania, to znaczy w ułamku czasu koherencji kubitów. Nasze klasyczne łącze w czasie rzeczywistym umożliwia nam zastosowanie bramki kwantowej w jednej QPU, zależnie od wyniku pomiaru w innej QPU. Ponadto, sterowanie przepływem z ograniczonymi błędami zwiększa łączność kubitów i zestaw instrukcji sprzętu, zwiększając tym samym wszechstronność naszych komputerów kwantowych. Nasza praca pokazuje, że możemy używać kilku procesorów kwantowych jako jednego z dynamicznych obwodów z ograniczonymi błędami, włączonych przez klasyczne łącze w czasie rzeczywistym. 1 Główna Komputery kwantowe przetwarzają informacje kodowane w kubitach kwantowych za pomocą operacji unitarnych. Jednak komputery kwantowe są podatne na szumy, a większość wielkoskalowych architektur rozmieszcza fizyczne kubity w płaszczyznowej siatce. Niemniej jednak, obecne procesory z ograniczaniem błędów mogą już symulować natywne dla sprzętu modele Isinga z 127 kubitami i mierzyć obserwabele w skali, w której podejścia brute-force z użyciem komputerów klasycznych zaczynają sprawiać trudności . Użyteczność komputerów kwantowych zależy od dalszego skalowania i przezwyciężenia ich ograniczonej łączności kubitów. Podejście modułowe jest ważne dla skalowania obecnych kwantowych procesorów podatnych na szumy i dla osiągnięcia dużej liczby fizycznych kubitów potrzebnych do tolerancji na błędy . Architektury pułapek jonowych i atomów neutralnych mogą osiągnąć modularność poprzez fizyczne transportowanie kubitów , . W najbliższej przyszłości modularność w kubitach nadprzewodzących jest osiągana za pomocą krótkodystansowych łączników, które łączą sąsiednie układy scalone , . 1 2 3 4 5 6 7 8 W średnim terminie bramki dalekiego zasięgu działające w zakresie mikrofalowym mogą być realizowane za pomocą długich konwencjonalnych kabli , , . Umożliwiłoby to nieliniową łączność kubitów, odpowiednią do efektywnego korygowania błędów . Długoterminową alternatywą jest splątanie zdalnych QPU za pomocą łącza optycznego wykorzystującego transdukcję mikrofalowo-optyczną , która, o ile nam wiadomo, nie została jeszcze zademonstrowana. Ponadto, dynamiczne obwody rozszerzają zbiór operacji komputera kwantowego poprzez wykonywanie pomiarów w połowie obwodu (MCM) i sterowanie klasyczne bramki w czasie koherencji kubitów. Poprawiają one jakość algorytmów i łączność kubitów . Jak pokażemy, dynamiczne obwody umożliwiają również modularność poprzez połączenie QPU w czasie rzeczywistym za pomocą łącza klasycznego. 9 10 11 3 12 13 14 Przyjmujemy komplementarne podejście oparte na bramkach wirtualnych do implementacji interakcji dalekiego zasięgu w architekturze modułowej. Łączymy kubity w dowolnych lokalizacjach i tworzymy statystyki splątania poprzez rozkład quasi-prawdopodobieństwa (QPD) , , . Porównujemy schemat oparty wyłącznie na operacjach lokalnych (LO) z jednym rozszerzonym o komunikację klasyczną (LOCC) . Schemat LO, zademonstrowany w ustawieniu dwukubitowym , wymaga wykonania wielu obwodów kwantowych wyłącznie za pomocą operacji lokalnych. Natomiast w celu implementacji LOCC, zużywamy wirtualne pary Bella w obwodzie teleportacyjnym, aby stworzyć dwukubitowe bramki , . Na sprzęcie kwantowym o rzadkiej i płaszczyznowej łączności, utworzenie pary Bella między dowolnymi kubitami wymaga długozasięgowej bramki kontrolowanej NOT (CNOT). Aby uniknąć tych bramek, używamy QPD nad operacjami lokalnymi, co skutkuje pociętymi parami Bella, które są zużywane w teleportacji. LO nie potrzebuje łącza klasycznego i jest tym samym prostsze w implementacji niż LOCC. Jednakże, ponieważ LOCC wymaga tylko jednego parametryzowanego obwodu szablonowego, jest on bardziej wydajny w kompilacji niż LO, a koszt jego QPD jest niższy niż koszt schematu LO. 15 16 17 16 17 18 19 20 Nasza praca wnosi cztery kluczowe wkłady. Po pierwsze, prezentujemy obwody kwantowe i QPD do tworzenia wielu pociętych par Bella w celu realizacji wirtualnych bramek w ref. . Po drugie, tłumimy i łagodzimy błędy wynikające z opóźnienia sprzętu sterującego klasycznego w dynamicznych obwodach za pomocą kombinacji dekoherencji dynamicznej i ekstrapolacji zerowego szumu . Po trzecie, wykorzystujemy te metody do inżynierii okresowych warunków brzegowych na grafie 103 węzłowym. Po czwarte, demonstrujemy połączenie klasyczne w czasie rzeczywistym między dwoma oddzielnymi QPU, demonstrując tym samym, że system rozproszonych QPU może być obsługiwany jako jeden za pomocą łącza klasycznego . W połączeniu z dynamicznymi obwodami, pozwala nam to na obsługę obu układów scalonych jako jednego komputera kwantowego, co ilustrujemy poprzez inżynierię okresowego grafu, który obejmuje oba urządzenia na 142 kubitach. Omówimy ścieżkę naprzód do tworzenia bramek dalekiego zasięgu i przedstawimy nasze wnioski. 17 21 22 23 Cięcie obwodów Uruchamiamy duże obwody kwantowe, które mogą nie być bezpośrednio wykonalne na naszym sprzęcie z powodu ograniczeń w liczbie kubitów lub łączności, poprzez cięcie bramek. Cięcie obwodów rozkłada złożony obwód na podobwody, które mogą być wykonywane indywidualnie , , , , , . Musimy jednak uruchomić zwiększoną liczbę obwodów, co nazywamy nadmiarem próbkowania. Wyniki z tych podobwodów są następnie łączone klasycznie, aby uzyskać wynik pierwotnego obwodu (Metody ). 15 16 17 24 25 26 Sec6 Jako jeden z głównych wkładów naszej pracy jest implementacja wirtualnych bramek z LOCC, pokazujemy, jak stworzyć wymagane pocięte pary Bella za pomocą operacji lokalnych. Tutaj wiele pociętych par Bella jest inżynierowanych przez parametryzowane obwody kwantowe, co nazywamy fabryką pociętych par Bella (Rysunek 1b, c ). Cięcie wielu par jednocześnie wymaga niższego nadmiaru próbkowania . Ponieważ fabryka pociętych par Bella tworzy dwa rozłączne obwody kwantowe, umieszczamy każdy podobwód blisko kubitów, które mają bramki dalekiego zasięgu. Powstały zasób jest następnie wykorzystywany w obwodzie teleportacyjnym. Na przykład, na Rysunku 1b , pocięte pary Bella są zużywane do stworzenia bramek CNOT na parach kubitów (0, 1) i (2, 3) (patrz sekcja „Fabryki pociętych par Bella” ). Fig. 1b,c 17 Fig. 1b Sec11 , Przedstawienie architektury IBM Quantum System Two. Tutaj dwa procesory Eagle QPU z 127 kubitami są połączone klasycznym łączem w czasie rzeczywistym. Każdy QPU jest sterowany przez swoją elektronikę w swoim stojaku. Ściśle synchronizujemy oba stojaki, aby obsługiwać oba QPU jako jeden. , Szablon obwodu kwantowego do implementacji wirtualnych bramek CNOT na parach kubitów ( 0, 1) i ( 2, 3) za pomocą LOCC poprzez zużycie pociętych par Bella w obwodzie teleportacyjnym. Fioletowe podwójne linie odpowiadają klasycznemu łączu w czasie rzeczywistym. , Fabryki pociętych par Bella 2( ) dla dwóch jednocześnie pociętych par Bella. QPD ma łącznie 27 różnych zestawów parametrów . Tutaj, . a b q q q q c C θ i θ i Okresowe warunki brzegowe Konstruujemy stan grafu | ⟩ z okresowymi warunkami brzegowymi na ibm_kyiv, procesorze Eagle , wykraczając poza granice narzucone przez jego fizyczną łączność (patrz sekcja „Grafy” ). Tutaj, ma ∣ ∣ = 103 węzły i wymaga czterech długozasięgowych krawędzi lr = {(1, 95), (2, 98), (6, 102), (7, 97)} między górnymi i dolnymi kubitami procesora Eagle (Rysunek 2a ). Mierzymy stabilizatory węzłów w każdym węźle ∈ i stabilizatory krawędzi utworzone przez produkt na każdej krawędzi ( , ) ∈ . Z tych stabilizatorów budujemy świadectwo splątania , które jest ujemne, jeśli istnieje splątanie dwupartycyjne na krawędzi ( , ) ∈ (ref. ) (patrz sekcja „Świadectwo splątania” ). Skupiamy się na splątaniu dwupartycyjnym, ponieważ jest to zasób, który chcemy odtworzyć za pomocą wirtualnych bramek. Mierzenie świadectw splątania między więcej niż dwiema stronami mierzy tylko jakość bramek nie-wirtualnych i pomiarów, co czyni wpływ bramek wirtualnych mniej jasnym. G 1 Sec13 G V E Fig. 2a Si i V SiSj i j E i j E 27 Sec14 , Graf ciężko-sześciokątny jest składany na sobie w formę tubularną przez krawędzie (1, 95), (2, 98), (6, 102) i (7, 97) zaznaczone na niebiesko. Tniemy te krawędzie. , Stabilizatory węzłów (na górze) i świadectwa , (na dole), z odchyleniem standardowym 1 dla węzłów i krawędzi blisko długozasięgowych krawędzi. Pionowe linie przerywane grupują stabilizatory i świadectwa według ich odległości od przeciętych krawędzi. , Dystrybuanta funkcji skumulowanej błędów stabilizatora. Gwiazdki wskazują stabilizatory węzłów , które mają krawędź zaimplementowaną przez bramkę dalekiego zasięgu. W benchmarku odciętej krawędzi (linia czerwona kropkowano-przerywana), bramki dalekiego zasięgu nie są implementowane, a wskazane gwiazdkami stabilizatory mają jednostkowy błąd. Szary obszar to masa prawdopodobieństwa odpowiadająca stabilizatorom węzłów dotkniętych cięciami. – , W dwuwymiarowych układach, zielone węzły powielają węzły 95, 98, 102 i 97, aby pokazać przecięte krawędzie. Niebieskie węzły w to zasoby kubitów do tworzenia pociętych par Bella. Kolor węzła to absolutny błąd ∣ − 1∣ zmierzony stabilizator, jak wskazano na pasku kolorów. Krawędź jest czarna, jeśli statystyka splątania jest wykryta z 99% poziomem ufności, a fioletowa, jeśli nie. W , bramki dalekiego zasięgu są implementowane za pomocą bramek SWAP. W , te same bramki są implementowane za pomocą LOCC. W , nie są one w ogóle implementowane. a b Sj c Sj d f e i Si d e f Przygotowujemy | ⟩ metodami. Natywne dla sprzętu krawędzie są zawsze implementowane za pomocą bramek CNOT, ale okresowe warunki brzegowe są implementowane za pomocą (1) bramek SWAP, (2) LOCC i (3) LO do łączenia kubitów w całej siatce. Główna różnica między LOCC a LO to operacja śledzenia, składająca się z jednokubitowych bramek zależnych od wyników pomiarów 2 , gdzie jest liczbą cięć. Każdy z 22 przypadków wyzwala unikalną kombinację bramek i/lub na odpowiednich kubitach. Pobranie wyników pomiarów, określenie odpowiedniego przypadku i działanie zgodnie z nim jest wykonywane w czasie rzeczywistym przez sprzęt sterujący, kosztem stałego dodatkowego opóźnienia. Łagodzimy i tłumimy błędy wynikające z tego opóźnienia za pomocą ekstrapolacji zerowego szumu i sekwencyjnego odsprzęgania dynamicznego , (patrz sekcja „Instrukcje przełączania obwodów kwantowych z ograniczonymi błędami” ). G n n n X Z 22 21 28 Sec10 Benchmarkujemy implementacje SWAP, LOCC i LO | ⟩ z natywnym dla sprzętu grafem stanów na ′ = ( , ′) uzyskanej poprzez usunięcie długozasięgowych bramek, tj. ′ = lr. Obwód przygotowujący | ′⟩ wymaga zatem tylko 112 bramek CNOT rozmieszczonych w trzech warstwach zgodnie z topologią ciężko-sześciokątną procesora Eagle. Obwód ten zgłosi duże błędy przy pomiarze stabilizatorów węzłów i krawędzi | ⟩ dla węzłów na przeciętej bramce, ponieważ został zaprojektowany do implementacji | ′⟩. Nazywamy ten natywny dla sprzętu benchmark benchmarkiem odciętej krawędzi. Obwód oparty na SWAP wymaga dodatkowych 262 bramek CNOT do stworzenia długozasięgowych krawędzi lr, co drastycznie zmniejsza wartość zmierzonych stabilizatorów (Rysunek 2b-d ). Natomiast implementacja LOCC i LO krawędzi w lr nie wymaga bramek SWAP. Błędy ich stabilizatorów węzłów i krawędzi dla węzłów niezaangażowanych w przeciętą bramkę ściśle podążają za benchmarkiem odciętej krawędzi (Rysunek 2b, c ). Natomiast stabilizatory obejmujące bramkę wirtualną mają niższy błąd niż benchmark odciętej krawędzi i implementacja SWAP (Rysunek 2c , znaczniki gwiazdek). Jako ogólna miara jakości, najpierw raportujemy sumę błędów absolutnych na stabilizatorach węzłów, tj. ∑ ∈ ∣ − 1∣ (Tabela Danych Rozszerzonych 1 ). Duży nadmiar SWAP jest odpowiedzialny za sumę błędów absolutnych 44,3. Błąd 13,1 w benchmarku odciętej krawędzi jest zdominowany przez osiem węzłów na czterech cięciach (Rysunek 2c , znaczniki gwiazdek). Natomiast błędy LO i LOCC są dotknięte przez MCM. Przypisujemy dodatkowy błąd 1,9 LOCC nad LO do opóźnień i bramek CNOT w obwodzie teleportacyjnym i pociętych parach Bella. W wynikach opartych na SWAP, nie wykrywa splątania na 35 ze 116 krawędzi z 99% poziomem ufności (Rysunek 2b, d ). Dla implementacji LO i LOCC, świadczy o statystyce splątania dwupartycyjnego na wszystkich krawędziach w z 99% poziomem ufności (Rysunek 2e ). Metryki te pokazują, że wirtualne bramki dalekiego zasięgu produkują stabilizatory z mniejszymi błędami niż ich dekompozycja na SWAPy. Ponadto, utrzymują wariancję na wystarczająco niskim poziomie, aby zweryfikować statystykę splątania. G G V E E EE G G G E Fig. 2b–d E Fig. 2b,c Fig. 2c i V Si Tab1 Fig. 2c Fig. 2b,d G Fig. 2e Obsługa dwóch QPU jako jednej Łączymy teraz dwa procesory Eagle QPU z 127 kubitami każdy w jedną QPU poprzez klasyczne połączenie w czasie rzeczywistym. Obsługa urządzeń jako jednego, większego procesora polega na wykonywaniu obwodów kwantowych obejmujących większy rejestr kubitowy. Oprócz bramek unitarnych i pomiarów wykonywanych współbieżnie na połączonym QPU, używamy dynamicznych obwodów do wykonywania bramek, które działają na kubitach na obu urządzeniach. Jest to możliwe dzięki ścisłej synchronizacji i szybkiej komunikacji klasycznej między fizycznie oddzielnymi instrumentami, wymaganymi do zbierania wyników pomiarów i określania przepływu sterowania w całym systemie . 29 Testujemy to klasyczne połączenie w czasie rzeczywistym, tworząc stan grafu na 134 kubitach zbudowany z pierścieni ciężko-sześciokątnych, które przechodzą przez obie QPU (Rysunek 3 ). Pierścienie te zostały wybrane poprzez wykluczenie kubitów dotkniętych dwupoziomowymi systemami i problemami z odczytem, aby zapewnić wysokiej jakości stan grafu. Graf ten tworzy pierścień w trzech wymiarach i wymaga czterech długozasięgowych bramek, które implementujemy za pomocą LO i LOCC. Jak poprzednio, protokół LOCC wymaga dwóch dodatkowych kubitów na bramkę ciętą do pociętych par Bella. Jak w poprzedniej sekcji, benchmarkujemy nasze wyniki do grafu, który nie implementuje krawędzi rozciągających się na obie QPU. Ponieważ nie ma kwantowego połączenia między dwoma urządzeniami, benchmark z bramkami SWAP jest niemożliwy. Wszystkie krawędzie wykazują statystykę splątania dwupartycyjnego, gdy implementujemy graf za pomocą LO i LOCC z 99% poziomem ufności. Ponadto, stabilizatory LO i LOCC mają taką samą jakość jak benchmark odciętej krawędzi dla węzłów, których nie dotyczy bramka dalekiego zasięgu (Rysunek 3c ). Stabilizatory dotknięte przez bramki dalekiego zasięgu mają dużą redukcję błędu w porównaniu z benchmarkiem odciętej krawędzi. Suma błędów absolutnych na stabilizatorach węzłów ∑ ∈ ∣ − 1∣, wynosi 21,0, 19,2 i 12,6 odpowiednio dla benchmarku odciętej krawędzi, LOCC i LO. Jak poprzednio, przypisujemy 6,6 dodatkowych błędów LOCC nad LO do opóźnień i bramek CNOT w obwodzie teleportacyjnym i pociętych parach Bella. Wyniki LOCC demonstrują, jak dynamiczny obwód kwantowy, w którym dwa podobwody są połączone klasycznym łączem w czasie rzeczywistym, może być wykonywany na dwóch oddzielnych QPU. Wyniki LO mogłyby być uzyskane na pojedynczym urządzeniu z 127 kubitami kosztem dodatkowego współczynnika 2 w czasie wykonania, ponieważ podobwody mogą być wykonywane sukcesywnie. Fig. 3 Fig. 3c i V Si