Nykypäivän digitaalisessa ensimmäisessä maailmassa keskeytymätön pääsy tietoihin ei ole enää ylellisyyttä – se on välttämättömyys. Olipa kyseessä kriittisen sovelluksen käyttö, multimediasisällön tarjoaminen maailmanlaajuiselle yleisölle tai yksinkertaisesti henkilökohtaisten tiedostojen varmuuskopiointi, pilvitallennustesi luotettavuus vaikuttaa suoraan kaikkeen tuottavuudesta luottamukseen. Useimmilla pilvipalveluntarjoajilla luotettavuus mitataan käyttöajan prosenttiosuuksilla - 99,9%, 99,99% tai jopa Kuitenkin näiden kiillotettujen palvelutasosopimusten (SLA) takana on jyrkkä todellisuus: totta – kyky käyttää tietojasi milloin tahansa, missä tahansa, ilman odottamattomia viivästyksiä tai keskeytyksiä – pysyy hämmentävänä. Jopa tehokkaimmat keskitetyt pilvet ovat alttiita juuri sille, mitä he yrittävät lieventää: epäonnistumiselle. five nines continuous performance Luotettavuus ei ole jotain, jota toivot - se on jotain, jota suunnittelet. Alueellisista katkoksista virheellisiin verkkojen reitteihin olemme toistuvasti nähneet, että keskitetyt infrastruktuurit, riippumatta siitä, kuinka vahvistettuja ne ovat, eivät voi paeta omia rakenteellisia rajoituksiaan.Kun kaikki tiet johtavat muutamien datakeskusten läpi, yksi virhe - tulipalo, reititysongelma, sisäinen virhe - voi vaikuttaa koko teollisuuteen. Alueellisista katkoksista virheellisiin verkkojen reitteihin olemme toistuvasti nähneet, että keskitetyt infrastruktuurit, riippumatta siitä, kuinka vahvistettuja ne ovat, eivät voi paeta omia rakenteellisia rajoituksiaan.Kun kaikki tiet johtavat muutamien datakeskusten läpi, yksi virhe - tulipalo, reititysongelma, sisäinen virhe - voi vaikuttaa koko teollisuuteen. Tämä blogi tutkii, miksi Sia:n hajautettu arkkitehtuuri on ainutlaatuisesti sijoitettu voittamaan nämä rajoitukset. Seuraavissa osissa vertaamme tätä muotoilua perinteisiin tallennusmalleihin, hajotamme todelliset epäonnistumisskenaariot ja osoitamme, miten hajauttaminen ei ole vain turvallisempaa - se on luotettavampaa. Suorituskykyä vastustuskyvyn kautta Koska pilvitallennuksen tulevaisuudessa luotettavuus ei ole jotain, jota toivot - se on jotain, jota suunnittelet. Keskitettyjen pilvien hauraat perustukset Kaikista "viiden yhdeksän" käyttöajan lupauksista huolimatta perinteiset pilvitallennusalustat ovat toistuvasti osoittaneet, kuinka hauras keskitetty infrastruktuuri voi olla ympäristön äärimmäisyyksien, inhimillisten virheiden tai sisäisten virheiden edessä. huolimatta AWS: n, Google Cloudin ja Microsoft Azuren kaltaisten hyperskalaattoreiden väittämästä irtisanomisesta, reaalimaailman tapaustutkimukset kertovat erilaisen tarinan - sellaisen, jossa miljoonat käyttäjät voivat menettää pääsyn hetkessä ja kokonaiset yritykset pysähtyvät yhden epäonnistumispisteen vuoksi. Ehkä kaikkein dramaattisimpia esimerkkejä pilvipilven haavoittuvuudesta löytyy datakeskusten tulipaloista – tapahtumista, jotka voivat välittömästi poistaa käytöstä koko pilvipalveluiden alueet. Elokuussa 2022 sähköinen räjähdys Googlen Council Bluffs -tietokeskuksessa loukkasi kolmea työntekijää ja häiritsi ydinpalveluja, kuten Etsi ja Kartat. Tapahtuma, kaareva salama, joka aiheutui alustatilan kunnossapidon aikana, muistuttaa, että jopa teollisuuden jättiläiset eivät voi paeta fyysiseen infrastruktuuriin liittyviä riskejä. Vuotta myöhemmin Pariisissa Google Cloudin eurooppa-länsi9-alueen monikerroksinen vika alkoi veden tunkeutumisella – itse asiassa jäähdytysjärjestelmän vika, joka tulvi akkuhuoneeseen ja sytytti tulen. Nämä tapahtumat muistuttavat Strasbourgin nyt kuuluisaa 2021 OVHcloud-paloa, joka tuhosi täysin SBG2-tietokeskuksen ja osittain vaurioitti muita samassa kampuksessa. Many customers had no disaster recovery plans in place, and entire websites were lost without backups. Heinäkuussa 2022 Lontoon ennätykselliset lämpötilat, jotka ylittivät 40 °C (104 °F) löivät sekä Googlen että Oraclen datakeskukset offline-tilassa jäähdytysjärjestelmän epäonnistumisten vuoksi. Google joutui ennakoivasti sulkemaan osia pilvestään laitteiston vahingoittumisen estämiseksi - hämmästyttävä myöntäminen siitä, että sää yksin voi vaarantaa palvelun saatavuuden. Kuitenkin kaikki keskeytykset eivät synny fyysisestä katastrofista – jotkut ovat digitaalisia katastrofeja, jotka odottavat tapahtuvan. Helmikuussa 2024 Google Cloud kärsi jälleen toisen keskeytyksen, kun alueellinen metatietovaraston vika vei sen US-West1 -alueen pois käytöstä lähes kolme tuntia. Samoin CrowdStriken heinäkuussa 2024 tekemä rutiininomainen päivitys aiheutti laajamittaisia Microsoft Windows -järjestelmien kaatumisia, mikä aiheutti tuhansia peruutettuja lentoja ja massiivisia tuottavuuden menetyksiä eri aloilla. Nämä epäonnistumiset paljastavat pilvipalveluiden riippuvuuden vaarallisen vakiinnuttamisen.Kun Content Delivery Network (CDN) -verkko, kuten Fastly, kärsi virheellisestä konfiguroinnista vuonna 2021, se aiheutti maailmanlaajuisia häiriöitä, jotka vaikuttavat Redditiin, Spotifyon ja suurimpiin uutistoimistoihin sekunneissa. Jatkuva suorituskyky suunnittelussa Kun keskitetyt pilvipalveluntarjoajat rakentavat yhä suurempia linnoituksia suojaamaan epäonnistumisia vastaan, Sia poistaa ongelman kokonaan hylkäämällä linnoitusmallin. Sen sijaan, että panostettaisiin kaikkiin yhden alueen tai laitoksen kestävyyteen, Sia jakaa tietosi maailmanlaajuisesti, kymmeniin itsenäisesti toimiviin solmuihin, käyttämällä matematiikkaa – ei markkinointia – luotettavuuden takaamiseksi. irtisanominen, joka johtaa Irtisanominen nähdään usein turvallisuustoimenpiteenä – keinona suojella epäonnistumisia vastaan. Mutta Sia:ssa se on paljon enemmän. Oletusarvoisesti Sia jakaa jokaisen tiedoston 30:een salattuun osaan käyttämällä poistokoodausta. Vain 10 näistä osioista tarvitaan tiedoston täydelliseen uudelleenrakentamiseen.Tämä tarkoittaa, että verkko voi sietää paitsi keskeytyksiä myös vaihtelevaa suorituskykyä yksittäisiltä isännöiltä - kaikki säilyttäen saumaton pääsy. Irtisanominen ei ole taantuma – se on jatkuvan suorituskyvyn perusta. Sitä vastoin perinteiset pilvet luottavat täydelliseen tiedostojen kopiointiin useilla alueilla.Jos yksi alue epäonnistuu, pääsy hidastuu tai pysähtyy – ja ylimääräinen tallennus ei tarkoita parempaa nopeutta. Sia:n malli sopeutuu reaaliaikaisesti.Palautusreitit muuttuvat dynaamisesti isännän saatavuuden ja verkon olosuhteiden mukaan – ei vikoja, ei pullonkauloja, ei pysähtymisikkunoita. Ja vaikka keskitetyt pilvet voivat myös käyttää poistokoodausta sisäisesti, kaikki niiden infrastruktuuri toimii edelleen yhdellä palveluntarjoajalla. Sia:n isännät päinvastoin toimivat itsenäisesti – usein eri henkilöiden tai yritysten toimesta. Sia:n käyttäminen on kuin jakaisi tietosi 30 eri pilveen oletusarvoisesti. Kestävyys keskeytyksettä Useimmissa pilviympäristöissä, kun jokin rikkoutuu, suorituskyky kärsii.Jopa epäonnistumisjärjestelmien kanssa häiriöt johtavat usein nopeuden heikentymiseen, pääsyn häiriöihin tai täydelliseen pysähtymiseen, kun infrastruktuuri yrittää toipua. Arkkitehtuuri toimii eri tavalla. Kun isäntä tallentaa osan tiedoistasi offline-tilassa – epäonnistumisen, ylläpidon tai epävakauden vuoksi – tiedostosi pysyvät täysin käytettävissä. Ei latauspyörää, ei synkronointiviivästystä, ei hälytystä. Verkko jatkaa tarvittavien murto-osien hankkimista jäljellä olevista isännöistä, valitsemalla dynaamisesti nopeimmat käytettävissä olevat vaihtoehdot. Samaan aikaan taustalla vuokranantajaohjelmisto alkaa itsenäisesti palauttaa täyden irtisanomisen lataamalla uusia murto-osia terveille isännöille.Tämä itsensä parantava prosessi ei ainoastaan suojaa tulevilta epäonnistumisilta – se varmistaa, että suorituskyky pysyy keskeytyksettä. Sia ei vain toipu epäonnistumisesta - se toimii sen kautta. Sen sijaan, että reagoisi epäonnistumiseen sen jälkeen, kun se tapahtuu, Sia kohtelee churnia odotetuksi käyttäytymiseksi - yksi verkko on rakennettu käsittelemään loistavasti. Ei yksittäistä epäonnistumispistettä Keskitetyt pilvipalvelut ovat alttiita kaskadeille epäonnistumiselle, koska ne luottavat keskitettyyn hallintaan. Väärin määritetty reititin, viallinen ohjelmistotoiminta tai yksittäisen laitoksen virtaongelma voivat hajota eri alueilla - vetämällä palvelut pois, joihin miljoonat luottavat. Sia-arkkitehtuuri poistaa tämän riskin suunnittelulla. Ei ole pääsolmua. Ei keskeistä aluetta. Ei etuoikeutettua viranomaista, joka voi tahattomasti ottaa järjestelmän pois käytöstä. Sen sijaan tietosi jaetaan kymmeniin riippumattomiin isännöihin ympäri maailmaa - jokainen tallentaa vain salattuja fragmentteja. Jos yksi isäntä epäonnistuu, järjestelmä jatkaa toimintaa. Jos kymmenen isäntä epäonnistuu, se jatkaa toimintaa. Ei ole tarvetta "epäonnistua", koska ei ole yksittäistä polkua aloittaa. Ei aluetta. Ei pääsolmua. Ei pullonkaulaa. Vain pysäyttämätön pääsy. Tämä keskeisen riippuvuuden puute ei ainoastaan paranna vian toleranssia – se Et odota, että jokin alue palaa verkkoon.Et ole pullonkaulassa ylikuormitetun portin tai ihmisen järjestelmänvalvojan palautuspalvelun vuoksi.Voit vetää tietoja mistä tahansa nopeimmin – jatkuvasti. prevents performance blackouts Luotettavuuden suunnittelu, ei vain sitä toivominen Kun puhumme "pilvipalvelujen luotettavuudesta", meille myydään usein lupaus - SLA, jota tukevat taloudelliset rangaistukset, loistavat käyttöajan prosenttiosuudet ja brändin maine.Mutta kuten olemme nähneet, jopa suurimmat pilvipalvelujen tarjoajat eivät voi paeta keskittymisen haavoittuvuutta. Olipa kyseessä tulipalot, kuumia aaltoja tai ohjelmistovirheitä, perinteinen pilvimalli on aina muutamia kaskimoita maailmanlaajuisesta häiriöstä. Sen sijaan, että oletettaisiin, että infrastruktuuri pysyy ja valmistautuu katastrofiin, kun se ei, Sia olettaa, että epäonnistuminen on väistämätöntä - ja rakentaa järjestelmän, joka jatkaa toimintaa joka tapauksessa. Ei etuoikeutettuja palvelimia, ei alueellisia riippuvuuksia, ei toimittajien lukitsemista.Vain itse korjaava, hajautettu infrastruktuuri, joka pitää tietosi käytettävissä, koska yhdelläkään toimijalla ei ole valtaa tehdä siitä esteetöntä. Jatkuva suorituskyky Tämä on enemmän kuin tekninen etu. Se on muutos siinä, miten ajattelemme digitaalista vastustuskykyä. Sen sijaan, että rakentaisimme korkeampia seiniä ja syvempiä muureja, Sia hajottaa puolustuksensa. Se jakaa luottamusta. Ja näin tehdessään se määrittelee uudelleen, miltä luotettava pilvipalvelu voi näyttää maailmassa, jossa keskeytykset eivät ole enää hyväksyttäviä. Kun organisaatiot kohtaavat yhä suurempia keskeytyksiä, kasvavia kustannuksia ja tiukempia vaatimustenmukaisuusvaatimuksia, hajauttamisesta on tullut enemmän kuin toteutettavissa – se on parempi. Vaikka asiat menisivät pieleen, on aika lopettaa luottamuksen suunnittelu ja alkaa suunnitella varmuuden ympärille. Vain työtä Sia:n kanssa jatkuva suorituskyky ei ole tavoite, se on takuu. Lähteet Data Center Knowledge. (2022, 9. elokuuta). Tietokeskuksen tulipalo — Google kärsii ’sähkövahinko’, 3 loukkaantunut. Data Center Knowledge. https://www.datacenterknowledge.com/hyperscalers/data-center-fire-google-suffers-electric-incident-3-haavoittunut Claburn, T. (2023, 26. huhtikuuta). Google Cloud liukuu yli Euroopassa keskellä veden vuotoa, tulipaloa. https://www.theregister.com/2023/04/26/google_cloud_outage/ Sverdlik, Y. (2021, 9. maaliskuuta). Tulipalo on tuhonnut OVH:n Strasbourgin datakeskuksen (SBG2). Tietokeskuksen tietämys. https://www.datacenterknowledge.com/uptime/fire-has-destroyed-ovh-s-strasbourg-datacenter-sbg2 Bloomberg News. (2022, heinäkuu 20). Google, Oracle datakeskukset lyötiin pois päältä Lontoon lämpöä. Data Center Knowledge. https://www.datacenterknowledge.com/cooling/google-oracle-data-centers-knocked-offline-by-london-heat Millward, W. (2024, 5. joulukuuta). 10 suurinta pilvipäästöjä vuonna 2024. CRN. https://www.crn.com/news/cloud/2024/the-10-biggest-cloud-outages-of-2024 Barrett, B. (2021, 8. kesäkuuta). Kuinka epäselvä yritys otti alas suuria osia internetistä. WIRED. https://www.wired.com/story/fastly-cdn-internet-outages-2021/