En el món digital d'avui, l'expectativa d'accés ininterromput a les dades ja no és un luxe - és una necessitat. Ja sigui que estigui alimentant una aplicació crítica, servint contingut multimèdia a un públic global, o simplement backup d'arxius personals, la fiabilitat del seu emmagatzematge en el núvol afecta directament tot, des de la productivitat a la confiança. Per a la majoria dels proveïdors de núvols, la fiabilitat es quantifica en termes de percentatges de temps d'operació: 99,9%, 99,99%, o fins i tot No obstant això, darrere d'aquests acords de nivell de servei polit (SLA) hi ha una realitat dura: veritat. - La capacitat d'accedir a les seves dades en qualsevol moment, en qualsevol lloc, sense retards o interrupcions inesperades - segueix sent difícil. Fins i tot els núvols centralitzats més robustos són susceptibles a la mateixa cosa que intenten mitigar: el fracàs. five nines continuous performance La fiabilitat no és una cosa que esperes, és una cosa que dissenyes. Des de les interrupcions a tota la regió fins a les rutes de xarxa mal configurades, hem vist repetidament que la infraestructura centralitzada, independentment de com estigui fortificada, no pot escapar de les seves pròpies limitacions estructurals.Quan tots els camins condueixen a través d'un grapat de centres de dades, un sol error -un incendi, un problema d'encaminament, un error intern- pot tenir efectes en tota una indústria. Des de les interrupcions a tota la regió fins a les rutes de xarxa mal configurades, hem vist repetidament que la infraestructura centralitzada, independentment de com estigui fortificada, no pot escapar de les seves pròpies limitacions estructurals.Quan tots els camins condueixen a través d'un grapat de centres de dades, un sol error -un incendi, un problema d'encaminament, un error intern- pot tenir efectes en tota una indústria. Aquest blog explora per què l'arquitectura descentralitzada de Sia està posicionada de manera única per superar aquestes limitacions. En les seccions següents, compararem aquest disseny amb els models d'emmagatzematge tradicionals, descomptarem els escenaris d'error del món real i demostrarem com la descentralització no només és més segura, sinó més fiable. Eficiència a través de la resiliència Perquè en el futur de l’emmagatzematge en el núvol, la fiabilitat no és una cosa que esperis, és una cosa que dissenyis. Els fonaments fràgils dels núvols centralitzats En totes les seves promeses de temps d'operació de "cinc-nou", les plataformes tradicionals d'emmagatzematge en núvol han demostrat repetidament com la infraestructura centralitzada pot ser fràgil quan s'enfronta a extrems ambientals, error humà o errors interns. Tot i la redundància reivindicada per hiperscalers com AWS, Google Cloud i Microsoft Azure, els estudis de casos del món real expliquen una història diferent - una on milions d'usuaris poden perdre l'accés en un moment, i empreses senceres es posen en aturada a causa d'un únic punt d'error. Potser els exemples més dramàtics de fragilitat del núvol es troben en els incendis dels centres de dades, incidents que poden desactivar instantàniament àrees senceres de serveis de núvol.L'agost de 2022, una explosió elèctrica al centre de dades de Council Bluffs de Google va ferir tres treballadors i va interrompre els serveis bàsics com Search i Maps.L'esdeveniment, un flash d'arc causat durant el manteniment del subestació, serveix com a recordatori que fins i tot els gegants de la indústria no poden escapar dels riscos associats amb la infraestructura física. Un any més tard, a París, una fallada multi-cluster a la zona Europa-Oest9-a de Google Cloud va començar amb la intrusió de l'aigua, el resultat d'una fallada del sistema de refrigeració que va inundar la sala de la bateria i va encendre un foc. Aquesta fallada en cascada no només va treure una de les principals regions de núvols europees de Google, sinó que també va afectar més de 90 serveis de núvol durant un període prolongat. Aquests incidents ressonen el famós incendi OVHcloud de 2021 a Estrasburg, que va destruir completament el centre de dades SBG2 i va danyar parcialment altres al mateix campus. Many customers had no disaster recovery plans in place, and entire websites were lost without backups. Més enllà dels incendis, les onades de calor han demostrat ser una amenaça inesperada però creixent. Al juliol de 2022, les temperatures rècord de més de 40 °C (104 °F) a Londres van colpejar els centres de dades de Google i Oracle fora de línia a causa de fallades del sistema de refrigeració. No obstant això, no totes les interrupcions neixen de catàstrofes físiques —algunes són desastres digitals que esperen que succeeixin. Al febrer de 2024, Google Cloud va patir una altra interrupció quan una fallada de l'emmagatzematge de metadades regional va portar la seva regió nord-oest1 fora de línia durant gairebé tres hores. De la mateixa manera, una actualització rutinària de CrowdStrike al juliol de 2024 va desencadenar accidents generalitzats dels sistemes Microsoft Windows, el que va provocar milers de vols cancel·lats i pèrdues massives de productivitat a tot el sector. Aquests fracassos exposen la perillosa consolidació de la dependència de serveis en el núvol.Quan una xarxa de distribució de continguts (CDN) com Fastly va patir una configuració errònia el 2021, va causar interrupcions globals, afectant Reddit, Spotify i els principals mitjans de comunicació en pocs segons. Performance contínua per disseny Mentre que els proveïdors de núvols centralitzats construeixen fortaleses cada vegada més grans per protegir-se contra el fracàs, Sia evita el problema completament rebutjant el model de fortalesa. En comptes d'apostar tot per la resiliència d'una sola regió o instal·lació, Sia distribueix les seves dades a nivell mundial, a través de dotzenes de nodes operats de forma independent, utilitzant matemàtiques -no de màrqueting- per garantir la fiabilitat. L’acomiadament que dóna La redundància sovint es veu com una mesura de seguretat - una manera de protegir-se contra el fracàs. Però en Sia, és molt més que això. Per defecte, Sia divideix cada fitxer en 30 fragments xifrats utilitzant la codificació de supressió. Només es necessiten 10 d'aquests fragments per reconstruir completament el fitxer. Això vol dir que la xarxa pot tolerar no només interrupcions, sinó el rendiment variable dels hosts individuals - tot mantenint l'accés sense problemes. L’acomiadament no és un retrocés, és la base del rendiment continu. En canvi, els núvols tradicionals depenen de la replicació completa d'arxius en unes poques regions.Si una regió falla, l'accés s'alenteix o s'atura - i l'emmagatzematge addicional no significa una millor velocitat. Els camins de recuperació canvien dinàmicament en funció de la disponibilitat de l'host i de les condicions de la xarxa: no hi ha fallades, no hi ha barreres, no hi ha finestres d'aturada. I mentre que els núvols centralitzats també poden utilitzar el codi d'esborrat internament, tota la seva infraestructura encara és gestionada per un sol proveïdor. Els hosts de Sia, per contra, s'operen de forma independent, sovint per diferents individus o empreses. Utilitzar Sia és com dividir les seves dades en 30 núvols diferents per defecte. Resiliència sense interrupció En la majoria dels entorns de núvol, quan alguna cosa es trenca, el rendiment pateix. Fins i tot amb els sistemes de fallades en lloc, les interrupcions sovint condueixen a una velocitat degradada, accés aturat o temps total d'aturada mentre la infraestructura s'esforça per recuperar-se. L'arquitectura de Sia funciona de manera diferent. Quan un host emmagatzema part de les vostres dades fora de línia, ja sigui a causa d'un error, manteniment o inestabilitat, els vostres arxius segueixen sent completament accessibles. No hi ha cap girador de càrrega, cap retard de sincronització, cap alerta. La xarxa continua recuperant els fragments necessaris dels hosts restants, seleccionant dinàmicament les opcions més ràpides disponibles. Mentrestant, en el fons, el programari de l'arrendador comença a restaurar de forma autònoma la redundància completa carregant nous fragments als amfitrions sans. Aquest procés d'auto-cura no només protegeix contra fallades futures, sinó que assegura que el rendiment es manté ininterromput. Sia no només es recupera del fracàs - funciona a través d'ella. En lloc de reaccionar a un fracàs després que es produeixi, Sia tracta el churn com un comportament esperat, un comportament que la xarxa està construïda per gestionar amb gràcia. Cap punt de fracàs Les plataformes de núvol centralitzades són vulnerables a l'error de cascada perquè es basen en el control centralitzat.Un router mal configurat, una implementació de programari defectuosa o un problema d'alimentació en una sola instal·lació poden divergir entre regions, arrossegant serveis en els quals milions de persones confien. L'arquitectura de Sia elimina aquest risc per disseny. No hi ha node mestre. No hi ha regió central. No hi ha autoritat privilegiada que pugui desactivar involuntàriament el sistema. En canvi, les vostres dades es distribueixen a desenes d'amfitrions independents de tot el món - cadascun d'ells emmagatzemant només fragments xifrats. Si un host fracassa, el sistema continua funcionant. Si deu hosts fracassen, segueix funcionant. No hi ha necessitat de "fail over" perquè no hi ha cap camí singular per començar. No hi ha cap regió. No hi ha cap node principal. No hi ha cap botelló. Només hi ha accés impecable. Aquesta manca de dependència central no només millora la tolerància a defectes, sinó que No estàs esperant que una regió torni a la xarxa.No estàs bloquejat per una porta d'accés sobrecarregada o un servei de recuperació d'administradors humans.Estàs tirant dades des d'on sigui més ràpid - contínuament. prevents performance blackouts Dissenyant per a la fiabilitat, no només esperant-la Quan parlem de "confiabilitat en el núvol", sovint se'ns ven una promesa -un SLA recolzat per sancions financeres, percentatges brillants de temps d'operació i reputació de marca.Però com hem vist, fins i tot els proveïdors de núvol més grans no poden escapar de la fragilitat que ve amb la centralització. En comptes d'assumir que la infraestructura es mantindrà i es prepara per al desastre quan no ho fa, Sia assumeix que el fracàs és inevitable - i construeix un sistema que segueix funcionant de totes maneres. No hi ha servidors privilegiats, no hi ha dependències regionals, no hi ha bloqueig de proveïdors.Només una infraestructura autoparacional i descentralitzada que manté les teves dades accessibles perquè cap actor té el poder de fer-les inaccessibles. Performance contínua Això és més que un avantatge tècnic. És un canvi en la forma en què pensem sobre la resiliència digital. En comptes de construir murs més alts i molls més profunds, Sia dispersa les seves defenses. Distribueix confiança. I en fer-ho, redefineix com pot semblar un emmagatzematge en núvol fiable en un món on els temps d'aturada ja no són acceptables. A mesura que les organitzacions s'enfronten a interrupcions creixents, costos creixents i exigències de compliment més estrictes, la descentralització s'ha convertit en més que viable - és superior. Fins i tot quan les coses van malament, és hora que deixem de dissenyar al voltant de la confiança i comencem a dissenyar al voltant de la certesa. Només treballen Amb Sia, el rendiment continu no és un objectiu, és una garantia. Fonts Coneixement del centre de dades. (2022, 9 d'agost). Incendi del centre de dades - Google pateix un 'incident elèctric', 3 ferits. Coneixement del centre de dades. https://www.datacenterknowledge.com/hyperscalers/data-center-fire-google-suffers-electric-incident-3-ferit Claburn, T. (2023, 26 d'abril). Google Cloud es desplaça a Europa enmig de fuites d'aigua, foc. https://www.theregister.com/2023/04/26/google_cloud_outage/ Sverdlik, Y. (2021, 9 de març). El foc ha destruït el centre de dades d'OVH a Estrasburg (SBG2). Coneixement del centre de dades. https://www.datacenterknowledge.com/uptime/fire-has-destroyed-ovh-s-strasbourg-datacenter-sbg2 Bloomberg News. (2022, 20 de juliol). Google, Oracle centres de dades colpejat fora de línia per la calor de Londres. Coneixement del centre de dades. https://www.datacenterknowledge.com/cooling/google-oracle-data-centers-knocked-offline-by-london-heat Millward, W. (2024, 5 de desembre). Les 10 majors interrupcions de núvols de 2024. CRN. https://www.crn.com/news/cloud/2024/the-10-biggest-cloud-outages-of-2024 Barrett, B. (2021, 8 de juny). Com una empresa obscura va abatre grans trossos d'Internet. WIRED. https://www.wired.com/story/fastly-cdn-internet-outages-2021/

This story contains new, firsthand information uncovered by the writer.

Aquest àudio és produït a l'idioma original de la història!

Sia redefineix la fiabilitat del núvol amb un rendiment continu per disseny

About Author

COMENTARIS

Etiquetes penjant

AQUEST ARTICLE VA SER PRESENTAT A

Related Stories

Generar líders de qualitat ASAP: HackerNoon's Content-Relevant Niche Ads FTW

The Fall of OM by Mantra DAO: Accident or Pattern?

Meet Filestack: HackerNoon Company of the Week

Startups of The Year: Meet the Engineering Industry

Generar líders de qualitat ASAP: HackerNoon's Content-Relevant Niche Ads FTW

The Fall of OM by Mantra DAO: Accident or Pattern?

Meet Filestack: HackerNoon Company of the Week

Startups of The Year: Meet the Engineering Industry

Light-Mode

Classic

Newspaper

Minty

Dark-Mode

Neon Noir

Minty

HN StartUps