Свеобухватна инжењерска и оперативна анализа Интернет архиве Увод: Хум историје у магли Ако тихо стојите у чамцу бивше цркве Хришћанске науке на Фунстон Авенуеу у Ричмонд Дистрикту у Сан Франциску, можете чути звук интернета који дише. То није хаотични врисак модема за позивање или пинг обавештења, већ стални, индустријски хум - нискофреквентни тром који генеришу стотине ротирајућих хард дискова и брзих вентилатора који их хладе. Овде, међу редизајнираним неокласичним стубовима и дрвеним стабљикама зграде изграђене да обожавају другачију врсту трајности, лежи физичка манифестација "виртуелног" света. Ми имамо тенденцију да мислимо о интернету као етерном облаку, мјесту без географије или масе. Али у овој згради, интернет има тежину. Она има топлоту. То захтева електричну енергију, одржавање и константну борбу против другог закона термодинамике. Од краја 2025. године, ова машина – колективно позната као Архивира више од једног трилиона веб страница.1 Садржи 99 петабајта јединствених података, број који се проширује на преко 212 петабајта када се рачуна о резервним копијама и отпуштању.3 Wayback машина Wayback машина Skala operacije je zapanjujuća, ali inženjerski izazov je još dublji.Kako izgraditi mašinu koja može da unese široku, dinamičnu i neprestano promenljivu svetsku mrežu u realnom vremenu?Kako čuvate te podatke vekovima kada prosečni hard disk traje samo nekoliko godina?I možda najkritičnije, kako plaćate električnu energiju, prosečnu širinu i sredstva pravne odbrane potrebna za održavanje svetlosti u vremenu gde su zakoni o autorskim pravima i digitalno očuvanje zaključani u koliziji velikih ulaganja? Ovaj izveštaj proučava mehaniku Internet Arhiva sa preciznošću od suza. Povratit ćemo šasiju da bismo ispitali prilagođene PetaBox servere koji zagrevaju zgradu bez klima uređaja. Pratili smo evoluciju web crawlera – od ranih otpada na bazi tepiha Alexa Internet-a do sofisticiranih botova na bazi pretraživača 2025. godine. Analizirat ćemo finansijski registar ovog neprofitnog divova, istraživši kako on preživi na budžetu koji je za svoje susede u Silicijumskoj dolini zaokruživanje greške. I na kraju, gledat ćemo u budućnost, gde „Decentralized Web“ (DWeb) obećava da će fragment Arhiva u milion komada kako bi se osiguralo da nikada neće biti uništen.5 То је прича о 20.000 хард дискова, 45 миља каблова и визији која је почела 1996. године са једноставним, смелим циљем: "Универзални приступ свим знањима".7 Део I: Термодинамика меморије ПетаБок архитектура: инжењерство за густину и топлоту Срце Интернет архиве је ПетаБок, сервер за складиштење који је персонализовано дизајниран од стране особља Архива како би решио специфичан проблем: складиштење огромних количина података уз минималну потрошњу енергије и производњу топлоте. У раним 2000-тим, решења за складиштење предузећа од гиганта као што су ЕМЦ или НетАпп била су забрањиво скупа и гладна за енергију. Они су дизајнирани за брзе трансакционе податке – као што су банкарски системи или берзе – где су милисекунди кашњења ствар. , оснивач Архива и компјутерски инжењер који је раније основао суперкомпјутерску компанију Thinking Machines, приступио је проблему са другачијом филозофијом. Уместо високих перформанси РАИД масива, Архив је изградио ПетаБок користећи потрошачке делове. Филозофија дизајна је била радикална за своје време: користити "Само гомилу дискова" (ЈБОД) уместо скупих РАИД контролера, и бавити се редунданцијом података путем софтвера уместо хардвера.4 Бровстер Кале Бровстер Кале Еволуција густине: од терабајта до петабајта Трајекторија ПетаБок-а је студија случаја у Мооровом закону примењеном на магнетно складиштење. Први ПетаБок рацк, који је започео рад у јуну 2004. године, био је откриће у густини складиштења. Имао је 100 терабајта (ТБ) података – огромну количину у то време – док је потрошио само око 6 киловата енергије.1 Да би то урадио, 2003. године цела Веебацк Машина је расла брзином од само 12 терабајта месечно. Инжењерске спецификације ПетаБок-а откривају неумољиву потрагу за густином: Specification Generation 1 (2004) Generation 4 (2010) Current Generation (2024-2025) Capacity per Rack 100 TB 480 TB ~1.4 PB (1,400 TB) Drive Count ~40-80 drives 240 drives (2TB each) ~360+ drives (8TB+ each) Power per Rack 6 kW ~6-8 kW ~6-8 kW Heat Dissipation Utilized for building heat Utilized for building heat Utilized for building heat Processor Arch Low-voltage VIA C3 Intel Xeon E7-8870 (10-core) Modern High-Efficiency x86 Cooling Passive / Fan-assisted Passive / Fan-assisted Passive / Fan-assisted Капацитет по раку 100 ТБ 480 ТБ ~ 1,4 ПБ (1,400 ТБ) Вожња графа 40 - 80 возача 240 дискова (2ТБ сваки) ~360+ дискова (8ТБ+ сваки) Снага за рацк 6 КВ 6-8 кВ 6-8 кВ Топлотна дисипација Користи се за изградњу топлоте Користи се за изградњу топлоте Користи се за изградњу топлоте Процесор Arch Нисконапонска VIA C3 Intel Xeon E7-8870 (10 језгара) Висока ефикасност x86 хлађење Pasivno / Fan-Assisted Pasivno / Fan-Assisted Pasivno / Fan-Assisted 1 Четврта генерација ПетаБок-а, уведена око 2010. године, приказала је ову густину. Сваки рацк садржи 240 дискова од 2 терабајта сваки, организованих у 4У високе рацк-монте. Ове јединице су напајале процесори Интел Ксеон (нарочито серија Е7-8870 у каснијим надоградњама) са 12 гигабајта РАМ-а. До 2025. године, пејзаж складишта се поново променио. Тренутни петаБок полице пружају 1,4 петабајта складишта по полици. Овај скок се постиже не додавањем више слотова, већ коришћењем значајно већих дискова – 8ТБ, 16ТБ, па чак и 22ТБ дискови су сада стандардни. У 2016. години, Архив је управљао око 20.000 појединачних дискова. Експеримент са „црном кутијом“ У својој потрази за ефикасним складиштењем, Архив је такође експериментисао са модуларним центрима података. 2007. године Архив је постао рани усвојитељ Сун Мицросистемс "Блацкбокс" (касније Сун Модулар Датацентер). Ово је био контејнер за испоруку упакован са Сун Фире Кс4500 "Тхумпер" серверима за складиштење, способним да држи огромне количине података у преносивој, самосталној јединици. Овај експеримент потврдио је концепт контејнеризованих центара података - модел који су касније усвојили Мицрософт и Гоогле - али је Архив на крају вратио своје прилагођене дизајне ПетаБок за своју примарну интерну инфраструктуру, што је фаворизирало флексибилност и нижу цену њихових сопствених дизајна хардвера отвореног кода у односу на власничка комерцијална решења. Хлађење без клима уређаја: Фунстон Лооп Једна од најинтелигентнијих карактеристика инфраструктуре Архива је његов систем управљања топлотом.Центри података су познато енергетски интензивни, често троше толико електричне енергије на хлађење (ХВАЦ) као што троше на рачунарство. Решење је био географија и физика. Примарни центар података Архива налази се у Рицхмонд Дистрикту у Сан Франциску, комшилуку познатом по својој вечној магли и хладној морској клими. Зграда користи овај атмосферски ваздух за хлађење. Не постоји традиционална клима уређаја у машинским собама ПетаБок. Уместо тога, сервери су дизајнирани да раде на мало вишој оперативној температури, а вишак топлоте генерисане од стране ротирајућих дискова је ухваћен и рециркулисан да загреје зграду током мрачне зиме у Сан Франциску.9 Овај систем "отпадне топлоте" је затворени циклус ефикасности. Више од 60 киловата топлотне енергије произведене од стране кластера за складиштење није нуспроизвод који треба елиминисати, већ ресурс који треба искористити. Овај избор дизајна драматично смањује однос ефикасности коришћења енергије (ПУЕ) објекта, омогућавајући Архиву да троши своје ограничене фондове на хард дискове, а не на рачуне за електричну енергију. То је дословно примена мантре "смањи, понови, рециклирај" на термодинамику складиштења података.3 Поузданост и одржавање: Модел "Замена када је мртав" Са преко 28.000 ротирајућих дискова у раду, неуспјех диска је статистичка сигурност.3 У традиционалном корпоративном центру података, неуспјех диска изазива тренутни, страшан протокол замене како би се одржало "пет девет" (99.999%) поузданости. Подаци се огледају на више машина, често на различитим физичким локацијама (укључујући центре података у Редвуду Ситију и Рицхмонд, Калифорнија, и копије у Европи и Канади).12 Пошто подаци нису „критични за мисију“ у смислу банкарске трансакције, Архив може толерисати одређени број мртвих дискова у чвору пре него што је потребно физичко одржавање. Овај "ниско одржавање" дизајн омогућава врло мали тим - историјски само један систем администратор по петабајта података - да управља империја складиштења који се такмичи са великим технолошким корпорацијама. систем користи Нагиос алат за праћење да прати здравље преко 16.000 различитих контролних тачака широм кластера, упозоравајући мале особље само када је достигнут критичан праг неуспеха.8 Део 2: Цроулер'с Дилема Захваљујући покретној мети Ако је ПетаБок мозак Архива, веб скенери су његове очи. Архивирање веба није пасивни процес; захтева активан, агресиван софтвер који неуморно пролази кроз везе Ворлд Виде Веб-а, копирајући све што нађе. Nasleđe Heritrixa Већи део своје историје, Архив се ослањао на претраживач који се зове Развијен заједнички 2003. године од стране Интернет Архива и нордијских националних библиотека (Норвешка и Исланд), Херитрикс је јава-басед, отворен изворни претраживач дизајниран посебно за верност архива. Еритрекс Еритрекс За разлику од претраживача претраживача (као што је Гооглебот), који се првенствено брине о извлачењу текста за релевантност претраге, Херитрикс се брине о Покушава да ухвати тачно стање веб странице, укључујући његове слике, стилске листове и уграђене објекте.Пакује ова средства у стандардизовани формат контејнера познат као ВАРЦ (Веб АРцхиве).18 Артифакти ВАРЦ датотека је атомска јединица Интернет архиве. Она не чува само садржај странице, већ и "ХТТП наслове" - дигитално руковање између сервера и претраживача које се десило у тренутку хватања. Страница је ухваћена, Сервер га је испоручио, и Однос је преговарао.19 Када Šta Kako Херитрикс ради користећи "Фронтиер" - софистицирани систем за управљање редом који одлучује који УРЛ да посетите следећи.Она се придржава строгих "поштовања" политика, поштује протоколе за искључивање роботс.ткт и ограничава учесталост захтјева како би се избегло срушење циљних сервера.16 Криза динамичког Веба Међутим, Херитрикс је изграђен за једноставнију вебу - вебу статичких ХТМЛ датотека и хиперлинкова.Када је веб еволуирао у платформу динамичких апликација (Веб 2.0), друштвених медија и ЈаваСцрипт-тешких интерфејса, Херитрикс је почео да се суочава. Херитрикс хвата почетни ХТМЛ који испоручује сервер.Али на модерном сајту као што је Твиттер (сада Кс) или Фацебоок, тај почетни ХТМЛ је често само празан штапић. Херитрикс, будући да је глуп преузимач, није могао да изврши овај код. Резултат је често био сломљена, празна шкољка странице - дигитални град духова.17 posle Успон Брозлера и Умбре Да би се борио против „динамичког веба“, Архив је морао да еволуира своје алате. и Умбра, алати који замагљују линију између претраживача и веб претраживача. Brozler Brozler Brozzler (portmanteau „browser“ i „crawler“) koristi „bez glave“ verziju Google Chrome pregledača da bi prikazala stranice tačno onako kako ih korisnik vidi. Ово омогућава Архиву да сачува сложене сајтове као што су Инстаграм и интерактивне вести које би биле невидљиве традиционалном претраживачу.17 пре Умбра делује као помоћни алат, користећи аутоматизацију претраживача да имитира људско понашање. Он "прокрућује" доле страницу да би изазвао бесконачне фееде за учитавање, прелази преко падајућих менија да би открио скривене везе и кликне на дугмад. Ова промена захтева знатно више рачунарске снаге.Рендерирање странице у Цхромеу захтева наређења величине више циклуса ЦПУ-а него једноставно преузимање текстуалне датотеке.Ово је приморало Архив да буде селективнији и циљанији у својим високо-веродостојним претраживачима, резервишући ресурсно-интензивно претраживање претраживача за динамичке сајтове високе вредности док користе лакше алате за статички веб.17 Револуција „Save Page Now“ Možda je najznačajnija tehnološka promena u poslednjih nekoliko godina bila demokratizacija crawla. funkcija Save Page Now omogućava svakom korisniku da odmah pokrene crawl određenog URL-a. Подржан овим технологијама заснованим на претраживачу, Сачувај страницу сада је постао критичан алат за новинаре, истраживаче и провераватеље чињеница.У 2025. години, то је често прва линија одбране против рушења везе, омогућавајући корисницима да креирају непроменљиву евиденцију твита или чланка са вести секунди пре него што се избрише или промене.1 Alexa internet konekcija Немогуће је дискутовати о историји претраживања архива без помињања Алека Интернета.Основан од стране Бреустера Калеа 1996. године заједно са Архивом, Алека је била профитна компанија која је претраживала веб да пружи аналитику саобраћаја (познати "Алека Ранк"). Током скоро две деценије, Алека је био примарни извор података Архива. Алека би претраживала веб у сопствене комерцијалне сврхе, а затим донирала податке за претраживање Интернет Архиву након периода ембаргоа. Ова симбиотска веза пружала је Архиву огроман, континуирани ток података без потребе за покретањем сопствене масивне инфраструктуре за претраживање. Међутим, са Амазоном (која је купила Алеку у 1999) прекидањем услуге Алека у мају 2022. године, Архив се морао више ослањати на сопствену инфраструктуру за претраживање и партнере као што је Цоммон Цравл.7 Део III: Економија преживљавања Финансирање непрофитабилног Покретање врхунског глобалног сајта обично захтева буџет Гоогле-а или Мета-а. Интернет Архив успева да функционише као један од најпосећенијих сајтова на свету на буџету који је шокантно скроман. Финансијски ледгер Prema finansijskim podacima (Form 990) i godišnjim izveštajima, godišnji prihod Internet Arhiva kreće se između 25 i 30 miliona dolara.7 U 2024. godini, na primer, organizacija je ostvarila prihode od 26,8 miliona dolara, a troškovi od 23,5 miliona dolara. Примарни покретач прихода су доприноси и грантови, који обично чине 60-70% укупног прихода. Микро-донације: "Википедија модел" тражећи кориснике за $ 5 или $ 10. Главне грантове: Финансирање од филантропских организација као што су Фондација Меллон, Фондација Кале / Аустин и Фондација Филецоин.25 Други главни извор прихода је Програмске услуге, посебно услуге дигитализације и архивирања.Архив није само библиотека, већ и пружалац услуга. Архива-то: Ова претплата услуга омогућава институцијама (библиотеке, универзитети, владе) да изграде своје куриране веб архиве. претплате почињу око 2.400 долара годишње за 100 ГБ складишта и скалирају се до 12.000 долара годишње за терабајт. Ова услуга генерише милионе прихода, ефикасно субвенционишући бесплатну Wayback Machine.27 Услуге дигитализације: Архив управља центрима за дигитализацију у којима скенира књиге и друге медије за партнере. „Сцрибе“ скенери књига – прилагођене машине са В-обличним крилима и камерама са педалом – омогућавају не-деструктивно скенирање књига. Vault Услуге: Новија понуда, Vault пружа дигитално складиштење за једнократну накнаду (нпр. $1,000 по терабајту). Овај "модел донације" омогућава институцијама да плаћају једном за трајно складиштење, кладећи се да ће трошкови складиштења смањити брже од камате на донацију.30 Цена једног петабајта Stranicu troškova knjigovodstva dominiraju plate i plate (oko pola budžeta) i IT infrastruktura.Međutim, „PetaBox ekonomija“ omogućava arhivu da skladišti podatke za deo troškova komercijalnih cloud provajdera. Размотрите трошкове складиштења 100 петабајта на Амазон С3. по стандардним ценама (~ 0,021 долара по ГБ месечно), само складиштење би коштало преко 2,1 милиона долара месечно. Оперативни буџет - за особље, зграде, правну одбрану и хардвер - је мањи од онога што би коштало складиштење њихових података на АВС-у годину дана. Годишњи Власништвом свог хардвера, коришћењем архитектуре високе густине ПетаБок-а, избегавањем трошкова климатизације и коришћењем софтвера отвореног кода, Архив постиже ефикасност трошкова складиштења која је ред величине боља од комерцијалних стопа облака.25 Четврти део: Правно бојно поље Када очување испуњава ауторска права Ова мисија је морално убедљива, али правно опасна.Када се Архив проширио изван једноставних веб страница у књиге, музику и софтвер, преселио се из релативно сигурне луке "имплицитне лиценце" веба у тешко утврђену територију ауторског права. Национална библиотека за хитне случајеве и Хашетте В. Интернет архива Хашетте В. Интернет архива Напетост је експлодирала 2020. године током ЦОВИД-19 пандемије.Са затвореним физичким библиотекама, Архив је покренуо "Националну хитну библиотеку", уклањајући листе чекања на својој дигитализованој колекцији књига.Овај потез подстакао је четири главна издавача - Хацхет, ХарперЦоллинс, Вилеи и Пингвин Рандом Хоусе - да туже, наводећи масивно кршење ауторских права.31 Теорија је тврдила да ако библиотека поседује физичку књигу, треба јој дозволити да скенира ту књигу и позајми дигиталну копију једној особи у исто време, под условом да се физичка књига извуче из обраде док је дигитална позајмљена. Међутим, у пресудној одлуци у марту 2023. године, федерални судија је одбацио ову одбрану, одлучујући да скенирање и позајмљивање Архива није била „праведна употреба“. Суд је утврдио да су дигиталне копије конкурисале са тржиштима сопствених комерцијалних е-књига издавача. Тврдња Архива да је његова употреба била „трансформативна“ (учинити позајмљивање ефикаснијим) је одбачена. Успостављање у Архив је био приморан да уклони отприлике 500.000 књига из свог програма за позајмљивање – посебно оних за које постоји комерцијална верзија е-књиге.Ова "преговарана пресуда" фундаментално је променила књижну стратегију Архива, присиљавајући га да се врати на старије, ван штампе, и радове у јавном домену где су комерцијални сукоби мање вероватни.31 Хашета Велики пројекат 78 и Sony Settlement Док се битка за књиге распламсала, отворио се други фронт на аудио страни. Велики 78 пројекат је имао за циљ да дигитализује рекорде од 78рпм из раног 20. века. Ови шелак дискови су крхки, застарели и често се погоршавају. Они су тужили 2023. године, тврдећи да је пројекат функционисао као "илегална продавница албума" која је нарушила ауторска права на хиљаде песама уметника попут Франка Синатре и Биллие Холидаи. У септембру 2025. године, ова тужба је такође дошла до решења. Док су услови остали поверљиви, резолуција је омогућила Архиву да избегне потенцијално банкротско суђење. Међутим, непосредна последица је била уклањање приступа многим ауторским аудио снимцима, ограничавајући их на истраживаче, а не на општу јавност. Овај образац – уређење праћено ограничењем – обележава нову стварност за Интернет Архив 2025. године: повлачење из приступа „покрени брзо и разбиј ствари“ на опрезнији, законски ограничени модел очувања.39 Федерални депозитни штит У великој стратешкој победи усред ових губитака, Интернет Архив је одредио као Федералну депозитарну библиотеку (ФДЛ) од стране америчког Сената у јулу 2025. године.7 Овај статус је више од само наслова; законски овлашћује Архив да прикупља, чува и пружа приступ америчким владиним публикацијама. Иако не штити ауторску музику или комерцијалне романе, то ојачава улогу Архива као суштинске компоненте информационе инфраструктуре нације, чинећи га политички и правно тежим за потпуно затварање.7 Део V: Будућност-Провери прошлост Децентрализација и „крај термина“ Правне претње у периоду од 2020. до 2025. године изложиле су критичну рањивост: централизацију.Ако судски налог или катастрофални пожар погоди главни штаб Фунстон Авенуе, примарна копија историје Веба могла би бити изгубљена. Децентрализована мрежа (DWeb) Архив је примарни покрет иза ДВЕБ покрета, који настоји да изгради веб који је дистрибуиран, а не централизован.Циљ је да складишти податке Архива преко глобалне мреже вршњака, што онемогућава било којем појединачном ентитету - било да је то влада, корпорација или природна катастрофа - да га преузме ван мреже.5 Технолошки, ово укључује интеграцију са протоколима као што су ИПФС (Интерпланетарни фајл систем) и Филецоин. ИПФС: Дозвољава да садржај буде адресиран својим криптографским хасхом (што је то) уместо његовог локације (где се налази).Ако је сервер Архива блокиран, корисник може да преузме исту ВАРЦ датотеку из било ког другог чвора у мрежи који држи копију.5 Филецоин: Обезбеђује слој подстицаја за складиштење. У 2025. години, Архив је почео да учита критичне колекције, као што су владине веб архиве „Краја термина“, у мрежу Филецоин за хладно складиштење. Ово делује као децентрализована, непроменљива резервна копија која постоји ван директне физичке контроле Архива.45 2025. „Крај термина“ Сваке четири године, Архив води огроман напор да претражује (dot)gov и (dot)mil веб-сајтове пре преласка на председничке изборе. Претрага 2024/2025 била је највећа у историји, сакупљајући преко 500 терабајта владиних података.45 Овај пројекат наглашава улогу Архива као чувара историје, осигуравајући да климатски подаци, извештаји о попису становништва и документи политике не нестану када нова администрација преузме дужност. Генеративна АИ и фер употреба Послао сам Бровсер Калеу о 2025 и генеративном АИ, а ево његовог цитата: „Генеративна АИ је проузроковала да неке веб странице траже ознаке долара блокирањем њихових сајтова или покретањем тужби.То не помаже институцијама културног наслеђа, као што је Интернет Архива и често повређује кориснике уопште. Internet Arhiva će ostati slobodna i otvorena da bi pomogla ljudima da dobiju uvid u naš promenjiv svet.Arhiva nudi otvorene setove podataka za AI istraživače i kompanije da iskoriste svoje usluge.Kao organizacija, Internet Arhiva koristi generativne AI alate kako bi pomogla da se ubrza dodeljivanje metapodataka i aktivnosti skeniranja. „Генеративна АИ је проузроковала да неке веб странице траже ознаке долара блокирањем њихових сајтова или покретањем тужби.То не помаже институцијама културног наслеђа, као што је Интернет Архива и често повређује кориснике уопште. Internet Arhiva će ostati slobodna i otvorena da bi pomogla ljudima da dobiju uvid u naš promenjiv svet.Arhiva nudi otvorene setove podataka za AI istraživače i kompanije da iskoriste svoje usluge.Kao organizacija, Internet Arhiva koristi generativne AI alate kako bi pomogla da se ubrza dodeljivanje metapodataka i aktivnosti skeniranja. Извођач: The Long Now Како се крећемо дубље у 21. век, Интернет Архив стоји као парадокс.То је технолошки бехемот, који ради на скали која се такмичи са гигантима Силиконске долине, али је смештен у цркви и управља библиотекарима.То је крхка институција, погођена тужбама и буџетским ограничењима, али је и најтрајнија меморијска банка коју је човечанство икада изградило. Догађаји из 2025. године – мерило „трилиона страница“, болна правна насеља и преокрет ка децентрализованом складишту – обележавају зрелост организације.Она више није „дивљи запад“ раног веба.Она је оштећена али отпорна институција, прилагођавајући своју машину и своју мисију да преживи у свету који је све више непријатељски настројен концепту слободног, универзалног приступа.И растућа популарност генеративне АИ додаје још једну непредвидљиву димензију будућем опстанку архива јавног домена. Топлота коју генеришу загрева зграду, држећи облак Рицхмонд Дистрикта на заливу.И негде на овим плочама, међу трилионама нула и оних, лежи једини доказ да је дигитални свет јуче икада постојао.Машина се сећа, тако да не морамо. Референце Wayback Machine - Википедија, преузета 8. јануара 2026, https://en.wikipedia.org/wiki/Wayback_Machine Гледајући уназад на “Очување Интернета” из 1996-их Интернет Архива Блогови, приступио 8. јануара 2026, https://blog.archive.org/2025/09/02/looking-back-on-preserving-the-internet-from-1996/ Petabox - Internet Archive, accessed 8 јануар 2026, https://archive.org/web/petabox.php PetaBox - Википедија, преузета 8. јануара 2026, https://en.wikipedia.org/wiki/PetaBox ИПФС: Изградња блокова за бољу веб локацију ИПФС, приступио 8. јануара 2026, https://ipfs.tech/ интернетархиве/двеб-архиве - ГитХуб, доступан 8. јануара 2026, https://github.com/internetarchive/dweb-archive Интернет архива - Википедија, преузета 8. јануара 2026, https://en.wikipedia.org/wiki/Internet_Archive Макинг Веб Мемори са ПетаБок - eWeek, accessed January 8, 2026, https://www.eweek.com/storage/making-web-memories-with-the-petabox/ PetaBox - Internet Archive Незванична вики страница, доступна 8. јануара 2026, https://internetarchive.archiveteam.org/index.php/PetaBox Четврта генерација петабокса на интернет архиви Блогови, доступан 8. јануара 2026, https://blog.archive.org/2010/07/27/the-fourth-generation-petabox/ Internet Archive Hits One Trillion Web Pages - Hackaday, accessed јануар 8, 2026, https://hackaday.com/2025/11/18/internet-archive-hits-one-trillion-web-pages/ Internet Archive's Wayback Machine добија нови центар података - Computerworld, доступан 8. јануара 2026, https://www.computerworld.com/article/1562759/the-internet-archive-s-wayback-machine-gets-a-new-data-center.html Internet Archive to Live in Sun Blackbox - Data Center Knowledge, accessed January 8, 2026, https://www.datacenterknowledge.com/business/internet-archive-to-live-in-sun-blackbox Inside the Internet Archive: A Meat World Tour, Root Simple, доступан 8. јануара 2026, https://www.rootsimple.com/2023/08/inside-the-internet-archive-a-meat-world-tour/ Internet Archive Preserves Data from World Wide Web - Richmond Review/Sunset Beacon, accessed January 8, 2026, https://richmondsunsetnews.com/2017/03/11/internet-archive-preserves-data-from-world-wide-web/ Heritrix - Википедија, преузето 8. јануара 2026, https://en.wikipedia.org/wiki/Heritrix Archive-It Crawling Technology, accessed 8 јануар 2026, https://support.archive-it.org/hc/en-us/articles/115001081186-Archive-It-Crawling-Technology WARCreate: Create Wayback-Consumable WARC Files From Any Webpage - ODU Digital Commons, accessed January 8, 2026, https://digitalcommons.odu.edu/cgi/viewcontent.cgi?article=1154&context=computerscience_fac_pubs The WARC Format - IIPC Community Resources, accessed January 8, 2026, https://iipc.github.io/warc-specifications/specifications/warc-format/warc-1.1/ Шта је херитрикс? - Халл: АИ, приступио 8. јануара 2026, https://usehall.com/agents/heritrix-bot Архивирање веб локација које садрже стреаминг медије, приступљено 8. јануара 2026, https://library.imaging.org/admin/apis/public/api/ist/website/downloadArticle/archiving/14/1/art00004 Марта 2025. године Интернет Архив Блогови, приступио 8. јануара 2026, https://blog.archive.org/2025/03/ Alexa Crawls - Internet Archive, accessed јануар 8, 2026, https://archive.org/details/alexacrawls Alexa Internet - Википедија, преузета 8. јануара 2026, https://en.wikipedia.org/wiki/Alexa_Internet Internet Archive - Nonprofit Explorer - ProPublica, accessed January 8, 2026, https://projects.propublica.org/nonprofits/organizations/943242767 Ажурирање на 2024/2025 End of Term Web Archive - Ben Werdmuller, доступно 8. јануара 2026, https://werd.io/update-on-the-20242025-end-of-term-web-archive/ Архива Историја као код, доступна 8. јануара 2026, https://www.historyascode.com/tools-data/archive-it/ Ценовник - Интернет архивске услуге за дигитализацију, доступно 8. јануара 2026, https://digitization.archive.org/pricing/ Случајно заливско складиште које налази један од највећих архива човечанства - СФГАТЕ, приступио 8. јануара 2026, https://www.sfgate.com/tech/article/bay-area-warehouse-internet-archive-19858332.php Vault Pricing Model - Vault Support, accessed January 8, 2026, https://vault-webservices.zendesk.com/hc/en-us/articles/22896482572180-Vault-Pricing-Model Hachette v. Internet Archive - Википедија, преузета 8. јануара 2026, https://en.wikipedia.org/wiki/Hachette_v._Internet_Archive Хацхетте Боок Гроуп, Инц. против Интернет Архива, Приступљено 8. јануара 2026, https://copyrightalliance.org/copyright-cases/hachette-book-group-internet-archive/ Hachette Book Group, Inc. v. Internet Archive, No. 23-1260 (2d Cir. 2024) - Justia Law, accessed January 8, 2026, https://law.justia.com/cases/federal/appellate-courts/ca2/23-1260/23-1260-2024-09-04.html Hachette Book Group v. Internet Archive and the Future of Controlled Digital Lending, accessed January 8, 2026, https://www.library.upenn.edu/news/hachette-v-internet-archive Отворена библиотека и закон о ауторским правима Интернет архива: Завршно поглавље, доступно 8. јануара 2026, https://www.lutzker.com/ip_bit_pieces/internet-archives-open-library-and-copyright-law-the-final-chapter/ Шта одлука Хашета против Интернет архива значи за нашу библиотеку, доступна 8. јануара 2026, https://blog.archive.org/2023/08/17/what-the-hachette-v-internet-archive-decision-means-for-our-library/ Labels settle copyright lawsuit against Internet Archive over streaming of vintage vinyl records - Music Business Worldwide, accessed January 8, 2026, https://www.musicbusinessworldwide.com/labels-settle-copyright-lawsuit-against-internet-archive-over-streaming-of-vintage-vinyl-records/ Интернет Архив решава тужбу од 621 милиона долара са главним ознакама о Пројекту о очувању винила - Consequence.net, доступан 8. јануара 2026, https://consequence.net/2025/09/internet-archive-labels-settle-copyright-lawsuit/ Ажурирање на Големим 78с Лаусуитх Интернет Арцхивес Блоговима, доступан 8. јануара 2026, https://blog.archive.org/2025/09/15/an-update-on-the-great-78s-lawsuit/ Music Publishers, Internet Archive Settle Lawsuit Over Old Recordings - GigaLaw, accessed January 8, 2026, https://giga.law/daily-news/2025/9/15/music-publishers-internet-archive-settle-lawsuit-over-old-recordings Internet Archive Settles Copyright Suit with Sony, Universal Over Vintage Records, accessed January 8, 2026, https://www.webpronews.com/internet-archive-settles-copyright-suit-with-sony-universal-over-vintage-records/ Јул 2019 - Интернет Архив Блогови, приступљен 8. јануар 2026, https://blog.archive.org/2025/07/ Decentralized Web FAQ - Internet Archive Blogs, accessed јануар 8, 2026, https://blog.archive.org/2018/07/21/decentralized-web-faq/ Децентрализовани веб сервер: Могући приступ са проценама трошкова и перформанси, доступан 8. јануара 2026, https://blog.archive.org/2016/06/23/decentalized-web-server-possible-approach-with-cost-and-performance-estimates/ Ажурирање на 2024/2025 Крај термина Веб Арцхиве на Интернету ..., доступно 8. јануара 2026, https://blog.archive.org/2025/02/06/update-on-the-2024-2025-end-of-term-web-archive/ Ажурирање напретка из The End of Term Web Archive: 100 милиона веб страница прикупљених, преко 500 ТБ података : r/DataHoarder - Reddit, доступно 8. јануара 2026, https://www.reddit.com/r/DataHoarder/comments/1ijkdjl/progress_update_from_the_end_of_term_web_archive/ https://en.wikipedia.org/wiki/Wayback_Machine https://blog.archive.org/2025/09/02/looking-back-on-preserving-the-internet-from-1996/ https://archive.org/web/petabox.php https://en.wikipedia.org/wiki/PetaBox https://ipfs.tech/ https://github.com/internetarchive/dweb-archive https://en.wikipedia.org/wiki/Internet_Archive https://www.eweek.com/storage/making-web-memories-with-the-petabox/ https://internetarchive.archiveteam.org/index.php/PetaBox https://blog.archive.org/2010/07/27/the-fourth-generation-petabox/ https://hackaday.com/2025/11/18/internet-archive-hits-one-trillion-web-pages/ https://www.computerworld.com/article/1562759/the-internet-archive-s-wayback-machine-gets-a-new-data-center.html https://www.datacenterknowledge.com/business/internet-archive-to-live-in-sun-blackbox https://www.rootsimple.com/2023/08/inside-the-internet-archive-a-meat-world-tour/ https://richmondsunsetnews.com/2017/03/11/internet-archive-preserves-data-from-world-wide-web/ https://en.wikipedia.org/wiki/Heritrix https://support.archive-it.org/hc/en-us/articles/115001081186-Archive-It-Crawling-Technology https://digitalcommons.odu.edu/cgi/viewcontent.cgi?article=1154&context=computerscience_fac_pubs https://iipc.github.io/warc-specifications/specifications/warc-format/warc-1.1/ https://usehall.com/agents/heritrix-bot https://library.imaging.org/admin/apis/public/api/ist/website/downloadArticle/archiving/14/1/art00004 https://blog.archive.org/2025/03/ https://archive.org/details/alexacrawls https://en.wikipedia.org/wiki/Alexa_Internet https://projects.propublica.org/nonprofits/organizations/943242767 https://werd.io/update-on-the-20242025-end-of-term-web-archive/ https://www.historyascode.com/tools-data/archive-it/ https://digitization.archive.org/pricing/ https://www.sfgate.com/tech/article/bay-area-warehouse-internet-archive-19858332.php https://vault-webservices.zendesk.com/hc/en-us/articles/22896482572180-Vault-Pricing-Model https://en.wikipedia.org/wiki/Hachette_v._Internet_Archive https://copyrightalliance.org/copyright-cases/hachette-book-group-internet-archive/ https://law.justia.com/cases/federal/appellate-courts/ca2/23-1260/23-1260-2024-09-04.html https://www.library.upenn.edu/news/hachette-v-internet-archive https://www.lutzker.com/ip_bit_pieces/internet-archives-open-library-and-copyright-law-the-final-chapter/ https://blog.archive.org/2023/08/17/what-the-hachette-v-internet-archive-decision-means-for-our-library/ https://www.musicbusinessworldwide.com/labels-settle-copyright-lawsuit-against-internet-archive-over-streaming-of-vintage-vinyl-records/ https://consequence.net/2025/09/internet-archive-labels-settle-copyright-lawsuit/ https://blog.archive.org/2025/09/15/an-update-on-the-great-78s-lawsuit/ https://giga.law/daily-news/2025/9/15/music-publishers-internet-archive-settle-lawsuit-over-old-recordings https://www.webpronews.com/internet-archive-settles-copyright-suit-with-sony-universal-over-vintage-records/ https://blog.archive.org/2025/07/ https://blog.archive.org/2018/07/21/decentralized-web-faq/ https://blog.archive.org/2016/06/23/decentalized-web-server-possible-approach-with-cost-and-performance-estimates/ https://blog.archive.org/2025/02/06/update-on-the-2024-2025-end-of-term-web-archive/ https://www.reddit.com/r/DataHoarder/comments/1ijkdjl/progress_update_from_the_end_of_term_web_archive/