U trci da se veštačka inteligencija učini bržom, efikasnijom i široko dostupnom, naglasak često pada na GPU-e. Oni dominiraju AI zaključivanjem i obukom, ali njihova prominencija ostavlja važno pitanje: šta se događa izvan GPU-ovih sustava? Kako organizacije traže skalabilna rešenja koja se ne oslanjaju na skupo ili ograničeno hardver, CPU-i se vraćaju u fokus. Optimizacija radnih opterećenja AI-a na ovim arhitekturama koje nisu GPU-ovi više nije opcionalna; to postaje neophodno. To je mjesto na kojem je Rajalakshmi Srinivasaraghavan izgradila svoju stručnost. Istraživačica i inženjerka s dubokim korijenima u računalstvu visokih performansi, posvetila je svoju karijeru rafiniranju AI inferencije na CPU-ima. Njeno putovanje kombinira tehničke proboje sa saradnjom usmjerenom na zajednicu. „Sudjelovanjem sa zajednicama otvorenog koda, uspjeli smo objaviti najsavremenije optimizacije koje su ubrzale performanse preko AI radnih opterećenja“, kaže ona. „Ovaj napor je ojačao ekosistem u cjelini i pozicionirao naš tim kao ključnog igrača u skalabilnom, visokoučinkovnom računaru.“ Jedan od njezinih istaknutih postignuća bio je u strategijama za optimizaciju CPU-a. Dok se mnogi u polju fokusiraju na pristupe usredotočene na GPU, Rajalakshmi je pokazala kako ciljano poboljšanje CPU-a donosi stvarne rezultate. Njegov tim je prioritetirao ključne softverske pakete za optimizaciju CPU-a, što je rezultiralo značajnim poboljšanjem performansi. „Postigli smo do 50% poboljšanje performansi na hardveru sledeće generacije identifikacijom i optimizacijom kritičnih AI tokova rada“, objašnjava ona. Ovi rezultati dokazuju da organizacije mogu proširiti postojeće resurse dok se pripremaju za sljedeći talas uvođenja AI-a. Ona je vodila uvođenje kontinuirane integracije (CI) u širokom spektru paketa, automatizaciju testiranja i integracije. „Ova automatizacija poboljšala je pouzdanost i oslobodila resurse kako bi se usredotočila na osnovni razvoj“, kaže ona. Uticaj je bio neposredan: brži inovacijski ciklusi i softverske optimizacije koje bi mogle pratiti rastuće zahtjeve za hardverom. Rajalakshmi takođe cijeni mentorstvo kao dio svog rada. Ona je vodila nove inženjere, prenoseći tehničke i strateške uvid potrebne za optimizaciju CPU. „Omoćivanje novih članova osiguralo je da poboljšanja performansi nisu samo jednokratne pobjede, već dio dugoročne trajektorije“, odražava ona. Njena sposobnost da razmišlja unapred je takođe napravila razliku. Rješavala je jednu od ponavljajućih prepreka u industriji optimizovanjem i potvrđivanjem koda u simulatorima prije izdavanja hardvera. Ovaj proaktivni pristup omogućio je timovima da ranije uhvate probleme i pokrenu potpuno funkcionalne softverske stakove uz novi hardver. „To je značilo da je naš softverski stak bio potpuno funkcionalan i spreman za proizvodnju prvog dana“, kaže ona. Uticaj se proširuje i na istraživanje i akademsku zajednicu. Radovi kao što su „Modeling Matrix Engines for Portability and Performance“ i „A Matrix Math Facility for Power ISA Processors“ naglašavaju njenu predanost povezivanju teorije s praktičnim primjenama. Gledajući u budućnost, ona vidi rastuću potražnju za skalabilnim rješenjima koja se kreću dalje od GPU-a.Vjeruje da budućnost leži u čvršćem usklađivanju hardvera i softvera. „Tako što smo pažljivo pratili trendove u industriji i predvidjeli promene, integrisali smo mogućnosti koje se odnose na budućnost u hardver i softver“, kaže ona. Ona naglašava potrebu da industrija prihvati inkluzivniji pogled na infrastrukturu AI. Optimizacija zaključivanja na CPU-ima i drugim ne-GPU arhitekturama nije plan za rezervu; to je način izgradnje pristupačnijih, otpornijih i pristupačnijih AI ekosustava. U svetu fiksiranom na GPU-ima, Rajalakshmi nam pokazuje da prave inovacije često rastu u zanemarenim prostorima. Ova priča je distribuirana kao izdanje Kashvi Pandey pod HackerNoon's Business Blogging Program. Ova priča je distribuirana kao izdanje Kashvi Pandey pod HackerNoon's Business Blogging Program.