V pretekoch, aby sa umelá inteligencia stala rýchlejšou, efektívnejšou a široko dostupnejšou, zameranie často padá na GPU. Oni dominujú AI záverom a školením, ale ich prominencia zanecháva dôležitú otázku: čo sa deje mimo systémov poháňaných GPU? Keďže organizácie hľadajú škálovateľné riešenia, ktoré sa nespoliehajú na drahý alebo obmedzený hardvér, procesory sa vrátia do zamerania. Optimalizácia pracovných záťaží AI na týchto architektúrach, ktoré nie sú GPU, už nie je voliteľná; stáva sa nevyhnutnou. To je miesto, kde Rajalakshmi Srinivasaraghavan vybudovala svoje odborné znalosti. Výskumníčka a inžinierka s hlbokými koreňmi v oblasti vysokovýkonného výpočtu, venovala svoju kariéru zdokonaľovaniu AI inferencie na procesoroch. Jej cesta spája technické objavy s komunitnou spoluprácou. „Spoluprácou s komunitami s otvoreným zdrojovým kódom sme boli schopní publikovať špičkové optimalizácie, ktoré urýchlili výkon v rámci pracovných záťaží AI,“ hovorí. „Toto úsilie posilnilo ekosystém ako celok a umiestnilo náš tím ako kľúčového hráča v škálovateľnom, vysokovýkonnom výpočte.“ Jedným z jej vynikajúcich úspechov boli stratégie optimalizácie CPU. Zatiaľ čo mnohí v odbore sa sústreďujú na prístupy zamerané na GPU, Rajalakshmi ukázala, ako cielené zlepšenia CPU prinášajú skutočné výsledky. Jej tím uprednostnil kľúčové softvérové balíky pre optimalizáciu CPU, čo prináša významné zvýšenie výkonu. „Dosiahli sme až 50% zlepšenie výkonu na hardvéri ďalšej generácie identifikáciou a optimalizáciou kritických pracovných postupov AI,“ vysvetľuje. Tieto výsledky dokazujú, že organizácie môžu rozšíriť existujúce zdroje pri príprave na ďalšiu vlnu nasadenia AI. Jej vplyv v organizáciách presahuje rámec kódovania.Vedela nasadenie kontinuálnej integrácie (CI) budov v širokej škále balíkov, automatizácie testovania a integrácie. „Táto automatizácia zlepšila spoľahlivosť a uvoľnila zdroje na zameranie sa na základný vývoj,“ hovorí. Rajalakshmi tiež oceňuje mentorstvo ako súčasť svojej práce.Vedela nových inžinierov, odovzdávala technické a strategické poznatky potrebné na optimalizáciu CPU. „Posilnenie nových členov zabezpečilo, že zlepšenie výkonu nebolo len jednorazovým víťazstvom, ale súčasťou dlhodobej trajektórie,“ odráža. Jej schopnosť premýšľať o budúcnosti ju tiež odlišila.Riešila jednu z opakujúcich sa prekážok v odvetví tým, že pred vydaním hardvéru optimalizovala a validovala kód v simulátoroch.Tento proaktívny prístup umožnil tímom včas zachytiť problémy a spustiť plne funkčné softvérové zásobníky spolu s novým hardvérom. „Znamenalo to, že náš softvérový zásobník bol plne funkčný a pripravený na výrobu v prvý deň,“ hovorí. Vplyv sa rozširuje aj na výskum a akademickú oblasť.Práce ako „Modeling Matrix Engines for Portability and Performance“ a „A Matrix Math Facility for Power ISA Processors“ zdôrazňujú jej odhodlanie spojiť teóriu s praktickými aplikáciami. Pri pohľade do budúcnosti vidí rastúci dopyt po škálovateľných riešeniach, ktoré presahujú hranice GPU. „Pri dôkladnom sledovaní trendov v odvetví a predvídaní zmien sme do hardvéru a softvéru začlenili schopnosti zamerané na budúcnosť,“ hovorí. „Pre ňu bude ďalšia generácia umelej inteligencie vyžadovať efektívnosť na všetkých úrovniach, čo dáva platformám, ktoré integrujú optimalizáciu, jasnú konkurenčnú výhodu. Zdôrazňuje potrebu, aby priemysel prijal inkluzívnejší pohľad na infraštruktúru AI. Optimalizácia záverov na CPU a iných architektúrach, ktoré nie sú GPU, nie je záložným plánom; je to spôsob, ako vybudovať cenovo dostupnejšie, odolnejšie a prístupnejšie ekosystémy AI. „Základ pre dlhodobý úspech v oblasti AI spočíva v budovaní riešení, ktoré sa vyvíjajú s hardvérom a škálou s dopytom.“ Vo svete, ktorý sa zameriava na GPU, nám Rajalakshmi ukazuje, že skutočné inovácie často rastú v prehliadnutých priestoroch.Zameriava sa na CPU, otvára nové možnosti pre nasadenie AI a buduje budúcnosť, kde sa AI cíti spravodlivejšia, efektívnejšia a udržateľnejšia. Tento príbeh bol distribuovaný ako vydanie Kashvi Pandey v rámci HackerNoon Business Blogging Program. Tento príbeh bol distribuovaný ako vydanie Kashvi Pandey v rámci HackerNoon Business Blogging Program.