450 olvasmányok

Az OpenAI-tól a zárt mesterséges intelligenciaig: Az egyedi chipek bezárják az ajtókat – mi a következő lépés?

által susie liu11m2024/11/20

Túl hosszú; Olvasni

Az utcákon az a hír járja, hogy az OpenAI a Broadcommal együttműködve fejleszt egyedi chipeket. Ez a pletyka azt az üzenetet tartalmazza, hogy az univerzálisan hozzáférhető mesterséges intelligencia napjai meg vannak számlálva – íme, miért elkerülhetetlenek a tervezői hardverek, hogyan használhat a technológia a chipeket a láncra, és mire számíthatunk 2025-től.

featured image - Az OpenAI-tól a zárt mesterséges intelligenciaig: Az egyedi chipek bezárják az ajtókat – mi a következő lépés?

Október végén olyan jelentések jelentek meg – a Reuters jóvoltából –, hogy az OpenAI a Broadcommal együttműködve olyan egyedi szilíciumot fejleszt ki, amely a hatalmas mesterségesintelligencia-terhelések kezelésére szabott . A források felfedték, hogy a vállalat a TSMC- vel biztosította a gyártási kapacitást, és összeállított egy 20 fős mérnökcsapatot , akik a Google Tensor processzorrészlegének egykori veteránjait zsákmányolják. A gyártási határidők továbbra is rugalmasak, a chipek akár 2026- ban is megjelenhetnek, de az alapjait már lefektették egy szeizmikus változáshoz az OpenAI infrastruktúrájának kezelésében.

Noha a lépés valóban összhangban van az OpenAI folyamatban lévő stratégiájával, amelynek célja az ellátási lánc diverzifikálása és a növekvő infrastruktúra-költségek szabályozása, ez a pletyka azt az üzenetet jelentheti, hogy az univerzálisan elérhető mesterséges intelligencia napjai meg vannak számlálva. A mesterséges intelligencia jövője nem egy nagyobb, fényesebb világ, amely nyitva áll bárki előtt, akinek ragyogó elméje van – ez egy VIP-társalgó egyedi chipekkel a falakhoz , ahol a tagsági díj milliárd dolláros költségvetés.

Az egyedi hardverek kétségtelenül áttörést hoznak , de akadályokat is építenek ; barikádok, amelyek a nagyközönséget – és a legtöbb játékost – kívülről nézik be.

És lehet, hogy a technika mindvégig pontosan ezt akarta.

Nézzük meg, miért elkerülhetetlen a hardveres fegyverkezési verseny, hogyan játszanak szerepet a chipek a technológia nagyobb uralmi stratégiájában, és mire számíthatunk ezután.

Egyedi zsetonok: „Elakadtunk” egy divatos kifejezés

A mesterséges intelligencia nagyot álmodott – a személyre szabott terápiás robotoktól az autonóm szállító drónokig és a mesterséges intelligencia által vezérelt diagnosztikáig minden telefonon. De az OpenAI legújabb lépése, amely az egyedi chipek fejlesztésére irányul, azt jelzi, hogy vad ambícióink a mesterséges intelligencia iránt most olyan félelmetes modelleket tesznek szükségessé, hogy még a legerősebb általános célú processzorok is fehér zászlót lengenek . Az egyedi szilícium nem arról szól, hogy gyorsabbá, jobbá és szabadabbá tegyük az AI-t, hanem arról, hogy az egészet felszínen tartsuk az egyre növekvő igények mellett – csendes beismerés, hogy elértük azt az innovációs plafont, amelyet csak a hardver tud áttörni.

Íme, mi okozza az egyedi szilícium iránti igényt.

A ChatGPT valódi személyisége: magas szintű karbantartás

Az olyan LLM-ek bölcsessége, mint a GPT-4 és a Gemini, olyan transzformátor alapú modellekre épül, amelyek több milliárd paramétert követnek nyomon. Ennek az intelligenciának azonban ára van : az önfigyelő mechanizmusok gerince, amelyek hatalmas mátrixszorzásokat igényelnek, amelyek felfalják a memória sávszélességét. A transzformátorok architektúrája másodfokú komplexitási skálázást is igényel, ami azt jelenti, hogy a modellbővítés exponenciálisan megnöveli az igényeket. Amikor az LLM-ek megpróbálják szintre emelni játékukat a megerősítő tanulás (RL) rétegzésével, hogy valós időben alkalmazkodjanak a visszacsatoláshoz, vagy megpróbálják feltérképezni a kapcsolatokat gráfneurális hálózatok (GNN-ek) segítségével, a dolgok komoly adatpartiba torkollnak, és az energiaigényeket továbbítják a tető. Ha észrevette, hogy a ChatGPT-nél időnként epilepsziás rohamok vannak, ez az oka annak .

Az egyedi chipek, mint például a Google TPU-i, meg tudják oldani ezeket a problémákat azáltal, hogy nagy sávszélességű memóriát (HBM) integrálnak a chipbe, kezelik az adatmozgást és javítják a memóriahierarchiát a késleltetés csökkentése érdekében, valamint a szisztolés tömbök segítségével párhuzamosítják a mátrixműveleteket.

Generatív AI: a kimenetektől a kimaradásokig

A generatív mesterséges intelligencia az egyedi kimenetek (például szöveg vagy képek) továbbításáról a többmodális remekművekre vált át a média többféle formájának (szöveg, hang, videó) ötvözésével. Ez a technikai varázslat számítási káoszt szül – minden modalitásnak sajátos feldolgozási szükségletei vannak, és az, hogy az AI-t egyidejűleg emésztse meg, megterheli az általános célú GPU-kat, amelyeket nem mesteri zsonglőröknek terveztek. Ezen túlmenően a valós idejű szintézismodellek továbbfejlesztett elköteleződési funkciókhoz, például dinamikusan adaptív sztorivonalak játékokhoz vagy SFX-szűrők az élő közvetítéshez, rendkívül alacsony késleltetést és gyors következtetési sebességet követelnek meg, olyan követelményeket, amelyeket a GPU-k nehezen teljesítenek késések és égbolt nélkül. - magas villanyszámla.

Az egyedi szilícium, például az NVIDIA A100 és a Google TPU-i ezeket a problémákat többpéldányos GPU-kkal (MIG) és tenzormagokkal oldják meg, lehetővé téve az energiahatékony, valós idejű keresztmodális számítást azáltal, hogy a feladatokat ugyanazon a chipen párhuzamos, elszigetelt folyamatokra osztja fel. Csökkentett pontosságú aritmetika is bevezethető annak érdekében, hogy az FP32 helyett az FP16 vagy INT8 formátumban lehessen feldolgozni, megőrizve a pontosságot a hardver megolvadása nélkül.

Life-or-Death AI: Pontosság, amely lemeríti a rácsot

A nagy téttel járó valós káoszban való eligazodás – gondoljunk csak az autonóm vezetésre, a robotikára, a drónokra – szükségessé teszi, hogy **==eseményvezérelt mesterséges intelligencia ==** emberfeletti sebességgel reagáljon, ez a feladat megfelel a neuromorf és valószínűségi modelleknek , amelyek megszakítanák a a polc chip. Az olyan egyedi chipek, mint az Intel Loihi, olyan architektúrákkal készülnek, amelyek utánozzák a biológiai neurális hálózatokat, a spiking neurális hálózatokra (SNN) és az eseményalapú feldolgozásra támaszkodva, hogy csak releváns események esetén elemezzék az adatokat, miközben dinamikusan allokálják az erőforrásokat a bejövő adatminták alapján. Bár ez a kialakítás lehetővé teszi az alacsony fogyasztású és alacsony késleltetésű műveleteket nagy méretekben, nem kompatibilis a nyílt piacon lévő hardverekkel.

Szociális mesterséges intelligencia: Az emberiség feltörése nehéz emelést igényel

Ó, a mesterséges intelligencia csábító, de etikailag homályos alkalmazása, amelytől a titánok azt remélik, hogy megbabonáz minket platformjaik, és elvarázsol minket programozott házi kedvenceikkel. Az emberi természet megfoghatatlanságának dekódolásához olyan rendszerekre van szükség, amelyek mind egyéni, mind társadalmi szinten értelmezik, megjósolják és alkalmazkodnak a viselkedéshez – keresztmodális figyelemmechanizmusok , GNN-ek a kollektív interakciók boncolgatására, affektív számítástechnika az érzelmi intelligencia fejlesztésére, tudásgráfok a kontextuális relevancia biztosítására, és a lista folytatódik. Ezenkívül a közösségi mesterséges intelligencia érzékeny környezetekben is működhet (például egy depressziót gyógyító roborágcsáló belsejében), ami szükségessé teszi az eszközön lévő mesterséges intelligenciát a felhasználói adatok védelme érdekében . Mondanom sem kell, hogy mindez a számítás a mainstream chipeket és azok kötegelt feldolgozását bénult állapotba küldi.

Ezek a folyamatok csekély adathatékonyságot és nagy pontosságot igényelnek alacsony késleltetés mellett , amelyeknek a designer szilícium képes megfelelni olyan funkciók beépítésével, mint az egyesített memóriaarchitektúra , a feladatspecifikus gyorsítók , a ritka adatoptimalizálás (a Graphcore IPU-jában használatos) és a multimodális fúzióoptimalizálás .

Scientific AI: A végső határ túl nagy a hagyományos hardverekhez

Bár kevésbé számít a média kedveltségének, mint más területek, a tudományos mesterséges intelligencia a mesterséges intelligencia legmélyebben forradalmi határterületévé válik . De csak akkor, ha a hardver képes lépést tartani. Ahhoz, hogy a generatív tudományos AI új lehetőségeket (pl. új molekulákat, anyagokat és rendszereket) teremtsen, fejlett számítási keretrendszereket, például diffúziós modelleket , VAE-ket , transzformátorokat és megerősítő tanulást kell kombinálni a tartomány-specifikus tudással. A prediktív modellezéshez és szimulációkhoz használt nem generatív mesterséges intelligencia petabájtos méretű adatokkal és nagydimenziós rendszerekkel foglalkozik, olyan mechanizmusok felhasználásával, mint a PDE-megoldók , GNN-ek , Bayes-modellek és végeselem-elemzés (FAE) . Bár a tudományos mesterséges intelligencia két ága különböző célokat szolgál, mindkettő pontosságot, méretezhetőséget és számítási intenzitást igényel – ezeknek a kritériumoknak csak a legelitebb mechanizmusok felelhetnek meg mind a generatív, mind a prediktív AI-ban. Nem véletlen, hogy a kész hardver nem éri el a vágást.

A Death Open AI és az exkluzivitás csábítása

A testre szabott szilíciumhoz vezető út egy árcédulával jár, amely szinte garantálja az AI-hoz való hozzáférés rétegzettségét. Economics 101: a csillagászati kiadások fedezésére az OpenAI (és mindenki, aki követi a példáját) elkerülhetetlenül az ügyfelekre hárítja a terhet, és a hozzáférést olyan ajánlatokká köti össze, amelyek révén jelenlegi előfizetéseink úgy néznek ki, mint egy fillér dollár .

De ne tévessze össze a felfújt árakat és a hierarchikus rendszert, ahol a pénzügyi izom előfeltétele a reaktív túlélési taktika; ez egy stratégiai lehetőség – mert az exkluzivitás nem hiba; ez az a funkció, amelyre a technológia várt.

Vendor Lock-In 2.0: Vállalatok láncolása chipeken keresztül

A szabadalmaztatott hardver gravitációs mezőt hoz létre: amint a vállalatok beágyazódnak egy ökoszisztémába, amely egyesíti a szoftvert és az egyedi szilíciumot, gyakorlatilag leköti őket. Szoftververem szilíciumba fonása olyan mechanizmust hoz létre, amelyben a rendszerek csak a szolgáltató tartományain belül működhetnek csúcsteljesítményen – ez egy visszafordíthatatlan beállítás , ahol a hardver diktálja a szoftvert . Miután a vállalatok erre az egyéni környezetre építik alkalmazásaikat és munkafolyamataikat, a távozás nem egyszerűen az adatok vagy szoftverlicencek átvitele, hanem az újbóli tervezés , mint például a PS-ről az Xbox-ra való átvitel .

És ahogy a hardver ismétlődik, az integráció zökkenőmentesebbé válik, így a kilépési költségek minden frissítéssel magasabbak lesznek . A megnövekedett teljesítménnyel együtt jár a megerősített hűség – mint a legtöbb vertikálisan integrált ökoszisztéma esetében, a kiállás az újrakezdést jelenti.

Egyedi zsetonok, egyedi szabályok: Tervezett gyilkos verseny

Az egyedi szilícium a mesterséges intelligencia ökoszisztémáját fallal körülvett kertekké darabolja, ahol a korai AI fellendülést meghatározó interoperabilitás elhal. Az egyedi chipek által kínált megnövekedett hatékonyság és vezérlés miatt az OpenAI olyan szabványokat állíthat fel (például teljesítményléceket, funkciókat és kompatibilitási követelményeket), amelyek saját rendszerei és szellemi szabadalmai körül forognak , marginalizálva a nyílt forráskódú kezdeményezéseket és a kisebb játékosokat, akik erre nem képesek. versenyeznek a hardverfüggő fejlesztésekkel. Ha van egy ötlete, akkor lehet, hogy el kell vinnie az OpenAI-hoz, és hardvertámogatásért kell keresnie, ahogy a technikusok jelenleg felsorakoznak az NVIDIA forgóajtói előtt.

Az egyedi szilícium tudásbeli hiányt és hozzáférési hiányt is teremt. A szabadalmaztatott mesterséges intelligencia architektúrákhoz optimalizált hardver tervezésével az OpenAI nemcsak a saját modelljeit gyorsítja fel, hanem olyan értelmezhetetlen ökoszisztémákat is épít, amelyeket a versenytársak nem tudnak hatékonyan visszatervezni vagy reprodukálni. Ez a tanulási aszimmetria hatékonyan gátolja a versenytársakat abban, hogy ugyanazon a paradigmán belül tanuljanak vagy újítsanak, és az exkluzivitást felfegyverezve lassítja az iparági fejlődést.

Az exkluzív hardver innovációs blokádká válik, lehetővé téve a szolgáltatók számára, hogy ellenőrizzék a fejlődés ütemét , és biztosítsák, hogy továbbra is ők maradjanak a mesterséges intelligencia következő fejezetének középpontjában – ahol a tehetség és a kreativitás megadja magát a nyers tőke izomzatának .

Zárt chipek mögött: Az átlátszatlanság biztosítja az uralmat

Ellentétben a szoftverekkel, amelyek visszafejthetők vagy forgácsolhatók, a hardver alapú folyamatok fizikailag átláthatatlanok , és nehéz dekonstruálni anélkül, hogy készpénzkötegeket égetne el. Az absztrakciónak ez az áthatolhatatlan rétege a végső erődítmény, megerősítve az OpenAI igényét a mesterséges intelligencia vastrónjára.

Kitérő vizsgálat: elszámoltathatóság válaszok nélkül

Az egyedi szilícium kényelmes pajzsot kínál a szabályozók fürkésző szemeinek, valamint a média és az érdekképviseleti csoportok kemény kérdéseinek azáltal, hogy olyan összetettségi rétegeket ad hozzá, amelyek megnehezítik a rendszerek belső működésének magyarázatát, és még nehezebbé teszik az ellenőrzést. A vállalatok azzal érvelhetnek, hogy bizonyos kimenetek nem szándékos tervezési hibák, hanem a hardver-szoftver interakció melléktermékei, amelyek eltérítik a vizsgálatot azáltal, hogy rámutatnak a rendszer belső átlátszatlanságára.

Megjósolható teljesítményparaméterek is beépíthetők, hogy csökkentsék a rendszer változékonyságát bizonyos kritikus környezetekben történő telepítéskor. Ez az átlátszatlanság biztosítja, hogy a vállalatoknak ne kelljen kompromisszumokat vagy sebezhetőségeket felfedniük modelljeikben, különösen az olyan iparágakban, mint az egészségügy, a pénzügy vagy a védelem, ahol a megbízhatóság a legfontosabb.

Belső biztosítás: A koronaékszerek védelme

Mivel a legtöbb mesterséges intelligencia vállalat elosztott munkaerőre, vállalkozókra vagy felhőinfrastruktúra-szolgáltatókra támaszkodik, nő a szellemi tulajdon kiszivárgásának kockázata. A programozási nyelvek és keretrendszerek egyetemessége miatt a szoftverek eleve hordozhatóak és replikálhatók. Ezzel szemben a hardverfejlesztés nagymértékben kontextusfüggő , speciális szaktudásra , valamint meghatározott gyártási folyamatokhoz, folyamatokhoz és létesítményekhez való hozzáférésre támaszkodik – ez a felosztás, és azt jelenti, hogy egyetlen mérnök sem rendelkezik elegendő tudással vagy erőforrással ahhoz, hogy a versenytárs varázslatát felpörgesse. Az innovációk chipekbe történő hegesztésével az OpenAI az infrastruktúrához köti IP-jét, nem pedig az egyénekhez , így minimálisra csökkenti a versenyelőny elvesztésének kockázatát, ha a mérnökök beadják lemondását.

A hálózati hatás: az észlelés valósággá alakítása

Azáltal, hogy az AI-rendszerek belső működését elérhetetlenné teszi, az OpenAI biztosítja, hogy csak ők határozhatják meg és szabályozhatják képességeik narratíváját . Hasonlóan ahhoz, ahogy az NVIDIA GPU-i a mesterséges intelligencia teljesítményének szinonimájává váltak az architektúrájukra optimalizált benchmarkok miatt, az OpenAI saját, a szilíciumhoz kötődő mérőszámokat hozhatott létre, amelyek a fokozatos fejlesztéseket a játék változásaként határozták meg . Az átláthatóság hiánya azt is jelenti, hogy a kisebb hardveroptimalizálások révén elért szelektív teljesítmény-mérföldkövek (pl. „5x gyorsabb következtetés”) valódi áttörésként értékesíthetők , kihasználva annak előnyeit, hogy úttörőnek tekintenek minket, miközben eltitkolják a kompromisszumokat vagy a korlátokat.

Mivel nincs mód az állítások összehasonlítására vagy érvényesítésére, az ügyfelek, a befektetők és a média bízhatnak a vállalat PR-játékában. Egy hazugság bejárhatja a fél világot, miközben az igazság még csak a cipőjét ölti magára: hamarosan mindannyian beszállunk az „innováció” eme összecsapott változatába, átadjuk a készpénzt és a híreket, és a koholt dominancia kézzelfogható valósággá válik.

Ez az illúzió éppúgy márkaépítési stratégia, mint technikai, amely az átlátszatlanságot a tartós piacvezető szerep eszközévé alakítja.

Kitekintés 2025-re: Lesz innováció, csak nem neked

A hardver szűk keresztmetszet, de a technológia soha nem lassult le gyorsulás miatt. Csak ne tévesszen meg – a valódi előrelépések a vállalati befolyás és a versenyellenőrzés megszilárdítását szolgálják, míg a közemberekhez és a vállalatokhoz eljuttatott újdonságok a PR rétegeibe álcázott adatgyűjtések lesznek.

Fogyasztói játékok: Adatok, figyelemelterelés, és az őrség megszakadt

Gondolja, hogy a hardverfejlesztési terhelés leállítja a fogyasztói műveleteket? Nem, a dolgok felgyorsulni fognak , mert csak a viselkedési adatainkat adjuk át a „ haladásért ” cserébe. De most, hogy nagyszüleink szórakozást találnak a chatbotokban, a technológia az inasokkal való elragadtatástól a „Vissza a jövőbe” című trükkökig fog fordulni. (Ne aggódj, a technológia időről időre megújítja ezeket a furcsa asszisztenseket, hogy frissen tartsák őket a radarunkon. Az OpenAI állítólag 2025 januárjában bemutatja az „Operator” nevű mesterségesintelligencia-ügynököt. A források szerint az Operator közvetlenül kommunikál majd az Ön számítógépével, elsősorban munkafolyamat-javító és webböngésző eszközként is működik, automatizálja a feladatokat és egyszerűsíti az online élményt.)

A nagy kutyák a szoftvertől az elegáns kütyükhöz fognak fordulni, hogy lekössék a kifinomultakat – Altman épp az Orion korábbi hardvervezetőjét, Caitlin Kalinowskit húzta át, Zuck robotkezeken dolgozik, Cook pedig még az okosotthoni eszközök gondolatán is rágódik. A Wall Street piacra viszi az abszurdumot, az olyan furcsa termékektől, mint a Friend's hátborzongató nyaklánc, az olyan megkérdőjelezhető alkalmazásokig, mint a Daze.

A szüntelen hype és a címlapok nemcsak vásárlásra késztetnek bennünket; erodálják a védelmünket, és felkészítenek minket arra, hogy boldogan fogadjuk a hardverrel kiegészített mesterséges intelligencia jövőbeli ételeit.

Vállalati eszközök: skálázási mélység, nem szélesség

Az igazi pénz az intézmények pénztárcájában rejlik, nem az egyénekben. A vállalatok azonban csak olyan megoldásokat alkalmaznak, amelyek ott érik őket, ahol fáj, ami azt jelenti, hogy az AI-nak túl kell ásnia a felszíni fájdalompontokat. A jövő év nem az általános célú eszközökről fog szólni, amelyek hozzásegítik a vállalkozásokat az AI gondolatához, hanem olyan tartomány-specifikus modellekről, amelyek az algoritmusokat az egyes szektorok, részlegek, csapatok és alkalmazottak minden apró bonyodalmának teszik ki.

Példa : A Microsoft a Siemens-szel , a Bayer-rel és a Rockwell-lel együttműködve egy sor mesterséges intelligencia modellt dobott piacra a gyártás, a mezőgazdaság és a pénzügyi szolgáltatások speciális kihívásainak kezelésére. A niche-specifikus mesterséges intelligencia induló vállalkozásai is aratnak a pénzből – a Breakr a zenei marketingért, a Dreamwell az influencer automatizálásért, a Beeble a VFX-ért, és ez csak az elmúlt pár hónapból. Az elemzők azt jósolják, hogy a vertikális mesterséges intelligencia piaci kapitalizációja legalább tízszer akkora lesz, mint az örökölt vertikális SaaS.

Őrzött zseni: Úttörő a tekintélyesekért

A technikusok megtakarítják lóerejüket olyan átalakuló fejlesztésekre, amelyek jövőjüket az elithez kötik: a vállalati behemótokhoz és a kormányokhoz. Az OpenAI bemutatja Trumpnak az amerikai mesterséges intelligencia-infrastruktúra tervezetét, az Anthropic pedig most lépett partnerségre a Palantir védelmi vállalkozóval, hogy "nagy mennyiségű összetett adatot gyorsan feldolgozzon, az adatközpontú betekintést javítsa, hatékonyabban azonosítsa a mintákat és trendeket, ésszerűsítse a dokumentumok áttekintését és előkészítését, valamint segítséget nyújtson. Az amerikai tisztviselők tájékozottabb döntéseket hoznak az időérzékeny helyzetekben." A Microsoft partnersége a BlackRock-kal, az IBM az AWS-szel, a Google pedig Szaúd-Arábiaba került .

Mi áll a partnerségek mögött? Csak az idő fogja megmondani.

Végső gondolatok: Esettanulmány a PR Hírességek Csarnokához

Az AI mindenki számára meséje – a közös innováció és az egyetemes hozzáférés ígérete – mindig túl szépnek tűnt ahhoz, hogy igaz legyen. De utólag visszagondolva, ugyanazokat a látnokokat, akik feltörték magát az intelligencia kódját, valóban elvakíthatták volna a testre szabott szilícium és a milliárd dolláros nevezési díjak elkerülhetetlensége?

Ez a szerző nincs meggyőzve.

Most pedig azáltal, hogy a hardveres fordulatot a mesterséges intelligencia növekvő igényeire adott hősies válaszként határozták meg, az OpenAI-hoz hasonlók szépen megkerülik a valóságot, amelyet kezdettől fogva az exkluzivitás felé építettek.

A „nyitott” mindig is egy branding gyakorlat volt, egy több évtizedes PR-terv, a demokrácia pedig csak a szlogen.