У канцы кастрычніка з'явіліся паведамленні - з дазволу Reuters - што OpenAI супрацоўнічае з Broadcom для распрацоўкі карыстальніцкага крэмнію, прыстасаванага для апрацоўкі каласальных працоўных нагрузак AI . Крыніцы раскрылі, што кампанія забяспечыла вытворчыя магутнасці з TSMC і сабрала каманду з 20 чалавек інжынераў , выбраўшы былых ветэранаў з падраздзялення працэсараў Google Tensor. Тэрміны вытворчасці застаюцца гнуткімі, і чыпы патэнцыйна пачнуць выпускацца не пазней за 2026 год , але аснова ўжо закладваецца для сейсмічных зрухаў у тым, як OpenAI апрацоўвае сваю інфраструктуру.
Нягледзячы на тое, што гэты крок сапраўды адпавядае бягучай стратэгіі OpenAI па дыверсіфікацыі ланцужка паставак і кантролі за ростам выдаткаў на інфраструктуру, гэты слых можа сведчыць аб тым, што дні агульнадаступнага штучнага інтэлекту могуць быць злічаны. Будучыня штучнага інтэлекту - гэта не вялікі і яркі свет, адкрыты для ўсіх з бліскучым розумам, - гэта VIP-зала з нестандартнымі фішкамі для сцен , дзе членскі ўзнос складае мільярд даляраў.
Карыстальніцкае абсталяванне, несумненна, прынясе прарыў , але таксама створыць бар'еры ; барыкады, якія пакідаюць шырокай публіцы — і большасці іншых гульцоў — звонку, гледзячы ўнутр.
І гэта можа быць менавіта тое, чаго ўвесь час жадалі тэхналогіі.
Давайце паглядзім, чаму гонка ўзбраенняў апаратнага забеспячэння непазбежная, як чыпы ўплываюць на шырокую стратэгію дамінавання тэхналогій і чаго чакаць далей.
AI прымусіў нас марыць аб вялікім - ад персаналізаваных ботаў для тэрапіі да беспілотных лятальных апаратаў з аўтаномнай дастаўкай і дыягностыкі з дапамогай AI на кожным тэлефоне. Але апошні крок OpenAI па распрацоўцы карыстацкіх чыпаў сведчыць аб тым, што нашы шалёныя амбіцыі ў галіне штучнага інтэлекту цяпер патрабуюць такіх грозных мадэляў, што нават самыя магутныя працэсары агульнага прызначэння махаюць белым сцягам . Нестандартны крэмній прызначаны не для таго, каб зрабіць штучны інтэлект больш хуткім, лепшым і больш свабодным, а для таго, каб падтрымліваць усю рэч на плаву пры пастаянна ўзрастаючых патрабаваннях — ціхае прызнанне таго, што мы дасягнулі столі інавацый, якую можа парушыць толькі абсталяванне.
Вось што выклікае патрэбу ў спецыяльным крэмніі.
Мудрасць LLM, такіх як GPT-4 і Gemini, заснавана на мадэлях на аснове трансфарматараў , якія адсочваюць мільярды параметраў. Але гэты інтэлект мае сваю цану : аснова механізмаў самаканцэнтрацыі , якія патрабуюць вялізнага множання матрыц, што паглынае прапускную здольнасць памяці. Архітэктура трансфарматараў таксама патрабуе квадратычнага маштабавання складанасці , што азначае, што пашырэнне мадэлі павялічвае патрабаванні ў геаметрычнай прагрэсіі . Калі магістранты спрабуюць павысіць узровень сваёй гульні праз наладжванне навучання з падмацаваннем (RL), каб адаптавацца да зваротнай сувязі ў рэжыме рэальнага часу, або спрабуюць адлюстраваць злучэнні з дапамогай графічных нейронавых сетак (GNN) , усё пераходзіць у сур'ёзную партыю дадзеных, адпраўляючы патрабаванні да магутнасці праз дах. Калі вы заўважылі, што апошнім часам у ChatGPT часам здараюцца прыступы эпілепсіі, вось чаму .
Карыстальніцкія чыпы, такія як TPU Google, могуць вырашыць гэтыя праблемы шляхам інтэграцыі памяці з высокай прапускной здольнасцю (HBM) у чып, кіравання перамяшчэннем даных і паляпшэння іерархій памяці для памяншэння затрымкі, а таксама выкарыстання сісталічных масіваў для паралелізму матрычных аперацый.
Генератыўны штучны інтэлект пераходзіць ад выдачы асобных вынікаў, такіх як тэкст або малюнкі, да крос-мадальных шэдэўраў шляхам змешвання розных формаў мультымедыя (тэкст, аўдыя, відэа). Гэта тэхнічнае вядзьмарства спараджае вылічальны хаос - кожная мадальнасць мае розныя патрэбы ў апрацоўцы, і патрабаванне штучнага інтэлекту пераварваць усё адначасова нагружае графічныя працэсары агульнага прызначэння, якія не былі створаны для майстэрскіх жанглёраў. Акрамя таго, мадэлі сінтэзу ў рэжыме рэальнага часу для пашыраных функцый узаемадзеяння, такіх як дынамічна адаптыўныя сюжэтныя лініі для гульняў або фільтры SFX для жывых трансляцый, патрабуюць звышнізкай затрымкі і высокай хуткасці вываду, патрабаванняў, якім GPU з цяжкасцю задаволіць без увядзення затрымак і неба - высокі рахунак за электраэнергію.
Карыстальніцкі крэмній, напрыклад A100 ад NVIDIA і TPU ад Google, вырашае гэтыя праблемы з дапамогай шматэкземплярных графічных працэсараў (MIG) і тэнзарных ядраў , якія забяспечваюць энергаэфектыўныя крос-мадальныя вылічэнні ў рэальным часе шляхам падзелу задач на паралельныя ізаляваныя працэсы на адным чыпе. Арыфметыка з паніжанай дакладнасцю таксама можа быць уведзена, каб дазволіць апрацоўку ў такіх фарматах, як FP16 або INT8 замест FP32, захоўваючы дакладнасць без расплаўлення абсталявання.
Для навігацыі ў хаосе з высокімі стаўкамі ў рэальным свеце - падумайце аб аўтаномным кіраванні, робататэхніцы, беспілотніках - неабходна, каб **==кіраваны падзеямі штучны інтэлект ==**рэагаваў са звышчалавечай хуткасцю, задача, прыдатная для нейраморфных і імавернасных мадэляў , якія б парушылі паліца чып. Карыстальніцкія чыпы, такія як Loihi ад Intel, створаны з архітэктурай, якая імітуе біялагічныя нейронавыя сеткі, абапіраючыся на імпульсныя нейронавыя сеткі (SNN) і апрацоўку на аснове падзей для аналізу даных толькі пры адпаведных падзеях пры дынамічным размеркаванні рэсурсаў на аснове ўваходных шаблонаў даных. Нягледзячы на тое, што гэтая канструкцыя забяспечвае маштабныя аперацыі з нізкім энергаспажываннем і затрымкай, яна несумяшчальная з апаратным забеспячэннем, якое ёсць на адкрытым рынку.
Ах, прывабнае, але этычна цьмянае прымяненне штучнага інтэлекту, якое, як спадзяюцца тытаны, будзе трымаць нас у захапленні ад іх платформаў і апантаных іх запраграмаванымі гадаванцамі. Дэкадзіраванне няўлоўнасці чалавечай прыроды патрабуе сістэм, якія інтэрпрэтуюць, прагназуюць і адаптуюць паводзіны як на індывідуальным, так і на грамадскім узроўнях - крос-мадальныя механізмы ўвагі , GNN для аналізу калектыўных узаемадзеянняў, афектыўныя вылічэнні для развіцця эмацыйнага інтэлекту, графікі ведаў для забеспячэння кантэкстуальнай рэлевантнасці, і спіс можна працягваць. Акрамя таго, сацыяльны штучны інтэлект можа працаваць у канфідэнцыйных умовах (напрыклад, унутры робата-грызуна, які лечыць дэпрэсію), у выніку чаго штучны інтэлект на прыладзе павінен абараняць дадзеныя карыстальніка . Залішне казаць, што ўсе гэтыя вылічэнні пераводзяць асноўныя чыпы і іх пакетную апрацоўку ў стан паралічу.
Гэтыя працэсы патрабуюць эфектыўнасці разрэджаных даных і высокай дакладнасці пры нізкай затрымцы , патрабаванням, якім дызайнерскі крэмній можа задаволіць дзякуючы ўключэнню такіх функцый, як уніфікаваная архітэктура памяці , паскаральнікі для канкрэтных задач , аптымізацыя разрэджаных даных (выкарыстоўваецца ў IPU Graphcore) і аптымізацыя мультымадальнага зліцця .
Нягледзячы на тое, што навуковы штучны інтэлект менш папулярны ў СМІ, чым іншыя вобласці, ён гатовы стаць самай глыбокай рэвалюцыяй у галіне штучнага інтэлекту . Але толькі ў тым выпадку, калі абсталяванне можа паспяваць. Каб генератыўны навуковы штучны інтэлект ствараў новыя магчымасці (напрыклад, новыя малекулы, матэрыялы і сістэмы), удасканаленыя вылічальныя структуры, такія як мадэлі дыфузіі , VAE , трансфарматары і навучанне з падмацаваннем , павінны спалучацца з прадметна-спецыфічнымі ведамі. Негенератыўны штучны інтэлект, які выкарыстоўваецца для прагназуючага мадэлявання і мадэлявання, працуе з данымі ў петабайтным маштабе і сістэмамі высокай памернасці з выкарыстаннем такіх механізмаў, як вырашальнікі PDE , GNN , байесовские мадэлі і аналіз канечных элементаў (FAE) . Хоць дзве галіны навуковага штучнага інтэлекту служаць розным мэтам, абедзве патрабуюць дакладнасці, маштабаванасці і інтэнсіўнасці вылічэнняў — крытэрыяў, якім могуць адпавядаць толькі самыя элітныя механізмы як генератыўнага, так і прагназуючага штучнага інтэлекту. Зразумела, што гатовае абсталяванне не будзе працаваць.
Шлях да вырабленага на заказ крэмнія мае цану, якая амаль гарантуе стратыфікацыю доступу да штучнага інтэлекту. Эканоміка 101: каб пакрыць астранамічныя выдаткі, OpenAI (і ўсе, хто рушыць услед іх прыкладу) непазбежна перанясуць цяжар кліентаў, аб'яднаўшы доступ у прапанову, якая зробіць нашы цяперашнія падпіскі падобнымі на капейкі за долар .
Але не блытайце завышаныя цэны і іерархічную сістэму, дзе фінансавыя сілы з'яўляюцца неабходнай умовай, як рэактыўную тактыку выжывання; гэта стратэгічная магчымасць, таму што эксклюзіўнасць - гэта не памылка; гэта функцыя, якой так доўга чакалі.
Запатэнтаванае абсталяванне стварае гравітацыйнае поле : як толькі прадпрыемствы ўваходзяць у экасістэму, якая аб'ядноўвае праграмнае забеспячэнне і карыстацкі крэмній, яны фактычна звязаны ёю. Уплятанне стэка праграмнага забеспячэння ў крэмній стварае механізм, пры якім сістэмы могуць працаваць на піку толькі ў даменах пастаўшчыка - гэта незваротная ўстаноўка , калі апаратнае забеспячэнне дыктуе праграмнае забеспячэнне . Пасля таго, як кампаніі ствараюць свае прыкладанні і працоўныя працэсы вакол гэтага карыстальніцкага асяроддзя, сыход - гэта не проста перадача даных або ліцэнзій на праграмнае забеспячэнне, а рэінжынірынг з пачатку - як спроба перанесці прагрэс з PS на Xbox .
І па меры таго, як апаратнае забеспячэнне паўтараецца, інтэграцыя становіцца больш бесперабойнай, у выніку чаго выдаткі на выхад растуць з кожным абнаўленнем . З павышэннем прадукцыйнасці прыходзіць цвёрдая лаяльнасць - як і ў большасці вертыкальна інтэграваных экасістэм, пераключэнне азначае пачаць усё спачатку.
Карыстальніцкі крэмній разбівае экасістэму штучнага інтэлекту на агароджаныя сады, дзе ўзаемадзеянне, якое вызначала ранні бум штучнага інтэлекту, памірае. З-за павышанай эфектыўнасці і кантролю, якія забяспечваюцца карыстальніцкімі чыпамі, OpenAI можа ўсталёўваць стандарты (напрыклад, паказчыкі прадукцыйнасці, асаблівасці і патрабаванні да сумяшчальнасці), якія круцяцца вакол уласных сістэм і інтэлектуальных патэнтаў , маргіналізуючы ініцыятывы з адкрытым зыходным кодам і меншых гульцоў, якія не могуць канкураваць з прагрэсам, які залежыць ад абсталявання. Калі ў вас ёсць ідэя, вам, магчыма, спатрэбіцца аднесці яе ў OpenAI і панізіцца за апаратнай падтрымкай, як тэхнічныя спецыялісты цяпер выстройваюцца каля варот NVIDIA.
Індывідуальны крэмній стварае прабел у ведах, а таксама прабел у доступе. Распрацоўваючы апаратнае забеспячэнне, аптымізаванае для прапрыетарных архітэктур штучнага інтэлекту, OpenAI не толькі паскарае свае ўласныя мадэлі, але і стварае незразумелыя экасістэмы , якія канкурэнты не могуць сканструяваць або эфектыўна паўтарыць. Гэтая асіметрыя навучання эфектыўна перашкаджае канкурэнтам вучыцца або ўводзіць інавацыі ў рамках адной і той жа парадыгмы, узброіўшы эксклюзіўнасць для запаволення прагрэсу ва ўсёй галіны.
Эксклюзіўнае апаратнае забеспячэнне становіцца блакадай інавацый , дазваляючы пастаўшчыкам кантраляваць тэмп прагрэсу і гарантуючы, што яны застануцца ў цэнтры наступнай главы штучнага інтэлекту - той, дзе талент і крэатыўнасць паддаюцца мускулам сырога капіталу .
У адрозненне ад праграмнага забеспячэння, якое можа быць сканструявана або разгалінавана, апаратныя працэсы фізічна непразрыстыя , і іх цяжка дэканструяваць, не спаліўшы пачкі грошай. Гэты непранікальны пласт абстракцыі дзейнічае як найвышэйшая крэпасць, умацоўваючы прэтэнзіі OpenAI на Жалезны трон штучнага інтэлекту.
Пабочны кантроль: адказнасць без адказаў
Карыстальніцкі сілікон прапануе зручны шчыт ад пільных вачэй рэгулятараў і цяжкіх пытанняў СМІ і прапагандысцкіх груп праз даданне слаёў складанасці, якія робяць унутраную працу сістэм цяжэй растлумачыць і яшчэ цяжэй правяраць. Кампаніі могуць сцвярджаць, што пэўныя вынікі не з'яўляюцца наўмыснымі недахопамі ў канструкцыі, а пабочнымі прадуктамі ўзаемадзеяння апаратнага і праграмнага забеспячэння, якія адхіляюць увагу, паказваючы на ўласцівую сістэме непразрыстасць.
Прадказальныя параметры прадукцыйнасці таксама могуць быць уключаны, каб паменшыць зменлівасць сістэмы для разгортвання ў пэўных крытычных асяроддзях. Такая непразрыстасць гарантуе, што кампаніям не трэба выяўляць кампрамісы або слабыя месцы ў сваіх мадэлях, асабліва ў такіх галінах, як ахова здароўя, фінансы або абарона, дзе надзейнасць мае першараднае значэнне.
Унутранае страхаванне: абарона каштоўнасцяў кароны
Паколькі большасць кампаній штучнага інтэлекту залежаць ад размеркаванай працоўнай сілы, падрадчыкаў або пастаўшчыкоў воблачнай інфраструктуры, рызыка ўцечкі інтэлектуальнай уласнасці расце. Дзякуючы ўніверсальнасці моў праграмавання і фрэймворкаў, праграмнае забеспячэнне па сваёй сутнасці партатыўнае і тыражаванае. Наадварот, распрацоўка апаратнага забеспячэння вельмі залежная ад кантэксту , залежыць ад спецыялізаванага і адасобленага вопыту і доступу да канкрэтных вытворчых канвеераў, працэсаў і аб'ектаў - такое раздзяленне азначае, што ні ў аднаго інжынера няма дастаткова ведаў або рэсурсаў, каб стварыць магію для канкурэнта. Зварваючы інавацыі ў чыпы, OpenAI звязвае іх IP з інфраструктурай, а не з прыватнымі асобамі , зводзячы да мінімуму рызыку страты канкурэнтнай перавагі, калі інжынеры пададуць у адстаўку.
Сеткавы эфект: ператварэнне ўспрымання ў рэальнасць
Робячы ўнутраную працу сістэм штучнага інтэлекту недаступнай, OpenAI гарантуе, што толькі яны могуць вызначаць і кантраляваць апавяданне аб сваіх магчымасцях . Падобна таму, як графічныя працэсары NVIDIA сталі сінонімам прадукцыйнасці штучнага інтэлекту дзякуючы тэстам, аптымізаваным для іх архітэктуры, OpenAI можа ствараць уласныя паказчыкі, звязаныя з іх крэмніем, разглядаючы паступовыя паляпшэнні як змяняючыя гульню . Адсутнасць празрыстасці таксама азначае, што выбарачныя этапы прадукцыйнасці (напрыклад, «у 5 разоў больш хуткія высновы»), дасягнутыя шляхам нязначнай аптымізацыі апаратнага забеспячэння, могуць быць прададзены як сапраўдныя прарывы , пажынаючы перавагі ўспрымання як піянера, хаваючы кампрамісы або абмежаванні.
Не маючы магчымасці параўнаць або пацвердзіць сцвярджэнні, кліенты, інвестары і сродкі масавай інфармацыі вымушаны давяраць піяру кампаніі. Хлусня можа абляцець паўсвету, пакуль праўда яшчэ не абуваецца: неўзабаве мы ўсе паверымся на гэтую сфальсіфікаваную версію «інавацыі», аддамо грошы і загалоўкі, і сфабрыкаванае дамінаванне стане адчувальнай рэальнасцю.
Гэтая ілюзія - гэта як стратэгія брэндынгу , так і тэхнічная, якая ператварае непразрыстасць у інструмент для ўстойлівага лідэрства на рынку.
Апаратнае забеспячэнне з'яўляецца вузкім месцам, але тэхналогіі ніколі не зніжаюць хуткасці. Толькі не падманвайце сябе — сапраўдныя дасягненні будуць служыць для ўмацавання карпаратыўнага ўплыву і канкурэнтнага кантролю, у той час як навінкі, прызначаныя для простых людзей і кампаній, будуць захопам дадзеных, замаскіраваным пластамі PR.
Думаеце, нагрузка на распрацоўку апаратнага забеспячэння спыніць спажывецкія аперацыі? Не, здаецца, усё паскараецца , таму што мы будзем працягваць перадаваць нашы даныя аб паводзінах толькі ў абмен на « прагрэс ». Але цяпер, калі нашы бабулі і дзядулі знаходзяць забаву ў чат-ботах, тэхналогія зменіцца ад спробы захапіць вас дварэцкімі да трукаў, якія нагадваюць «Назад у будучыню». (Не хвалюйцеся, тэхналогія будзе перыядычна падцягваць твар гэтых мудрагелістых памочнікаў, каб яны заўсёды былі на нашым радары. Паведамляецца, што OpenAI прадстаўляе агент штучнага інтэлекту пад назвай «Operator» у студзені 2025 года. Крыніцы паказваюць, што Operator будзе непасрэдна ўзаемадзейнічаць з вашым кампутарам, перш за ўсё функцыянуе адначасова як інструмент для паляпшэння працоўнага працэсу і вэб-браўзера, аўтаматызуючы задачы і аптымізуючы працу ў Інтэрнэце.)
Вялікія сабакі пяройдуць ад праграмнага забеспячэння да элегантных гаджэтаў, каб задзейнічаць складаных — Альтман толькі што замяніў Кейтлін Каліноўскі, якая была кіраўнік апаратнага забеспячэння Orion, Цук працуе над рукамі робатаў, нават Кук жуе думку аб прыладах разумнага дома. Уол-стрыт выведзе на рынак абсурд - ад дзіўных прадуктаў, такіх як жудаснае каралі Фрэнда, да сумніўных праграм, такіх як Daze.
Няспынная шуміха і загалоўкі не проста падштурхнуць нас да пакупкі; яны падарвуць нашу абарону, падрыхтаваўшы нас да таго, каб з радасцю прыняць усё, што прынясе ў будучыні штучны інтэлект з дапоўненым абсталяваннем.
Сапраўдныя грошы ляжаць у кашальках устаноў, а не фізічных асоб. Але прадпрыемствы будуць прымаць толькі тыя рашэнні, якія б'юць іх там, дзе балюча, а гэта азначае, што штучнаму інтэлекту трэба выйсці за межы болевых кропак на павярхоўным узроўні. У наступным годзе гаворка пойдзе не пра інструменты агульнага прызначэння, каб змякчыць бізнес да ідэі штучнага інтэлекту, а пра даменна-спецыфічныя мадэлі, якія падвяргаюць алгарытмам усе драбнюткія тонкасці кожнага сектара, аддзела, каманды і супрацоўніка.
Прыклад : Microsoft у супрацоўніцтве з кампаніямі Siemens , Bayer і Rockwell толькі што запусціла набор мадэляў штучнага інтэлекту для вырашэння канкрэтных праблем у вытворчасці, сельскай гаспадарцы і фінансавых паслугах. Спецыяльныя нішавыя стартапы са штучным інтэлектам таксама пажынаюць грошы — Breakr для музычнага маркетынгу, Dreamwell для аўтаматызацыі ўплыву, Beeble для VFX, і гэта толькі за апошнія пару месяцаў. Аналітыкі прагназуюць, што рынкавая капіталізацыя вертыкальнага штучнага інтэлекту будзе як мінімум у 10 разоў перавышаць памер састарэлага вертыкальнага SaaS.
Тэхналогія зберагае свае сілы для трансфармацыйных дасягненняў, якія звяжуць іх будучыню з будучыняй эліты: карпаратыўных гігантаў і ўрадаў. Кампанія OpenAI прадстаўляе Трампу план амерыканскай інфраструктуры штучнага інтэлекту, а кампанія Anthropic толькі што ўступіла ў партнёрства з абаронным падрадчыкам Palantir, каб «хутка апрацоўваць велізарныя аб'ёмы складаных даных, паляпшаць інфармацыю, якая кіруецца дадзенымі, больш эфектыўна вызначаць заканамернасці і тэндэнцыі, аптымізаваць праверку і падрыхтоўку дакументаў і дапамагаць Афіцыйныя асобы ЗША павінны прымаць больш абгрунтаваныя рашэнні ў сітуацыях, у якіх няма часу». Microsoft супрацоўнічае з BlackRock, IBM супрацоўнічае з AWS, а Google перайшоў у Саудаўскую Аравію .
Што стаіць за партнёрствам? Толькі час пакажа.
Казка пра штучны інтэлект для ўсіх — абяцанне агульных інавацый і ўсеагульнага доступу — заўсёды здавалася занадта добрай, каб быць праўдай. Але ў рэтраспектыве ці маглі тыя ж празорцы, якія ўзламалі сам код інтэлекту, быць аслепленыя непазбежнасцю вырабленага на заказ крэмнію і бай-інаў на мільярды долараў?
Гэты аўтар не перакананы.
І цяпер, разглядаючы апаратнае забеспячэнне як гераічны адказ на растучыя патрабаванні штучнага інтэлекту, такія, як OpenAI, акуратна абыходзяць той факт, што яны з самага пачатку імкнуліся да эксклюзіўнасці.
«Адкрытае» заўсёды было практыкаваннем па брэндынгу, піярам, які распрацоўваўся дзесяцігоддзямі, а дэмакратыя — толькі лозунгам.