В конце октября появились сообщения — любезно предоставленные Reuters — о том, что . Источники сообщили, что компания обеспечила производственные мощности и собрала , переманив бывших ветеранов из подразделения процессоров Tensor компании Google. Сроки производства остаются гибкими, и чипы могут быть выпущены не позднее , но уже закладывается основа для кардинального сдвига в том, как OpenAI управляет своей инфраструктурой. OpenAI работает с Broadcom над разработкой специального кремния, предназначенного для обработки колоссальных рабочих нагрузок ИИ TSMC команду из 20 инженеров 2026 года Хотя этот шаг действительно соответствует текущей стратегии OpenAI по диверсификации своей цепочки поставок и контролю за растущими расходами на инфраструктуру, в этот слух можно вписать сообщение о том, что дни общедоступного ИИ могут быть сочтены. Будущее ИИ — это не более большой, яркий мир, открытый для любого человека с блестящим умом, а , где членский взнос составляет миллиард долларов. VIP-зал с индивидуальными чипами вместо стен Нестандартное оборудование, несомненно, , но также и , баррикады, которые оставят широкую общественность — и большинство других игроков — в стороне, наблюдая за происходящим. принесет прорывы создаст барьеры И, возможно, именно этого и хотели технологии с самого начала. Давайте рассмотрим, почему гонка вооружений в области оборудования неизбежна, какую роль чипы играют в более масштабной стратегии доминирования технологий и чего ожидать дальше. Индивидуальные чипсы: необычный способ сказать: «Мы застряли» ИИ заставил нас мечтать о большем — обо всем, от персонализированных терапевтических ботов до автономных доставочных дронов и диагностики на основе ИИ на каждом телефоне. Но последний шаг OpenAI по разработке индивидуальных чипов сигнализирует о том . Индивидуальный кремний — это не о том, чтобы сделать ИИ быстрее, лучше и свободнее, а о том, чтобы удержать все это на плаву в условиях постоянно растущих требований — молчаливое признание того, что мы достигли инновационного потолка, преодолеть который может только аппаратное обеспечение. , что наши дикие амбиции в отношении ИИ теперь требуют моделей настолько внушительных, что даже самые мощные процессоры общего назначения размахивают белым флагом Вот что движет потребностью в изготовлении специализированных кремниевых чипов. Настоящая личность ChatGPT: высокие требования к обслуживанию Мудрость LLM, таких как GPT-4 и Gemini, основана на , которые отслеживают миллиарды параметров. : основа , требующих массивных умножений матриц, которые поглощают полосу пропускания памяти. Архитектура трансформаторов также требует , что означает, что расширение модели увеличивает требования . Когда LLM пытаются повысить уровень своей игры с помощью наложения слоев на , чтобы адаптироваться к обратной связи в реальном времени, или пытаются сопоставить соединения с помощью , все превращается в серьезную вечеринку с данными, заставляя требования к мощности зашкаливать. . моделях на основе трансформаторов Но этот интеллект имеет свою цену механизмов самовнимания масштабирования квадратичной сложности экспоненциально обучение с подкреплением (RL) графовых нейронных сетей (GNN) Если вы заметили, что в последнее время у ChatGPT случаются приступы эпилепсии, вот почему Специальные чипы, такие как TPU от Google, могут решить эти проблемы за счет интеграции в чип , управления перемещением данных и улучшения иерархий памяти для сокращения задержек, а также использования для распараллеливания матричных операций. памяти с высокой пропускной способностью (HBM) систолических массивов Генеративный ИИ: от результатов до сбоев Генеративный ИИ переходит от предоставления таких как текст или изображения, к посредством смешивания нескольких форм медиа (текста, аудио, видео). Это техническое колдовство порождает вычислительный хаос — у каждой модальности есть свои потребности в обработке, и просьба к ИИ обработать все одновременно нагружает универсальные графические процессоры, которые не были разработаны для того, чтобы быть мастерами жонглерства. Кроме того, для расширенных функций взаимодействия, таких как динамически адаптивные сюжетные линии для игр или фильтры SFX для потоковой передачи, требуют сверхнизкой задержки и высокой скорости вывода, требования, которые графические процессоры с трудом справляются без внесения задержек и заоблачных счетов за электроэнергию. отдельных результатов, кросс-модальным шедеврам модели синтеза в реальном времени Пользовательские кристаллы, такие как NVIDIA A100 и Google TPU, решают эти проблемы с помощью и , что позволяет проводить энергоэффективные кросс-модальные вычисления в реальном времени, разделяя задачи на параллельные изолированные процессы на одном чипе. Также может быть введена , чтобы обеспечить обработку в форматах, таких как FP16 или INT8 вместо FP32, сохраняя точность без расплавления оборудования. многоэкземплярных GPU (MIG) тензорных ядер арифметика пониженной точности ИИ на грани жизни и смерти: точность, истощающая сеть Навигация с высокими ставками — подумайте об автономном вождении, робототехнике, дронах — требует, чтобы **==событийно-управляемый ИИ ==** реагировал со сверхчеловеческой скоростью, задача, подходящая для , которые сломали бы стандартный чип. Пользовательские чипы, такие как построены с использованием архитектур, которые имитируют биологические нейронные сети, полагаясь на и для анализа данных только при соответствующих событиях, при этом динамически распределяя ресурсы на основе входящих шаблонов данных. Хотя эта конструкция обеспечивает маломощные и малозадерживаемые операции в масштабе, она несовместима с оборудованием, которое находится на открытом рынке. в реальном хаосе нейроморфных и вероятностных моделей Loihi от Intel, импульсные нейронные сети (SNN) основанную на событиях обработку Социальный ИИ: Взлом человечества требует больших усилий Ах, применение ИИ, которое, как надеются титаны, будет держать нас зачарованными их платформами и одурманенными их запрограммированными питомцами. Расшифровка неуловимости человеческой натуры требует систем, которые интерпретируют, предсказывают и адаптируются к поведению как на индивидуальном, так и на общественном уровнях , для анализа коллективных взаимодействий, для развития эмоционального интеллекта, для обеспечения контекстной релевантности, и этот список можно продолжать. Более того, социальный ИИ может работать в чувствительных контекстах (например, внутри лечащего депрессию робогрызуна), . Излишне говорить, что все эти вычисления приводят основные чипы и их пакетную обработку в состояние паралича. заманчивое, но этически смутное — кросс-модальные механизмы внимания GNN аффективные вычисления графы знаний что требует наличия ИИ на устройстве для защиты пользовательских данных Эти процессы — требования, которые проектировщики кремниевых чипов могут удовлетворить за счет внедрения таких функций, как , , (используемая в IPU Graphcore) и . требуют эффективности разреженных данных и высокой точности при малой задержке унифицированная архитектура памяти ускорители для конкретных задач оптимизация разреженных данных оптимизация многомодального слияния Научный ИИ: последний рубеж, слишком большой для обычного оборудования Хотя . Но только если оборудование сможет выдержать его. Для того, чтобы генеративный научный ИИ создавал новые возможности (например, новые молекулы, материалы и системы), передовые вычислительные структуры, такие как , , и , должны быть объединены со знаниями, специфичными для предметной области. Негенеративный ИИ, используемый для предиктивного моделирования и симуляции, имеет дело с и многомерными системами, используя такие механизмы, как , , и . Хотя эти две ветви научного ИИ служат разным целям, обе требуют точности, масштабируемости и вычислительной интенсивности — критериев, которым могут соответствовать только самые элитные механизмы как генеративного, так и предиктивного ИИ. Нетрудно догадаться, что готовое оборудование не подойдет. научный ИИ менее любим СМИ, чем другие области, он готов стать самым революционным рубежом в области искусственного интеллекта модели диффузии VAE трансформаторы обучение с подкреплением данными в масштабе петабайт решатели уравнений в частных производных GNN байесовские модели конечно-элементный анализ (FAE) Смерть открытого ИИ и очарование исключительности Путь к изготовлению кремния на заказ сопряжен с ценой, которая почти гарантирует стратификацию доступа к ИИ. Экономика 101: чтобы покрыть астрономические расходы, OpenAI (и все, кто последует этому примеру) неизбежно переложат бремя на клиентов, . объединяя доступ в предложение, которое заставит наши текущие подписки выглядеть как копейки на долларе Но не стоит путать завышенные цены и иерархическую систему, где финансовая мощь является обязательным условием, с тактикой выживания в ответ на обстоятельства; это стратегическая возможность, поскольку эксклюзивность — это не ошибка, а функция, которую так долго ждали технологии. Vendor Lock-In 2.0: объединение компаний с помощью чипов Фирменное оборудование вносит : как только предприятия встраиваются в экосистему, которая объединяет программное обеспечение и индивидуальный кремний, они фактически связаны ею. Вплетение программного стека в кремний создает механизм, в котором системы могут функционировать на пике только поставщика — , в которой . После того, как компании построят свои приложения и рабочие процессы вокруг этой индивидуальной среды, уход — это не просто вопрос переноса данных или лицензий на программное обеспечение, а реинжиниринг с нуля . гравитационное поле в доменах необратимая установка оборудование диктует программное обеспечение — как попытка перенести прогресс с PS на Xbox И по мере того, как оборудование обновляется, интеграция становится более бесшовной, . С повышением производительности приходит укрепленная лояльность — как и в большинстве вертикально интегрированных экосистем, переключение означает начало заново. что делает затраты на выход все выше с каждым обновлением Индивидуальные фишки, индивидуальные правила: уничтожение конкуренции с помощью дизайна Пользовательский кремний фрагментирует экосистему ИИ в огороженные сады, где совместимость, которая определила ранний бум ИИ, умирает. Благодаря повышенной эффективности и контролю, предлагаемым пользовательскими чипами, , маргинализируя инициативы с открытым исходным кодом и более мелких игроков, которые не могут конкурировать с аппаратно-зависимыми достижениями. Если у вас есть идея, вам, возможно, придется принести ее в OpenAI и пресмыкаться для аппаратной поддержки, как технари в настоящее время выстраиваются в очередь за вращающимися дверями NVIDIA. OpenAI может устанавливать стандарты (такие как планки производительности, функции и требования к совместимости), которые вращаются вокруг его собственных систем и интеллектуальных патентов Пользовательский кремний создает , а также пробел в доступе. Разрабатывая аппаратное обеспечение, оптимизированное для фирменных архитектур ИИ, OpenAI не только ускоряет свои собственные модели, но и создает , которые конкуренты не могут эффективно реконструировать или реплицировать. Эта эффективно блокирует конкурентов от обучения или инноваций в рамках той же парадигмы, превращая эксклюзивность в оружие для замедления общеотраслевого прогресса. пробел в знаниях непонятные экосистемы асимметрия обучения Эксклюзивное оборудование становится , позволяя поставщикам и — . препятствием для инноваций контролировать темпы прогресса гарантируя, что они останутся в центре следующей главы ИИ той, где талант и креативность уступают силе сырого капитала За закрытыми фишками: непрозрачность обеспечивает доминирование В отличие от программного обеспечения, которое можно подвергнуть обратному проектированию или форкнуть, аппаратные процессы и их трудно деконструировать, не прожигая пачки денег. физически непрозрачны Этот непроницаемый слой абстракции выступает в качестве окончательной цитадели, укрепляя претензии OpenAI на Железный трон ИИ. Обход контроля: ответственность без ответов Индивидуальный кремний предлагает удобный щит для пытливых глаз регулирующих органов и жестких вопросов СМИ и групп поддержки посредством добавления слоев сложности, которые усложняют объяснение внутренней работы систем и еще более затрудняют аудит. Компании могут утверждать, что определенные результаты не являются преднамеренными недостатками дизайна, а побочными продуктами взаимодействия аппаратного и программного обеспечения, отвлекая внимание, указывая на присущую системе непрозрачность. также могут быть встроены для снижения изменчивости системы при развертывании в определенных критических средах. Эта непрозрачность гарантирует, что компаниям не придется раскрывать компромиссы или уязвимости в своих моделях, особенно в таких отраслях, как здравоохранение, финансы или оборона, где надежность имеет первостепенное значение. Предсказуемые параметры производительности Внутреннее страхование: защита королевских драгоценностей Поскольку большинство компаний ИИ полагаются на распределенную рабочую силу, подрядчиков или поставщиков облачной инфраструктуры, риск утечки интеллектуальной собственности растет. Благодаря универсальности языков программирования и фреймворков программное обеспечение по своей сути является переносимым и воспроизводимым. Напротив, разработка оборудования в значительной степени , зависит от и доступа к определенным производственным конвейерам, процессам и объектам — эта раздробленность означает, что ни один инженер не обладает достаточными знаниями или ресурсами, чтобы сотворить волшебство для конкурента. Сваривая инновации в чипы, , сводя к минимуму риск потери конкурентного преимущества, когда инженеры подают заявление об увольнении. контекстуальна специализированных и изолированных знаний OpenAI привязывает свою интеллектуальную собственность к инфраструктуре, а не к отдельным лицам Сетевой эффект: превращение восприятия в реальность Сделав внутреннюю работу систем ИИ недоступной, . Подобно тому, как графические процессоры NVIDIA стали синонимом производительности ИИ благодаря оптимизированным для их архитектуры бенчмаркам, OpenAI может создать свои собственные метрики, привязанные к их кристаллу, . Отсутствие прозрачности также означает, что , извлекая выгоду из того, что их воспринимают как пионера, скрывая компромиссы или ограничения. OpenAI гарантирует, что только они могут определять и контролировать повествование об их возможностях обрамляя постепенные улучшения как меняющие правила игры выборочные вехи производительности (например, «вывод в 5 раз быстрее»), достигнутые за счет незначительной аппаратной оптимизации, могут быть представлены как подлинные прорывы Не имея возможности сравнить или подтвердить заявления, клиенты, инвесторы и СМИ остаются верными пиар-рассказам компании. Ложь может обойти полмира, пока правда еще надевает туфли: вскоре мы все купимся на эту сфальсифицированную версию «инновации», отдадим деньги и заголовки, и сфабрикованное доминирование станет осязаемой реальностью. Эта иллюзия представляет собой не только техническую, но и стратегию, превращающую непрозрачность в инструмент для устойчивого лидерства на рынке. брендинговую Прогноз на 2025 год: будут инновации, но не для вас Аппаратное обеспечение — это узкое место, но технологии никогда не замедлялись из-за «лежачего полицейского». Просто не обманывайтесь — настоящие достижения послужат укреплению корпоративного влияния и конкурентного контроля, в то время как новинки, представленные простым людям и компаниям, будут замаскированными под слои PR-акциями. Потребительские игрушки: данные, отвлечение внимания и потеря бдительности Нет, , потому что мы будем продолжать передавать наши поведенческие данные только в обмен на « ». Но теперь, когда наши бабушки и дедушки находят развлечение в чат-ботах, (Не волнуйтесь, технологии будут периодически делать этим причудливым помощникам подтяжку лица, чтобы они оставались свежими на нашем радаре. Сообщается, что OpenAI представит агента ИИ под названием «Оператор» в январе 2025 года. Источники указывают, что Operator будет напрямую взаимодействовать с вашим компьютером, в первую очередь функционируя как улучшение рабочего процесса и инструмент веб-браузера, автоматизируя задачи и оптимизируя онлайн-опыт. Итак, настольный шпион.) Думаете, что рабочая нагрузка по разработке оборудования остановит операции потребителей? все будет выглядеть так, как будто все ускорится прогресс технологии перейдут от попыток увлечь вас дворецкими к трюкам, которые кажутся из «Назад в будущее». — Altman только что перехватил бывшего руководителя отдела оборудования Orion Кейтлин Калиновски, Zuck работает над роботизированными руками, даже Cook обдумывает идею умных домашних устройств. Уолл-стрит выведет абсурд на рынок, от диковинных продуктов, таких как жуткое ожерелье Friend, до сомнительных приложений, таких как Daze. Большие собаки перейдут от программного обеспечения к изящным гаджетам, чтобы привлечь утонченных Непрекращающаяся шумиха и заголовки не просто подтолкнут нас к покупкам; они подорвут нашу защиту, заставив нас с радостью принять все, что преподнесет нам будущее искусственного интеллекта, дополненного аппаратными средствами. Корпоративные инструменты: масштабирование в глубину, а не в ширину Настоящие деньги лежат в кошельках учреждений, а не отдельных лиц. Но предприятия будут принимать только те решения, которые бьют по больному месту, а это значит, что ИИ нужно выходить за рамки поверхностных болевых точек. В следующем году речь пойдет не об универсальных инструментах, которые смягчат бизнес в отношении идеи ИИ, а о предметно-ориентированных моделях, которые откроют алгоритмам все мельчайшие тонкости каждого сектора, отдела, команды и сотрудника. : в сотрудничестве с , и только что запустили набор моделей ИИ для решения конкретных задач в производстве, сельском хозяйстве и финансовых услугах. Нишевые стартапы ИИ также пожинают плоды — Breakr для музыкального маркетинга, Dreamwell для автоматизации инфлюенсеров, Beeble для VFX, и это только за последние пару месяцев. Аналитики прогнозируют, что рыночная капитализация вертикального ИИ будет как минимум в 10 раз больше, чем у устаревшего вертикального SaaS. Показательный пример Microsoft Siemens Bayer Rockwell Охраняемый гений: пионер для престижных OpenAI представляет Трампу проект инфраструктуры искусственного интеллекта в США, а только что заключила партнерство с оборонным подрядчиком чтобы «быстро обрабатывать огромные объемы сложных данных, повышать уровень аналитических данных, более эффективно выявлять закономерности и тенденции, упрощать рассмотрение и подготовку документов и помогать должностным лицам США принимать более обоснованные решения в ситуациях, требующих срочности». . Технологии берегут свои лошадиные силы для преобразующих достижений, которые свяжут их будущее с будущим элиты: корпоративных гигантов и правительств. Anthropic Palantir, Microsoft сотрудничает с BlackRock, IBM в сговоре с AWS, а Google ушла в Саудовскую Аравию Что стоит за партнерством? Только время покажет. Заключительные мысли: пример для Зала славы связей с общественностью Сказка об ИИ для всех — обещание совместных инноваций и всеобщего доступа — всегда казалась слишком хорошей, чтобы быть правдой. Но оглядываясь назад, могли ли те же визионеры, которые взломали код самого интеллекта, действительно быть ошеломленными неизбежностью заказного кремния и миллиардных бай-инов? Этот автор не убежден. И теперь, представляя поворот в аппаратном обеспечении как героический ответ на растущие требования ИИ, такие компании, как OpenAI, ловко обходят стороной реальность, к которой они стремились с самого начала, стремясь к эксклюзивности. «Открытость» всегда была всего лишь брендинговым ходом, PR-кампанией, разрабатывавшейся десятилетиями, а демократия — всего лишь лозунгом. Возможно, самым революционным аспектом ИИ является не сама технология, а повествование, которое нам преподнесли.