10月末、ロイター通信によると、 OpenAIがBroadcomと提携して、膨大なAIワークロードに対応できるカスタムシリコンを開発しているという報道が浮上した。情報筋によると、同社はTSMCと提携して製造能力を確保し、GoogleのTensorプロセッサ部門から元ベテランを引き抜いて20人のエンジニアチームを編成したという。生産スケジュールは柔軟で、チップの展開は2026年まで遅れる可能性があるが、OpenAIがインフラを扱う方法に大きな変化をもたらすための基盤はすでに整いつつある。
この動きは確かに、サプライチェーンを多様化し、高騰するインフラコストを抑制するというOpenAIの継続的な戦略と一致しているが、この噂には、AIが普遍的にアクセス可能な時代は終わりに近づいているというメッセージが込められているのかもしれない。AIの未来は、優れた頭脳を持つすべての人に開かれた、より大きく明るい世界ではなく、壁にカスタムチップを取り付けたVIPラウンジであり、その会費は10億ドルの予算である。
カスタム ハードウェアは間違いなく画期的な進歩をもたらしますが、同時に障壁も築き上げます。つまり、一般の人々、そして他のほとんどのプレーヤーが外から見ているだけのバリケードとなるのです。
そして、それはまさにテクノロジーがずっと望んでいたことなのかもしれない。
ハードウェアの軍拡競争がなぜ避けられないのか、テクノロジーの支配に向けたより大きな戦略においてチップがどのように機能するのか、そして次に何が期待できるのかを見てみましょう。
AIは私たちに大きな夢を与えてきた。パーソナライズされた治療ボットから自律走行の配達ドローン、あらゆるスマートフォンのAI駆動診断まで、あらゆるものがそうだ。しかし、カスタムチップを開発するというOpenAIの最新の動きは、AIに対する私たちの野望が今や、最も強力な汎用プロセッサですら白旗を振るほどの強力なモデルを必要としていることを示すものだ。カスタムシリコンは、AIをより高速、より優れ、より自由にすることではなく、常に高まる需要の下で全体を浮かせておくことが目的だ。これは、ハードウェアでしか突破できないイノベーションの天井に達したことを暗に認めているのだ。
カスタム シリコンの必要性が高まっている理由は次のとおりです。
GPT-4 や Gemini のような LLM の知恵は、数十億のパラメータを追跡するトランスフォーマー ベースのモデルに基づいています。しかし、このインテリジェンスには代償が伴います。それは、メモリ帯域幅を大量に消費する大規模な行列乗算を必要とする自己注意メカニズムのバックボーンです。トランスフォーマーのアーキテクチャでは、2 次複雑度のスケーリングも必要であり、モデルの拡張によって需要が指数関数的に増加します。LLM が強化学習 (RL)を重ねてレベルアップを図り、リアルタイムでフィードバックに適応しようとしたり、グラフ ニューラル ネットワーク (GNN)を使用して接続をマッピングしようとしたりすると、深刻なデータ パーティに陥り、電力要件が急上昇します。最近 ChatGPT が時々てんかん発作を起こしていることに気づいた場合は、これが理由です。
Google の TPU のようなカスタム チップは、高帯域幅メモリ (HBM) をチップに統合し、データの移動を管理してメモリ階層を改善し、レイテンシを削減することでこれらの問題を解決し、シストリック アレイを活用して行列演算を並列化することもできます。
ジェネレーティブ AI は、テキストや画像などの単一の出力を提供することから、複数の形式のメディア (テキスト、オーディオ、ビデオ) をブレンドしたクロスモーダルの傑作へと移行しています。この技術的な魔法は計算上の混乱を生み出します。各モダリティには異なる処理ニーズがあり、AI にすべてを同時に処理するように要求すると、マスタージャグラーとして設計されていない汎用 GPU に負担がかかります。さらに、ゲームの動的に適応するストーリーラインやライブストリーミングの SFX フィルターなど、強化されたエンゲージメント機能のリアルタイム合成モデルには、超低レイテンシと高速な推論速度が求められますが、GPU では遅延や高額な電気代を発生させずにこれらの要件を満たすのは困難です。
NVIDIA の A100 や Google の TPU などのカスタム シリコンは、マルチインスタンス GPU (MIG)とテンソル コアを使用してこれらの問題に対処し、タスクを同じチップ上の並列の独立したプロセスに分割することで、電力効率の高いリアルタイムのクロスモーダル計算を可能にします。また、精度を下げた演算を導入して、FP32 ではなく FP16 や INT8 などの形式で処理できるようにすることで、ハードウェアを溶融させることなく精度を維持することもできます。
自動運転、ロボット工学、ドローンなど、現実世界の大きな混乱を切り抜けるには、イベント駆動型 AI が超人的なスピードで応答する必要があります。これは、既製のチップでは対応できないニューロモルフィック モデルや確率モデルに適したタスクです。Intelの Loihiなどのカスタム チップは、生物学的ニューラル ネットワークを模倣したアーキテクチャで構築されており、スパイキング ニューラル ネットワーク (SNN)とイベント ベース処理を利用して、関連するイベントが発生した場合にのみデータを分析し、受信データ パターンに基づいてリソースを動的に割り当てます。この設計により、大規模な低電力および低レイテンシ操作が可能になりますが、オープン マーケットのハードウェアとは互換性がありません。
ああ、魅力的だが倫理的に曖昧なAI の応用は、巨人たちが私たちを彼らのプラットフォームに魅了し、プログラムされたペットに夢中にさせ続けることを望んでいる。人間の本質の捉えどころのなさを解読するには、個人レベルと社会レベルの両方で行動を解釈、予測、適応するシステムが必要である。クロスモーダル注意メカニズム、集団的相互作用を分析するGNN 、感情的知性を開発する感情コンピューティング、コンテキストの関連性を保証するナレッジ グラフなど、リストは続きます。さらに、ソーシャル AI はセンシティブなコンテキスト (うつ病治療ロボットの内部など) で機能する可能性があり、ユーザー データを保護するためにデバイス上の AI が必要になる。言うまでもなく、このすべての計算により、主流のチップとそのバッチ処理は麻痺状態に陥ります。
これらのプロセスでは、低レイテンシでのスパースデータ効率と高精度が求められますが、設計者シリコンは、統合メモリアーキテクチャ、タスク固有のアクセラレータ、スパースデータ最適化(Graphcore の IPU で使用)、マルチモーダル融合最適化などの機能を組み込むことで、これらの要件を満たすことができます。
他の領域ほどメディアで取り上げられることはないものの、科学的 AI は人工知能における最も根本的な革命の最前線になろうとしています。しかし、それはハードウェアが追いつけばの話です。生成科学的 AI が新しい可能性 (新しい分子、材料、システムなど) を生み出すには、拡散モデル、 VAE 、トランスフォーマー、強化学習などの高度な計算フレームワークをドメイン固有の知識と組み合わせる必要があります。予測モデリングとシミュレーションに使用される非生成 AI は、 PDE ソルバー、 GNN 、ベイズモデル、有限要素解析 (FAE)などのメカニズムを使用して、ペタバイト規模のデータと高次元システムを扱います。科学的 AI の 2 つの分野は異なる目的を果たしますが、どちらも精度、スケーラビリティ、計算強度を求めており、これは生成 AI と予測 AI の両方で最も優れたメカニズムだけが満たすことができる基準です。既製のハードウェアが基準を満たさないことは明らかです。
特注のシリコンへの道には、AI へのアクセスの階層化をほぼ保証する価格が伴います。経済学の基本: 天文学的な費用を賄うために、OpenAI (およびそれに追随するすべての企業) は必然的にその負担を顧客に転嫁し、現在のサブスクリプションが 1 ドルのわずかな金額に見えるようなサービスにアクセスをバンドルします。
しかし、高騰した価格や、資金力が必須条件となる階層的なシステムを、受動的な生き残り戦略と誤解してはならない。それは戦略的なチャンスなのだ。なぜなら、独占性は欠陥ではなく、テクノロジーが待ち望んでいた機能だからだ。
独自のハードウェアは引力をもたらします。企業がソフトウェアとカスタム シリコンを組み合わせたエコシステムに組み込まれると、事実上そのエコシステムに縛られてしまいます。ソフトウェア スタックをシリコンに組み込むと、システムがプロバイダーのドメイン内でのみピーク時に機能するメカニズムが作成されます。これは、ハードウェアがソフトウェアを指示する不可逆的な設定です。企業がこのカスタム環境を中心にアプリケーションとワークフローを構築した後、離脱は単にデータやソフトウェア ライセンスを転送するだけでなく、ゼロからの再設計が必要になります。PS から Xbox に進行状況を転送しようとするようなものです。
また、ハードウェアが進化するにつれて、統合はよりシームレスになり、更新のたびに撤退コストが急上昇します。パフォーマンスが向上すると、忠誠心が固まります。ほとんどの垂直統合型エコシステムと同様に、切り替えるということは最初からやり直すことを意味します。
カスタム シリコンは AI エコシステムを分断して壁で囲まれた庭園にし、初期の AI ブームを特徴づけた相互運用性は死滅します。カスタム チップによって効率性と制御性が向上するため、 OpenAI は独自のシステムと知的特許を中心とした標準 (パフォーマンス バー、機能、互換性要件など) を設定し、ハードウェアに依存する進歩に太刀打ちできないオープンソースの取り組みや小規模なプレーヤーを疎外する可能性があります。アイデアがある場合は、技術者が現在 NVIDIA の回転ドアの外に並んでいるように、それを OpenAI に持ち込んでハードウェア サポートを懇願する必要があるかもしれません。
カスタム シリコンは、知識のギャップだけでなくアクセスのギャップも生み出します。独自の AI アーキテクチャに最適化されたハードウェアを設計することで、OpenAI は独自のモデルを高速化するだけでなく、競合他社がリバース エンジニアリングしたり効果的に複製したりできない、理解不能なエコシステムを構築します。この学習の非対称性により、競合他社が同じパラダイム内で学習したり革新したりすることが事実上阻止され、排他性を武器にして業界全体の進歩を遅らせます。
専用ハードウェアはイノベーションの障壁となり、プロバイダーが進歩のペースをコントロールすることを可能にし、 AI の次の章の中心に留まることを確実にします。その章では、才能と創造性が資本の力に屈することになります。
リバースエンジニアリングやフォークが可能なソフトウェアとは異なり、ハードウェアベースのプロセスは物理的に不透明で、多額の現金を費やさずに解体するのは困難です。この侵入不可能な抽象化レイヤーは究極の要塞として機能し、AI の鉄の玉座に対する OpenAI の主張を強化します。
監視を回避する:答えのない説明責任
カスタム シリコンは、システムの内部動作の説明を困難にし、監査をさらに困難にする複雑さの層を追加することで、規制当局の厳しい監視やメディアや擁護団体の厳しい質問に対する便利な盾を提供します。企業は、特定の出力は意図的な設計上の欠陥ではなく、ハードウェアとソフトウェアの相互作用による副産物であると主張し、システムの本質的な不透明性を指摘して精査をそらすことができます。
予測可能なパフォーマンス パラメータを組み込むことで、特定の重要な環境での展開におけるシステムの変動性を低減することもできます。この不透明性により、特に信頼性が最も重要となる医療、金融、防衛などの業界では、企業がモデルのトレードオフや脆弱性を明らかにする必要がなくなります。
内部保険:王冠の宝石の保護
ほとんどの AI 企業が分散した労働力、請負業者、またはクラウド インフラストラクチャ プロバイダーに依存しているため、知的財産の漏洩のリスクが高まっています。プログラミング言語とフレームワークの普遍性により、ソフトウェアは本質的に移植可能で複製可能です。対照的に、ハードウェア開発は高度にコンテキストに依存し、専門的でサイロ化された専門知識と、特定の製造パイプライン、プロセス、および施設へのアクセスに依存しています。この区分化により、競合他社のために魔法をかけるのに十分な知識やリソースを 1 人のエンジニアが持つことはできません。OpenAIは、イノベーションをチップに組み込むことで、IP を個人ではなくインフラストラクチャに結び付け、エンジニアが辞職したときに競争上の優位性を失うリスクを最小限に抑えます。
ネットワーク効果: 認識を現実に変える
AIシステムの内部構造にアクセスできないようにすることで、 OpenAIは、AIシステムだけがその能力を定義および制御できるようにします。NVIDIAのGPUが、そのアーキテクチャに最適化されたベンチマークによってAIパフォーマンスの代名詞となったのと同じように、OpenAIはシリコンに結び付けられた独自の指標を作成し、段階的な改善を画期的なものとして位置付けることができます。透明性の欠如は、マイナーなハードウェア最適化によって達成された選択的なパフォーマンスマイルストーン(「推論が5倍高速化」など)が真のブレークスルーとして売り出され、トレードオフや制限を隠しながら先駆者として認識されるメリットを享受できることも意味します。
主張をベンチマークしたり検証したりする方法がないため、顧客、投資家、メディアは企業の PR 宣伝文句を信じるしかありません。真実がまだその姿を現していない間に、嘘は地球の反対側まで伝わってしまいます。すぐに私たちはこの不正な「イノベーション」を信じ、現金と見出しを手渡し、でっちあげの優位性が現実のものとなります。
この錯覚は技術的な戦略であると同時にブランド戦略でもあり、不透明性を持続的な市場リーダーシップのツールに変えています。
ハードウェアはボトルネックだが、技術はスピードバンプのために減速したことはない。だまされてはいけない。真の進歩は企業の影響力と競争上の支配を強化するのに役立つが、一般の人々や企業にもたらされる目新しいものは、PR の層に隠されたデータ収集に過ぎない。
ハードウェア開発の作業負荷が消費者の業務を停滞させると思いますか?いいえ、物事は加速するように見えます。なぜなら、私たちは「進歩」と引き換えに行動データを提供し続けるだけだからです。しかし、私たちの祖父母がチャットボットに楽しみを見出している今、テクノロジーは執事であなたを魅了しようとするのではなく、「バック・トゥ・ザ・フューチャー」のような仕掛けに方向転換するでしょう。 (心配しないでください。テクノロジーは、私たちのレーダーに新鮮さを保つために、これらの風変わりなアシスタントを定期的に改装します。OpenAIは、2025年1月に「Operator」と呼ばれるAIエージェントを発表すると報じられています。情報筋によると、Operatorはコンピューターと直接対話し、主にワークフロー強化とWebブラウザーツールの両方として機能し、タスクを自動化してオンラインエクスペリエンスを合理化します。つまり、デスクトップスパイです。)
大手企業は、洗練された人々を引き付けるために、ソフトウェアから洗練されたガジェットへと方向転換するだろう。アルトマンはオリオンの元ハードウェア責任者ケイトリン・カリノフスキーを引き抜いたばかりだし、ザッカーバーグはロボットハンドの開発に取り組んでおり、クックでさえスマートホーム機器のアイデアを検討している。ウォール街は、フレンドの不気味なネックレスのような突飛な製品から、Dazeのような疑わしいアプリまで、ばかげたものを市場に持ち込むだろう。
絶え間ない誇大宣伝や見出しは、私たちに購入を促しているだけではありません。私たちの防御を弱め、ハードウェアで強化された AI の未来が何をもたらすとしても喜んで受け入れるように準備させています。
本当のお金は、個人ではなく、組織の財布の中にあります。しかし、企業は、痛いところを突くソリューションしか採用しません。つまり、AI は表面的な痛みのポイントを超えて掘り下げる必要があります。来年は、AI の考え方に対して企業を柔軟にするための汎用ツールではなく、各セクター、部門、チーム、従業員のあらゆる細かい複雑さにアルゴリズムを公開するドメイン固有のモデルが重要になります。
一例を挙げると、マイクロソフトはシーメンス、バイエル、ロックウェルと共同で、製造、農業、金融サービスにおける特定の課題に対処するための AI モデルのセットをリリースしたばかりです。ニッチに特化した AI スタートアップも利益を上げています。音楽マーケティングの Breakr、インフルエンサー自動化の Dreamwell、VFX の Beeble などです。これはここ数か月の数字にすぎません。アナリストは、垂直 AI の時価総額が従来の垂直 SaaS の少なくとも 10 倍になると予測しています。
テクノロジー企業は、その将来をエリート層、つまり巨大企業や政府と結びつける変革的な進歩のために、そのパワーを温存している。OpenAIは米国のAIインフラの青写真をトランプ大統領に提示し、 Anthropicは防衛関連企業Palantirと提携して「膨大な量の複雑なデータを迅速に処理し、データに基づく洞察を高め、パターンと傾向をより効果的に特定し、文書のレビューと準備を効率化し、時間的制約のある状況で米国当局者がより情報に基づいた決定を下せるように支援する」と発表した。MicrosoftはBlackRockと提携し、IBMはAWSと密接な関係にあり、Googleはサウジアラビアに進出している。
パートナーシップの背後にあるものは何か?それは時が経てばわかるだろう。
すべての人のための AI という物語、つまり、共有されたイノベーションと普遍的なアクセスの約束は、いつもあまりにも良すぎて真実には思えませんでした。しかし、振り返ってみると、知能そのもののコードを解読した同じ先見の明のある人たちが、特注のシリコンと数十億ドルの投資の必然性に本当に驚かされたのでしょうか。
この著者は納得していない。
そして今、OpenAI のような組織は、ハードウェアへの転換を AI の高まる需要に対する英雄的な対応として位置づけることで、最初から排他性に向けて構築してきた現実を巧みに回避している。
「オープン」は常にブランディング活動であり、何十年にもわたるPR計画であり、民主主義は単なるスローガンに過ぎなかった。