paint-brush
オープンソース: AI 革命の次のステップ@minio
109,716 測定値
109,716 測定値

オープンソース: AI 革命の次のステップ

MinIO6m2024/01/25
Read on Terminal Reader

長すぎる; 読むには

オープンソース AI の未来を探るこの調査では、AI 開発における「偽者」を分析し、「本物」を擁護し、すべての根底で動いているオープンソース ソフトウェアのイノベーション エンジンを明らかにします。肝心なのは、オープンソース AI がオープンソース データ スタックを生み出すということです。
featured image - オープンソース: AI 革命の次のステップ
MinIO HackerNoon profile picture
0-item
1-item


AI が企業の金庫に閉じ込められるのではなく、イノベーターの世界的なコミュニティによってオープンな場所で一個ずつ構築される未来を想像してみてください。競争ではなく協力が進歩を促進し、倫理的配慮が生のパフォーマンスと同等の重みをもつ場合。これは SF ではなく、AI 開発の中心で進行中のオープンソース革命です。しかし、ビッグテックには独自の狙いがあり、真にオープンなコミュニティの恩恵を享受しようとしながら、制限されたモデルをオープンソースとして覆い隠しています。


コードの層を剥がして、これらの取り組みの背後にある真実を明らかにしましょう。オープンソース AI の未来を探るこの調査では、AI 開発における「偽者」を分析し、「本物」を擁護し、すべての根底で動いているオープンソース ソフトウェアのイノベーション エンジンを明らかにします。肝心なのは、オープンソース AI がオープンソース データ スタックを生み出すということです。


必要なもの

アトランティック誌のマテオ・ウォンによる最近の記事、「 「オープン」AI などというものは存在しなかった」は、真のオープンソース AI を求める学界とソフトウェア コミュニティの傾向が成長していることを説明しています。 「そのアイデアは、一般の人々がより簡単かつ安価に使用、研究、再現できる比較的透明なモデルを作成し、仕事、警察、レジャー、さらには宗教さえも変える可能性を秘めた高度に集中したテクノロジーの民主化を試みることです。」同じAtlanticは、Metaのようなビッグテック企業が自社製品を「オープンウォッシュ」することで市場のこのニーズを満たそうとしていることを示唆している。彼らは、製品を真にオープンソース化することなく、オープンソース コミュニティの品質と肯定的な評判を前提としています。しかし、本物に代わるものはありません。これは、真のオープンソース ソフトウェアがイノベーションとコラボレーションを促進するためです。この 2 つの特性は、責任を持って AI を前進させるために絶対に必要です。


プリテンダーズ

LLaMA 2 は、 Metaによって作成された大規模な言語モデルで、研究用途と商業用途の両方に無料で使用できます。 LLaMA 2 はオープンソースであると示唆する人もいます。ただし、Meta はモデルの使用に関していくつかの厳しい制限を設けています。たとえば、LLaMA 2 を使用して他の大規模な言語モデルを改善することはできません。従来の常識に反する立場民間集団イノベーションモデルソフトウェア コミュニティの全員の利益のために、イノベーションの自由かつオープンな啓示を促進するオープン ソフトウェアの推進。


Meta はさらに、月間ユーザー数 7 億人の製品と LLaMA 2 の統合を許可せず、モデルがどのようなデータでトレーニングされているか、モデルの構築に使用されたコードを開示しないことで、モデルの使用を妨げました。メタは開示しないことで、固有の偏見や偶発的な差別の問題に自らをさらけ出すことになる。差別的なデータでトレーニングされたモデルは、 差別的な対応をする。ソフトウェア コミュニティ全体が、モデルの構築に使用されたコードを参照して安全対策が組み込まれているかどうかを確認したり、モデルのトレーニングに使用されたデータを閲覧したりすることができなければ、私たちはこれらの道徳的問題について闇の中に取り残されます。という時代にAIに関する研究結果を発表正義よりもパフォーマンスに関心があり、この曖昧さは特に不快です。


本物の人たち

ミストラルAIは、オープンソースの大規模言語モデル、特に Mistral 7B と Mixtral 8x7B で認知を得ています。同社は、オープン ソフトウェア コミュニティによるレビュー、変更、再利用を奨励し、自社の AI モデルへの幅広いアクセスを確保するよう努めています。


vLLM 「ベクトル化された低遅延モデル サービング」の略で、大規模言語モデル (LLM) の高速化と最適化を目的として特別に設計されたオープンソース ライブラリです。これは、LLM のパフォーマンスと使いやすさを大幅に向上させる強力なツールです。そのため、チャットボットや仮想アシスタントからコンテンツ作成やコード生成まで、さまざまな AI アプリケーションに取り組む開発者にとって貴重な資産となります。そのため、Mistral では、7B および 8x7B モデルの推論サーバーとして vLLM を使用することを推奨しています。


エレウザーAIは、GPT-3 について議論するための Discord サーバーから、主要な非営利研究組織に成長した非営利の AI 研究機関です。このグループは、自然言語処理におけるオープン サイエンス規範のトレーニングと促進に取り組んでいることで知られています。彼らはさまざまなオープンソースの大規模言語モデルをリリースしており、AI の調整と解釈可能性に関連する研究プロジェクトに携わっています。彼らのLMハーネスプロジェクトは、おそらく言語モデルの主要なオープンソース評価ツールです。


ファイ-2は、その重量を超えた機能を備えた Microsoft の LLM です。合成テキストとフィルタリングされた Web サイトを組み合わせてトレーニングされたこの小規模ながら強力なモデルは、質問応答、要約、翻訳などのタスクに優れています。 Phi-2 を真に際立たせているのは、推論と言語理解に重点を置いていることであり、高度な調整技術がなくても優れたパフォーマンスを実現します。


多くの有能なオープンソース埋め込みモデルは、オープンソースの生成 AI 空間全体を強化しています。これらはオープンソースの現在の最先端のものであり、次のものが含まれます。 UAE-大-V1そして多言語-e5-largel


この成長を続ける分野には、さらに多くのものが存在します。この限定されたリストはほんの始まりにすぎません。


オープンソースがイノベーションを推進

極端なオープン イノベーションの哲学を受け入れ、オープンソース ソフトウェア開発に真に参加する企業は、次のことを認識することで、競争上の優位性に関する従来の概念に挑戦します。 すべての優れたコードや優れたアイデアが組織内に存在するわけではありません。この変化は、口論オープンソース エコシステム内でイノベーションを共有することで市場の成長が加速し、研究開発資金が限られている小規模なソフトウェア会社にも提供できるというものです。利益を得る機会オープンソース ソフトウェアに存在する研究開発の波及効果によるものです。なぜなら、従来のアウトソーシングとは対照的に、オープンイノベーションは内部リソースを強化します社内の研究開発努力を減らすことなく、コミュニティの集合知を活用することによって。つまり、オープンソース ソフトウェア企業は、組織外でソート リーダーシップとコードを追求するために予算を犠牲にする必要がありません。


さらに、オープンソース ソフトウェア企業は、次のような方法で戦略的にイノベーションを推進しています。 コードを早期かつ頻繁にリリースする、ソフトウェアコミュニティにおけるイノベーションプロセスの累積的な性質を認識しています。これらすべては、多くの人がすでに認識していることを言います: オープンソース ソフトウェアはイノベーションを推進します。


オープンソースがコラボレーションを促進

を通してネットワーキングオープンソース ソフトウェア コミュニティでは、起業家は短期と長期の両方の目標を達成できます。短期的な利益目標は企業を築き、長期的な利益目標は企業を維持します。同時に、このネットワーキングの取り組みはネットワーク自体を永続させ、次の起業家のためにネットワークを成長させます。オープンソース プラットフォームではソース コードへのアクセスが提供され、開発者がアップグレード、プラグイン、その他のソフトウェアを作成し、要件に応じて使用できることはよく知られています。この特定の種類のコラボレーションは、広範なソフトウェア コミュニティで Kubernetes が広く採用され、ブームを巻き起こしました。最新のテクノロジーはこれまで以上にほとんど摩擦なく連携し、ほぼどこでも数分で連携できるようになりました。


ビッグテック企業は、社内ツールの保守と開発のために作成したフレームワーク、ライブラリ、言語を自由にリリースする際に、オープンソース コミュニティに固有のこの緊密なコラボレーションを認識しています。そうすることで、製品に取り組むことができる開発者のプールが深まり、同様のテクノロジーがどのように動作するかについての標準を設定し始めます。同じ Atlantic の記事では、Meta の創設者である Mark Zuckerberg 氏の言葉を引用しており、「現在、業界の優秀な開発者全員が、私たちも社内で使用しているツールを使用しているため、これを提供することは私たちにとって非常に価値がある」と述べています。


オープンソースがオープンソースの始まり

これらは、オープンソース企業間の相乗効果が頻繁に見られる理由です。オープンソースの AI および ML 企業は、当然のことながら、オブジェクト ストレージなどの基礎製品からスタックに至るまでの視覚化ツールに至るまで、他のオープンソース製品を使用してソリューションを開発することになります。 1 つのオープンソース企業が前進すれば、私たち全員が前進します。この総合的で混合されたアプローチは、おそらく人間中心のアプローチをとる AI を開発するための最善の策です。オープンソース AI に対する市場のニーズに内在するこれらの自然の力が、イノベーションとコラボレーションというオープンソース ソフトウェアの特性と組み合わされて、AI データ スタックのオープンソース化を推進します。


下記宛にメールを送信して、この会話やコミュニティに参加し、貢献してください。 [email protected]または、 Slack チャネルでメッセージを送信してください。


ここでも公開されています。