see more

無修正の AI モデルを使用し、データでトレーニングする方法に@jeferson

30,947 測定値

30,947 測定値

無修正の AI モデルを使用し、データでトレーニングする方法

に Jeferson Borba3m2023/12/25

Read on Terminal Reader

JA

長すぎる; 読むには

Mistral はフランスのスタートアップで、元 Meta と DeepMind の研究者によって設立されました。 Apache 2.0 ライセンスに基づいて、このモデルは LLaMA 2 や ChatGPT 3.5 よりも強力であると主張していますが、そのすべてが完全なオープンソースです。私たちはそれを無修正で使用する方法を学び、データを使用してトレーニングする方法を発見するつもりです。

featured image - 無修正の AI モデルを使用し、データでトレーニングする方法

‘synth human releasing itself from cables in a dystopian red room’ Image created by HackerNoon AI Image Generator

ChatGPT が AI 業界で唯一のソリューションだった時代は遠い昔になりました。 Meta と Google がそれぞれ開発した LLaMA や Gemini などの新しいプレーヤーがこの分野に参入しました。ツールや実装は異なりますが、クローズドソース (LLaMA の一部を除く) であり、大手テクノロジー企業の管理下にあるという共通点があります。

この記事では、ChatGPT 3.5 よりも優れたパフォーマンスを誇り、ローカルで実行できるオープンソースツールを誇る、AI 業界の新たな競争相手について考察します。また、それを無修正で使用する方法と、独自のデータを使用してトレーニングする方法についても学びます。

ミストラル 8x7B の紹介

Mistral は、Meta と DeepMind の元研究者によって設立されたフランスのスタートアップです。広範な知識と経験を活用して、彼らは 4 億 1,500 万米ドルの投資調達に成功し、ミストラルの評価額は 20 億米ドルになりました。

ミストラルのチームは、X 上に新しいモデルであるミストラル 8x7B へのトレントリンクをドロップしたときから注目を集め始めました。 Apache 2.0 ライセンスによると、このモデルは LLaMA 2 や ChatGPT 3.5 よりも強力であるだけでなく、完全にオープンソースでもあります。

ミストラルの力と能力

32k トークンのコンテキストを処理します。

英語、ドイツ語、スペイン語、イタリア語、フランス語で機能します。

コード生成時に優れたパフォーマンスを発揮します。

指示に従うモデルに変換できます。

テストでは、Mistral は顕著なパワーを実証し、ほとんどのベンチマークで LLaMA 2 70B を上回り、他のベンチマークでも ChatGPT 3.5 と同等かそれを上回りました。

ミストラルをローカルで実行する

図や表を超えて、実践的に始めてみましょう。まず、ローカルでの実行に役立つツールOllamaが必要です。 MacOS ユーザーはここからファイルをダウンロードできます。 Linux または WSL ユーザーの場合は、次のコマンドをターミナルに貼り付けます。

 curl https://ollama.ai/install.sh | sh

その後、LLM をローカルで実行できますが、単に AI がランダムな質問に答えることを目指しているわけではありません。それが ChatGPT の目的です。私たちは、好みに応じて微調整できる無修正の AI を目指しています。

これを考慮して、すべての制約を解除した Mistral のカスタムバージョンである dolphin-mistral を使用します。 dolphin-mistral がこれらの制約をどのように削除したかについて詳しくは、作成者によるこの記事をご覧ください。

ターミナルで次のコマンドを実行して、コンピューター上で Ollama の実行を開始します。

 ollama serve

次に、別のターミナルで次を実行します。

 ollama run dolphin-mistral:latest

初回ダウンロードには 26GB のダウンロードが必要なため、時間がかかる場合があります。ダウンロードが完了すると、mistral は入力を待ちます。

dolphin-mistral を実行するには、大量のシステムリソース、特に RAM が必要であることに注意してください。

独自のモデルをトレーニングする

ここで、データを使用してミストラルをトレーニングできる可能性について疑問に思っているかもしれません。答えは大きくイエスです。

まず、Hugging Face でアカウントを作成し (まだお持ちでない場合)、新しいスペースを作成します。

Autotrain 用に Docker を選択する

ここから、モデルを選択し、データをアップロードし、トレーニングを開始できます。ハードウェアの需要により、自宅のコンピューターでモデルをトレーニングするのは困難な場合があります。

Hugging Face のようなサービスはコンピューティング能力を (有料で) 提供しますが、プロセスを迅速化するために Amazon Bedrock や Google Vertex AI を検討することもできます。

Bright Data

L O A D I N G
. . . comments & more!

About Author

Jeferson Borba@jeferson

Hackernoon dev, Elixir enthusiast, and video games collector

Read my stories

ラベル

purcat-img

machine-learning #ai #chatgpt #llms #ai-trends #future-of-ai #futurism #hackernoon-top-story #mistral

この記事は...

Read on Terminal Reader

Read this story w/o Javascript

Join HackerNoon

Latest technology trends. Customized Experience. Curated Stories. Publish Your Ideas