2022 年 11 月に ChatGPT が導入され、新しい Generative AI の巨大企業である OpenAI が登場しました。チャットボットの最初のバージョンは、GPT-3.5 と呼ばれる大規模な言語モデルに依存していました。しかし、ChatGPT の最初のローンチから 4 か月後の 2023 年 3 月 14 日火曜日に、OpenAI は以前のバージョンよりも高性能なモデルである GPT-4 のリリースで状況を改善しています。当初は GPT-3.5 に対応するように設計されていたチャットボットは、現在 GPT-4 と対話するための媒体として機能しています。
GPT-3.5 でできることは同じですが、それ以上です。同社はブログ投稿で次のように述べています。
「GPT-4 は、GPT-3.5 よりも信頼性が高く、創造的であり、はるかに微妙な指示を処理できます。」
2018 年以来、OpenAI は GPT 言語モデルを広めてきましたが、Open AI のすべての巨大な言語モデルの中で、GPT-4 は最新であるだけでなく、最も強力でもあります。 OpenAI は、Microsoft Azure を使用してモデルをトレーニングしたと報告しました。 GPT-4 と GPT-3.5 を比較するいくつかの方法を次に示します。
GPT-4 は視覚入力を受け入れますが、GPT-3.5 は受け入れません。
GPT-4 が OpenAI で指定されているように「マルチモーダル」であり、情報の多くの「モダリティ」を理解できることを考えると、GPT-3.5 が基本的にテキストを読み書きできたのに対し、視覚的手がかりとテキストの手がかりの両方によってコンテンツを作成するように促すことができます。 .それにもかかわらず、同社は画像記述機能をすぐに展開するわけではなく、GPT-4 バージョンは OpenAI の ChatGPT Plus ユーザーと開発者のサブスクライバーのみが利用でき、テキストのみをサポートします.
GPT-3.5 と比較して、GPT-4 はより大きなバッファを持っています。
簡単に言えば、GPT-4 は以前のモデルよりも長いメモリを持っています。 GPT-3.5 と ChatGPT の以前のイテレーションでは、最大は 4,096 "トークン"、つまり約 8,000 ワードでしたが、GPT-4 の最大トークン数は 32,768、つまり約 64,000 ワードでした。これは、8 倍のメモリ容量です。
GPT-4 にはさまざまな「ペルソナ」があります。 GPT-3.5とは異なり、または操縦性
操縦性とは、言語モデルの出力を特定の方向またはスタイルに制御または影響を与える能力を指します。つまり、ユーザーは言語モデルをガイドして、特定のトーン、スタイル、またはトピックに適合するテキストを生成できます。 GPT-3 には操縦性機能が組み込まれていませんが、GPT-4 には組み込まれています。 GPT-4 では、開発者と ChatGPT ユーザーは、「システム」メッセージでそのような指示を与えることにより、AI のスタイルとタスクを指定できます。従来の ChatGPT パーソナリティは定義された冗長性、トーン、およびスタイルとは対照的です。同社は、この機能は現在開発者のみがアクセスできると述べていますが、ChatGPT ユーザーもすぐに利用できるようになる予定です.
GPT-4 はより広い言語範囲を持っています。
これは、GPT-4 が以前の GPT-3.5 よりも幅広い言語でテキストを理解し、生成できることを意味します。これは、自然言語処理の分野における大きな進歩です。 OpenAI によると、GPT-4 は、テストした 26 の言語のうち 24 で、GPT-3.5 および他の LLM の英語のパフォーマンスを上回っています。その結果、GPT-4 は 26 の異なる言語で多数の多肢選択問題に正確に応答できます。
GPT-4は、事実に関する「幻覚」が少ない
幻覚を完全に止めるわけではありませんが、GPT-4 は以前の亜種と比較して幻覚を大幅に軽減します。ただし、注意点があります。GPT-4 はまだ完全に信頼できるわけではありません。同社によると、更新された言語モデルは、GPT-3.5 ほどではないが、事実を「幻覚」にし、論理の欠陥を示し続けているという。言語モデル ソフトウェアのコンテキストにおける幻覚とは、一貫性があり意味があるように見えるが、実際には入力データによってサポートされていないテキストの生成を指します。これは、言語モデルが生成するテキストが文脈に基づいていないか、入力テキストのセマンティックな意味と一致しない場合に発生する可能性があります。
言い換えれば、言語モデルは、トレーニングされた情報に基づいて、正確ではない、またはもっともらしくないテキストを生成する場合があり、その結果、一般に「幻覚」と呼ばれるものが発生します。このモデルには、上記の制限に加えて、社会的バイアスと敵対的プロンプトも組み込まれています。 OpenAI のブログ投稿には、次のように記載されています。
「GPT-4 は、内部の敵対的事実性評価で最新の GPT-3.5 よりも 40% 高いスコアを獲得しました。」
The Washington Post によると、 LLM は、インターネットのテキストとビジュアルに関するトレーニングの結果として、人種、性別、宗教、階級に対する人間の偏見を模倣することを学びました。
GPT-4 には、GPT-3.5 に見られるものと同様の追加の制限もあります。その 1 つは、2021 年 9 月以降に発生したイベントに関する知識がまだ不足していることです。その経験から学ばない。いずれにせよ、GPT-4 はさらにスマートです。より正確で、より正確で、より優れた専門知識を持っているためです。
言語モデルは、試験に合格できることも示しています。 OpenAI によると、模擬司法試験で 90 パーセンタイル、SAT 読解テストで 93 パーセンタイル、SAT 数学テストで 89 パーセンタイルを獲得しました。
GPT-4 は、自然言語の理解と生成を必要とする幅広いアプリケーションで使用できる可能性があります。言語学習ソフトウェアの Duolingo、決済プロバイダーの Stripe、オンライン学習プラットフォームの Khan Academy、金融サービス会社の Morgan Stanley などは、OpenAI の声明で言及されている、現在新しいモデルを使用している企業の 1 つです。
Microsoft はまた、同社のチャットボットである BingAI が、モデルの公開前からずっと GPT-4 を使用していると報告しました。
「新しい Bing が検索用にカスタマイズした GPT-4 で実行されていることを確認できてうれしく思います。過去 5 週間で新しい Bing プレビューをいつでも使用したことがある場合は、すでに早い段階でこの強力なモデルのバージョン。
マイクロソフトのコーポレート バイス プレジデント兼消費者向け最高マーケティング責任者のユスフ メディ (Yusuf Mehdi) 氏は、 声明の中で次のように述べています。
OpenAIによると、GPT-4は「高度な推論、複雑な指示の理解、およびより多くの創造性を必要とするタスクに優れています」.
ユーザーは、GPT-4 がリリースされてから短期間でさまざまな独創的な方法で使用したと報告しています。
この新しいツールの可能性は無限であると信じられています。
\基本的にChatGPTにアクセスするには、まずOpenAIに登録する必要があります
Microsoft は、新しい Bing が新しいモデルの GPT で動作することを確認しているため、何百万もの Bing ユーザーがチャットボットを通じて既に Bing にアクセスできることは明らかです。
新しいモデルは API 経由でもアクセスできます。同社は、GPT-4 のゆっくりとしたロールアウト中に OpenAI Evals に優れたモデル評価を与える開発者の API アクセスを優先して、すべての人のためにモデルを強化する方法を学習していると述べています。