生成人工知能 (Generative AI)、ChatGPT、安定拡散、MobileGPT に興味がある場合は、この記事をお読みください。
この記事では、プロンプトの技術、つまりプロンプト エンジニアリングについて説明します。このストーリーが終わるまでに、あなたは生成 AI のプロンプト生成の達人になるでしょう。テキスト生成プロンプトと画像生成プロンプトの両方について説明します。
この記事は、使用している GenerativeAI ツールから得られる出力を最大化したい場合に役立ちます。
プロンプト エンジニアリングは、最も基本的なレベルでは、人工知能 (AI) モデルの出力を導くために使用される入力または「プロンプト」を設計、作成、改良するプロセスです。
この用語は、OpenAI (GPT-3 および GPT-4) または他の同様のテクノロジによって開発されたモデルなどの生成 AI モデルを扱う場合に特に関連します。
誰かに、これまでにやったことのないタスクを実行するように指示していると想像してください。指示の明確さと具体性は、最終結果に大きな影響を与えます。同様に、AI の場合も、プロンプトを組み立てる方法が AI の応答に大きく影響する可能性があります。
例を学ぶこと以上に良い方法はありません。これらの概念を実証するために、WhatsApp でMobileGPT - GenerativeAI を使用します。
プロンプトの例:
スピーチを書く
これは MobileGPT から返される応答です。この命令は AI が理解するには曖昧すぎるため、より明確な質問が返されることもあります。
少なくとも、トピックまたは主題を提供する必要があります。ここで、プロンプトの基本について説明します。形式とトピックの両方を指定する必要があります。
形式: これは AI が返すか送信する必要があるもので、プロンプトの基礎となります。たとえば、箇条書き、正式な手紙、スピーチ、または会話の形式でテキストを生成するように AI に依頼しますか?
件名: あなたのフォーマットは何ですか? AI が返すコンテンツの基礎となるコンテンツの件名、トピック、またはタイトル。
この例では、次のように言えます。
「盗作の危険性」についてスピーチを書く
タイトルまたは件名:盗作の危険性
生成 AI は非常にインテリジェントでよく訓練されているため、形式と件名だけで本当に優れたコンテンツを生成するのに十分です。
ただし、これをもう少し改良したいので、このスピーチを希望どおりにカスタマイズする変数をさらにいくつか導入します。
検討:
トーンとは、AI が生成するコンテンツによって伝えられる一般的な性格、態度、または感情を指します。それは、出力で使用される言語を通じて表現される全体的な感情や雰囲気です。
トーンは、AI がその応答でどのように「聞こえる」べきかについての指示であると考えることができます。
視聴者とは、 AI が生成したコンテンツの対象となる受信者または消費者を指します。基本的に、コンテンツがリーチしたり影響を与えたりするように設計された人々のグループです。
GenerativeAI では聴衆を明確にすることが非常に重要です。たとえ主題が同じであっても、幼稚園のクラスにスピーチを行うことは、ハーバード大学の卒業生のクラスと同じではありません。
目的とは、AI が生成したコンテンツの意図された目的または目標を指します。それは本質的に、AI が生成するコンテンツで達成することを目指すものです。目的を定義すると、AI がコンテンツに関連する論点を選択しやすくなります。
プロンプトで「Act As」を定義することは、コンテンツの生成中に特定の役割、視点、またはペルソナを引き受けるよう AI に指示する方法です。これは、AI の出力のトーン、スタイル、言語、および全体的な性質に大きな影響を与える可能性があります。
ほとんどの場合、これらすべての変数を 1 つのプロンプトで定義する必要はありません。たとえば、「講師として行動する」と言う場合、ペルソナには文脈と口調が伴うため、口調を定義する必要はないかもしれません。
これらをテストしてプロンプトを改良してみましょう。
バリエーション 1:
オプラ・ウィンフリーが高校卒業生に向けて行う「盗作の危険性」についてのスピーチを書く
バリエーション 2:
未就学児に盗作の危険性を納得させるために、ユーモアを交えて「盗作の危険性」に関するスピーチを書きます。
聴衆を変えるとまったく異なるスピーチになり、口調を指定することは AI がコンテンツの構成方法を理解するのに役立ちます。そして最も重要なことは、目的を定義することで AI にコンテンツが達成すべき内容の仕様を与えることです。
私は概要リファレンス ガイドを作成し、ダウンロードして共有し、疑問がある場合はチート シートを参照してください。
しかし、待ってください - それだけではありません。 (1) 背景情報、(2) キーワード、(3) 単語数、(4) ガイドライン、(5) 概要などの変数をさらに指定することで、Generative AI から取得する出力をカスタマイズできます。
あなたはスピーチをしているが、AI に文脈についてもっと知ってもらいたいとします。背景情報をいくつか与えることができます。たとえば、次のように追加できます。「私はこの学校に初めて入学しました。今年は 1 年目で、クラスを首席で卒業しました。私はこの学校に入学しました。」このスピーチでは謙虚な姿勢を示したいと思います。」
MobileGPT 応答を要求する GPT3 および GPT4 エンジンは、一般的にキーワードに関する指示を無視するのが好きですが、特にブログやソーシャル メディアのコンテンツを作成する場合は、キーワードを含めるのが大好きです。
通常、生成されるコンテンツに含まれる必要がある重要な用語や単語を指定することが重要です。
これも GPT3 および GPT4 エンジンが無視したい変数ですが、言い方によっては常にそうとは限りません。 「500 単語書いて」と言うよりも、「5 つの段落に 2 つの文を書いてください」と言ったほうがよいかもしれません。
正直なところ、追加変数としての「ガイドライン」だけでも、一般的な応答と適切に設計された AI 出力の違いを意味する可能性があります。ガイドラインは、AI がコンテンツを「どのように」構築するかについての一連の指示のようなものです。
研究レポートを書きたいとして、AI に次のように指示したと想像してください。
ソーシャルメディアがメンタルヘルスに及ぼす影響に関する研究レポートを書きます。
聴衆、トーン、目的を追加することもできますが、おそらく AI にさらなる構造を与える必要があるでしょう。
ここでガイドラインが登場します。私は通常こう言います:
ソーシャルメディアがメンタルヘルスに及ぼす影響に関する研究レポートを書きます。
--開始ガイドライン--
すべての重要なポイントと要点を強調した概要を提供することから始めます。
利点と課題について批判的な方法で議論し、そのトピックについて賛否両論の証拠を提示します。トピックの背景を簡単に説明し、そのトピックに関する文献について議論し、さまざまな学派を紹介します。
このテーマが長年にわたってどのように進化してきたか、また文学や学派がどのように変化したかについて話し合います。最後の方に SWOT 分析を追加し、結果について話し合います。最後に、重要なポイントを要約し、結果を箇条書きで示します。
--ガイドライン終了--
これを MobileGPT でテストしてみましょう。今回は「ロングリサーチレポート」機能を使用します。任意のメッセージからメニューをクリックし、「長期調査レポート」を選択するだけです。
次に、レポートのタイトルを入力します:「ソーシャルメディアがメンタルヘルスに及ぼす影響」
つまり、MobileGPT はバックグラウンドでプロンプト エンジニアリングを処理し、インターネットから実際のデータを収集し、Word 形式でレポートを返します。
データの編集に使用されるリンクも表示されるので、好きな時間にレポートを拡張することができます。
特に、レポート、ブログ、または規定のアウトラインに従う必要があるコンテンツのコンテンツを生成する場合、Generative AI コンテンツのアウトラインを提供すると役立つ場合があります。例としてブログの執筆を使用します。次のような概要を提供できます。
盗作の危険性についてのブログを作成し、そのブログに次の小見出しを含めます。 (1) はじめに - ブログの目的について話し合います。 (2) 利点 - 盗作の利点について話し合います。 (3) 盗作の課題について話し合います。 (4) 結論 - 説得力のある結論を書きます。
AI 画像の生成は、覚えなければならない事柄や変数が少ないため、より簡単になる可能性があります。テキスト生成の場合と同様に、単純なプロンプトから始めて、より詳細に複雑さを高めて出力を調整し、AI から取得するものをカスタマイズします。
次のプロンプトを使用して作業します。
犬の画像を生成する
幸いなことに、MobileGPT でもこれを行うことができます。メニューから [イメージ生成] を選択し、プロンプトを入力します。
これは私が欲しかった犬ではありません。画像の生成に関しては、本当にアーティストのように考える必要があります。この犬がどんな種類の犬で、何をしているのか、そしてどこにいるのかを視覚化し始めます。
主題を詳細に定義します。
被験者が何をしているのかを定義する
背景画像を詳細に定義します。
これをもう一度試してみましょう:
青い空と高い木々に囲まれた家の前の歩道を走る白いチワワの画像を生成します。
画像はかなり良くなりましたが、それだけではありません。画像タイプの追加を検討してください。次から選択できます。
画像生成を行うときに見落とされがちな変数は設定です。これは通常、画像の種類と連動しており、画像の主題によって異なります。
たとえば、モデルが写真撮影などのスタジオ環境にいるのは理にかなっていて、鳥が森などの自然環境にいるのは理にかなっています。
ここではいくつかの例を示します。
AI 画像生成テクノロジーは、複雑な照明やテクスチャの詳細を備えた幅広い背景や設定を作成できるところまで進歩しました。
具体的な機能は、特定の AI モデルとそのトレーニング データによって異なる場合がありますが、作成できる背景と設定の種類の例をいくつか示します。
スタジオ設定: これには、制御されたプロ仕様の照明を備えた基本的な背景 (白、黒、または特定の色など) が含まれる場合があります。小道具やモデルも含めることができ、AI がスタジオの照明条件に合わせて外観を調整します。
自然環境: これらには、森林、山、ビーチ、砂漠、海、その他の風景が含まれます。照明条件は、明るい太陽光から夕日の柔らかな色合い、月夜の涼しい色調までさまざまです。
都市環境: 高層ビル、交通量の多い通り、公園、郊外地区などの都市景観がすべて可能です。ここでも、照明条件を変更して、さまざまな時間帯や気象条件をシミュレートできます。
屋内シーン: 家のインテリア、オフィス、レストラン、学校、美術館、またはその他のタイプの屋内環境が考えられます。照明は、テーブルランプの暖かい光やオフィスの明るい蛍光灯など、一般的な室内条件に合わせて調整できます。
歴史的または架空の設定: AI のトレーニング データによっては、歴史的設定 (中世の村や 1920 年代の街路など) または本、映画、ゲームから架空の環境の画像を生成できる場合があります。
抽象的な背景: AI は、さまざまな色、形、パターンを使用して、純粋に抽象的または芸術的な背景を生成できます。
今学んだことを応用して、雑誌の表紙にぴったりの未来的な車を作成してみましょう。
完璧な色と車の金属表面に輝く光を使用して、スタジオ設定で未来の BMW 電気自動車の写実的なイメージを生成します。
そして、これは私の最初の試みにすぎませんでした。車の位置やさまざまなカメラ角度などを追加して、プロンプトを調整できます。
何かを学んだことを願っています。こちらからお気軽に MobileGPT をチェックしてください: https://mobile-gpt.io/これを WhatsApp エクスペリエンスに追加して、プロンプト マスターになりましょう。