このガイドでは、テキスト プロンプトの操作の基本と、テキスト プロンプトを効果的に利用して思い描いたイメージをレンダリングする方法について説明します。
AI 画像生成のプロンプトは、AI プラットフォームが作成する画像を指示するコマンド (テキストまたはビジュアル) です。通常、テキストと画像の 2 つの異なる画像生成プロンプト タイプがあります。
レンダリングする画像の種類を AI に伝えるには、まずその画像を記述する必要があります。これはテキスト プロンプトで行われます。テキスト プロンプトは単語のリストであり、場合によっては文法的に正しい文章であり、AI が何をレンダリングする必要があるかを説明します。
強調表示されたテキスト ボックスは、使用されるテキスト プロンプトの例です。
テキストだけでは不十分な場合は、画像を AI 画像ジェネレーターにアップロードし、それを参照して他の画像を作成することができます。使用している AI プラットフォームの種類と必要な結果の種類によっては、画像プロンプトを使用する方がテキストよりも効果的です。
たとえば、DALL.E の Outpainting AI は、既存の画像を取得して、その続きをレンダリングできます。上の画像は、有名なヨハネス フェルメールの絵画「真珠の耳飾りの少女」の続きであると AI が信じていることを示しています。
絵画の元のイメージは正方形の中にあり、それを囲むすべてが DALL.E によってレンダリングされました。
現在市場に出回っている AI 画像ジェネレーターのほとんどは、画像プロンプトのいくつかのオプションを備えたテキストベースですが、両方のプロンプトを組み合わせて目的の画像をレンダリングする方法があります。
覚えておく必要がある非常に重要な詳細の 1 つは、特定の AI 画像ジェネレーターが何を専門としており、それを効果的に使用するかを理解することです。 Dall-E シリーズなどの一部の AI 画像ジェネレーターは、フォトリアリズムを模倣した画像のレンダリングに非常に優れています。
一方、デジタル アートやイラスト形式で非常に効果的であることでよく知られている Midjourney があります。
当社独自の Let's Enhance Image Generator は、写真のようにリアルな画像、イラスト、および 3D モデルのレンダリングに加えて、製品画像の視覚的な美しさをシミュレートするのに優れています。
ほとんどの AI 画像ジェネレーターでは、テキスト プロンプトに文字数制限がありますが、文字数制限はありません。これは、テキスト プロンプトを自由に構成できることを意味します。
ただし、現時点では、AI がレンダリングする適切なテキスト プロンプトを作成するには 3 ~ 7 語が必要であるというのがコンセンサスのようです。
上記の例のテキスト プロンプトのレンダリング イメージを次に示します。 「ワイド ショット」プロンプトは、左側の列の画像に大きな影響を与えました。
この規則に厳密に従う必要はなく、3 つ未満または 7 つを超える単語を使用することが許可されています。しかし、以下の例でわかるように、重要なのは単語の数ではなく、どの単語を使用するかです。
AI 画像のレンダリングには、何らかの主題が必要です。これは、テキスト プロンプトに最初に書き込む必要があります (ほとんどの場合)。テキスト プロンプトに 1 つの件名を残すだけで、AI にもう少し一般的な内容を生成させることができます。
ただし、ほとんどの場合、レンダリングしようとしているものにできるだけ近い画像を生成するには、より説明的なテキスト プロンプトが必要になります。
件名は通常名詞であるため、使用している AI に関係なく、テキスト プロンプトを開始するのに最適な場所は、1 つから開始することです。
レンダリングされた画像にもう少しニュアンスを追加し、AI が参照として使用する画像を絞り込むのを助けるために、説明を利用する必要があります。これらは形容詞であり、通常の文で使用するのと同じように、主題を説明します。
AI 画像生成で形容詞を使用する際の秘訣は、形容詞のいくつかを組み合わせて、画像に深みと複雑さを追加できることです。
主題を説明する形容詞とは別に、説明のもう 1 つの要素は、次のような質問に答える詳細です。
背景は効果的な説明において重要な役割を果たすため、この最後の質問は非常に重要です。以下は、まったく異なる結果をもたらす 2 つの類似したテキスト プロンプトの例です。左側の画像のテキスト プロンプトは、 Raccoon readingでした。
ただし、右の画像のテキスト プロンプトはもう少し詳細です。したがって、画像がより鮮明で複雑になった理由は次のとおりです。アライグマが図書館の写真で本を読んでいます。
結果からわかるように、いくつかの質問に答えたところ、AI は探しているものを絞り込み、探しているものにできるだけ近いものをレンダリングすることができました。 AI は、より詳細で異常の少ない画像を生成することができました。
AI 画像ジェネレーターがより詳細な画像プロンプトでどのように機能するかを示す別の良い例を次に示します。
この生成されたフィンチの画像は、記述子を追加しなくても、AI が一般的でありながら非常に正確な画像をレンダリングできることを示しています。
ただし、右側のレンダリングは、AI イメージ ジェネレーター (この場合は Stable Diffusion) がより多くの要素を処理して、非常に複雑なビジュアルをレンダリングする方法を示しています。
テキスト プロンプトを完成させるには、さらにいくつかのテキスト プロンプトを追加する必要があります。これにより、レンダリングされたイメージに最後の仕上げが行われます。上記のテキストプロンプトの最後に、「写真」や「クローズアップ」などの単語があったことに注目してください。
プロンプトの最後の言葉は、画像の全体的な美学とスタイルを決定するものです。
「写真」の代わりに、「油絵」、「フレスコ画」、または「3D レンダリング」を使用することもできます。イメージのスタイルを決定するために、印象派、ゴシック、スチームパンクなどの芸術運動を使用することもできます.
また、有名なアーティストの作品を複製したい場合は、1 つまたは複数の有名な名前をテキスト プロンプトに入力することもできます。 AI は、さまざまな有名アーティストからの影響を組み合わせて、それらすべての要素をブレンドしたものを作成します。
最後に、画像のフレーミングも指定できます。写真で行うのと同じように、「クローズアップ」や「ミディアムショット」などのプロンプトは、画像をどの角度から、どの距離から提示したいかを AI が理解するのに役立ちます。
これは、ハンドヘルド コンピューター デバイスの Lexica によって生成された 2 つの画像の例です。左側のプロンプトは単純ですが、古い学校の LCD ディスプレイを複製するビンテージ デバイスを生成することができました。
ただし、右側のレンダリングは、「vaporwave 美学」や「製品写真」などのプロンプトのおかげで、ネオンの色からわかるように、より明確な視覚的美学とスタイルを持っています.
経験ほど効果的な AI プロンプトを作成する方法を教えてくれるヒントやコツはありません。 AI 画像ジェネレーターの最も優れた点は、非常にアクセスしやすいことです。必要なのはインターネット接続だけで、利用可能な多くの無料プラットフォームから選択できます。
そこで、AI 画像プロンプトを試して、画像生成の台頭分野でどのような新しく魅力的なものを発見できるかを確認してください。