ChatGPT、MidJourney、Synthesia、Runway ML、その他の AI ツールのいずれであっても、プロンプトに関しては、できるだけ正確であることが鍵となることを何度も聞いたことがあるでしょう。正確さへの第一歩は詳細です。私たちが知っているように、AI は心を読むことはできません。AI はユーザーが提供する情報のみに基づいて機能します。明確で詳細な入力によってのみ、最高の結果を得ることができます。
この原則は、正確な画像を生成するときにも当てはまります。ただし、この場合、プロンプトを出すときは、写真家、デザイナー、ライターのように同時に考える必要があります。
この記事では、Google の AI Test Kitchen ImageFX で正確な結果を得るために効果的なプロンプトを作成する方法について説明します。
精度は、特に画像を生成するときに、欠陥のある結果と完璧に実行された出力の違いを意味する場合があります。テキスト プロンプトは漠然とした概要を提供するかもしれませんが、構造化されていない画像プロンプトは結果に大きく影響する可能性があります。私のように、白人以外のユーザー向けに作成する場合は、非常に正確にする必要があります。漠然としたプロンプトでは、一般的で使用できない結果が生成される可能性が高くなります。ただし、正しく実行された場合、ImageFX はニーズに合わせて調整された地域固有の出力を生成するのに優れています。
画像プロンプトを作成するときは、次の 3 つの重要な要素を念頭に置いてください。
1. あなたの主題は誰ですか?
「コーヒーショップにいる女性」のイメージを概念化しているとします。この場合、女性が主題です。対象者と意図に応じて、主題を明確に定義することが重要です。
両方のプロンプトの違いを確認してください。
プロンプト 1: コーヒーショップにいる女性。
プロンプト 2: コーヒーショップに座っているふくよかなナイジェリア人女性。
2. 詳しく記述する
言い換えれば、 「ショーの仕組み」です。登場人物はどのような行動を取っていますか? 時間帯はいつですか? 雰囲気はどのようなものですか? 設定、登場人物の服装、副次的な主題、全体的な雰囲気を説明してください。
例:
ふくよかなナイジェリア人女性がコーヒーショップに座ってコーヒーをすすっています。テーブルの上には本と iPhone があり、彼女の横にはポメラニアンが座っています。
3. 構成とスタイルを具体的にする
ここでは、デザイナーのように考える必要があります。レイアウトとスタイルを検討します。アニメーション スタイルが必要ですか? そうであれば、どのような種類ですか? アニメーションにしますか? そうであれば、どのような種類のアニメーションにしますか? 従来のアニメーション (2D、手描きアニメーション) または 3D アニメーション (CGI) ですか? 幸いなことに、好きなアニメーションの特定のスタイルを採用したい場合は、ImageFX を使用すると、さまざまなアニメーション スタイルを試すことができます。
プロンプト
ふくよかなナイジェリア人女性がコーヒーショップに座ってコーヒーをすすっています。テーブルの上には本と iPhone があり、彼女の横にはポメラニアンが座っています。すべてピクサーのアニメ風です。
ふくよかなナイジェリア人女性がコーヒーショップに座ってコーヒーをすすっています。テーブルの上には本と iPhone があり、彼女の横にはポメラニアンが座っています。これらはすべてシンプソンのアニメ風です。
写真家の心構えを理解するには、撮影の角度、照明、焦点を考慮する必要があります。
さまざまな角度からのプロンプト:
ふくよかなナイジェリア人女性がコーヒーカップを口元に持ち上げ、ゆっくりと一口飲んでいるところをクローズアップで撮影。彼女の表情はリラックスしている。彼女の前のテーブルには、iPhone の横に本が開かれており、一部が見える。ポメラニアンが彼女の横に静かに座り、フレームの中を覗いている。
ふくよかなナイジェリア人女性の後ろから肩越しに撮影した写真。彼女の視点からその光景をとらえている。テーブルの上には開いた本があり、その横には彼女の iPhone が置かれている。ポメラニアン犬が彼女の隣に座り、背景にはコーヒーショップの雰囲気が見える。
コーヒーショップのシーン全体を映した広角ショット。ふくよかなナイジェリア人女性がテーブルに座ってコーヒーをすすり、目の前には本と iPhone が置いてあります。ポメラニアンが彼女の横に座り、落ち着いた様子です。カフェの設定には、柔らかな照明、他の客、温かい雰囲気が含まれています。
テーブルの真上からの鳥瞰図には、テーブルの上に開かれた本、iPhone、コーヒーカップがあり、シーン全体が写っています。ポメラニアンが、コーヒーをすするふくよかなナイジェリア人女性の横に座っており、上空から撮影された穏やかで満足なひとときを作り出しています。
横からのミディアムショット。ふくよかなナイジェリア人女性がコーヒーショップでくつろぎながらコーヒーを飲んでいる。テーブルには開いた本と iPhone が置かれ、隣にはポメラニアンが座って周囲を静かに見守っている。コーヒーショップの温かみのある照明が雰囲気を盛り上げている。
テーブルに座り、コーヒーをすすりながら、目の前に本を開き、近くに iPhone を置いている、ふくよかなナイジェリア人女性の横顔ショット。ポメラニアンが彼女の横に座って、彼女の方を見ているか、または前を見つめている。コーヒーショップの内装が、柔らかく居心地の良い背景となっている。
女性の隣の椅子に座り、穏やかで満足そうな表情を浮かべるポメラニアンのクローズアップ写真。ぼやけた背景には、テーブルの上に本と iPhone を置き、コーヒーをすするふくよかなナイジェリア人女性が写っている。
ふくよかなナイジェリア人女性がコーヒーカップを持ち、それを持ち上げて一口飲む様子を、頭上から撮影した写真。テーブルの上には開いた本が置かれ、その横には iPhone が置かれており、テーブルの配置を上から見下ろしたような光景が広がっている。彼女の横にポメラニアンが座っていて、このシーンを完璧に演出している。
クエリ: 「私はナイジェリア人で、ナイジェリアの視聴者向けに作品を作成していますが、詳細が一部間違っています。」 回答: AI は心を読むことはできません。より正確な結果を得るには、記述を調整する必要があります。
例:
プロンプト 2:黄色のダンフォバス (フォルクスワーゲン T3) の前に、ショートパンツとタンクトップ姿のナイジェリア人ラゴスの車掌が立っています。
効果的なプロンプトを作成するために多作なライターである必要はありませんが、自分が望むものを明確かつ説明的に概説するために時間をかける必要があります。最初の試みで結果が完璧でなくても落胆しないでください。必要に応じてキーワードを追加または削除して実験を続けてください。
それでは、ImageFX を使用して概念化したこれらの画像を皆さんに紹介します。お楽しみください。