長すぎる; 読むには
この新しいモデルの目的は、dalle のようにユーザーがテキスト プロンプトに従ってランダムな画像を生成できるようにすることではありません。代わりに、Meta は、このテキストから画像へのトレンドを以前のスケッチから画像へのモデルと融合させ、創造的な表現を推し進めたいと考えました。これは、テキストとスケッチによって調整された画像生成の間の素晴らしいブレンドである「シーンを作る」につながります。ビデオで詳細をご覧ください... 「Make-a-Scene は「単なる別の Dalle」ではありませんが、世代に対するユーザー コントロールを制限します。