Dieser Leitfaden behandelt die Grundlagen der Arbeit mit Textaufforderungen und wie Sie diese effektiv nutzen können, um die Bilder darzustellen, die Sie sich vorgestellt haben.
Eingabeaufforderungen für die KI-Bildgenerierung sind Befehle, entweder in Textform oder visuell, die vorgeben, welches Bild die KI-Plattform erstellt. Typischerweise finden Sie zwei verschiedene Eingabeaufforderungstypen für die Bildgenerierung: Text und Bild.
Um der KI mitzuteilen, welche Art von Bild gerendert werden soll, sollten Sie dieses Bild zunächst beschreiben. Dies geschieht mit einer Textaufforderung, bei der es sich um eine Liste von Wörtern, manchmal sogar um einen grammatikalisch korrekten Satz, handelt, die beschreibt, was die KI rendern soll.
Das hervorgehobene Textfeld ist ein Beispiel für eine Textaufforderung
In manchen Fällen, wenn der Text nicht ausreicht, können Sie Bilder auf einen KI-Bildgenerator hochladen und ihn als Referenz für die Erstellung anderer Bilder verwenden. Abhängig von der Art der KI-Plattform, die Sie verwenden, und der Art der Ergebnisse, die Sie benötigen, kann die Verwendung von Bildaufforderungen sogar noch effektiver sein als die Verwendung von Text.
Beispielsweise kann die Outpainting-KI von DALL.E ein vorhandenes Bild aufnehmen und dessen Fortsetzung rendern. Das Bild oben zeigt, was die KI für die Fortsetzung des berühmten Johannes Vermeer-Gemäldes „Mädchen mit dem Perlenohrring“ hält.
Das Originalbild des Gemäldes befindet sich innerhalb des Platzes und alles, was ihn umgibt, wurde von DALL.E gerendert.
Während die meisten KI-Bildgeneratoren, die Sie heute auf dem Markt finden, textbasiert sind und einige Optionen für Bildaufforderungen bieten, gibt es Möglichkeiten, eine Mischung aus beiden Aufforderungen zu verwenden, um gewünschte Bilder zu rendern.
Ein sehr wichtiges Detail, das Sie beachten müssen, ist zu verstehen, worauf ein bestimmter KI-Bildgenerator spezialisiert ist und wie Sie ihn effektiv nutzen können. Einige KI-Bildgeneratoren wie die Dall-E-Serie sind sehr gut darin, Bilder zu rendern, die den Fotorealismus imitieren.
Auf der anderen Seite gibt es Midjourney, das dafür bekannt ist, in digitalen Kunst- oder Illustrationsformaten sehr effektiv zu sein.
Unser eigener Let's Enhance Image Generator eignet sich hervorragend zum Simulieren der visuellen Ästhetik von Produktbildern und zum Rendern fotorealistischer Bilder, Illustrationen und 3D-Modelle.
Während die meisten KI-Bildgeneratoren eine Zeichenbeschränkung für die Textaufforderungen haben, gibt es keine Wortbeschränkung. Das bedeutet, dass Sie die Freiheit haben, Ihre Textaufforderung nach Ihren Wünschen zu strukturieren.
Derzeit besteht jedoch Einigkeit darüber, dass Sie drei bis sieben Wörter benötigen, um eine erfolgreiche Textaufforderung zu schreiben, die von der KI gerendert werden soll.
Hier sind die gerenderten Bilder der Textaufforderung im obigen Beispiel. Die Eingabeaufforderung „Weitwinkelaufnahme“ hatte erhebliche Auswirkungen auf die Bilder in der linken Spalte.
Sie müssen sich nicht strikt an diese Regel halten und dürfen weniger als 3 oder mehr als 7 Wörter verwenden. Aber wie Sie in den folgenden Beispielen sehen werden, kommt es nicht so sehr auf die Anzahl der Wörter an, sondern darauf, welche Wörter Sie verwenden.
Für jedes KI-Bildrendering ist ein bestimmtes Motiv erforderlich. Dies sollte (in den meisten Fällen) das Erste sein, was Sie in die Textaufforderung schreiben. Es ist möglich, einfach einen einzelnen Betreff in der Textaufforderung zu belassen und die KI etwas Allgemeineres generieren zu lassen.
In den meisten Fällen benötigen Sie jedoch eine aussagekräftigere Textaufforderung, um ein Bild zu generieren, das dem, was Sie rendern wollten, möglichst nahe kommt.
Subjekte sind in der Regel Substantive. Daher ist es am besten, mit einer Textaufforderung zu beginnen, unabhängig davon, welche KI Sie verwenden.
Um Ihrem gerenderten Bild etwas mehr Nuancen zu verleihen und der KI dabei zu helfen, einzugrenzen, welche Bilder als Referenz verwendet werden sollen, müssen Sie Beschreibungen verwenden. Dies sind Ihre Adjektive, und ähnlich wie Sie sie in jedem gewöhnlichen Satz verwenden würden, beschreiben sie das Thema.
Der Trick bei der Verwendung von Adjektiven bei der KI-Bildgenerierung besteht darin, dass Sie mehrere davon kombinieren können, um dem Bild mehr Tiefe und Komplexität zu verleihen.
Neben Adjektiven, die das Thema beschreiben, sind Details, die Fragen beantworten, ein weiteres Element der Beschreibung:
Diese letzte Frage ist ziemlich wichtig, da Hintergründe eine Schlüsselrolle für wirkungsvolle Beschreibungen spielen. Hier ist ein Beispiel für zwei ähnliche Textaufforderungen, die zu völlig unterschiedlichen Ergebnissen führen. Die Textaufforderung für das Bild links war Raccoon reading .
Die Textaufforderung für das richtige Bild war jedoch etwas detaillierter; Daher wirkte das Bild klarer und komplexer: Waschbär liest ein Buch in einer Bibliotheksfoto-Nahaufnahme.
Wie Sie an den Ergebnissen sehen können, haben wir mehrere Fragen beantwortet, und die KI konnte eingrenzen, wonach wir suchten, und etwas so nah wie möglich an das rendern, was wir suchten. Die KI konnte ein Bild mit mehr Details und weniger Anomalien erzeugen.
Hier ist ein weiteres großartiges Beispiel dafür, wie KI-Bildgeneratoren mit detaillierteren Bildaufforderungen besser funktionieren.
Dieses generierte Bild eines Finkens zeigt, wie KI auch ohne zusätzliche Deskriptoren ein generisches, aber sehr genaues Bild rendern kann.
Das Rendering auf der rechten Seite zeigt jedoch, wie KI-Bildgeneratoren, in diesem Fall Stable Diffusion, mit mehr Elementen arbeiten können, um ein deutlich komplexeres Bild zu rendern.
Um die Textaufforderung zu vervollständigen, müssen Sie noch einige weitere Textaufforderungen hinzufügen, die Ihrem gerenderten Bild den letzten Schliff geben. Beachten Sie, dass wir am Ende der Textaufforderung oben Wörter wie „Foto“ und „Nahaufnahme“ hatten.
Die letzten Worte in Ihrer Eingabeaufforderung bestimmen die Gesamtästhetik und den Stil Ihres Bildes.
Anstelle von „Foto“ hätten Sie auch „Ölgemälde“, „Fresko“ oder „3D-Rendering“ verwenden können. Um den Stil Ihres Bildes zu bestimmen, können Sie auch Kunstrichtungen wie Impressionismus, Gothic, Steampunk usw. verwenden.
Wenn Sie außerdem die Werke eines berühmten Künstlers nachbilden möchten, können Sie auch einen oder mehrere berühmte Namen in die Textaufforderung eingeben. Die KI wird Einflüsse verschiedener berühmter Künstler kombinieren, um etwas zu schaffen, das Elemente von allen vereint.
Schließlich können Sie auch den Bildausschnitt bestimmen. Eingabeaufforderungen wie „Nahaufnahme“ oder „mittlere Aufnahme“, ähnlich wie in der Fotografie, können der KI dabei helfen, zu verstehen, aus welchem Winkel und aus welcher Entfernung das Bild präsentiert werden soll.
Hier ist ein Beispiel für zwei von Lexica generierte Bilder eines Handheld-Computers. Die Eingabeaufforderung auf der linken Seite war zwar einfach, konnte jedoch ein Vintage-Gerät generieren, das sogar das LCD-Display der alten Schule nachbildet.
Allerdings hat die Darstellung auf der rechten Seite dank Eingabeaufforderungen wie „Vaporwave-Ästhetik“ und „Produktfotografie“ eine ausgeprägtere visuelle Ästhetik und einen klareren Stil, wie Sie an den Neonfarben erkennen können.
Es gibt keine Tipps und Tricks, die Ihnen besser lehren, wie man effektive KI-Eingabeaufforderungen schreibt, als Erfahrung. Das Beste an KI-Bildgeneratoren ist, dass sie sehr zugänglich sind. Sie benötigen lediglich eine Internetverbindung und können aus den vielen verfügbaren kostenlosen Plattformen wählen.
Gehen Sie also raus und experimentieren Sie mit KI-Bildaufforderungen, um zu sehen, welche neuen und faszinierenden Dinge Sie im aufstrebenden Bereich der Bilderzeugung entdecken können.