paint-brush
Un guide simple sur les invites de texte de l'IA : dites à l'IA exactement ce que vous voulez voirpar@claidai
23,771 lectures
23,771 lectures

Un guide simple sur les invites de texte de l'IA : dites à l'IA exactement ce que vous voulez voir

par Sofiia Shvets6m2023/02/06
Read on Terminal Reader

Trop long; Pour lire

Les invites pour la génération d'images d'IA sont des commandes, textuelles ou visuelles, qui dictent quelle image la plate-forme d'IA crée. Vous trouverez deux types d'invite de génération d'image différents : texte et image. La plupart des générateurs d'images AI que vous trouvez sur le marché aujourd'hui seront basés sur du texte avec quelques options pour les invites d'image.
featured image - Un guide simple sur les invites de texte de l'IA : dites à l'IA exactement ce que vous voulez voir
Sofiia Shvets HackerNoon profile picture

Ce guide couvrira les bases du travail avec des invites de texte et comment vous pouvez les utiliser efficacement pour rendre les images que vous avez envisagées.

Plats à emporter

  • Les invites pour les générateurs d'images AI peuvent être à la fois basées sur du texte et sur des images, et dans certains cas, un mélange des deux


  • La structure générale des invites de texte pour les générateurs d'images AI est similaire dans tous les domaines, tout comme le nombre de mots et l'ordre des descripteurs.


  • Différents éléments d'une invite de texte ont des effets uniques sur le rendu et ajoutent de la complexité à l'image.

Que sont les invites ?

Les invites pour la génération d'images d'IA sont des commandes, textuelles ou visuelles, qui dictent l'image créée par la plate-forme d'IA. En règle générale, vous trouverez deux types d'invite de génération d'image différents : texte et image.

Invites textuelles

Pour dire à l'IA quel type d'image rendre, vous devez d'abord décrire cette image. Cela se fait avec une invite de texte, qui est une liste de mots, parfois même une phrase grammaticalement correcte, décrivant ce que l'IA doit rendre.

Le générateur d'images Let's Enhance utilise des invites de texte pour rendre les images


La zone de texte en surbrillance est un exemple d'invite de texte utilisée pour rendre des images avec l'IA à l'aide du générateur d'images Let's Enhance . Selon la plate-forme de rendu que vous utilisez, des invites de texte identiques auront des résultats variables.

Invite d'image

Dans certains cas, lorsque le texte ne suffit pas, vous pouvez télécharger des images vers un générateur d'images AI et l'utiliser comme référence pour créer d'autres images. Selon le type de plate-forme d'IA que vous utilisez et le type de résultats dont vous aurez besoin, l'utilisation d'invites d'image peut être encore plus efficace que le texte.

Original : Jeune fille à la perle de Johannes Vermeer Peint par : August Kamp


Par exemple, Outpainting AI de DALL.E peut prendre une image existante et rendre sa suite. L'image ci-dessus montre ce que l'IA considère comme la continuation du célèbre tableau de Johannes Vermeer de Girl with a Pearl Earring.


L'image originale du tableau se trouve dans le carré et tout ce qui l'entoure a été rendu par DALL.E.

Un mélange des deux

Alors que la plupart des générateurs d'images AI que vous trouvez sur le marché aujourd'hui seront basés sur du texte avec quelques options pour les invites d'image, il existe des moyens d'utiliser un mélange des deux invites pour rendre les images souhaitées.

Écrire une invite de génération d'image

Un détail très important que vous devez garder à l'esprit est de comprendre en quoi un générateur d'image AI particulier est spécialisé et comment l'utiliser efficacement. Certains générateurs d'images AI, tels que la série Dall-E, sont très bons pour rendre des images qui imitent le photoréalisme.


D'autre part, il y a Midjourney, qui est bien connu pour être très efficace dans les formats d'art numérique ou d'illustration.


Notre propre générateur d'images Let's Enhance est excellent pour simuler l'esthétique visuelle des images de produits, en plus de rendre des images, des illustrations et des modèles 3D photoréalistes.


Nombre de mots : utilisez au moins 3 à 7 mots

Alors que la plupart des générateurs d'images AI auront une limite de caractères sur les invites de texte, il n'y a pas de limite de mots. Cela signifie que vous avez la liberté de structurer votre invite de texte comme vous le souhaitez.


Cependant, le consensus, pour l'instant, semble être que vous avez besoin de 3 à 7 mots pour écrire une invite de texte réussie à rendre par l'IA.


Rendu à l'aide de Let's Enhance Image Generator

Voici les images rendues de l'invite de texte dans l'exemple ci-dessus. L'invite "plan large" a eu un impact significatif sur les images de la colonne de gauche.


Vous n'êtes pas obligé de respecter strictement cette règle et vous êtes autorisé à utiliser moins de 3 ou plus de 7 mots. Mais comme vous le verrez dans les exemples ci-dessous, ce n'est pas tant le nombre de mots qui compte, mais les mots que vous utilisez.

Sujet : qui et quoi

Tout rendu d'image AI nécessite une sorte de sujet. Cela devrait être la première chose que vous écrivez dans l'invite de texte (dans la plupart des cas). Il est possible de ne laisser qu'un seul sujet dans l'invite de texte et que l'IA génère quelque chose d'un peu plus général.


Cependant, dans la plupart des cas, vous aurez besoin d'une invite de texte plus descriptive pour générer une image qui se rapproche le plus de ce que vous cherchiez à rendre.


Les sujets sont généralement des noms, donc le meilleur endroit pour commencer avec votre invite de texte, quelle que soit l'IA que vous utilisez, est de commencer par un.

Description : Ce qu'ils font, où et comment

Pour ajouter un peu plus de nuances à votre image rendue et aider l'IA à affiner les images à utiliser comme références, vous devez utiliser des descriptions. Ce sont vos adjectifs, et tout comme vous les utiliseriez dans n'importe quelle phrase ordinaire, ils décrivent le sujet.


L'astuce avec l'utilisation d'adjectifs dans la génération d'images AI est que vous pouvez combiner plusieurs d'entre eux pour ajouter plus de profondeur et de complexité à l'image.


Outre les adjectifs décrivant le sujet, un autre élément de la description est constitué de détails qui répondent à des questions telles que :


  • Ce qui se passe?
  • Que fait le sujet ?
  • Comment le sujet fait-il cela ?
  • Que se passe-t-il autour du sujet ?


Cette dernière question est assez importante, car les arrière-plans jouent un rôle clé dans les descriptions efficaces. Voici un exemple de deux invites de texte similaires produisant des résultats assez différents. L'invite de texte pour l'image de gauche était Raccoon reading .


L'invite de texte pour l'image de droite, cependant, était légèrement plus détaillée ; d'où la raison pour laquelle l'image est ressortie plus claire et plus complexe : Raton laveur lisant un livre dans une bibliothèque photo en gros plan.

Rendu à l'aide de Let's Enhance Image Generator


Comme vous pouvez le voir par les résultats, nous avons répondu à plusieurs questions, et l'IA a pu affiner ce que nous recherchions et rendre quelque chose d'aussi proche que possible de ce que nous recherchions. L'IA a pu générer une image avec plus de détails et moins d'anomalies.


Voici un autre excellent exemple de la façon dont les générateurs d'images AI fonctionnent mieux avec des invites d'image plus détaillées.


Rendu à l'aide de la diffusion stable

Cette image générée d'un pinson montre comment l'IA peut rendre une image générique mais très précise même sans descripteurs supplémentaires.


Cependant, le rendu de droite montre comment les générateurs d'images AI, dans ce cas, Stable Diffusion, peuvent fonctionner avec plus d'éléments pour rendre un visuel beaucoup plus complexe.

Esthétique et style : à quoi ça ressemble

Pour compléter l'invite de texte, vous devez ajouter quelques invites de texte supplémentaires qui apporteront la touche finale à votre image rendue. Remarquez comment, à la fin de l'invite de texte ci-dessus, nous avions des mots comme "photo" et "gros plan".


Les derniers mots de votre invite seront ceux qui dicteront l'esthétique générale et le style de votre image.


Au lieu de "photo", vous auriez pu avoir "peinture à l'huile", "fresque" ou "rendu 3D". Pour dicter le style de votre image, vous pouvez également utiliser des mouvements artistiques tels que impressionniste, gothique, steampunk, etc.


De plus, si vous cherchez à reproduire les œuvres d'un artiste célèbre, vous pouvez même mettre un ou plusieurs noms célèbres dans l'invite de texte. L'IA combinera les influences de divers artistes célèbres pour créer quelque chose qui mélange des éléments de chacun d'eux.


Enfin, vous pouvez également dicter le cadrage de l'image. Des invites telles que "gros plan" ou "plan moyen", un peu comme vous le feriez en photographie, peuvent aider l'IA à comprendre sous quel angle vous voulez que l'image soit présentée et à quelle distance.


Rendu à l'aide de Lexica

Voici un exemple de deux images générées par Lexica d'un ordinateur de poche. L'invite de gauche, bien que simple, a pu générer un appareil vintage qui reproduit même l'écran LCD de la vieille école.


Cependant, le rendu à droite, grâce à des invites telles que "esthétique vaporwave" et "photographie de produit", a une esthétique visuelle et un style plus définis, comme vous pouvez le constater par les couleurs néon.

L'expérience est le meilleur professeur

Aucune quantité de trucs et astuces ne vous apprendra comment écrire des invites d'IA efficaces que l'expérience. La meilleure partie des générateurs d'images AI est qu'ils sont très accessibles. Tout ce dont vous avez besoin est une connexion Internet et vous pouvez choisir parmi les nombreuses plateformes gratuites disponibles.


Alors lancez-vous et expérimentez les invites d'image de l'IA pour voir ce que vous pouvez découvrir de nouveau et de fascinant dans le domaine en plein essor de la génération d'images.