paint-brush
Um guia simples sobre prompts de texto de IA: diga à IA exatamente o que você deseja verpor@claidai
22,940 leituras
22,940 leituras

Um guia simples sobre prompts de texto de IA: diga à IA exatamente o que você deseja ver

por Sofiia Shvets6m2023/02/06
Read on Terminal Reader

Muito longo; Para ler

Prompts para geração de imagem de IA são comandos, textuais ou visuais, que determinam qual imagem a plataforma de IA cria. Você encontrará dois tipos diferentes de prompt de geração de imagem: texto e imagem. A maioria dos geradores de imagem AI que você encontra no mercado hoje será baseada em texto com algumas opções para prompts de imagem.
featured image - Um guia simples sobre prompts de texto de IA: diga à IA exatamente o que você deseja ver
Sofiia Shvets HackerNoon profile picture

Este guia abordará os fundamentos do trabalho com prompts de texto e como você pode utilizá-los efetivamente para renderizar as imagens que imaginou.

Aprendizado

  • Os prompts para geradores de imagens AI podem ser baseados em texto e imagem e, em alguns casos, uma mistura de ambos


  • A estrutura geral dos prompts de texto para geradores de imagens AI é semelhante em todos os aspectos, assim como a contagem de palavras e a ordem dos descritores.


  • Diferentes elementos de um prompt de texto têm efeitos únicos na renderização e adicionam complexidade à imagem.

O que são prompts?

Prompts para geração de imagens de IA são comandos, textuais ou visuais, que determinam qual imagem a plataforma de IA cria. Normalmente, você encontrará dois tipos diferentes de prompt de geração de imagem: texto e imagem.

Prompts de texto

Para dizer à IA que tipo de imagem renderizar, você deve primeiro descrever essa imagem. Isso é feito com um prompt de texto, que é uma lista de palavras, às vezes até uma frase gramaticalmente correta, descrevendo o que a IA deve renderizar.

O Let's Enhance Image Generator usa prompts de texto para renderizar imagens


A caixa de texto destacada é um exemplo de prompt de texto usado para renderize imagens com IA usando o gerador de imagens Let's Enhance . Dependendo da plataforma de renderização que você está usando, prompts de texto idênticos terão resultados variados.

Solicitação de imagem

Em alguns casos, quando o texto não é suficiente, você pode fazer upload de imagens para um gerador de imagens AI e usá-lo como referência para criar outras imagens. Dependendo do tipo de plataforma de IA que você está usando e do tipo de resultados que você precisará, o uso de prompts de imagem pode ser ainda mais eficaz do que o texto.

Original: Moça com Brinco de Pérola de Johannes Vermeer Pintado por: August Kamp


Por exemplo, o Outpainting AI do DALL.E pode pegar uma imagem existente e renderizar sua continuação. A imagem acima demonstra o que a IA acredita ser a continuação da famosa pintura de Johannes Vermeer da Moça com Brinco de Pérola.


A imagem original da pintura está dentro do quadrado e tudo ao seu redor foi renderizado por DALL.E.

Uma mistura de ambos

Embora a maioria dos geradores de imagem AI que você encontra no mercado hoje sejam baseados em texto com algumas opções para prompts de imagem, existem maneiras de utilizar uma mistura de ambos os prompts para renderizar as imagens desejadas.

Escrevendo um prompt de geração de imagem

Um detalhe muito importante que você deve ter em mente é entender em que um determinado gerador de imagens de IA é especializado e como usá-lo de maneira eficaz. Alguns geradores de imagem AI, como a série Dall-E, são muito bons em renderizar imagens que imitam o fotorrealismo.


Por outro lado, há Midjourney, que é bem conhecido por ser muito eficaz em formatos de ilustração ou arte digital.


Nosso próprio gerador de imagem Let's Enhance é ótimo para simular a estética visual de imagens de produtos, além de renderizar imagens fotorrealistas, ilustrações e modelos 3D.


Contagem de palavras: use pelo menos 3-7 palavras

Embora a maioria dos geradores de imagens AI tenham um limite de caracteres nos prompts de texto, não há limite de palavras. Isso significa que você tem a liberdade de estruturar seu prompt de texto da maneira que desejar.


No entanto, o consenso, por enquanto, parece ser que você precisa de 3 a 7 palavras para escrever um prompt de texto bem-sucedido para a IA renderizar.


Renderizado usando o gerador de imagens Let's Enhance

Aqui estão as imagens renderizadas do prompt de texto no exemplo acima. O prompt “wide shot” impactou significativamente as imagens na coluna da esquerda.


Você não precisa seguir estritamente esta regra e pode usar menos de 3 ou mais de 7 palavras. Mas, como você verá nos exemplos abaixo, não é tanto o número de palavras que importa, mas quais palavras você usa.

Assunto: Quem e o que

Qualquer renderização de imagem AI requer algum tipo de assunto. Esta deve ser a primeira coisa que você escreve no prompt de texto (na maioria dos casos). É possível deixar apenas um único assunto no prompt de texto e fazer com que a IA gere algo um pouco mais geral.


No entanto, na maioria dos casos, você precisará de um prompt de texto mais descritivo para gerar uma imagem que se aproxime do que você deseja renderizar.


Assuntos são tipicamente substantivos, então o melhor lugar para começar com seu prompt de texto, independentemente de qual AI que você está utilizando, é começar com um.

Descrição: O que eles estão fazendo, onde e como

Para adicionar um pouco mais de nuances à sua imagem renderizada e ajudar a IA a restringir quais imagens usar como referência, você precisa utilizar descrições. Esses são seus adjetivos e, assim como você os usaria em qualquer frase comum, eles descrevem o sujeito.


O truque de usar adjetivos na geração de imagens de IA é que você pode combinar vários deles para adicionar mais profundidade e complexidade à imagem.


Além dos adjetivos que descrevem o assunto, outro elemento da descrição são os detalhes que respondem a perguntas como:


  • O que está acontecendo?
  • O que o sujeito está fazendo?
  • Como o sujeito está fazendo isso?
  • O que está acontecendo em torno do assunto?


Essa última pergunta é muito importante, pois os antecedentes desempenham um papel fundamental em descrições eficazes. Aqui está um exemplo de dois prompts de texto semelhantes produzindo resultados bastante diferentes. O prompt de texto para a imagem à esquerda era Raccoon Reading .


O prompt de texto para a imagem certa, no entanto, era um pouco mais detalhado; daí porque a imagem saiu mais clara e complexa: Guaxinim lendo um livro em uma foto de biblioteca em close.

Renderizado usando o gerador de imagens Let's Enhance


Como você pode ver pelos resultados, respondemos a várias perguntas e a IA foi capaz de restringir o que procurávamos e renderizar algo o mais próximo possível do que procurávamos. A IA foi capaz de gerar uma imagem com mais detalhes e menos anomalias.


Aqui está outro ótimo exemplo de como os geradores de imagem AI funcionam melhor com prompts de imagem mais detalhados.


Renderizado usando difusão estável

Esta imagem gerada de um tentilhão demonstra como a IA pode renderizar uma imagem genérica, mas muito precisa, mesmo sem descritores adicionais.


No entanto, a renderização à direita demonstra como os geradores de imagem AI, neste caso, Stable Diffusion, podem trabalhar com mais elementos para renderizar um visual significativamente mais complexo.

Estética e estilo: como fica

Para concluir o prompt de texto, há mais alguns prompts de texto que você deve adicionar para dar os toques finais à sua imagem renderizada. Observe como, no final do prompt de texto acima, tínhamos palavras como “foto” e “close up”.


As últimas palavras em seu prompt serão aquelas que ditarão a estética geral e o estilo de sua imagem.


Em vez de “foto”, você poderia ter “pintura a óleo”, “fresco” ou “renderização 3D”. Para ditar o estilo da sua imagem, você também pode usar movimentos artísticos como impressionista, gótico, steampunk, etc.


Além disso, se você deseja replicar as obras de um artista famoso, também pode colocar um ou mais nomes famosos no prompt de texto. A IA combinará influências de vários artistas famosos para criar algo que combine elementos de todos eles.


Finalmente, você também pode ditar o enquadramento da imagem. Prompts como “close up” ou “medium shot”, muito parecidos com o que você faria na fotografia, podem ajudar a IA a entender de que ângulo você deseja que a imagem seja apresentada e de que distância.


Renderizado usando Lexica

Aqui está um exemplo de duas imagens geradas pelo Lexica de um computador portátil. O prompt à esquerda, embora simples, foi capaz de gerar um dispositivo vintage que replica até mesmo o antigo display LCD.


No entanto, a renderização à direita, graças a dicas como “estética vaporwave” e “fotografia do produto”, tem uma estética visual e um estilo mais definidos, como você pode perceber pelas cores neon.

Experiência é o melhor professor

Nenhuma quantidade de dicas e truques vai ensiná-lo a escrever prompts de IA eficazes do que a experiência. A melhor parte dos geradores de imagens AI é que eles são muito acessíveis. Tudo o que você precisa é de uma conexão com a Internet e pode escolher entre as várias plataformas gratuitas disponíveis.


Portanto, vá lá e experimente os prompts de imagem de IA para ver quais coisas novas e fascinantes você pode descobrir no crescente campo da geração de imagens.