Este guia abordará os fundamentos do trabalho com prompts de texto e como você pode utilizá-los efetivamente para renderizar as imagens que imaginou.
Prompts para geração de imagens de IA são comandos, textuais ou visuais, que determinam qual imagem a plataforma de IA cria. Normalmente, você encontrará dois tipos diferentes de prompt de geração de imagem: texto e imagem.
Para dizer à IA que tipo de imagem renderizar, você deve primeiro descrever essa imagem. Isso é feito com um prompt de texto, que é uma lista de palavras, às vezes até uma frase gramaticalmente correta, descrevendo o que a IA deve renderizar.
A caixa de texto destacada é um exemplo de prompt de texto usado para
Em alguns casos, quando o texto não é suficiente, você pode fazer upload de imagens para um gerador de imagens AI e usá-lo como referência para criar outras imagens. Dependendo do tipo de plataforma de IA que você está usando e do tipo de resultados que você precisará, o uso de prompts de imagem pode ser ainda mais eficaz do que o texto.
Por exemplo, o Outpainting AI do DALL.E pode pegar uma imagem existente e renderizar sua continuação. A imagem acima demonstra o que a IA acredita ser a continuação da famosa pintura de Johannes Vermeer da Moça com Brinco de Pérola.
A imagem original da pintura está dentro do quadrado e tudo ao seu redor foi renderizado por DALL.E.
Embora a maioria dos geradores de imagem AI que você encontra no mercado hoje sejam baseados em texto com algumas opções para prompts de imagem, existem maneiras de utilizar uma mistura de ambos os prompts para renderizar as imagens desejadas.
Um detalhe muito importante que você deve ter em mente é entender em que um determinado gerador de imagens de IA é especializado e como usá-lo de maneira eficaz. Alguns geradores de imagem AI, como a série Dall-E, são muito bons em renderizar imagens que imitam o fotorrealismo.
Por outro lado, há Midjourney, que é bem conhecido por ser muito eficaz em formatos de ilustração ou arte digital.
Nosso próprio gerador de imagem Let's Enhance é ótimo para simular a estética visual de imagens de produtos, além de renderizar imagens fotorrealistas, ilustrações e modelos 3D.
Embora a maioria dos geradores de imagens AI tenham um limite de caracteres nos prompts de texto, não há limite de palavras. Isso significa que você tem a liberdade de estruturar seu prompt de texto da maneira que desejar.
No entanto, o consenso, por enquanto, parece ser que você precisa de 3 a 7 palavras para escrever um prompt de texto bem-sucedido para a IA renderizar.
Aqui estão as imagens renderizadas do prompt de texto no exemplo acima. O prompt “wide shot” impactou significativamente as imagens na coluna da esquerda.
Você não precisa seguir estritamente esta regra e pode usar menos de 3 ou mais de 7 palavras. Mas, como você verá nos exemplos abaixo, não é tanto o número de palavras que importa, mas quais palavras você usa.
Qualquer renderização de imagem AI requer algum tipo de assunto. Esta deve ser a primeira coisa que você escreve no prompt de texto (na maioria dos casos). É possível deixar apenas um único assunto no prompt de texto e fazer com que a IA gere algo um pouco mais geral.
No entanto, na maioria dos casos, você precisará de um prompt de texto mais descritivo para gerar uma imagem que se aproxime do que você deseja renderizar.
Assuntos são tipicamente substantivos, então o melhor lugar para começar com seu prompt de texto, independentemente de qual AI que você está utilizando, é começar com um.
Para adicionar um pouco mais de nuances à sua imagem renderizada e ajudar a IA a restringir quais imagens usar como referência, você precisa utilizar descrições. Esses são seus adjetivos e, assim como você os usaria em qualquer frase comum, eles descrevem o sujeito.
O truque de usar adjetivos na geração de imagens de IA é que você pode combinar vários deles para adicionar mais profundidade e complexidade à imagem.
Além dos adjetivos que descrevem o assunto, outro elemento da descrição são os detalhes que respondem a perguntas como:
Essa última pergunta é muito importante, pois os antecedentes desempenham um papel fundamental em descrições eficazes. Aqui está um exemplo de dois prompts de texto semelhantes produzindo resultados bastante diferentes. O prompt de texto para a imagem à esquerda era Raccoon Reading .
O prompt de texto para a imagem certa, no entanto, era um pouco mais detalhado; daí porque a imagem saiu mais clara e complexa: Guaxinim lendo um livro em uma foto de biblioteca em close.
Como você pode ver pelos resultados, respondemos a várias perguntas e a IA foi capaz de restringir o que procurávamos e renderizar algo o mais próximo possível do que procurávamos. A IA foi capaz de gerar uma imagem com mais detalhes e menos anomalias.
Aqui está outro ótimo exemplo de como os geradores de imagem AI funcionam melhor com prompts de imagem mais detalhados.
Esta imagem gerada de um tentilhão demonstra como a IA pode renderizar uma imagem genérica, mas muito precisa, mesmo sem descritores adicionais.
No entanto, a renderização à direita demonstra como os geradores de imagem AI, neste caso, Stable Diffusion, podem trabalhar com mais elementos para renderizar um visual significativamente mais complexo.
Para concluir o prompt de texto, há mais alguns prompts de texto que você deve adicionar para dar os toques finais à sua imagem renderizada. Observe como, no final do prompt de texto acima, tínhamos palavras como “foto” e “close up”.
As últimas palavras em seu prompt serão aquelas que ditarão a estética geral e o estilo de sua imagem.
Em vez de “foto”, você poderia ter “pintura a óleo”, “fresco” ou “renderização 3D”. Para ditar o estilo da sua imagem, você também pode usar movimentos artísticos como impressionista, gótico, steampunk, etc.
Além disso, se você deseja replicar as obras de um artista famoso, também pode colocar um ou mais nomes famosos no prompt de texto. A IA combinará influências de vários artistas famosos para criar algo que combine elementos de todos eles.
Finalmente, você também pode ditar o enquadramento da imagem. Prompts como “close up” ou “medium shot”, muito parecidos com o que você faria na fotografia, podem ajudar a IA a entender de que ângulo você deseja que a imagem seja apresentada e de que distância.
Aqui está um exemplo de duas imagens geradas pelo Lexica de um computador portátil. O prompt à esquerda, embora simples, foi capaz de gerar um dispositivo vintage que replica até mesmo o antigo display LCD.
No entanto, a renderização à direita, graças a dicas como “estética vaporwave” e “fotografia do produto”, tem uma estética visual e um estilo mais definidos, como você pode perceber pelas cores neon.
Nenhuma quantidade de dicas e truques vai ensiná-lo a escrever prompts de IA eficazes do que a experiência. A melhor parte dos geradores de imagens AI é que eles são muito acessíveis. Tudo o que você precisa é de uma conexão com a Internet e pode escolher entre as várias plataformas gratuitas disponíveis.
Portanto, vá lá e experimente os prompts de imagem de IA para ver quais coisas novas e fascinantes você pode descobrir no crescente campo da geração de imagens.