Leia este artigo se estiver entusiasmado com Inteligência Artificial Generativa (IA Gerativa), ChatGPT, Difusão Estável e MobileGPT.
Neste artigo, vamos explorar a arte do prompt, ou engenharia de prompt. No final desta história, você será um mestre em gerar prompts para IA generativa - abordaremos prompts de geração de texto e imagem.
Este artigo é para você, se deseja maximizar a saída obtida das ferramentas GenerativeAI que está usando.
A engenharia de prompt, em seu nível mais fundamental, é o processo de projetar, elaborar e refinar entradas ou "prompts" usados para orientar as saídas de um modelo de inteligência artificial (IA).
O termo é especialmente relevante quando estamos lidando com modelos de IA generativa, como os desenvolvidos pela OpenAI (GPT-3 e GPT-4) ou outras tecnologias semelhantes.
Imagine que você está dando instruções a alguém para realizar uma tarefa que nunca fez antes. A clareza e a especificidade de suas instruções podem influenciar muito o resultado final. Da mesma forma, com IA, a maneira como você enquadra seus prompts pode afetar significativamente as respostas da IA.
Não há melhor maneira de aprender do que com exemplos; usaremos o MobileGPT - GenerativeAI no WhatsApp para demonstrar esses conceitos.
Exemplo de solicitação:
Escreva um discurso
Esta é a resposta que recebemos do MobileGPT, a instrução é muito vaga para a IA entender e até responderá com mais perguntas de esclarecimento.
No mínimo, precisamos fornecer um tópico ou assunto. Isso nos leva ao básico da solicitação - você precisa fornecer o formato e o tópico.
Formato : é o que a IA deve retornar ou enviar de volta para você, é a base do seu prompt. Por exemplo, você pede à IA para gerar texto na forma de uma lista de marcadores, uma carta formal, um discurso ou uma conversa?
Assunto : Qual é o seu formato? O assunto, tópico ou título do conteúdo que forma a base do conteúdo que a IA retornará.
No nosso exemplo, poderíamos dizer:
Escreva um discurso sobre 'Os perigos do plágio'
O título ou assunto é: Perigos do plágio
A IA generativa é tão inteligente e bem treinada que - o formato e o assunto sozinhos podem ser suficientes para gerar um ótimo conteúdo.
Porém, queremos refinar um pouco mais isso, então vou apresentar mais algumas variáveis que vão customizar esse discurso, exatamente do jeito que queremos.
Considerar:
O tom refere-se ao caráter geral, atitude ou sentimento transmitido pelo conteúdo gerado pela IA. É o sentimento geral ou humor que é retratado por meio da linguagem usada na saída.
Você pode pensar no tom como uma diretriz sobre como a IA deve "soar" em sua resposta.
O público refere-se aos destinatários ou consumidores pretendidos do conteúdo gerado pela IA. Essencialmente, é o grupo de pessoas que o conteúdo pretende alcançar ou influenciar.
Esclarecer o público é muito importante no GenerativeAI - fazer nosso discurso para a turma do jardim de infância não seria o mesmo que para a turma de graduação em Harvard, por exemplo - mesmo que o assunto fosse o mesmo.
O objetivo refere-se ao propósito ou objetivo pretendido do conteúdo gerado pela IA. É essencialmente o que você pretende alcançar com o conteúdo que a IA produz. Definir o objetivo pode ajudar a IA a escolher pontos de discussão relevantes para o seu conteúdo.
Definir "Agir como" em um prompt é uma maneira de instruir a IA a assumir uma função, perspectiva ou persona específica ao gerar o conteúdo. Isso pode influenciar significativamente o tom, o estilo, a linguagem e a natureza geral da saída da IA.
Na maioria dos casos, você não precisará definir todas essas variáveis em um prompt. Por exemplo, se você decidir dizer: Aja como palestrante, talvez não seja necessário definir um tom porque a persona vem com um contexto e um tom.
Vamos colocá-los à prova e refinar nosso prompt.
Variação 1:
Escreva um discurso sobre 'Os perigos do plágio' para ser entregue aos formandos do ensino médio por Oprah Winfrey
Variação 2:
Escreva um discurso sobre 'Os perigos do plágio' em um tom bem-humorado para convencer crianças em idade pré-escolar sobre os perigos do plágio
Alterar o público resulta em um discurso completamente diferente, especificar o tom ajuda a IA a entender como estruturar o conteúdo e, o mais importante, definir o objetivo fornece à IA as especificações do que o conteúdo deve alcançar.
Desenvolvi um guia de referência resumido, baixe-o, compartilhe-o e, em caso de dúvida, consulte a folha de dicas:
Mas espere - há mais. Você pode personalizar a saída obtida do Generative AI especificando mais variáveis, como (1) informações básicas, (2) palavras-chave, (3) contagem de palavras, (4) diretrizes e (5) estrutura de tópicos.
Digamos que você esteja fazendo um discurso, mas deseja que a IA saiba mais sobre o contexto. Você poderia fornecer algumas informações básicas. Por exemplo, você pode acrescentar: “Sou novo nesta escola, este é meu primeiro ano e me formei como o primeiro da turma; Eu gostaria de soar humilde neste discurso.”
Devo dizer que os mecanismos GPT3 e GPT4, que chamamos de respostas MobileGPT, geralmente adoram ignorar instruções sobre palavras-chave, mas adoro incluí-las, especialmente ao escrever conteúdo para blogs ou mídias sociais.
Geralmente é importante especificar os termos e palavras importantes que devem aparecer no conteúdo gerado.
Essa é outra variável que os mecanismos GPT3 e GPT4 adoram ignorar, mas nem sempre, dependendo de como você a expressa. Talvez seja melhor dizer: escreva-me 5 parágrafos com 2 frases cada, em vez de dizer: escreva-me 500 palavras.
Honestamente, “diretrizes” sozinhas, como uma variável adicionada, podem significar a diferença entre uma resposta genérica e uma saída de IA bem projetada. As diretrizes são como conjuntos de instruções sobre “como” a IA deve estruturar seu conteúdo.
Imagine que você deseja escrever um relatório de pesquisa e diz à IA:
Escreva um relatório de pesquisa sobre o impacto das mídias sociais na saúde mental.
Você pode adicionar público, tom e objetivo, mas provavelmente precisará dar mais estrutura à IA.
É aqui que entram as diretrizes; Eu normalmente digo:
Escreva um relatório de pesquisa sobre o impacto das mídias sociais na saúde mental.
--Iniciar Diretrizes--
Comece fornecendo um resumo executivo destacando todos os pontos importantes e sugestões.
Discuta os benefícios e desafios de forma crítica, produzindo evidências a favor e contra o tema. Forneça um breve histórico sobre o tema, discuta a literatura sobre o assunto e apresente as diferentes escolas de pensamento.
Discuta como o tópico evoluiu ao longo dos anos e como a literatura e as escolas de pensamento mudaram. Adicione uma análise SWOT no final e discuta os resultados. Por fim, resuma as principais conclusões e apresente as descobertas em tópicos.
--Fim das Diretrizes--
Vamos testar isso no MobileGPT, desta vez usaremos a funcionalidade “Long Research Report”. Basta clicar no menu, em qualquer mensagem e escolher - Long Research Report.
Em seguida, insira o título do seu relatório: O impacto das mídias sociais na saúde mental
É isso: o MobileGPT lida com a engenharia de prompt em segundo plano, coleta dados reais da Internet e retorna um relatório em formato Word.
Você também obterá links usados para compilar os dados - para que possa expandir o relatório em seu próprio tempo.
Às vezes, ajuda a fornecer um esboço de conteúdo de IA generativa, especialmente se você estiver gerando conteúdo para relatórios, blogs ou conteúdo que precise seguir um esboço prescrito. Vou usar a escrita do blog como exemplo, você pode fornecer um esboço como este:
Crie um blog sobre os perigos do plágio e inclua os seguintes subtítulos no blog. (1) Introdução - discuta o propósito do blog, (2) Benefícios - Fala sobre os benefícios do plágio, (3) Discuta os desafios do plágio, (4) Conclusão - escreva uma conclusão convincente.
A geração de imagens AI pode ser mais fácil, pois há menos coisas e variáveis que você precisa lembrar. Assim como fizemos com a geração de texto, começaremos com prompts simples e aumentaremos a complexidade com mais detalhes para refinar a saída e personalizar o que obteremos da IA.
Vamos trabalhar com o prompt:
Gerar uma imagem de um cachorro
Para nossa sorte, também podemos fazer isso no MobileGPT - selecione Geração de imagem no menu e digite seu prompt.
Este não é o cachorro que eu queria. Quando se trata de geração de imagens, você realmente precisa pensar como um artista. Comece visualizando esse cachorro, que tipo de cachorro é, o que está fazendo e onde está.
Defina o assunto em detalhes.
Defina o que o sujeito está fazendo
Defina a imagem de fundo em detalhes.
Vamos tentar isso novamente:
Gere a imagem de um chihuahua branco, correndo na calçada, em frente a uma casa, rodeado de céu azul e árvores altas.
A imagem parece muito melhor, mas há mais. Considere adicionar o tipo de imagem, você pode escolher entre:
Uma variável frequentemente negligenciada ao fazer a geração de imagens é a configuração. Isso geralmente anda de mãos dadas com o tipo de imagem e depende do assunto da imagem.
Por exemplo, faz sentido para um modelo estar em um ambiente de estúdio, talvez seja uma sessão de fotos, e para um pássaro estar em um ambiente natural, como uma floresta.
aqui estão alguns exemplos:
As tecnologias de geração de imagens de IA avançaram a um ponto em que podem criar uma ampla gama de planos de fundo e configurações, completas com detalhes complexos de iluminação e textura.
Os recursos específicos podem depender do modelo de IA específico e de seus dados de treinamento, mas aqui estão alguns exemplos dos tipos de planos de fundo e configurações que podem ser criados:
Ambiente de estúdio : pode incluir um pano de fundo básico (como branco, preto ou uma cor específica) com iluminação profissional controlada. Adereços e modelos também podem ser incluídos, com a IA ajustando suas aparências para corresponder às condições de iluminação do estúdio.
Cenários naturais : podem incluir florestas, montanhas, praias, desertos, oceanos e outras paisagens. As condições de iluminação podem variar da luz do sol aos tons suaves de um pôr do sol ou aos tons frios de uma noite de luar.
Ambientes urbanos : Paisagens urbanas com arranha-céus, ruas movimentadas, parques ou bairros suburbanos são possíveis. Novamente, as condições de iluminação podem variar para simular diferentes horas do dia ou condições climáticas.
Cenas internas : podem ser interiores de residências, escritórios, restaurantes, escolas, museus ou qualquer outro tipo de ambiente interno. A iluminação pode ser ajustada para corresponder às condições internas típicas, como o brilho quente de uma luminária de mesa ou as luzes fluorescentes brilhantes de um escritório.
Cenários históricos ou fictícios : dependendo dos dados de treinamento da IA, pode ser possível gerar imagens de cenários históricos (como uma vila medieval ou uma rua da cidade de 1920) ou ambientes fictícios de livros, filmes ou jogos.
Fundos abstratos : A IA pode gerar fundos puramente abstratos ou artísticos com uma variedade de cores, formas e padrões.
Vamos aplicar o que aprendemos agora e criar um carro futurista digno de uma capa de revista:
Gere uma imagem fotorrealista de um carro BMW elétrico futurístico, em um ambiente de estúdio com cores perfeitas e luz brilhando na superfície metálica do carro.
E esta foi apenas minha primeira tentativa; você pode refinar o prompt adicionando como o carro está posicionado, diferentes ângulos de câmera, etc.
Espero que você tenha aprendido alguma coisa; sinta-se à vontade para conferir o MobileGPT aqui: https://mobile-gpt.io/ Adicione-o à sua experiência no WhatsApp e torne-se um mestre do prompt.