Esta guía cubrirá los aspectos básicos del trabajo con mensajes de texto y cómo puede utilizarlos de manera efectiva para representar las imágenes que imaginó.
Las indicaciones para la generación de imágenes de IA son comandos, ya sean textuales o visuales, que dictan qué imagen crea la plataforma de IA. Por lo general, encontrará dos tipos diferentes de mensajes de generación de imágenes: texto e imagen.
Para decirle a la IA qué tipo de imagen renderizar, primero debe describir esa imagen. Esto se hace con un mensaje de texto, que es una lista de palabras, a veces incluso una oración gramaticalmente correcta, que describe lo que la IA debe representar.
El cuadro de texto resaltado es un mensaje de texto de ejemplo utilizado para
En algunos casos, cuando el texto no es suficiente, puede cargar imágenes en un generador de imágenes de IA y utilizarlo como referencia para crear otras imágenes. Según el tipo de plataforma de IA que utilice y el tipo de resultados que necesite, el uso de mensajes de imagen puede ser incluso más eficaz que el texto.
Por ejemplo, Outpainting AI de DALL.E puede tomar una imagen existente y renderizar su continuación. La imagen de arriba demuestra lo que la IA cree que es la continuación de la famosa pintura de Johannes Vermeer de La joven de la perla.
La imagen original del cuadro se encuentra dentro de la plaza y todo lo que la rodea fue realizado por DALL.E.
Si bien la mayoría de los generadores de imágenes de IA que encuentra en el mercado hoy en día estarán basados en texto con algunas opciones para indicaciones de imágenes, hay formas de utilizar una combinación de ambas indicaciones para representar las imágenes deseadas.
Un detalle muy importante que debe tener en cuenta es comprender en qué se especializa un generador de imágenes de IA en particular y cómo usarlo de manera efectiva. Algunos generadores de imágenes de IA, como la serie Dall-E, son muy buenos para representar imágenes que imitan el fotorrealismo.
Por otro lado, está Midjourney, que es muy conocido por ser muy efectivo en formatos de arte digital o ilustración.
Nuestro propio generador de imágenes Let's Enhance es excelente para simular la estética visual de las imágenes de productos, además de representar imágenes, ilustraciones y modelos 3D fotorrealistas.
Si bien la mayoría de los generadores de imágenes de IA tendrán un límite de caracteres en las indicaciones de texto, no hay límite de palabras. Esto significa que tiene la libertad de estructurar su mensaje de texto de la forma que desee.
Sin embargo, el consenso, por ahora, parece ser que necesita de 3 a 7 palabras para escribir un mensaje de texto exitoso para que la IA lo procese.
Aquí están las imágenes renderizadas del indicador de texto en el ejemplo anterior. El indicador de "toma amplia" impactó significativamente las imágenes en la columna izquierda.
No tienes que seguir estrictamente esta regla y puedes usar menos de 3 o más de 7 palabras. Pero como verá en los ejemplos a continuación, no es tanto la cantidad de palabras lo que importa, sino las palabras que usa.
Cualquier representación de imagen AI requiere algún tipo de tema. Esto debería ser lo primero que escriba en el mensaje de texto (en la mayoría de los casos). Es posible dejar un solo asunto en el mensaje de texto y hacer que la IA genere algo un poco más general.
Sin embargo, en la mayoría de los casos, necesitará un mensaje de texto más descriptivo para generar una imagen que se acerque lo más posible a lo que buscaba representar.
Los sujetos suelen ser sustantivos, por lo que el mejor lugar para comenzar con su mensaje de texto, independientemente de la IA que esté utilizando, es comenzar con uno.
Para agregar un poco más de matiz a su imagen renderizada y ayudar a la IA a reducir qué imágenes usar como referencias, debe utilizar descripciones. Estos son sus adjetivos, y al igual que los usaría en cualquier oración ordinaria, describen el sujeto.
El truco con el uso de adjetivos en la generación de imágenes de IA es que puede combinar varios de estos para agregar más profundidad y complejidad a la imagen.
Además de los adjetivos que describen al sujeto, otro elemento de la descripción son los detalles que responden a preguntas como:
Esa última pregunta es bastante importante, ya que los fondos juegan un papel clave en las descripciones efectivas. Aquí hay un ejemplo de dos indicaciones de texto similares que arrojan resultados bastante diferentes. El mensaje de texto para la imagen de la izquierda era la lectura de Raccoon .
Sin embargo, el mensaje de texto para la imagen de la derecha era un poco más detallado; por eso la imagen salió más clara y compleja: Mapache leyendo un libro en una foto de biblioteca de cerca.
Como puede ver en los resultados, respondimos varias preguntas y la IA pudo reducir lo que buscábamos y presentar algo lo más parecido posible a lo que buscábamos. La IA pudo generar una imagen con mayores detalles y menos anomalías.
Aquí hay otro gran ejemplo de cómo los generadores de imágenes de IA funcionan mejor con indicaciones de imágenes más detalladas.
Esta imagen generada de un pinzón demuestra cómo la IA puede generar una imagen genérica pero muy precisa, incluso sin descriptores adicionales.
Sin embargo, la representación de la derecha demuestra cómo los generadores de imágenes de IA, en este caso, Stable Diffusion, pueden trabajar con más elementos para representar una imagen significativamente más compleja.
Para completar el mensaje de texto, hay algunos mensajes de texto más que debe agregar y que le darán los toques finales a su imagen renderizada. Observe cómo, al final del mensaje de texto anterior, teníamos palabras como "foto" y "primer plano".
Las últimas palabras en su aviso serán las que dicten la estética general y el estilo de su imagen.
En lugar de "foto", podría haber tenido "pintura al óleo", "fresco" o "representación 3D". Para dictar el estilo de su imagen, también puede utilizar movimientos artísticos como el impresionista, el gótico, el steampunk, etc.
Además, si está buscando replicar las obras de un artista famoso, también puede poner uno o más nombres famosos en el mensaje de texto. La IA combinará influencias de varios artistas famosos para crear algo que combine elementos de todos ellos.
Finalmente, también puede dictar el encuadre de la imagen. Indicaciones como "primer plano" o "plano medio", muy parecido a lo que haría en fotografía, pueden ayudar a la IA a comprender desde qué ángulo desea que se presente la imagen y desde qué distancia.
Aquí hay un ejemplo de dos imágenes generadas por Lexica de un dispositivo de computadora de mano. El indicador de la izquierda, aunque simple, pudo generar un dispositivo antiguo que incluso replica la pantalla LCD de la vieja escuela.
Sin embargo, la representación de la derecha, gracias a mensajes como "estética de onda de vapor" y "fotografía de producto", tiene una estética y un estilo visual más definidos, como se puede ver en los colores de neón.
Ninguna cantidad de consejos y trucos le enseñará cómo escribir indicaciones de IA efectivas que la experiencia. La mejor parte de los generadores de imágenes de IA es que son muy accesibles. Todo lo que necesita es una conexión a Internet y puede elegir entre las muchas plataformas gratuitas disponibles.
Así que salga y experimente con las indicaciones de imágenes de IA para ver qué cosas nuevas y fascinantes puede descubrir en el creciente campo de la generación de imágenes.