paint-brush
Com escriure indicacions precises a la cuina de prova d'IA de Googleper@thecharlemagne
778 lectures
778 lectures

Com escriure indicacions precises a la cuina de prova d'IA de Google

per Obinna Mbajunwa7m2024/10/25
Read on Terminal Reader

Massa Llarg; Per llegir

L'AI Test Kitchen ImageFX de Google es pot utilitzar per crear imatges animades. Quan creeu una indicació d'imatge, tingueu en compte aquests tres components clau. Una indicació vaga probablement produirà resultats genèrics i inutilitzables. Quan es fa correctament, ImageFX destaca per generar sortides específiques de la regió adaptades a les vostres necessitats.
featured image - Com escriure indicacions precises a la cuina de prova d'IA de Google
Obinna Mbajunwa HackerNoon profile picture

Probablement heu sentit innombrables vegades que quan es tracta de sol·licitar, ja sigui a ChatGPT, MidJourney, Synthesia, Runway ML o qualsevol altra eina d'IA, és clau ser el més precís possible. El primer pas cap a la precisió és el detall. La IA, tal com la coneixem, no és un lector de ment; funciona únicament en funció de la informació que proporcioneu. Només amb aportacions clares i detallades podeu aconseguir els millors resultats.


Aquest principi també s'aplica quan es generen imatges precises. Tanmateix, en aquest cas, quan us demaneu, heu de pensar com un fotògraf, un dissenyador i un escriptor alhora.


En aquest article, explorarem com escriure instruccions efectives per a l'AI Test Kitchen ImageFX de Google per obtenir resultats precisos.


En primer lloc, no fer-ho amb AI Test Kitchen Image FX

  • ImageFX no permet consultes que puguin donar lloc a sortides que involucren menors o determinades persones destacades.
  • També desaconsella les consultes que donen lloc a imatges que representen abusos, violència, autolesions o qualsevol contingut que promogui l'odi.


Per què importa la precisió?

La precisió pot significar la diferència entre un resultat defectuós i una sortida perfectament executada, especialment quan es generen imatges. Les indicacions de text poden oferir resums vagues, però les indicacions d'imatge mal estructurades poden afectar dràsticament el resultat. Si, com jo, estàs creant per a un públic no caucàsic, has de ser extremadament precís. Una indicació vaga probablement produirà resultats genèrics i inutilitzables. Tanmateix, quan es fa correctament, ImageFX destaca per generar sortides específiques de la regió adaptades a les vostres necessitats.

Elaboració d'indicacions efectives: una guia pas a pas

Quan creeu una indicació d'imatge, tingueu en compte aquests tres components clau:

1. Qui és el teu tema?

Suposem que estàs conceptualitzant una imatge d'una "dona en una cafeteria". En aquest cas, la dona és el subjecte. És fonamental definir clarament el teu tema, en funció del públic i de la teva intenció.


Vegeu la diferència entre ambdues indicacions.


Avís 1: una dona en una cafeteria.


Indicador d'ImaageFX que mostra una dona en una cafeteria.


Avís 2: una dona nigeriana grassa asseguda en una cafeteria.


Indicació d'ImageFX d'una dona nigeriana grassa asseguda en una cafeteria.



2. Sigues descriptiu i detallat


En altres paraules, "mostrar el funcionament". Quines accions fan els personatges? Quina hora del dia és? Quin és l'estat d'ànim? Descriu l'escenari, els vestits dels personatges, els temes secundaris i l'atmosfera general.


Exemple:

Una dona nigeriana grassona asseguda en una cafeteria prenent cafè. A la taula hi ha un llibre i un iPhone i assegut al seu costat hi ha un Pomeranian.


Indicador d'ImageFX que mostra una dona nigeriana asseguda en una cafeteria amb una pomerania


3. Sigueu específics sobre la composició i l'estil

Aquí és on cal pensar com un dissenyador. Tingueu en compte el disseny i l'estil. Vols un estil animat? Si és així, de quin tipus? Voleu que estigui animat i, en cas afirmatiu, quin tipus d'animació: animació tradicional (2D, animació dibuixada a mà) o animació 3D (CGI)? Afortunadament, si voleu adoptar un estil d'animació particular que us agradi, ImageFX us permet experimentar amb diferents estils d'animació.


Avís

Una dona nigeriana grassona asseguda en una cafeteria prenent cafè. A la taula hi ha un llibre i un iPhone i assegut al seu costat hi ha un Pomeranian. Tots estan a l'estil animat de Pixar.


ImageFX Pixar animació d'una dona nigeriana asseguda en una cafeteria amb un pomeranian


Una dona nigeriana grassona asseguda en una cafeteria prenent cafè. A la taula hi ha un llibre i un iPhone i assegut al seu costat hi ha un Pomeranian. Tots estan a l'estil animat de Simpson.


ImageFX Simpson animació d'una dona nigeriana asseguda en una cafeteria amb una pomerània


Per entrar en la mentalitat d'un fotògraf, heu de tenir en compte els angles, la il·luminació i l'enfocament de la fotografia.

Indicacions amb diferents angles:

1. Primer pla (Centrar en la dona i el glop de cafè)

Imatge de primer pla d'una dona nigeriana grassa aixecant la tassa de cafè cap als llavis, fent un glop lent. La seva cara mostra una expressió relaxada. A la taula davant d'ella, hi ha un llibre obert al costat d'un iPhone, parcialment a la vista. Un Pomeranian s'asseu tranquil·lament al seu costat, mirant al marc.


Imatge en primer pla d'una dona nigeriana asseguda en una cafeteria amb una pomerània


2. Per sobre de l'espatlla (Enfocament a la taula i l'escena)

Fotografiada per sobre de l'espatlla des de darrere d'una dona nigeriana grassa, capturant l'escena des de la seva perspectiva. La taula mostra un llibre obert i el seu iPhone al costat. La Pomerania està asseguda al seu costat, amb l'ambient de la cafeteria visible al fons.


Imatge per sobre de l'espatlla d'una dona nigeriana asseguda en una cafeteria amb una pomerania


3. Gran angular (vista completa de la sala de l'escena)

Plana gran angular que mostra tota l'escena de la cafeteria: una dona nigeriana grassa asseguda a una taula, prenent cafè, amb el llibre i l'iPhone al davant. Una Pomerania està asseguda al seu costat, semblant tranquil·la. L'entorn de la cafeteria inclou una il·luminació suau, altres clients i un ambient càlid.


Imatge gran angular d'una dona nigeriana asseguda en una cafeteria amb una pomerània


4. Vista d'ocell (Perspectiva de dalt a baix de la taula)

La vista d'ocell des de sobre de la taula mostra tota l'escena: un llibre obert, un iPhone i una tassa de cafè sobre una taula. Una pomerania s'asseu al costat d'una dona nigeriana grassa mentre beu el seu cafè, creant un moment tranquil i content capturat des de dalt.


Vista d'ocell d'una dona nigeriana asseguda en una cafeteria amb una pomerània


5. Pla mitjà (vista equilibrada de la dona, la taula i la pomerania)

Plano mitjà des del costat, que mostra una dona nigeriana grassona asseguda còmodament a la cafeteria prenent el seu cafè. Es veu una taula amb el llibre obert i l'iPhone disposats, i un Pomeranian està assegut al seu costat, observant tranquil·lament l'entorn. La càlida il·luminació de la cafeteria augmenta l'ambient.

Imatge mitjana d'una dona nigeriana asseguda en una cafeteria amb una pomerania


6. Perfil lateral (destacant la dona i la mascota)

Imatge de perfil lateral d'una dona nigeriana grassa asseguda a una taula, prenent el cafè, amb un llibre obert davant i l'iPhone col·locat a prop. Un Pomeranian està assegut al seu costat, mirant cap a ella o mirant endavant. L'interior de la cafeteria ofereix un teló de fons suau i acollidor.

Imatge de perfil lateral d'una dona nigeriana asseguda en una cafeteria amb una pomerania


7. Primer pla (Enfocament en la Pomerania)

Primer pla d'un Pomeranian assegut a la cadira al costat d'una dona, amb aspecte tranquil i content. Al fons borrós, es pot veure una dona nigeriana grassa prenent el seu cafè amb el llibre i l'iPhone a la taula.


Imatge de primer pla d'una dona nigeriana asseguda en una cafeteria amb una pomerània


9. Angle superior (mostrar cafè, llibre i telèfon)

Plant d'angle superior que captura la mà d'una dona nigeriana grassa que sosté la tassa de cafè mentre l'aixeca per prendre un glop. Un llibre es troba obert a la taula amb un iPhone al costat, creant una vista de dalt a baix de la configuració de la taula. Només es veu un Pomeranian assegut al seu costat, completant l'escena.

Cap d'angle d'una dona nigeriana asseguda en una cafeteria amb un pomeranian


Consells per obtenir els millors resultats a ImageFX

  • Experimenteu amb paraules clau: no dubteu a provar diferents combinacions de paraules clau. ImageFX pot ser restrictiu, però amb les indicacions adequades, podeu aconseguir resultats propers als ideals.
  • Mantenir la coherència: quan creeu una sèrie d'imatges, mantingueu l'angle i l'estil coherents. Canvia de tema només quan sigui necessari.
  • Utilitzeu identificadors: quan genereu diverses imatges amb el mateix tema, doneu identificadors únics al subjecte per mantenir el flux.

Resolució de problemes habituals amb ImageFX

Consulta: "Sóc un nigerià que crea per a un públic nigerià, però alguns detalls estan desactivats". Resposta: la IA no és un lector de ment. Heu d'ajustar els vostres descriptors per obtenir resultats més precisos.


Exemple:

  • Avís 1: Un conductor nigerià davant d'un autobús.

Imatge de sortida ràpida d'un conductor nigerià


Avís 2: un conductor nigerià de Lagos amb pantalons curts i una samarreta de tirants davant d'un autobús Danfo groc (Volkswagen T3).


Imatge detallada sortida ràpida d'un conductor nigerià

Conclusió

Tot i que no necessiteu ser un escriptor prolífic per elaborar indicacions efectives, sí que us heu de prendre el temps per descriure de manera clara i descriptiva el que voleu. No us desanimeu si el resultat no és perfecte al primer intent; seguiu experimentant, afegint o eliminant paraules clau segons sigui necessari.


I amb això us deixo aquestes imatges que vaig conceptualitzar amb ImageFX. Gaudeix.


Sortida ImageFX de So Good, potser Netflix

Sortida ImageFX de So Good, potser Netflix

Sortida ImageFX de So Good, potser Netflix