Вероятно сте чували безброй пъти, че когато става въпрос за подсказване – независимо дали в ChatGPT, MidJourney, Synthesia, Runway ML или който и да е друг AI инструмент – е от ключово значение да бъдете възможно най-точни. Първата стъпка към прецизността е детайлът. AI, както го познаваме, не е четец на мисли; тя работи единствено въз основа на информацията, която предоставяте. Само с ясен и подробен вход можете да постигнете най-добри резултати.
Този принцип се прилага и при генериране на прецизни изображения. В този случай обаче, когато подсказвате, трябва да мислите като фотограф, дизайнер и писател едновременно.
В тази статия ще проучим как да напишем ефективни подкани за AI Test Kitchen ImageFX на Google, за да получите точни резултати.
Прецизността може да означава разликата между грешен резултат и перфектно изпълнен изход, особено при генериране на изображения. Текстовите подкани може да предложат неясни обобщения, но лошо структурираните подкани за изображения могат драстично да повлияят на резултата. Ако като мен създавате за некавказка публика, трябва да сте изключително прецизни. Една неясна подкана вероятно ще доведе до общи, неизползваеми резултати. Въпреки това, когато се направи правилно, ImageFX се отличава с генерирането на специфични за региона изходи, съобразени с вашите нужди.
Когато създавате подкана за изображение, имайте предвид тези три ключови компонента:
1. Кой е вашият предмет?
Да предположим, че концептуализирате образ на „жена в кафене“. В случая субект е жената. От съществено значение е ясно да дефинирате темата си в зависимост от аудиторията и вашите намерения.
Вижте разликата между двете подкани.
Подсказка 1: Жена в кафене.
Подсказка 2: Закръглена нигерийска жена, седнала в кафене.
2. Бъдете описателни и подробни
С други думи "покажете работата." Какви действия извършват героите? Кое време на деня е? какво е настроението Опишете обстановката, облеклото на героите, всички второстепенни теми и цялостната атмосфера.
Пример:
Пълна нигерийка, седнала в кафене и отпивайки кафе. На масата има книга и iPhone, а до нея седи померан.
3. Бъдете конкретни относно композицията и стила
Тук трябва да мислите като дизайнер. Помислете за оформлението и стила. Искате ли анимиран стил? Ако да, какъв вид? Искате ли да бъде анимирана и ако да каква анимация - традиционна анимация (2D, ръчно рисувана анимация) или 3D анимация (CGI)? За щастие, ако искате да приемете конкретен стил на анимация, който харесвате, ImageFX ви позволява да експериментирате с различни стилове на анимация.
подкана
Пълна нигерийка, седнала в кафене и отпивайки кафе. На масата има книга и iPhone, а до нея е седнал померан. Всички са в анимационен стил на Pixar.
Пълна нигерийка, седнала в кафене и отпивайки кафе. На масата има книга и iPhone, а до нея седи померан. Всички те са в анимационния стил на Симпсън.
За да влезете в мисленето на фотографа, трябва да имате предвид ъглите, осветлението и фокуса на кадъра.
Подкани с различни ъгли:
Близък план на пълна нигерийска жена, вдигаща чашата си с кафе към устните си, отпивайки бавно. Лицето й показва отпуснато изражение. На масата пред нея книга лежи отворена до iPhone, частично видима. Померан седи тихо до нея и наднича в рамката.
Кадър през рамо отзад на пълна нигерийска жена, улавяне на сцената от нейната гледна точка. Масата показва отворена книга и нейния iPhone, разположен до нея. Померанът е седнал до нея, а на заден план се вижда атмосферата на кафенето.
Широкоъгълен кадър, показващ цялата сцена от кафенето: пълна нигерийска жена, седнала на маса, отпивайки кафе, с книгата и iPhone, разположени пред нея. Померан седи до нея и изглежда спокоен. Обстановката на кафенето включва меко осветление, други клиенти и топла атмосфера.
Изглед от птичи поглед точно над масата показва цялата сцена: отворена книга, iPhone и чаша кафе на масата. Померан е седнал до пълна нигерийска жена, докато тя отпива от кафето си, създавайки спокоен, доволен момент, уловен отгоре.
Средна снимка отстрани, показваща пълна нигерийска жена, удобно седнала в кафенето и отпивайки от кафето си. Вижда се маса с отворена книга и iPhone, а до нея е седнал померан, който спокойно наблюдава околността. Топлото осветление на кафенето допринася за атмосферата.
Страничен профил на пълна нигерийска жена, седнала на маса, отпивайки от кафето си, с отворена книга пред нея и iPhone, поставен наблизо. Померан е седнал до нея, или гледа към нея, или гледа напред. Интериорът на кафенето осигурява мек, уютен фон.
Близък план на померан, седнал на стола до жена, изглеждащ спокоен и доволен. На замъгления фон може да се види пълна нигерийска жена, която отпива от кафето си с книгата и iPhone на масата.
Кадър отгоре, който улавя ръката на пълна нигерийска жена, която държи чашата за кафе, докато я повдига, за да отпие. Книга лежи отворена на масата с iPhone до нея, създавайки изглед отгоре надолу на настройката на масата. Вижда се померан, седнал до нея, допълвайки сцената.
Запитване: „Аз съм нигериец, творя за нигерийска публика, но някои подробности не са налични.“ Отговор: AI не е четец на мисли. Трябва да коригирате вашите дескриптори за по-точни резултати.
Пример:
Подсказка 2: Нигерийски кондуктор от Лагос, облечен с къси панталони и потник пред жълт автобус Danfo (Volkswagen T3).
Въпреки че не е нужно да сте плодовит писател, за да създавате ефективни подсказки, трябва да отделите време, за да очертаете ясно и описателно това, което искате. Не се обезсърчавайте, ако резултатът не е перфектен при първия опит – продължавайте да експериментирате, добавяйки или премахвайки ключови думи, ако е необходимо.
И с това ви оставям с тези изображения, които концептуализирах с помощта на ImageFX. Насладете се.