Подробный промт для описания фото (с примерами готовых промтов)

В сети представлено огромное множество изображений, сгенерированных искусственным интеллектом, однако далеко не каждое из них выглядит правдоподобно. Обыватель часто думает, что достаточно набросать пару слов, и умная машина немедленно выдаст готовый шедевр мирового уровня. Скепсис быстро сменяется разочарованием, когда на экране появляется шестипалый мутант на фоне криво покосившихся стен. Буквально пару лет назад это считалось забавным багом, но сейчас индустрия цифрового искусства шагнула невероятно далеко вперёд, требуя глубокого понимания механик. И всё же, чтобы получить скрупулёзный, математически точный результат, придётся изрядно попотеть над текстом. Махинации с настройками могут отпугнуть новичка на первых порах. Но чтобы не ошибиться в общении с алгоритмами, нужно освоить искусство составления грамотных текстовых запросов.

С чего начинается выбор?

С определения базовой стилистики и общей атмосферы. Естественно, для начала стоит понять, будет ли это фотографический гиперреализм, векторная графика или имитация густых мазков масляной краски. Начинать нужно с чёткого указания формата изображения. Ведь именно он имеет решающее значение для итоговой картинки. К первой группе относится классический фотографический стиль, требующий указания типа старой плёнки или модели современной камеры. Далее следует художественная интерпретация, строго вписанная в рамки конкретного направления классического искусства. Ну и, наконец, замыкает этот ряд сложный трёхмерный рендер, солирует в котором движок Unreal Engine пять или Octane. Разумеется, излишняя наляпистость здесь ни к чему. На самом деле, львиная доля итогового успеха зависит от первого предложения, задающего тон всей композиции. Истинный кладезь идей можно найти на специализированных форумах, где местный цифровой бомонд охотно делится своими рабочими формулами.

Освещение

Мягкий вечерний свет скользит по лицам прохожих. Начинать работу с кадром без понимания законов оптики совершенно бессмысленно. Чудеса способен творить правильно выставленный свет. Это факт. Проверенный. Практикой. К слову, неудачно расположенные виртуальные источники могут испортить даже самую добротную первоначальную задумку. В сознании многих достаточно написать слово «солнечно», но машина требует абсолютной конкретики. Дело в том, что алгоритмы мыслят жёсткими математическими формулами. Поэтому стоит использовать профессиональные термины вроде «мягкий контровой свет», «закатный золотой час» или «жёсткая неоновая подсветка». А если ещё вспомнить про кинематографическое освещение студийного уровня, то антураж картинки меняется просто кардинально. Нельзя не упомянуть про густые объёмные лучи, пробивающиеся сквозь пыльный воздух заброшенного помещения. При таком подходе главная изюминка кадра бросается в глаза моментально.

Построение кадра: композиция

Сложно ли выстроить правильную перспективу в текстовом запросе? Да, но итоговый результат точно того стоит. Выбор ракурса — задача не из лёгких. Индустрия генеративных сетей уже крепко стоит на ногах, поэтому случайности лучше исключить полностью. С одной стороны, можно довериться хаосу, с другой — лучше взять управление фокусом в свои руки. Не скупитесь на указания крупности плана при формировании сцены. Сначала алгоритмом формируется задний фон, размытый портретным объективом с фокусным расстоянием восемьдесят пять миллиметров. Затем прорисовывается насыщенный средний план, заполненный мелкими второстепенными деталями. И только потом на переднем плане появляется главный герой, моментально приковывающий внимание зрителя. К тому же, строгая симметрия в стиле Уэса Андерсона или агрессивный голландский угол добавляют тот самый колоритный эффект дорогого кино. Безусловно, процесс не сложный, но довольно кропотливый. Ошибки в пропорциях обязательно всплывут, если легкомысленно упустить этот этап.

Как подобрать детали?

Нюанс всегда кроется в едва заметных мелочах. Одежда, потёртые текстуры, мимолётные эмоции — всё это вносит свою лепту в создание полной иллюзии реальности. Исконно человеческая черта — замечать мельчайшие несовершенства кожи или неестественно идеальные складки на ткани. Поэтому при описании персонажа стоит отмечать даже лёгкие веснушки, глубокие мимические морщинки или капли холодного пота на лбу. Тем более, что современные сети отлично понимают структуру различных тканей. Желание облачиться в вычурный наряд всегда было свойственно виртуальным героям (особенно в жанре фэнтези). Плотный твидовый пиджак, надетый поверх тонкой шёлковой блузы, застёгнутый на все медные пуговицы, снабжённый массивными запонками, будет смотреться в кадре абсолютно достоверно. Использование творительного падежа при описании свойств отлично спасает алгоритм от смысловой путаницы. Однако не перегружайте нейросеть тысячей мельчайших атрибутов. Кошелёк станет легче довольно быстро, если вы будете платить за генерацию каждого неудачного варианта на коммерческих сервисах.

Какими бывают ошибки?

Часто новичок натыкается на проблему критической перегруженности запроса. Зрелище получается поистине удручающее. Когда в одну короткую строку пытаются впихнуть мрачный киберпанк, викторианскую эпоху, аниме и реализм. Итоговый результат обычно напоминает испорченный винегрет. Конечно, свободно экспериментировать можно, однако здравый смысл никто не отменял. Впрочем, другая крайность — излишняя, сухая лаконичность. Фраза «красивая девушка сидит в лесу» выдаст настолько скучную, шаблонную картинку, что взгляд за неё даже не зацепится. Настоящий спасательный круг в такой запутанной ситуации — это грамотный баланс. Нужно отметить, что использование старых слов-усилителей («шедевр», «лучшее качество», «восемь ка») уже давно не работает так потрясающе, как раньше. Буквально три года назад это было суровой необходимостью, но сейчас алгоритмы невероятно поумнели. Своя ложка дёгтя есть в любом обновлении. Здесь скрываются свои подводные камни, требующие постоянной адаптации. Да и самим художникам гораздо комфортнее работать с осмысленными, литературными предложениями.

Портретная съёмка

На глазах персонажа мгновенно фокусируется виртуальная камера. Правило начала сцены с главного работает здесь абсолютно безотказно: мы сразу видим пронзительный взгляд, а уже потом медленно замечаем остальное окружение. Создание идеального, живого лица требует крайне щепетильного отношения к техническим настройкам. Само собой, здесь полноправно солирует макро-объектив. Стоит задуматься о добавлении в текст конкретных культовых марок фототехники. Изысканный винтажный портрет гарантированно получится, если напрямую упомянуть среднеформатную камеру Хассельблад. А вот для суровой репортажной эстетики отлично подойдёт упоминание классической Лейки. Любимое чадо на таких семейных портретах будет выглядеть как ожившая музейная картина. Пыль медленно оседает на объективе. Обе стороны медали заключаются в том, что вы получаете невероятную, звенящую детализацию, но сильно рискуете потерять художественную, живописную лёгкость. Но есть и несомненные плюсы. Такие крупные портреты всегда выглядят невероятно внушительно.

Архитектура и пейзаж: особенности

Устав от серой суеты мегаполисов, многие люди искренне грезят о тихих лесных домиках или сияющих футуристичных городах. Архитектурные смелые махинации с формами — излюбленная тема современных цифровых творцов. Как правильно выстроить такой сложный промт? С точного указания времени суток и сопутствующих атмосферных явлений. Довольно часто авторы забывают про густой туман, проливной дождь или песчаную бурю. А ведь именно они задают нужное, глубокое настроение.

Грандиозный готический замок, окутанный плотной утренней дымкой, возвышающийся над крутым скалистым обрывом, освещённый первыми робкими лучами солнца — это очень добротный базовый запрос.

К слову, если добавить упоминание конкретного архитектурного бюро Захи Хадид или гениального Антонио Гауди, привычное строение сразу приобретёт причудливые, текучие формы. Нельзя не упомянуть, что широкие панорамные виды требуют соответствующего угла обзора. Самобытный стиль ночных мегаполисов лучше всего передаёт объектив с фокусным расстоянием в четырнадцать миллиметров, который легко охватит всю сцену целиком. Это мощно.

Стоит ли использовать модификаторы?

Обязательно ли вписывать сухие технические параметры в конец текста? Вовсе нет. Но именно с ними итоговый результат становится максимально предсказуемым. Глобальное освещение, трассировка лучей, объёмный туман — все эти специфические термины плавно перекочевали в нейросети из современной игровой индустрии. Тем более, что они отлично помогают избавиться от неприятной мыльности картинки. Кроме того, можно и нужно использовать негативные промты. Это специальное текстовое поле, куда вписывается абсолютно всё, что вы категорически не хотите видеть в готовом кадре. Откажитесь от сложных предложений, просто перечислите через пробел: мыло, анатомические искажения, лишние пальцы, водяные знаки, уродливый текст. Заслуживает истинного уважения тот замечательный факт, что современные интерфейсы позволяют гибко настраивать математический вес каждого отдельного слова. Если вы хотите, чтобы глубокий синий цвет преобладал в сцене, достаточно просто заключить его в скобки (иногда добавив нужный числовой коэффициент). Выручит такой инженерный подход в сложных, многоуровневых композициях. Такой подход даёт весьма неоднозначный результат в руках новичка. Это серьёзное вложение времени в обучение. Но оно точно не сильно ударит по кошельку в долгосрочной перспективе. Тем более, если вы генерируете изображения локально на своей видеокарте. Ну, а если итоговый результат всё равно не устраивает, придётся радикально менять сид.

Коммерческая фотография

Сухая теория без регулярной практики абсолютно мертва. Поэтому давайте разложим по полочкам несколько рабочих, проверенных вариантов. Даже самый бюджетный генератор отлично справится с едой, если задать правильные параметры. Венчает композицию всегда главный продукт. Первый пример идеально подойдёт для создания аппетитной коммерческой фуд-фотографии.

Сочный говяжий бургер с хрустящей румяной корочкой, с которого медленно стекает горячий расплавленный чеддер, лежащий на грубой деревянной доске, окружённый мелкими брызгами острого соуса, снятый при жёстком студийном свете с высокой детализацией.

Это совершенно не бьёт по бюджету рекламной кампании, а выглядит потрясающе. Второй запрос явно тяготеет к тёмному фэнтези.

Могущественный эльфийский маг, облачённый в тяжёлые изумрудные мантии, стоящий посреди мрачного древнего леса, крепко держащий светящийся деревянный посох, кинематографичное боковое освещение, абсолютный гиперреализм, Unreal Engine пять.

Ну и, конечно же, классический неоновый киберпанк.

Ночной Токио под сильным проливным дождём, отражающий яркий свет рекламных вывесок в глубоких лужах, одинокая фигура в длинном чёрном плаще со светящимся прозрачным зонтом, снято на тридцати пяти миллиметровый объектив.

Постулаты машинной генерации гласят, что эти базовые формулы можно легко адаптировать под абсолютно любые творческие нужды. Если нужно с головой окунуться в процесс, просто начните менять переменные местами.

Эксперименты с текстовыми запросами — это всегда захватывающее путешествие, требующее колоссального терпения и хорошей визуальной насмотренности. Не стоит слепо копировать чужие работы, лучше аккуратно комбинировать несочетаемые стили и смело нарушать привычные композиционные правила. Главное — чётко осознавать, какую именно эмоцию должна вызывать итоговая картинка у случайного зрителя, и шаг за шагом вести упрямую нейросеть к этой намеченной цели. Пусть каждый сгенерированный кадр невероятно точно передаёт вашу изначальную задумку, а сам процесс создания новых визуальных миров приносит только искреннее удовольствие. Удачных генераций, и пусть ваше творческое воображение никогда не знает скучных технических ограничений!