В сети представлено множество сгенерированных изображений, глядя на которые обыватель невольно замирает от восхищения. Буквально десятилетие назад подобная реалистичность казалась научной фантастикой, но сейчас нейросети плотно вошли в нашу жизнь. Устав от суеты стандартных фотосессий с их утомительным поиском локаций, многие грезят создать шедевр буквально в пару кликов. И ведь действительно кажется, что достаточно написать пару слов машинной бездне, как идеальный результат не заставит себя ждать. Однако на деле вместо ожидаемого великолепия часто всплывают откровенные махинации алгоритмов с лишними пальцами или искажёнными пропорциями лица. А начать стоит с понимания механики правильного составления текстового запроса.
Анатомия
Словами сыт не будешь. Точнее, абстрактными фразами нейросеть не накормишь. Ведь искусственный интеллект требует предельной конкретики и понятной структуры. К первой группе обязательных параметров относится сам субъект генерации. Далее следует детальное описание окружения, задающее тот самый колоритный антураж. Отдельно стоит упомянуть технические характеристики камеры, имитирующие реальную оптику. Последним в этой цепочке идёт тип освещения, который, собственно, и творит чудеса с объёмом. Разумеется, всё это нужно перевести на английский язык. Это тяжёлый, но эффективный способ добиться фотографического качества.
Стоит ли экономить слова?
Сложно ли составить идеальную комбинацию с первого раза? Да, поначалу придётся попотеть. Многие считают короткие команды благом, но на самом деле скудный словарный запас сильно бьёт по бюджету вашего времени. Ведь переделывать неудачные варианты придётся десятки раз. Конечно, система попытается додумать недостающие детали самостоятельно, однако её фантазия часто тяготеет к пугающему гротеску. Не стоит перебарщивать и с огромными абзацами. Алгоритм банально теряет фокус, забывая прописанные в самом конце условия. Оптимальный объём текста — от тридцати до семидесяти слов. И всё же иногда короткий запрос выдаёт грандиозный результат. Главное — разложить по полочкам самые важные визуальные акценты в самом начале строки.
Стиль киберпанк в генерации
Неоновые вывески, отражающиеся в лужах. Именно с таких деталей часто начинается погружение в мрачное будущее. Когда-то этот жанр жил лишь на страницах комиксов, сейчас же он переживает настоящий цифровой ренессанс. Для создания подобного шедевра нам понадобится брутальный мужской персонаж. Лицо, освещённое холодным синим светом, покрытое мелкими каплями дождя, снабжённое высокотехнологичными имплантами, вписывается в сцену идеально. К тому же, стоит добавить упоминание кинематографического стиля. В текстовом поле это выглядит примерно так:
«Cinematic portrait of a brutal man, neon cyberpunk city background, rain drops on face, glowing cybernetic eye implant, cold blue and magenta lighting, 85mm lens, highly detailed, 8k resolution»
Зрелище получается действительно впечатляющее.
Как выбрать свет?
В классической фотографии свет решает абсолютно всё. И нейросети здесь не стали исключением. Тем более, что именно глубокие тени формируют характер персонажа на итоговом холсте. Обязательно ли указывать конкретные схемы расстановки ламп? Вовсе нет. Но без них вы получите скучное, абсолютно плоское лицо. Настоящий спасательный круг кроется в профессиональных терминах. Одно из самых популярных студийных решений — свет Рембрандта, который мы прописываем как «Rembrandt lighting». Компактное решение для драматичных силуэтов — контровое освещение («backlighting»). Ну и, конечно же, нельзя не упомянуть золотой час («golden hour lighting»), заливающий кожу тёплым предзакатным солнцем. Заслуживает истинного уважения то, насколько точно математические модели научились имитировать физику реальных лучей.
Улицы Парижа: романтика
Цифровой бомонд часто использует узнаваемые географические маркеры. Ведь архитектура сразу задаёт нужное настроение. Молодая девушка, волосы, слегка растрёпанные ветром, задумчивая полуулыбка. Французский шарм творит настоящую магию. Заставляя модель облачиться в лёгкий бежевый тренч, мы добавляем кадру утончённости. Запрос формируется довольно просто:
«Beautiful french woman in a beige trench coat, sitting in a parisian street cafe, drinking coffee, blurred Eiffel tower in the background, soft morning sunlight, shot on Kodak Portra 400, natural makeup, candid photography»
Изысканный винтажный налёт плёнки Кодак делает картинку невероятно живой. Натыкаешься на такие работы в ленте и веришь, что это настоящий снимок.
Вредно ли перегружать запрос?
Ложка дёгтя кроется в чрезмерном энтузиазме новичков. Хочется ведь вписать сразу всё: и проливной дождь, и яркое солнце, и студийный свет, и снежные сугробы. Не стоит смешивать взаимоисключающие погодные явления. Дело в том, что система начнёт жестоко конфликтовать сама с собой. Из-за этого вычурный сложный текст превращается в кашу из искажённых пикселей. Лучше отказаться от лишних эпитетов, оставив только самую суть. Скрупулёзный подход к каждому прилагательному окупится сторицей. Да и самим серверам комфортнее обрабатывать логичные, непротиворечивые цепочки.
Винтажная оптика
Фотография зародилась в девятнадцатом веке, пройдя долгий путь от громоздких деревянных ящиков до современных матриц. Использовать старинные объективы сегодня — весьма дорогое удовольствие. Кошелёк станет легче на внушительную сумму при покупке реального стекла. Но в текстовой строке эксперименты не сильно ударят по кошельку. Внесение в промт таких маркеров, как «Helios 44-2 lens» или «Petzval lens», мгновенно меняет рисунок заднего плана. Закрученное боке, созданное виртуальными линзами, поражает своей художественной достоверностью. Впрочем, здесь кроются свои специфические подводные камни. Иногда искусственный интеллект слишком увлекается размытием. Поэтому не скупитесь на уточнения степени резкости на глазах вашей модели («sharp focus on eyes»).
Обязательны ли эмоции?
С чего начинается искренность в портрете? С еле уловимой мимики. Суровое статичное лицо быстро наскучит зрителю. Стоит отметить, что нейросети отлично понимают тончайшие душевные порывы. Искренняя улыбка, застывшая в уголках губ («subtle smile»), или лёгкий прищур («squinting eyes») добавляют ту самую необходимую изюминку. Безусловно, процесс подбора нужной эмоции не сложный, но довольно кропотливый. Эти нехитрые постулаты работают практически безотказно. Кстати, не забудьте проверить направление взгляда. Персонаж, смотрящий прямо в объектив («looking at viewer»), устанавливает прочный контакт. А вот отведённые в сторону глаза («looking away») создают атмосферу загадочности. Обе стороны медали хороши по-своему.
Свадебное платье в морском стиле
Ткань, пропитанная солёным бризом. Ни одна выездная церемония не обходится без развевающихся подолов. Чтобы запечатлеть такой момент в цифровой среде, придётся внести весомую лепту в описание фактур. Начинать нужно с главной героини. Исконно человеческие, слегка несовершенные черты делают портрет живым (например, лёгкие веснушки). Платье, сшитое из струящегося шёлка, украшенное тонким кружевом, отлично впишется в морской пейзаж. Формулируем мысль:
«Bridal portrait, young woman in a flowing silk wedding dress, standing on a rocky beach, stormy ocean waves, dramatic cloudy sky, cinematic wind in hair, medium format photography, Hasselblad camera, highly detailed fabric»
Венчает эту композицию упоминание среднеформатной камеры Хассельблад, которая славится своей феноменальной детализацией.
Создавая своё виртуальное чадо, помните о гармонии между техникой и искусством. Пробуйте смешивать стили, играйте с освещением и не бойтесь неожиданных результатов, ведь именно в них часто скрывается гениальность. Пусть каждый новый сгенерированный портрет порадует домочадцев и станет отличным решением ваших творческих задач!