Промт для фото друзей (с примерами готовых промтов)

В сети можно встретить великое множество сгенерированных картинок, но почему-то именно групповые портреты вызывают у машинного интеллекта наибольший ступор. Алгоритмы великолепно справляются с одиночными персонажами, выдавая фотореалистичные шедевры, однако стоит поместить в кадр целую компанию, как начинаются настоящие графические махинации со сросшимися туловищами и лишними конечностями. Неискушённый обыватель часто опускает руки после первых же попыток, разочаровавшись в современных технологиях окончательно. Буквально пару лет назад получить приличный результат без искажений было практически невозможно, но сейчас архитектура нейросетей шагнула далеко вперёд. Но чтобы не ошибиться и не слить кредиты генерации впустую, к составлению текстового запроса нужно подходить максимально осознанно.

С чего начинается работа? С определения того самого пресловутого контекста. Вспышка старой плёночной мыльницы, заливистый смех, слегка размытый фон вечерней улицы. Именно такую живую эмоцию чаще всего грезят получить авторы, садясь за клавиатуру. Ведь машина не умеет читать мысли, ей требуются конкретные вводные данные. Само собой, придётся скрупулёзно разложить по полочкам каждую мелочь: от направления лучей солнца до типа объектива. Процесс этот не сложный, но довольно кропотливый, требующий усидчивости. Не стоит бездумно копировать чужие многоэтажные абзацы текста на английском языке. Лучше отказаться от словесного мусора, оставив лишь точные, бьющие в цель инструкции. А начать стоит с понимания того, как машина вообще читает ваш текст.

Анатомия запроса

Строение фразы подчиняется весьма строгим законам. В первую очередь прописывается основной субъект, обрастая затем второстепенными деталями. К первой группе относится само описание людей: их точное количество, возраст, расовая принадлежность и стиль одежды. Далее следует указание локации, задающее нужный антураж всей сцене. Следующий важный критерий охватывает технические параметры виртуальной камеры, фокусное расстояние, глубину резкости. Ну и, наконец, замыкает конструкцию перечисление стилистических особенностей, вроде кинематографического света, зернистости или эффекта старой плёнки. К слову, порядок слов играет решающую роль. Стоящее в самом начале словосочетание алгоритм воспринимает как команду наивысшего приоритета. Вся суть в том, что веса внимания распределяются по убыванию. Поэтому важные детали, например, слово «фотореализм», стоит выносить в самый старт предложения.

Студийный портрет в минимализме

Наряд для избранных. Именно так можно охарактеризовать строгие студийные снимки, где нет ничего лишнего. Выглядит впечатляюще. Эстетичны ли такие кадры? Само по себе серое или белое полотно на заднем плане не отличается особой красотой, но именно на его фоне фактура лиц солирует по-настоящему. Нужно отметить, что отрисовка чистого фона даётся программам довольно просто, снижая риск появления галлюцинаций. Готовый добротный вариант текста выглядит так:

«фотореалистичный портрет, три молодых человека стоят в ряд на фоне бесшовной белой циклорамы, одеты в базовые белые футболки и классические голубые джинсы, смотрят в камеру, улыбаются, студийное освещение с мягкими тенями, снято на объектив пятьдесят миллиметров, диафрагма два и восемь, сверхвысокое разрешение, восемь ка»

Конечно, результат может слегка отличаться от задуманного в голове идеала, однако обычно обе стороны медали в подобных сюжетах вполне предсказуемы. Изысканный мягкий свет творит чудеса, скрывая мелкие программные недочёты.

Отдых в лесу: атмосфера кемпинга

Тёплый солнечный свет пробивается сквозь густую листву вековых сосен, освещая деревянный походный стол. Заслужить истинное уважение алгоритма можно, если погрузить персонажей в сложную природную среду, где много мелких деталей. Отдельно стоит упомянуть эстетику дикого кемпинга, которая бьёт все рекорды популярности среди пользователей. Пример рабочего запроса выстраивается следующим образом:

«документальная фотография, четверо друзей сидят вокруг вечернего костра в хвойном лесу, пьют чай из металлических кружек, на заднем плане видна колоритная туристическая палатка, золотой час, тёплый свет пламени освещает радостные лица, кинематографическая композиция, снято на плёнку»

Безусловно, здесь обязательно всплывут подводные камни с прорисовкой пальцев рук, держащих посуду. Не стоит перегружать сцену лишними мелкими предметами. Чем их больше, тем выше шанс получить на выходе жуткую наляпистость. К тому же, львиная доля внимания зрителя всё равно оседает на эмоциях и общей атмосфере, а не на количестве веток в костре.

Городские джунгли

Ложка дёгтя часто кроется в архитектурных фонах. Сложную перспективу улиц нейросети иногда искажают до неузнаваемости. Тем более, что обилие неоновых вывесок, витрин или рекламных щитов провоцирует визуальный хаос. Но есть и очевидные плюсы. Исконно урбанистические пейзажи смотрятся невероятно стильно. Взять хотя бы такой промт:

«уличная фотография, две девушки идут по мокрой брусчатке вечернего Нью-Йорка, смеются под прозрачным зонтом, отражения неоновых огней в лужах, стиль киберпанк, кожаные куртки, объёмное освещение, высокая контрастность, размытый задний фон»

Это надёжно. Потому что проверено. Временем. Впрочем, иногда натыкаешься на откровенный брак, когда фасады зданий вдалеке начинают сливаться в единую серую кашу. Спасательный круг кроется в добавлении параметра глубины резкости (так называемого эффекта боке). Сильно замыленный задник, размывающий грандиозный городской пейзаж, спасёт картинку от превращения в нагромождение невнятных пикселей.

Винтажный стиль и ретро-вайб

Буквально десятилетие назад возвращение к плёночной эстетике казалось уделом узкого круга хипстеров, но сейчас винтаж прочно захватил весь творческий бомонд. Кадры из девяностых или восьмидесятых тяготеют к совершенно особой цветопередаче. Потёртости, лёгкие засветы по краям, неправильный баланс белого — вся эта самобытная изюминка неизменно приковывает внимание. Рецепт создания подобной ностальгии звучит так:

«любительское фото, компания из пяти подростков сидит на капоте старого автомобиля, полароидный снимок, вспышка в лоб, переэкспонированное небо, одежда в стиле ранних девяностых, лёгкая небрежность в позах, сильное плёночное зерно»

Разумеется, без артефактов тут не обойдётся. Ведь именно он, этот нарочито грязный стиль, отлично маскирует дефекты генерации. Да и самим пользователям гораздо комфортнее воспринимать неидеальную картинку, похожую на случайно найденный кадр из старого семейного альбома.

Вредно ли завышать ожидания?

Многие считают, что достаточно вбить пару слов, и шедевр готов, но на самом деле реальность куда суровее. Щепетильный и вдумчивый подход требует огромного терпения. Естественно, придётся сделать не один десяток попыток, меняя параметры. Не сильно ударит по кошельку использование бесплатных версий генераторов, однако их вычислительной мощности часто не хватает для детальной прорисовки нескольких лиц одновременно. Серьёзное вложение в платные подписки оправдывает себя лишь тогда, когда нужна идеальная журнальная резкость и возможность многократного перестроения кадра. А если ещё вспомнить про особенности цензуры в разных сетях, то задача усложняется вдвое. Нельзя не упомянуть тот факт, что искусственный разум обучался на стандартных стоковых фотографиях, поэтому его представление о дружбе часто сводится к шаблонным, неестественным объятиям.

Стоит ли усложнять сцену?

Чтобы внести лепту оригинальности в статичный кадр, нужно описывать конкретные, физические действия. Пусть ваше нарисованное чадо и его друзья играют в настольные игры, увлечённо чинят велосипед или просто делят большой кусок пиццы. Именно физическое взаимодействие персонажей с объектами вдыхает настоящую жизнь в цифровой холст. Сложно ли стилизовать такую сцену? Да, но результат того однозначно стоит. Внушительный объём работы по подбору слов окупается детализацией. И всё же, не забудьте проверить логику описания перед отправкой запроса. Если персонажи стоят на ногах посреди чистого поля, им неоткуда взять чашки с горячим кофе, и алгоритм может дорисовать парящий в воздухе стол. Такие ошибки всегда бросаются в глаза.

В представлении многих людей создание картинок с помощью кода сродни тайной магии, доступной лишь избранным гикам. На самом же деле, обыкновенное человеческое терпение и грамотный, осмысленный подбор синонимов решают абсолютно всё. Не стоит бояться смелых экспериментов с освещением, погодными условиями и историческими эпохами, комбинируя на первый взгляд несочетаемые вещи. Творчество, льющееся рекой через правильно выстроенный текст, обязательно даст свои плоды. Удачный, атмосферный кадр, распечатанный на хорошей бумаге, запомнится надолго и станет отличным подарком.