В сети можно найти тысячи потрясающих изображений, сгенерированных нейросетями, но попытка повторить успех часто заканчивается разочарованием. Вместо детализированного портрета эльфийской принцессы в магическом лесу алгоритм выдаёт нечто размытое и далёкое от первоначальной задумки. Многие пользователи в этот момент опускают руки, списывая всё на сложность технологии или необходимость быть программистом, чтобы совладать с искусственным интеллектом. Удивительно, но для создания шедевра зачастую нужен не код, а всего лишь правильно сформулированное желание, или, как его принято называть, промт.
Что такое промт и как он работает?
Начать стоит с основ. Промт – это текстовый запрос, который вы отправляете нейросети для генерации изображения. Это не просто набор слов, а полноценное техническое задание для цифрового художника, который, впрочем, лишён воображения в человеческом понимании и воспринимает всё буквально. Именно от того, насколько точно, детально и структурированно составлен этот запрос, напрямую зависит конечный результат. В представлении многих обывателей достаточно написать «красивая девушка», чтобы получить фотореалистичный портрет. На самом деле такой запрос – лотерея с минимальными шансами на выигрыш.
Ключевая задача – разложить желаемый образ по полочкам и передать его нейросети на понятном ей языке. Что это за язык? Он состоит из нескольких фундаментальных блоков, которые стоит комбинировать. Во-первых, это объект или субъект, то есть главный герой вашей будущей картины. Во-вторых, его действия и окружение, создающие нужный антураж и атмосферу. Ну и, наконец, технические и стилистические параметры – от типа камеры и объектива до имени художника, чью манеру вы хотите эмулировать. Смешивая эти компоненты, вы превращаетесь из пассивного наблюдателя в настоящего режиссёра.
Как создать портрет, который приковывает внимание?
Задача не из лёгких. Ведь хочется получить не просто лицо, а характер, эмоцию, целую историю. С чего начинается работа над портретом? С описания внешности. Не стоит ограничиваться общими фразами. Детализируйте всё: цвет волос и глаз, причёску, наличие веснушек или морщинок, форму губ. Чем больше конкретики, тем меньше простора для «фантазии» останется у нейросети. Например, вместо «девушка с рыжими волосами» лучше использовать «девушка с огненно-рыжими вьющимися волосами до плеч и изумрудными глазами». Разница колоссальная.
Далее следует эмоция. Нейросети довольно хорошо научились передавать чувства, если им помочь. Слова вроде «лёгкая улыбка», «задумчивый взгляд», «искренний смех» или «сдержанная грусть» творят настоящие чудеса. Не забудьте про одежду и аксессуары, ведь они тоже вносят свою лепту в образ. Шёлковое платье, строгий деловой костюм, этнические украшения или футуристичный комбинезон – каждая деталь важна.
Ну и, конечно же, свет. Освещение – это душа фотографии. Попробуйте указать источник света и его характер. «Мягкий утренний свет из окна», «драматическое освещение в стиле Рембрандта», «неоновые огни ночного города» или «тёплый свет от камина» – всё это кардинально меняет восприятие портрета. В качестве примера добротного промта можно привести такой запрос:
«Фотореалистичный портрет молодой женщины с фарфоровой кожей и веснушками, пепельные волосы собраны в небрежный пучок, несколько прядей выбиваются, задумчивый взгляд карих глаз, она одета в уютный кашемировый свитер крупной вязки, сидит у окна в дождливый день, мягкий рассеянный свет, капли на стекле, снято на объектив 85mm f/1.4, кинематографичное освещение».
Пейзажи и архитектура: как передать масштаб?
С пейзажами дело обстоит несколько иначе. Здесь на первый план выходит не отдельный объект, а общая атмосфера, настроение и грандиозность сцены. Сложно ли создать эпический пейзаж? Вовсе нет, если следовать определённым постулатам. Начать нужно с географической привязки, даже если она вымышленная. «Исландские фьорды на рассвете», «затерянный в джунглях Амазонки древний храм», «футуристический мегаполис в стиле киберпанк под проливным дождём» – такие запросы уже задают мощный вектор для генерации.
Особый интерес вызывает работа с погодой и временем суток. Эти два фактора способны преобразить любую, даже самую скучную локацию. Густой туман, стелющийся по земле, грозовые тучи, собирающиеся над горами, золотой час перед закатом или глубокая ночь с россыпью звёзд – всё это мощные инструменты в ваших руках. Не стоит забывать и про детали, которые оживляют картинку: «старая деревянная лодка, привязанная к пирсу», «одинокий маяк на скалистом утёсе», «караван, идущий по пустыне».
Для архитектурных зарисовок стоит отдельно прописывать стиль здания. Готический собор с его вычурными шпилями и витражами будет сильно отличаться от минималистичного современного коттеджа из стекла и бетона. А если вы хотите получить действительно впечатляющий результат, можно указать на необычный ракурс. Например, «вид с высоты птичьего полёта» или «съёмка с нижнего ракурса, подчёркивающая величие здания». Вот пример запроса для пейзажа:
«Эпический пейзаж, шотландское высокогорье осенью, древние каменные руины на холме, покрытом вереском, низкие свинцовые облака, пробивающиеся лучи солнца, драматическая атмосфера, вид с дрона, высокая детализация, стиль National Geographic».
Что насчёт стиля и технических параметров?
Это, пожалуй, самая творческая и интересная часть работы с промтами. Именно здесь вы можете придать своим генерациям уникальный характер. Нейросети обучены на гигантском массиве данных, включающем миллионы произведений искусства, фотографий и иллюстраций. Поэтому они способны имитировать практически любой стиль.
Хотите картину в духе импрессионистов? Добавьте в запрос «в стиле Клода Моне». Грезят о чём-то сюрреалистичном? «В стиле Сальвадора Дали» станет вашим спасательным кругом. Можно указывать не только имена художников, но и целые направления: «барокко», «арт-деко», «стимпанк», «аниме 90-х», «пиксель-арт». К слову, очень хорошие результаты даёт указание на конкретную студию или фильм, например, «в стиле студии Ghibli» или «цветовая палитра как в фильме “Бегущий по лезвию”».
Технические параметры – это кладезь возможностей для тех, кто хочет добиться фотореализма. Указание на тип камеры (например, Hasselblad, Leica), тип плёнки (Kodak Portra 400, Fujifilm Velvia) или конкретный объектив (35mm, 50mm, 85mm) может существенно повлиять на итоговое изображение, добавив ему характерную зернистость, цветопередачу или глубину резкости. Команды вроде «–ar 16:9» или «–ar 3:2» (в Midjourney) позволяют задать соотношение сторон, что тоже довольно важно для композиции.
Вот простой пример, как стиль меняет всё. Изначальный запрос: «Астронавт в космосе». Теперь с добавлением стиля: «Астронавт в космосе, картина маслом, экспрессивные мазки, в стиле Ван Гога». Чувствуете разницу? Это уже не просто изображение, а произведение с характером.
Подводные камни и полезные советы
Конечно, не всё так гладко. Даже самый скрупулёзный и детализированный промт не всегда даёт идеальный результат с первой попытки. Нейросети всё ещё испытывают проблемы с некоторыми вещами, например, с пальцами на руках или сложными взаимодействиями нескольких персонажей. Не стоит отчаиваться. Часто достаточно немного перефразировать запрос, убрать или добавить деталь, чтобы добиться нужного эффекта.
Не бойтесь использовать отрицательные команды (negative prompts). Если вы не хотите видеть на изображении людей, добавьте в соответствующее поле «люди, толпа». Если результат получается слишком мультяшным, а вы стремились к реализму, можно добавить в негативный промт слова «аниме, мультфильм, 3D-рендер». Эта опция есть во многих генераторах, и она чрезвычайно полезна.
Ну и, наконец, экспериментируйте. Не существует единственно верной формулы идеального промта. Копируйте чужие удачные запросы, анализируйте, какие слова и конструкции дают тот или иной эффект, и создавайте свои собственные комбинации. Чем больше вы практикуетесь, тем лучше начинаете «чувствовать» нейросеть и предугадывать её реакцию. Это довольно увлекательный процесс, который открывает безграничные возможности для творчества. Удачи в ваших цифровых экспериментах!