В сети представлено множество удивительных изображений, созданных искусственным интеллектом. Глядя на фотореалистичные портреты несуществующих людей или фантастические пейзажи, многие обыватели тоже грезят о том, чтобы творить чудеса, просто вбивая слова в текстовое поле. Однако первые попытки часто приводят к разочарованию: вместо шедевра нейросеть выдаёт нечто несуразное, с искажёнными лицами и странной композицией. Это знакомо почти каждому, кто пробовал свои силы в Midjourney или Stable Diffusion. Но чтобы не ошибиться и получить по-настоящему впечатляющий результат, нужно освоить искусство составления правильного запроса, или, как его принято называть, промта.
Так в чём же секрет?
Задача не из лёгких. В представлении многих новичков промт – это просто одно-два слова, описывающих объект. Например, «кошка» или «закат». Разумеется, нейросеть сгенерирует изображение, но его художественная ценность будет стремиться к нулю. На самом деле, хороший промт — это подробное, скрупулёзное техническое задание для виртуального художника, который не умеет читать мысли, но досконально понимает команды. Здесь стоит разложить всё по полочкам. Во-первых, всегда нужно начинать с главного объекта и его описания. Это основа, на которую будет нанизываться всё остальное. Во-вторых, необходимо уточнить действие или позу. Сидит ли персонаж, бежит или задумчиво смотрит в даль? Ну и, наконец, нельзя забывать про окружение, которое создаёт львиную долю атмосферы.
С описательной частью дело обстоит довольно просто, но именно здесь кроются первые подводные камни. Чем больше конкретики вы дадите нейросети, тем предсказуемее будет результат. Не стоит писать просто «мужчина». Лучше уточнить: «старый морской волк с седой бородой, шрамом на щеке и добрыми морщинками у глаз». Вместо «здание» попробуйте «готический собор с высокими шпилями и витражными окнами». Это же правило касается и антуража. Не «лес», а «загадочный туманный лес с вековыми мшистыми деревьями на рассвете». Каждая деталь вносит свою лепту в итоговую картину, делая её глубокой и проработанной.
Как сделать картинку живой и атмосферной?
Даже самый подробный описательный запрос не гарантирует шедевра. Настоящая магия начинается тогда, когда в дело вступают художественные и технические уточнения. С чего начинается выбор? С определения стиля. Именно он задаёт общее настроение и визуальный язык изображения. Один из самых популярных стилей, к которому тяготеют многие, – это фотореализм. Он заставляет зрителя сомневаться, настоящее ли фото перед ним. Далее следует кинематографичный стиль, который имитирует кадр из дорогого голливудского фильма с его характерной цветокоррекцией и построением кадра. Отдельно стоит упомянуть стилизацию под работы конкретных художников или даже под целые направления в искусстве, будь то импрессионизм, киберпанк или мрачное фэнтези.
Следующий важный критерий — свет. Именно он творит чудеса, создавая объём, драматизм и настроение. В промте можно и нужно указывать тип освещения. Например, «мягкий свет золотого часа» (soft golden hour light) придаст сцене тёплый и ностальгический оттенок. «Драматическое студийное освещение» (dramatic studio lighting) подчеркнёт черты лица в портрете, а «неоновое свечение» (neon glow) моментально перенесёт нас на улицы ночного киберпанк-города. К слову, не стоит пренебрегать и техническими параметрами, имитирующими работу настоящего фотографа. Указание модели камеры (например, Canon EOS 5D Mark IV) или типа объектива (скажем, 85mm f/1.8) способно существенно повлиять на результат, добавив ему характерную глубину резкости или зернистость плёнки.
Готовые промты: разбор полётов
Теория – это хорошо, но без практики она мертва. Давайте посмотрим, как всё эти постулаты работают вместе, на конкретных примерах. Предположим, мы хотим получить изысканный женский портрет.
Photorealistic portrait of a beautiful young woman with freckles and long red hair, looking directly at the camera with a slight smile, soft natural light from a window, background of a cozy room with bookshelves, shot on a Sony a7 III with an 85mm f/1.4 lens, hyper-detailed, cinematic look
Что мы здесь видим? Начинается всё с основы – «фотореалистичный портрет». Далее идёт подробное описание модели, её мимики и взгляда. Критически важные уточнения – «мягкий естественный свет из окна» и «уютная комната с книжными полками» на фоне. Ну и, конечно же, вишенка на торте — технические детали о камере и объективе, которые сообщают нейросети, какой эффект размытия фона (боке) и какую общую детализацию мы хотим получить. Выглядит впечатляюще.
А если хочется чего-то более грандиозного? Например, фантастический пейзаж. Задача сложнее, но решаемая.
Epic fantasy landscape of a lost city in a jungle, overgrown with ancient vines and giant glowing mushrooms, a massive waterfall in the background, mysterious morning fog, volumetric rays of light piercing through the canopy, style of a highly detailed matte painting, 8k resolution, Unreal Engine.
Здесь совершенно иной подход. Главным героем становится «затерянный город в джунглях». Атмосферу создают детали: «заросли древних лиан», «гигантские светящиеся грибы» и «таинственный утренний туман». Указание на объёмные лучи света (volumetric rays) – это прямой приказ нейросети добавить в сцену драматизма. А связка из «детализированного matte painting» (техника создания фонов в кино) и упоминания игрового движка «Unreal Engine» даёт чёткий сигнал на создание гиперреалистичной, но при этом сказочной картинки.
А чего делать не стоит?
На пути к идеальной генерации всплывут и ошибки. Главное – вовремя их распознать. Во-первых, не стоит перегружать запрос взаимоисключающими понятиями. Нейросеть впадёт в ступор, если вы попросите её создать «минималистичный барочный интерьер» или «солнечную ночную улицу». Во-вторых, не нужно бояться отрицательных промтов (negative prompts). Это специальная команда, которая говорит ИИ, чего на картинке быть НЕ должно. Например, если вы устали от изображений с шестью пальцами на руках, можно добавить в негативный промт `–no extra fingers, deformed hands`. Ну и, наконец, не скупитесь на английский язык. Хотя многие модели и понимают русский, львиная доля данных, на которых они обучались, была на английском. Тем более, что именно на нём написано большинство подробных руководств и готовых промтов от энтузиастов со всего мира.
Создание промтов — это процесс не сложный, но кропотливый, требующий щепетильного подхода и наблюдательности. Это не просто набор слов, а диалог с машиной, язык, который нужно выучить. Но как только вы его освоите, перед вами откроется кладезь безграничных творческих возможностей.
Экспериментируйте, смешивайте стили, добавляйте неожиданные детали и ищите свою изюминку. Удачи в ваших творческих поисках, и пусть нейросеть станет вашим послушным и могущественным инструментом!