В сети представлено множество удивительных изображений, сгенерированных нейросетями, которые поражают воображение детализацией и художественной ценностью. Глядя на эти шедевры, обыватель часто думает, что за ними стоит сложный и недоступный для простого человека процесс. Кажется, будто нужно быть программистом или художником, чтобы заставить искусственный интеллект творить чудеса. Однако на самом деле львиная доля успеха скрывается не в технических махинациях, а в умении правильно составить текстовый запрос, или, как его принято называть, промт. А начать стоит с того, чтобы разложить по полочкам саму структуру этого «заклинания» для нейросети.
Из чего состоит идеальный промт?
Задача не из лёгких. Ведь здесь нет строгих постулатов, высеченных в камне, но есть общие принципы, которые помогут добиться желаемого результата гораздо быстрее. Промт – это не просто набор слов, а скорее подробное техническое задание для цифрового художника. Его структура тяготеет к последовательному описанию, где каждый элемент добавляет новый слой на холст будущего изображения. Начинать стоит всегда с главного объекта или субъекта. Это может быть что угодно: «портрет пожилого волшебника», «гоночный автомобиль», «фантастический пейзаж с летающими островами». Этот первый блок задаёт основную тему, вокруг которой будет строиться вся композиция.
Далее следует конкретизация. С чего начинается детализация? С описания внешности, эмоций и действий. Не стоит ограничиваться общими фразами. Вместо «красивая девушка» лучше написать «молодая женщина с веснушками, рыжими вьющимися волосами и задумчивой улыбкой, смотрящая в окно». Если мы генерируем автомобиль, то уточняем его цвет, модель и состояние: «красный спортивный автомобиль Ferrari 250 GTO с царапинами на капоте, мчащийся по ночному городу». Чем больше таких нюансов, тем меньше у нейросети пространства для самодеятельности и тем ближе результат к вашей задумке. Это же правило касается и окружения, которое приковывает к себе не меньше внимания, чем центральный объект.
Следующий важный критерий – определение художественного стиля. ИИ – это кладезь знаний о мировой культуре. Он «видел» работы всех известных художников и фотографов. Поэтому можно смело просить его имитировать конкретную манеру. Например, можно добавить в промт «в стиле Ивана Айвазовского», «как на картинах Винсента Ван Гога» или «в духе киберпанка». Это мгновенно задаст нужный антураж и цветовую палитру. К слову, можно указывать и более технические вещи: «рисунок углём», «акварельная иллюстрация», «3D-рендер». Такие уточнения творят настоящие чудеса, преображая исходную идею до неузнаваемости.
Ну и, конечно же, технические параметры. Свет, ракурс, детализация – это те самые вишенки на торте, которые делают изображение по-настоящему профессиональным. Стоит поэкспериментировать с описанием освещения: «драматическое освещение», «мягкий утренний свет», «неоновые огни», «золотой час». Не менее важен ракурс: «снято с уровня земли», «вид сверху», «крупный план лица». Ну и, наконец, можно добавить волшебные слова, которые любят многие diffusion-модели: «высокая детализация», «4K», «гиперреализм», «Unreal Engine». Эти маркеры служат для нейросети сигналом, что от неё требуется максимальное качество проработки.
Что такое негативные промты и зачем они нужны?
Многие считают, что достаточно лишь описать то, что хочешь увидеть. Но на самом деле не менее важно указать, чего на изображении быть не должно. Именно для этого и существуют негативные промты (negative prompts). Это своего рода стоп-лист, который отсекает нежелательные элементы, способные испортить всю картину. Представьте, вы создаёте портрет и получаете человека с тремя руками. Зрелище удручающее. Чтобы избежать таких казусов, в негативный промт вносят такие вещи, как «лишние конечности», «уродство», «мутации», «плохая анатомия».
Сложно ли их использовать? Вовсе нет. Принцип тот же, что и с основным запросом, только с обратным знаком. Если вы хотите получить фотореалистичное изображение, то в негативный промт стоит добавить «аниме», «мультфильм», «3D». Если картинка получается слишком яркой и наляпистой, можно написать «перенасыщенные цвета». Отдельно стоит упомянуть о текстах и водяных знаках. Нейросети (особенно старые модели) довольно плохо генерируют осмысленные надписи, поэтому часто на картинках всплывают непонятные каракули. Чтобы этого избежать, в негативный запрос добавляют «текст», «буквы», «подпись», «водяной знак». Это помогает очистить изображение от визуального шума.
Практические примеры для разных задач
Теория – это хорошо, но без практики она мертва. Давайте разберём несколько готовых промтов, чтобы понять, как всё это работает вместе.
Пример для создания персонажа:
Промт: «Фотореалистичный портрет кибернетического самурая, мужчина с седыми волосами, собранными в пучок, шрамы на лице, пронзительный взгляд, детализированные механические импланты на шее, одет в тёмное технологичное кимоно. Фон – ночной мегаполис с неоновыми вывесками и дождём. Драматическое боковое освещение, блики на мокром асфальте. Стиль фильма «Бегущий по лезвию». Высочайшая детализация, кинематографично, 8K».
Негативный промт: «Мультфильм, 3D, размытость, плохая анатомия, лишние пальцы, уродливое лицо, картина, рисунок».
В этом запросе мы последовательно описали персонажа, его одежду, фон, освещение и задали конкретный стилистический ориентир.
Пример для генерации пейзажа:
Промт: «Эпический фэнтезийный пейзаж, затерянный в облаках город на гигантских летающих островах, соединённых висячими мостами. Величественные водопады, стекающие с краёв островов в бездну. Мягкий свет восходящего солнца пробивается сквозь туман. На переднем плане летит дракон. Стиль художника Томаса Кинкейда. Гиперреализм, атмосферно, детализированная архитектура, Unreal Engine 5».
Негативный промт: «Люди, современные здания, дороги, размытый фон, низкое качество, тёмная ночь, мультяшный стиль».
Здесь акцент сделан на масштабе, атмосфере и конкретных элементах, которые должны присутствовать в кадре.
Пример для предметной «фотографии»:
Промт: «Профессиональная фуд-фотография, аппетитный бургер с говяжьей котлетой, сыром чеддер и свежими овощами на деревянном столе в деревенском стиле. Рядом стоит стакан с крафтовым пивом. Мягкий тёплый свет из окна. Боке на заднем плане. Снято на камеру Canon EOS 5D Mark IV с объективом 85mm f/1.2. Фотореализм, высокая детализация, сочные цвета».
Негативный промт: «Рисунок, иллюстрация, пластиковая еда, плохой свет, размытый бургер, грязный стол».
Указание конкретной камеры и объектива – это довольно продвинутый приём, который помогает нейросети лучше понять, какой именно результат вы от неё ждёте.
Эксперименты с промтами – это бесконечное поле для творчества. Не бойтесь смешивать стили, добавлять неожиданные детали и пробовать разные формулировки. Иногда одна маленькая поправка может кардинально изменить результат. Удачи в ваших творческих поисках.