В сети представлено множество потрясающих изображений, созданных нейросетями. Глядя на них, многие пользователи тоже грезят о создании собственных шедевров: от фантастических пейзажей до фотореалистичных портретов. Однако первая же попытка часто оборачивается разочарованием – вместо рыцаря в сияющих доспехах нейросеть выдаёт какой-то кривой-косой набросок, который и врагу не покажешь. Дело в том, что искусственный интеллект – не телепат, а скрупулёзный исполнитель. Но чтобы не разочаровываться в результатах, нужно освоить хотя бы азы промт-инжиниринга, то есть искусства составления правильных запросов.
С чего начинается магия? Основы промт-инжиниринга
Задача не из лёгких. Но вполне решаемая. Промт – это ваш прямой приказ, техническое задание для нейронной сети. И чем детальнее оно будет, тем точнее окажется результат. В представлении многих обывателей достаточно написать «красивая девушка», чтобы получить обложку для глянцевого журнала. На самом деле, это путь в никуда. Добротный, работающий промт всегда строится на нескольких постулатах. Во-первых, это объект – кто или что должно солировать на изображении. Во-вторых, действие или поза, которые добавляют динамики. В-третьих, окружение, создающее необходимый антураж. Ну и, наконец, самое главное – стиль и технические детали, которые и превращают заурядную картинку в произведение искусства. Ведь именно от них зависит, будет ли это акварельный рисунок, студийное фото или кадр из фильма.
Что насчёт структуры? Лучший вариант – это последовательное перечисление деталей от общего к частному. Начинать всегда стоит с описания главного объекта. Затем стоит добавить детали его внешности, одежды и эмоций. После этого можно переходить к фону и общей атмосфере. И только в самом конце прописываются технические параметры: стиль художника, тип камеры, освещение, цветовая палитра и другие нюансы, которые придадут изображению изюминку. Такой подход позволяет нейросети не запутаться и последовательно «наслаивать» детали друг на друга, что творит настоящие чудеса с итоговым качеством.
Промты для создания персонажей: от А до Я
Создание убедительного персонажа – это настоящий кладезь возможностей для творчества. Здесь можно дать волю фантазии. Однако и тут есть свои подводные камни. Чтобы получить не просто куклу, а живого героя с характером, нужно тщательно продумать его образ. К примеру, если вы хотите создать портрет фэнтезийного персонажа, не стоит ограничиваться фразой «эльф с луком». Пропишите детали. Например, так:
photorealistic portrait of an old wise male elf with long silver hair and glowing blue eyes, wearing intricate leather armor with leaf patterns, holding a majestically carved wooden bow, standing in an ancient misty forest at sunrise, cinematic lighting, fantasy art, ultra detailed, 8k
В этом запросе есть всё необходимое. Мы уточнили, что это фотореалистичный портрет. Описали персонажа (старый мудрый эльф), его отличительные черты (длинные серебряные волосы, светящиеся глаза), его одежду (кожаная броня с узорами) и предмет в руках (резной лук). Фон – не менее важен. Древний туманный лес на рассвете сразу задаёт нужную атмосферу. Ну а технические маркеры вроде cinematic lighting (кинематографичное освещение), fantasy art и ultra detailed окончательно формируют запрос, не оставляя нейросети пространства для нежелательных махинаций. А вот для создания киберпанк-самурая потребуется совершенно иной подход и лексикон:
full-body shot of a female cyberpunk samurai, with neon pink hair and robotic glowing katana, wearing a sleek black high-tech armor with holographic elements, standing on a rainy street of a futuristic Tokyo at night, surrounded by neon signs, blade runner style, moody, vibrant colors
Как нарисовать пейзаж или интерьер?
С генерацией неодушевлённых сцен дело обстоит довольно просто, но и тут есть свои секреты. Львиная доля успеха зависит от двух факторов: освещения и ракурса. Буквально десятилетие назад для создания впечатляющего цифрового пейзажа требовались часы работы в графических редакторах, но сейчас с этим справляется грамотно составленный промт. Вместо «горы и озеро» стоит использовать более развёрнутую конструкцию. Попробуйте что-то вроде этого:
cinematic wide shot of a misty norwegian fjord at dusk, dramatic clouds, calm water reflecting the last rays of sun, a small wooden viking boat in the distance, style of Caspar David Friedrich, hyperrealistic, epic scale, moody atmosphere
Как видите, здесь ключевую роль играет атмосфера (moody atmosphere), время суток (закат), погода (драматичные облака) и ракурс (широкий кинематографичный кадр). Упоминание конкретного художника (Каспара Давида Фридриха) даёт нейросети прямой ориентир на определённый стиль живописи, тяготеющий к романтизму и грандиозным пейзажам. Это же правило касается и интерьеров. Не стоит писать просто «уютная гостиная». Лучше уточнить стиль, цветовую гамму и ключевые детали. Например:
cozy modern scandinavian living room, with a large grey sofa, knitted blankets, a fireplace, large windows overlooking a snowy forest, warm natural light, minimalist interior design, photorealistic, octane render
Такой скрупулёзный подход гарантирует, что на выходе вы получите именно тот уютный скандинавский интерьер, о котором грезили, а не наляпистое нечто.
Технические хитрости и «волшебные слова»
Помимо основного описания, существуют и специальные команды, которые помогают «отполировать» результат. Одна из самых полезных – это негативные промты. Это слова-ограничители, которые говорят нейросети, чего на картинке быть НЕ должно. Обычно они добавляются в конец запроса с помощью специального параметра (например, –no). Не хотите видеть на изображении людей? Добавьте no people. Раздражают деформированные руки, частый бич нейросетей? Используйте bad anatomy, deformed hands. Это своего рода спасательный круг, который отсекает львиную долю брака.
Кроме того, почти все платформы для генерации изображений поддерживают технические команды. Стоит ли ими пользоваться? Безусловно. Ведь именно такие мелочи отделяют хороший результат от великолепного. К слову, одна из самых популярных команд – это –ar (aspect ratio), которая задаёт соотношение сторон изображения. Например, –ar 16:9 создаст широкоформатную картинку, идеальную для обоев на рабочий стол, а –ar 2:3 – вертикальную, подходящую для постов в социальных сетях. Тем более, что существуют и другие полезные параметры. Команда –q (quality) отвечает за уровень детализации, а –s (stylize) – за степень творческой интерпретации запроса нейросетью. Экспериментируя с этими значениями, можно добиться по-настоящему впечатляющих и самобытных результатов.
Главное – не бояться экспериментировать и рассматривать каждую неудачную генерацию не как провал, а как ценный опыт. Процесс этот не сложный, но довольно кропотливый. Иногда для получения идеального изображения приходится перепробовать десятки вариаций одного и того же промта, меняя одно-два слова, подбирая синонимы или переставляя фразы местами. Это похоже на работу скульптора, который отсекает всё лишнее, чтобы явить миру свой шедевр.
Так что смело пробуйте, комбинируйте разные стили, добавляйте неожиданные детали и не бойтесь ошибаться. Удачи в этом увлекательном творческом процессе.