В сети сегодня можно наткнуться на невероятное количество изображений, созданных искусственным интеллектом. Одни поражают своей детализацией и фотореализмом, другие вызывают недоумение или даже смех из-за странных артефактов и нелепых композиций. Многие обыватели считают, что генерация картинок — это лотерея, где результат зависит исключительно от капризов нейросети. Однако на самом деле львиная доля успеха кроется в одном-единственном элементе — текстовом запросе, или промте. Но чтобы не блуждать в потёмках, получая на выходе шестипалых людей и кривые здания, нужно скрупулёзно разложить по полочкам искусство составления правильных промтов.
Что такое промт и почему он так важен?
Задача не из лёгких. В представлении многих, промт — это простое описание желаемого, вроде «красивый закат над морем». С одной стороны, это так. С другой — всё гораздо глубже. Промт для фото ИИ — это, по сути, подробное техническое задание, бриф для цифрового художника, который не обладает человеческой интуицией, но обладает колоссальной базой визуальных данных. Нейросеть не умеет читать между строк, не понимает намёков и не догадывается о ваших истинных намерениях. Она воспринимает слова буквально. Поэтому чем точнее, детальнее и структурированнее ваш запрос, тем выше шанс получить изображение, которое вы себе нарисовали в воображении. Каждое слово в промте — это кисть, краска или указание на тип освещения. Проигнорируете детали — и вместо Моны Лизы получите карикатуру.
Анатомия идеального запроса
Чтобы создать добротный, работающий промт, стоит мысленно разбить его на несколько логических блоков. Это не строгий закон, а скорее проверенный временем подход, который помогает систематизировать мысли и не упустить важные нюансы.
Начинать нужно с главного — с основного объекта или сцены. Это ядро вашего будущего изображения. Кто или что солирует в кадре? Может, это «старый рыбак в потрёпанной лодке» или «одинокое дерево на вершине холма». На этом этапе закладывается фундамент, на который потом будут нанизываться все остальные детали. Без чёткого понимания центрального элемента композиция рискует развалиться.
Далее следует не менее важный элемент — детализация и описание. Здесь-то и начинается настоящее творчество. Ваша задача — насытить основной объект прилагательными и уточнениями. Рыбак не просто старый, а «с морщинистым лицом и седой бородой». Дерево не просто одинокое, а «могучий дуб с искривлёнными от ветра ветвями». Кроме того, стоит добавить контекст и действие. Например, наш рыбак может «чинить сеть», а под дубом может лежать «раскрытая старинная книга». Эти мазки делают картинку живой, наполняют её историей.
Отдельно стоит упомянуть стилистику. Это, пожалуй, самый мощный инструмент для придания изображению характера. Без указания стиля нейросеть, скорее всего, выдаст нечто усреднённое, часто напоминающее цифровой рисунок или стоковую фотографию. Что насчёт стиля? Лучший вариант — указать конкретное направление в искусстве, имя художника или тип съёмки. Например, можно добавить «в стиле импрессионизма, как у Клода Моне» или «киберпанк, неоновое освещение». А для реалистичности отлично подходят запросы «фотореализм, снято на Canon EOS 5D Mark IV» или «кинематографичный кадр, анаморфотный объектив».
Ну и, конечно же, нельзя забывать про свет и композицию. Как именно вы видите кадр? Может, это «крупный план» (close-up), «вид с высоты птичьего полёта» (bird’s-eye view) или «широкоугольный пейзаж». Освещение творит чудеса. Укажите «мягкий утренний свет», «драматическое освещение Рембрандта» или «золотой час», и антураж изображения изменится кардинально. К слову, в некоторых моделях (вроде Midjourney) можно задавать и технические параметры, например, соотношение сторон командой `–ar 16:9` для горизонтального изображения.
Как писать промты на русском языке?
Это довольно щепетильный вопрос. Буквально пару лет назад большинство нейросетей адекватно воспринимали исключительно английский язык, и попытки написать что-то на русском приводили к удручающим результатам. Сейчас ситуация изменилась. Модели вроде Stable Diffusion XL или Kandinsky отлично понимают русскоязычные запросы, особенно если речь идёт о простых, бытовых сценах. Однако подводные камни всё ещё существуют.
Дело в том, что львиная доля данных, на которых обучались эти махины, — англоязычная. Поэтому специфические термины, имена художников, названия техник или стилей гораздо надёжнее работают на языке оригинала.
Что же делать? Вовсе не обязательно в совершенстве владеть английским. Самый простой и эффективный путь — составить подробный, богатый на детали промт на русском, а затем воспользоваться хорошим онлайн-переводчиком. Полученный английский текст, как правило, даёт более предсказуемый и качественный результат. Впрочем, для несложных идей вроде «рыжий кот спит на подоконнике, солнечный день» родной язык подойдёт как нельзя лучше.
Готовые промты: Примеры для вдохновения
Теория — это хорошо, но без практики она мертва. Давайте разберём несколько готовых промтов, чтобы понять, как все эти постулаты работают вместе.
Представим, что нам нужен впечатляющий портрет. Вместо «мужчина в очках» стоит попробовать что-то вроде этого: «Фотореалистичный портрет пожилого писателя в твидовом пиджаке, сидит за дубовым столом в старинной библиотеке, тёплый свет от настольной лампы с зелёным абажуром, глубокие тени, снято на плёночную камеру Leica, кинематографичное зерно». Здесь есть всё: чёткий объект, детали одежды и окружения, конкретное описание света и указание на стиль съёмки. Результат будет на порядок выше.
А если хочется создать фантастический пейзаж? Запрос может выглядеть так: «Эпический фэнтезийный пейзаж, летающие острова с водопадами в облаках на закате, на одном из островов виден светящийся хрустальный замок, палитра в фиолетовых и оранжевых тонах, цифровое искусство, высокая детализация, в стиле Final Fantasy». Тут мы задаём не только сцену, но и цветовую гамму, и отсылку к конкретной эстетике, что сильно сужает поле для «домыслов» нейросети.
Ну и, наконец, пример для предметной съёмки. Допустим, нам нужно изображение часов. Банальное «золотые часы» не даст нужного эффекта. А вот такой промт — совсем другое дело: «Макро-фотография винтажных карманных часов из латуни с открытым механизмом, лежат на потёртой кожаной книге, мягкий боковой свет из окна, видны мельчайшие шестерёнки и царапины на корпусе, боке, глубина резкости». Этот запрос превращает простую картинку в целую историю, наполненную атмосферой и характером.
Процесс этот творческий, захватывающий и порой довольно непредсказуемый. Не бойтесь ломать шаблоны, смешивать несовместимое и добавлять в свои запросы щепотку контролируемого безумия. Ведь именно так и рождаются настоящие цифровые шедевры, которые приковывают внимание. Удачи в покорении этого удивительного цифрового холста.