Промт для нейросети для создания фотографии (с примерами готовых промтов)

Многие из нас грезят о том, чтобы творить, создавать визуальные образы, которые поражают воображение, но при этом не владеют кистью или цифровым пером. Буквально десятилетие назад это казалось непреодолимым барьером, уделом избранных. Сейчас же, с появлением генеративных нейросетей, любой желающий может почувствовать себя художником или фотографом. Однако чтобы волшебство случилось, а не превратилось в разочарование от кривых и бессмысленных картинок, нужно овладеть главным инструментом – искусством составления правильного запроса. А начать стоит с понимания его фундаментальных принципов.

Что такое промт?

На первый взгляд, всё довольно просто. Промт – это текстовое описание, которое вы даёте нейросети в качестве задания. Но есть один важный нюанс, который часто упускают новички. В представлении обывателя это просто набор слов, вроде «красивая девушка на пляже». Для искусственного интеллекта же это скрупулёзная техническая инструкция, каждый элемент которой влияет на финальный результат. Не стоит думать, что нейросеть «понимает» вас в человеческом смысле. Она не читает между строк и не угадывает скрытые желания. Она лишь анализирует последовательность слов (токенов) и сопоставляет их с гигантской базой данных, на которой обучалась. Поэтому львиная доля успеха зависит не от мощи алгоритма, а от вашей способности чётко и детально сформулировать мысль.

Как нейросеть «видит» ваш запрос?

Задача не из лёгких. Представьте, что вы общаетесь с невероятно исполнительным, но абсолютно лишённым фантазии стажёром, который знает всё на свете, но понимает команды буквально. Скажете ему «нарисуй дом», и он нарисует первый попавшийся, самый усреднённый дом из своего «опыта». Но стоит добавить деталей, как картина преображается. Дело в том, что каждое слово в промте имеет свой «вес». Слова в начале запроса обычно воспринимаются как более значимые. Именно поэтому с определения главного объекта и его действия стоит начинать любую махинацию с генерацией. А вот стилистические и технические уточнения лучше оставлять на потом, чтобы они не перебивали основную идею, а лишь дополняли её. Это же правило касается и сложных, витиеватых предложений. Нейросеть может в них попросту запутаться. Простота и ясность – вот ваш спасательный круг.

Структура идеального промта

Так с чего начинается создание фотошедевра? С правильного фундамента. Хотя строгих канонов не существует, и многое зависит от конкретной нейросети (например, Midjourney или Stable Diffusion), есть общие постулаты, которые творят чудеса. Во-первых, стоит чётко определить главный объект или персонажа. Не просто «мужчина», а «пожилой скандинавский рыбак с седой бородой и в вязаном свитере». Чувствуете разницу? Детализация приковывает внимание алгоритма к нужным образам.

Далее следует позаботиться об окружении и действии. Наш рыбак может «стоять на скалистом берегу во время шторма» или «сидеть в уютной хижине у камина, латая сеть». Антураж задаёт настроение и добавляет изображению глубины, превращая его из простого портрета в целую историю. Не стоит перегружать сцену, но и оставлять её пустой – тоже не лучшее решение.

Следующий важный слой – это стилистика. И вот здесь открывается настоящий кладезь возможностей. Вы можете указать конкретный жанр – «фэнтези», «киберпанк», «стимпанк». Или сослаться на работы известного художника, чтобы нейросеть имитировала его манеру: «в стиле Ивана Айвазовского» или «как на картинах Рембрандта». К слову, для фотореализма можно использовать имена знаменитых фотографов, например, «фотография в стиле Энни Лейбовиц». Это придаст снимку характерный свет и композицию.

Ну и, конечно же, технические параметры. Это изюминка, которая отделяет добротную картинку от профессиональной. Сюда входят указания на тип камеры или даже объектива («снято на Canon EOS 5D Mark IV, объектив 85mm f/1.2»), параметры освещения («мягкий утренний свет», «драматическое контровое освещение», «неоновое свечение»), детализацию («высокая детализация», «8K», «unreal engine») и даже цветовую палитру («тёплые осенние тона», «монохром»). Смешивая эти компоненты, вы получаете полный контроль над генерацией.

Пример простого запроса: от идеи до детализации

Давайте разложим по полочкам на конкретном примере. Допустим, наша исходная идея – «девушка в лесу». Звучит скучно и предсказуемо. Нейросеть, скорее всего, выдаст стандартное, ничем не примечательное изображение. А теперь начинаем добавлять слои.

Сначала детализируем персонажа: «молодая рыжеволосая девушка с веснушками в изумрудном средневековом платье». Уже лучше. Теперь добавляем действие и антураж: «молодая рыжеволосая девушка с веснушками в изумрудном средневековом платье идёт по тропинке в густом, залитом солнцем сказочном лесу». Картина оживает. Но нам нужен фотореализм, а не рисунок. Поэтому добавляем техническую часть:

фотография молодой рыжеволосой девушки с веснушками в изумрудном средневековом платье, идущей по тропинке в густом, залитом солнцем сказочном лесу. снято на sony a7iii, объектив 50mm f/1.8, мягкий естественный свет, кинематографично, высокая детализация кожи, 4k

Такой подробный промт почти не оставляет нейросети пространства для случайных интерпретаций и гарантирует впечатляющий результат.

Готовые промты для вдохновения

Иногда лучший способ научиться – это подсмотреть у других. Давайте рассмотрим несколько готовых «рецептов», которые можно адаптировать под свои нужды. Каждый из них нацелен на определённый стиль и атмосферу.

Начнём с киберпанка. Представьте себе ночной мегаполис будущего. Чтобы получить такой кадр, можно использовать следующий запрос:

неоновый нуар, дождливая улица Токио будущего, отражения неоновых вывесок в лужах на асфальте, пролетающие ховер-кары, одинокая фигура в длинном плаще с капюшоном, кинематографическое освещение, атмосфера киберпанка, высокая детализация, фотореализм, 8K

А если душа тяготеет к фэнтези? Попробуем создать портрет эльфийского мага.

портрет старого эльфа-мага с длинными седыми волосами и светящимися синими глазами, одет в тёмную мантию с серебряной вышивкой, на заднем плане древняя библиотека с парящими в воздухе книгами, магическое свечение от посоха в его руке, стиль фэнтези-арт, цифровая живопись, детализированное лицо, в духе aaron griffin, artstation

Ну, а для любителей спокойных, реалистичных сцен подойдёт что-то вроде натюрморта.

фотография уютной кухни в деревенском стиле, на деревянном столе стоит глиняный кувшин с молоком и свежеиспечённый хлеб, рядом лежит несколько яблок, тёплый утренний свет из окна падает на стол, создавая длинные тени, снято на fujifilm, эффект боке, уютная атмосфера, фотореализм

Какие ошибки стоит избегать?

На пути к идеальному изображению вас поджидают подводные камни. И главный из них – двусмысленность. Не стоит использовать слова, которые могут быть истолкованы по-разному. Вместо «большой» лучше указать конкретные пропорции или сравнение. Кроме того, откажитесь от сложных грамматических конструкций и нагромождения придаточных предложений. Чем проще и линейнее ваш запрос, тем лучше.

Ещё одна распространённая ошибка – попытка смешать несовместимые стили. Конечно, эксперименты приветствуются, однако запрос вроде «фотореалистичный кубизм в стиле аниме» скорее всего поставит нейросеть в тупик. Лучше сосредоточиться на одном-двух гармонирующих направлениях. Не забывайте и про негативные промты. Большинство сервисов позволяют использовать специальные команды (часто это `–no` или `–negative prompt`), чтобы исключить нежелательные элементы. Не хотите видеть на картинке людей? Просто добавьте в конце `–no people`. Это довольно мощный инструмент для тонкой настройки.

Экспериментируйте, пробуйте разные комбинации, меняйте слова местами и наблюдайте за результатом. Создание промтов – это не столько наука, сколько искусство, и со временем вы научитесь «чувствовать» нейросеть и говорить с ней на одном языке. Удачи в ваших творческих поисках.