В сети можно найти бесчислённое множество фантастических изображений, созданных искусственным интеллектом. Глядя на детализированные портреты, не отличимые от работ профессионального фотографа, или на грандиозные пейзажи из несуществующих миров, многие пользователи тоже грезят о создании чего-то подобного. Они открывают нейросеть, вписывают в строку «красивая девушка в лесу» и получают в ответ нечто странное, с искажёнными чертами лица и нелепой композицией. Знакомая ситуация? Дело в том, что нейросеть – не волшебник, а скрупулёзный, но абсолютно бездушный исполнитель, который требует чёткого технического задания. Но чтобы не ошибиться и получить желаемый результат, нужно научиться говорить с машиной на её языке, то есть освоить искусство составления промтов.
Что такое промт?
Начать нужно с самого определения. Промт (от англ. prompt – побуждение, подсказка) – это, по сути, текстовое описание, инструкция, которую вы даёте нейросети для генерации изображения. Многие ошибочно полагают, что это поле для полёта фантазии, где можно изъясняться поэтическими метафорами. На самом деле всё куда прозаичнее. Качественный, добротный промт больше похож на техническое задание для дизайнера или фотографа, где по полочкам разложены все требования к будущему изображению. Чем точнее и детальнее будет эта инструкция, тем выше вероятность, что искусственный интеллект вас «поймёт» и выдаст именно тот результат, который вы себе представляли. В этом и кроется главный секрет. Задача не из лёгких, но вполне выполнимая.
Главный объект: Кто или что на картинке?
Львиная доля успеха зависит от того, насколько подробно вы опишете центральный объект или персонажа вашей будущей картины. Достаточно ли просто написать «мужчина»? Разумеется, нет. Нейросеть не умеет читать ваши мысли и сгенерирует усреднённый, ничем не примечательный образ. Стоит конкретизировать всё: возраст, внешность, одежду, эмоции и даже действие, которое он совершает. Сравните два запроса. Первый: «девушка». Второй: «молодая девушка-скандинавка с веснушками и длинными рыжими волосами, заплетёнными в косу, одетая в зелёное льняное платье, улыбается и смотрит в камеру». Чувствуете разницу? Во втором случае вы задаёте чёткие рамки, внутри которых алгоритм будет работать. Не стоит скупиться на прилагательные и уточняющие детали. Именно они придают образу изюминку и характер.
Стилизация: Как это должно выглядеть?
Следующий важнейший компонент – это стиль. Просто описать объект недостаточно, ведь его можно изобразить совершенно по-разному. Будет ли это гиперреалистичная фотография, картина маслом или набросок углём? Выбор огромен, и именно он определяет антураж и настроение всего изображения. Один из самых востребованных вариантов – фотореализм (photorealistic, ultra realistic). Он заставляет нейросеть имитировать снимок, сделанный на профессиональную фотокамеру. Совершенно иное настроение создаёт стиль фэнтези (fantasy art) или киберпанк (cyberpunk), погружая зрителя в вымышленные миры. К слову, можно пойти ещё дальше и стилизовать изображение под работы конкретного художника, например, «в стиле картин Ивана Айвазовского» или «в духе Альфонса Мухи». А можно указать на конкретную технику: акварель, гравюра, пиксель-арт. Главное – не смешивать в одном запросе слишком много противоречивых стилей, иначе получится визуальная «каша».
Свет и ракурс: Технические нюансы
Детали решают всё. Этот постулат творит настоящие чудеса при работе с нейросетями. Даже самое простое изображение преобразится, если уделить внимание техническим аспектам, знакомым любому фотографу. Что насчёт света? Он может быть мягким и рассеянным, как в пасмурный день (soft light), или жёстким, с глубокими тенями (dramatic lighting). Невероятно красиво смотрится «золотой час» (golden hour light), придающий сцене тёплый, мечтательный оттенок, или «кинематографичный свет» (cinematic lighting), отсылающий к кадрам из фильмов. Кроме того, стоит указать ракурс. Это может быть портрет крупным планом (close-up shot), съёмка с высоты птичьего полёта (aerial view) или общий план, показывающий персонажа в окружении (full body shot). Для придания большей «фотографичности» в запрос часто добавляют параметры объектива (например, 85mm lens), которые влияют на глубину резкости и перспективу.
Готовые примеры: Разберём на практике
Давайте от теории перейдём к конкретным примерам. Довольно часто пользователи хотят получить качественный портрет. Представим такой запрос:
«Фотореалистичный портрет пожилого библиотекаря в очках, с седой бородой, он сидит в уютном кресле, окружённый старыми книгами, тёплый свет от настольной лампы, снято на 85mm объектив, высочайшая детализация».
Здесь есть всё: чёткий объект (библиотекарь), детализация его внешности и окружения (очки, борода, книги), указание на свет (тёплый от лампы) и технические параметры (85mm, детализация).
А теперь окунёмся в мир фантазии. Вот пример промта для создания эпического пейзажа:
«Эпический фэнтези-пейзаж, затерянный город в джунглях, древние руины, обвитые лианами, водопады, в стиле картин Альберта Бирштадта, атмосферные лучи света, пробивающиеся сквозь густую листву, вид с высоты».
Ну и, конечно же, нельзя обойти стороной научную фантастику. Запрос может выглядеть так:
«Киберпанк-неоновый мегаполис ночью, летящие автомобили, голографические рекламные вывески, дождь, отражения на мокром асфальте, кинематографичный свет, вид от первого лица, стиль фильма „Бегущий по лезвию“».
Типичные ошибки: Чего стоит избегать?
Существует несколько подводных камней, на которые натыкаются новички. Первая и главная ошибка – это двусмысленность. Запрос «красивая машина на фоне природы» для нейросети пустой звук. Какая машина? Красная спортивная или чёрный внедорожник? Какая природа? Горный перевал или осенний лес? Нужно быть максимально конкретным. Вторая проблема – перегруженность. Не стоит пытаться уместить в одном промте десять разных персонажей, три стиля и пять видов освещения. Это приведёт лишь к хаосу. Лучше сосредоточиться на одной, но хорошо проработанной идее. Ну и, наконец, не стоит использовать отрицания. Вместо «девушка без шляпы» лучше сформулировать то, что вы хотите видеть, например, «девушка с распущенными волосами». Алгоритмы гораздо лучше воспринимают позитивные команды.
Эксперименты – ваш главный союзник. Не бойтесь менять слова местами, добавлять неожиданные детали, пробовать новые стили. Каждая генерация – это шаг к пониманию того, как «мыслит» нейросеть. Со временем вы научитесь интуитивно подбирать правильные формулировки для воплощения самых смелых идей. Удачи в ваших творческих экспериментах, и пусть нейросеть станет вашим послушным и могущественным инструментом.