В сети можно найти несмётное количество советов по работе с нейросетями, которые генерируют изображения. Кажется, что для получения идеального аватара или иллюстрации достаточно просто описать желаемое. Однако львиная доля пользователей быстро натыкается на одни и те же «подводные камни»: результат выходит пластиковым, безжизненным, а порой и откровенно комичным, с шестью пальцами на руке или странной асимметрией лица. Вся суть в том, что искусственный интеллект – это не волшебник, а скрупулёзный исполнитель, требующий предельно точных инструкций. Но чтобы не ошибиться и не потратить часы на бесплодные попытки, нужно сначала разложить по полочкам саму структуру идеального запроса.
Как нейросеть «видит» мужской образ?
Многие считают, что достаточно ввести в строку «красивый мужчина в костюме», и Midjourney или Stable Diffusion тут же выдадут обложку журнала GQ. Отчасти это так, но результат будет донельзя усреднённым и лишённым изюминки. Это будет просто собирательный образ, основанный на миллионах фотографий из обучающей выборки. С чего начинается работа? С понимания, что для ИИ нет понятий «харизма», «брутальность» или «интеллигентность» в человеческом смысле. Он оперирует конкретными визуальными маркерами: формой челюсти, густотой щетины, типом причёски, фактурой ткани и, конечно же, игрой света и тени. Поэтому наша главная задача — перевести абстрактные желания на язык чётких и недвусмысленных команд.
Задача не из лёгких. Ведь нужно учесть буквально всё. Нейросеть не додумает за вас, что мужчина должен выглядеть уверенно. Ей нужно указать на «прямую осанку», «спокойный взгляд, устремлённый в камеру» и «слегка приподнятый подбородок». Именно из таких мелочей и складывается тот самый характер, который мы хотим увидеть на итоговом изображении. Без этого детального подхода любая генерация превращается в лотерею с довольно низкими шансами на выигрыш.
Основа промта: из чего состоит запрос?
Чтобы создать добротный, рабочий промт, не стоит вываливать на нейросеть поток сознания. Лучше действовать последовательно. Во-первых, стоит определить главного героя нашей фотосессии. Опишите его внешность максимально подробно: возраст (например, «мужчина 35 лет»), национальность, цвет и длина волос («короткие тёмные волосы с проседью на висках»), цвет глаз, особенности лица («квадратная челюсть, лёгкая щетина»). Чем больше таких деталей, тем меньше у ИИ пространства для самодеятельности.
Далее следует одежда. Это же правило касается и стиля. Не просто «костюм», а «идеально сшитый тёмно-серый шерстяной костюм-тройка с белой рубашкой и чёрным шёлковым галстуком». Чувствуете разницу? Каждое слово добавляет изображению текстуры и реализма. После этого нужно продумать окружение. Где находится наш герой? В «минималистичном лофте с бетонными стенами и большими окнами» или, может, он стоит на «улице ночного Токио, залитой неоновым светом»? Антураж играет колоссальную роль в создании настроения. Ну и, конечно же, технические параметры, которые для многих обывателей остаются за кадром, но для нейросети критически важны.
Что насчёт технических деталей? Это настоящий кладезь возможностей для управления результатом. Стоит указать тип съёмки – «студийный портрет», «репортажный снимок», «фэшн-фотография». Невероятные чудеса творит упоминание конкретной фототехники. Фразы вроде «снято на Canon EOS R5 с объективом 85mm f/1.2» или «имитация съёмки на плёнку Kodak Portra 400» мгновенно задают определённый стиль, зернистость и цветовую палитру. И, наконец, свет. Он солирует в любой фотографии. «Мягкий утренний свет из окна», «драматическое освещение в стиле Рембрандта», «жёсткий студийный свет» – всё это кардинально меняет восприятие одного и того же образа.
Готовые промты для разных стилей
Давайте перейдём от теории к практике. Чтобы понять, как всё это работает вместе, рассмотрим несколько готовых «рецептов». Разумеется, их стоит воспринимать как отправную точку для собственных экспериментов, а не как незыблемые постулаты.
Начнём с классики. Представим, что нам нужен строгий и современный деловой портрет. Запрос может выглядеть так:
Фотореалистичный портрет 40-летнего мужчины-архитектора с короткой стрижкой и лёгкой сединой, пронзительный взгляд, одет в тёмно-синий кашемировый свитер с высоким горлом, стоит на фоне минималистичного бетонного интерьера с панорамным окном. Мягкий, рассеянный дневной свет. Снято на цифровую камеру Leica M11, объектив 50mm, высокая детализация кожи, кинематографическое качество, 8K.
Здесь мы задали всё: от возраста и профессии до конкретной модели камеры, что придаст снимку характерный «дорогой» вид.
А если хочется чего-то более динамичного и неформального? Пожалуйста, уличный стиль. «Полный рост, молодой мужчина 25 лет с вьющимися светлыми волосами, идёт по дождливой улице вечернего Нью-Йорка, одет в чёрную кожаную куртку, джинсы и грубые ботинки. Динамичная поза, эффект размытия в движении, отражения неоновых вывесок в лужах на асфальте. Атмосфера фильма «Бегущий по лезвию». Стиль съёмки Грега Уильямса (Greg Williams), высокая контрастность, зернистость плёнки». В этом промте изюминка – упоминание конкретного фотографа и киноленты, что служит для нейросети мощнейшим стилистическим ориентиром.
Для любителей погрузиться в другие эпохи подойдёт фэнтезийный или исторический образ. «Эпический портрет сурового викинга 30 лет с длинными заплетёнными в косы волосами и густой бородой, на лице боевая раскраска и шрамы. Одет в потёртую кожаную броню с меховым воротником. Стоит на фоне заснеженного фьорда на рассвете. Драматическое холодное освещение, пар изо рта. Фотография в стиле игры The Witcher 3, гипердетализация, текстура кожи, капли влаги на волосах». Ключ к успеху здесь – апелляция к известной игровой вселенной и акцент на мелких деталях, которые и создают ощущение реальности.
Ну и, наконец, вариант для тех, кто тяготеет к искусству и минимализму. «Чёрно-белый студийный портрет мужчины-танцора с атлетичным телосложением, напряжённые мышцы. Свет и тень подчёркивают рельеф тела, стиль кьяроскуро. Капли пота на коже. Минималистичный тёмный фон. Фотография в стиле работ Герба Ритца (Herb Ritts), высокое разрешение, максимальная детализация, глубокие тени». Такой запрос отсекает всё лишнее, концентрируясь на главном – пластике тела и игре света.
Типичные ошибки новичков: чего стоит избегать?
В работе с нейросетями, как и в любом другом деле, со временем всплывут типичные ошибки. Первая и самая главная – чрезмерная обобщённость. Запросы вроде «сильный мужчина» или «модный парень» почти гарантированно приведут к разочарованию. Не стоит бояться конкретики, даже если она кажется избыточной. Вторая ошибка – это внутренние противоречия в промте. Например, «весёлый грустный клоун» или «солнечная ночная улица» могут поставить алгоритм в тупик, и результат будет, мягко говоря, неоднозначным.
Кроме того, не стоит перегружать запрос деталями сверх меры. Иногда желание впихнуть в одну картинку и горы, и море, и футуристический город приводит к визуальной какофонии, где ни один элемент не проработан как следует. Лучше сосредоточиться на одной идее и довести её до ума. Ну и, конечно же, не забывайте про негативные промты (команды с приставкой –no). С их помощью можно исключить из генерации нежелательные элементы: мультяшный стиль, лишние конечности, уродливые черты лица, водяные знаки. Это своего рода спасательный круг, который помогает отсечь брак.
Эксперименты – это ключ к успеху. Не бойтесь менять слова местами, добавлять имена художников, режиссёров, фотографов, пробовать разные комбинации настроек и стилей. Каждая новая попытка, даже неудачная, даёт понимание того, как «мыслит» машина. Со временем этот процесс превратится из сложной махинации в увлекательный творческий диалог. Удачи в ваших цифровых фотосессиях.