В сети представлено множество завораживающих изображений, созданных нейросетями. Лёгкие, воздушные пейзажи, нежные портреты с полупрозрачными мазками и сочные натюрморты так и манят попробовать свои силы. Кажется, что достаточно написать «котик акварелью», и искусственный интеллект тут же выдаст шедевр, достойный картинной галереи. Однако на практике результат часто разочаровывает: вместо изящного рисунка получается нечто размытое, с грязными цветами и странными артефактами. Вся суть в том, что нейросеть – это не волшебник, а скрупулёзный исполнитель, который нуждается в предельно точном техническом задании. Но чтобы не ошибиться и научиться говорить с машиной на одном языке, нужно разложить по полочкам саму структуру запроса, или, как его принято называть, промта.
Что такое промт и почему он так важен?
Задача не из лёгких. В представлении многих обывателей промт – это просто описание того, что хочется увидеть. Отчасти это правда, но лишь отчасти. При работе с нейросетями, особенно когда речь заходит о стилизации под конкретную художественную технику, этот принцип работает с оговорками. Качественный промт для акварели – это скорее подробный рецепт для художника, где указаны не только «ингредиенты» (объекты на картине), но и последовательность действий, инструменты и даже настроение. От того, насколько детально и грамотно составлен этот «рецепт», напрямую зависит львиная доля успеха. Ведь именно промт задаёт вектор, по которому будет двигаться алгоритм. Плохой запрос приведёт к хаосу, а добротный и продуманный поможет создать действительно впечатляющее произведение.
С чего начинается работа над запросом? С чёткого понимания его структуры. Условно любой промт можно разделить на несколько логических блоков. Во-первых, это основной объект или сюжет – то, что должно быть в центре внимания. Во-вторых, ключевой стилизатор, в нашем случае – прямое указание на акварельную технику. В-третьих, это уточняющие детали, которые касаются стиля, палитры, композиции и специфических приёмов. Ну и, наконец, технические параметры, вроде освещения или ракурса. Соединяя эти блоки в правильном порядке и используя верные формулировки, можно творить настоящие чудеса. Это же правило касается и негативных промтов, где мы перечисляем всё то, чего на изображении быть не должно.
Как добиться нужного эффекта?
Давайте перейдём от теории к практике. Чтобы получить воздушный и лёгкий рисунок, недостаточно просто написать watercolor. Нейросеть поймёт команду буквально и может выдать довольно плоское, «цифровое» изображение. Изюминка кроется в деталях. Стоит добавить в запрос слова, описывающие саму технику: «мокрым по мокрому» (wet-on-wet), «брызги краски» (paint splatters), «подтёки» (drips), «свободные мазки» (loose brushstrokes). Эти команды заставляют алгоритм имитировать физические свойства настоящей краски, её растекание по влажной бумаге.
Предположим, мы хотим создать пейзаж. Наш запрос может выглядеть так:
«An ethereal watercolor painting of a misty Scottish Highlands landscape at dawn, soft light filtering through the fog, muted greens and blues, wet-on-wet technique, loose brushstrokes, highly detailed, serene atmosphere».
Разберём его. Мы не просто просим «пейзаж», а уточняем – «туманные Шотландские highlands на рассвете». Добавляем атмосферу через «мягкий свет, пробивающийся сквозь туман» и «безмятежность». Палитру ограничиваем «приглушёнными зелёными и синими». Ну и, конечно же, указываем саму технику – wet-on-wet и loose brushstrokes. Результат будет в разы интереснее, чем от простого «Scottish landscape watercolor».
А что насчёт портретов? Здесь тоже есть свои нюансы. Важно указать не только внешность модели, но и характер рисунка. Например, minimalist или delicate. Попробуем такой вариант:
«Delicate watercolor portrait of a young woman with freckles, looking away, soft pastel color palette, light washes, on a clean white background, detailed eyes, minimalist style».
Ключевые слова здесь – «нежный портрет» (delicate), «лёгкие заливки» (light washes) и «минималистичный стиль». Уточнение про «детализированные глаза» приковывает внимание к главной части лица, а «чистый белый фон» создаёт ощущение воздуха и не перегружает композицию.
Ну и, конечно же, нельзя не упомянуть натюрморты, особенно еду. Акварельная техника идеально подходит для создания сочных и аппетитных иллюстраций. Здесь можно смело играть с яркостью и динамикой. Вот добротный пример:
«A vibrant watercolor illustration of a slice of cherry pie on a vintage plate, juicy filling, dripping syrup, splatters of red paint, high contrast, on a rustic wooden table, food illustration style».
Слова vibrant (яркий), juicy (сочный), dripping (капающий) и splatters (брызги) сообщают нейросети, что нам нужна не просто статичная картинка, а живая, динамичная сцена, которая вызывает аппетит.
Подводные камни: чего стоит избегать?
Процесс несложный, но довольно кропотливый. И на пути к идеальному изображению часто всплывут ошибки, которые могут испортить всю генерацию. Первая и, пожалуй, самая частая – это перегружённость промта противоречивыми командами. Не стоит писать в одном запросе «фотореалистичный» и «акварельный набросок». Это два взаимоисключающих понятия, и нейросеть, пытаясь угодить обоим, скорее всего, выдаст нечто среднее и невнятное. Лучше выбрать одно направление и придерживаться его.
Вторая распространённая проблема – это игнорирование веса слов. В большинстве нейросетей (особенно в Midjourney) слова, стоящие в начале промта, имеют больший вес. Поэтому начинать запрос стоит всегда с самого главного – с объекта и стиля. Детали, вроде освещения или ракурса, лучше перенести в конец. К слову, можно искусственно повышать или понижать значимость определённых слов с помощью специальных синтаксических конструкций, но это уже тема для отдельного, более глубокого разбора.
Ну и, наконец, третья ошибка – недостаток конкретики. Запросы вроде «красивый цветок акварелью» почти всегда ведут к шаблонным, скучным результатам. Какой цветок? Пион, роза, а может, полевой василёк? В каком он состоянии – в бутоне или уже распустился? Какого он цвета? Есть ли на лепестках капли росы? Чем больше таких уточняющих деталей вы дадите нейросети, тем более осмысленным и самобытным получится итоговое изображение. Не бойтесь описывать эмоции и атмосферу – современные алгоритмы довольно неплохо научились их интерпретировать.
Главное – не бояться экспериментов. Создание промтов – это творческий процесс, где нет единственно верного решения. Попробуйте смешивать стили, добавлять имена известных художников-акварелистов, чтобы нейросеть попыталась имитировать их манеру, меняйте слова местами и наблюдайте, как меняется результат. Каждая новая генерация – это маленький шаг к пониманию того, как мыслит искусственный интеллект. Удачи в ваших творческих начинаниях, и пусть каждая попытка станет маленьким шедевром.