Каждый из нас хотя бы раз натыкался в сети на фантастические изображения, созданные искусственным интеллектом: фотореалистичные портреты несуществующих людей, эпические пейзажи из сказочных миров или детализированные предметы, которые невозможно отличить от настоящих. Глядя на эту магию, многие тоже грезят о том, чтобы попробовать себя в роли цифрового демиурга. Но вот незадача: первая же попытка сгенерировать что-то вразумительное часто заканчивается разочарованием и выдачей какой-то наляпистой абракадабры. Вся суть в том, что нейросеть – не телепат, а скрупулёзный исполнитель. Но чтобы не ошибиться в этом творческом поиске и не потратить драгоценные попытки впустую, нужно разложить по полочкам саму суть запроса, или, как его принято называть, промта.
Русский или английский: есть ли разница?
Первый вопрос, который возникает у обывателя: на каком языке «общаться» с нейросетью? В представлении многих, львиная доля моделей (например, Midjourney или Stable Diffusion) обучалась на гигантских массивах англоязычных данных, поэтому и запросы на языке Шекспира они понимают лучше. Отчасти это правда. Английский язык, благодаря своей структуре, позволяет выстраивать довольно чёткие и лаконичные команды. Однако списывать со счетов великий и могучий тоже не стоит. Современные нейросети неплохо справляются с русским, особенно если речь идёт о популярных и хорошо описанных в культуре объектах. К тому же, на родном языке гораздо проще сформулировать сложную, многогранную идею, передать тонкий нюанс или самобытный колорит. Так что ответ неоднозначный. Если вы хотите получить что-то исконно русское, вроде «избушки на курьих ножках в заснежённом лесу», смело пишите по-русски. Если же задача – создать что-то в стилистике западной поп-культуры, то английский может дать более предсказуемый результат.
Анатомия идеального промта
Задача не из лёгких. Промт – это, по сути, техническое задание для художника-робота, и чем оно подробнее, тем лучше. Структуру удачного запроса можно условно разделить на несколько блоков. Начать стоит с главного объекта. Это может быть что угодно: человек, животное, здание или предмет. Важно описать его максимально конкретно, не оставляя пространства для вольных трактовок. Формулировка «девушка» слишком размыта, а вот «молодая рыжеволосая девушка с веснушками» – уже гораздо лучше.
Далее следует блок с уточнением деталей и действий. Что делает ваш персонаж? Во что он одет? Какое у него выражение лица? Здесь же можно описать окружение или фон. Например, «сидит за столиком в уютном парижском кафе» или «стоит на вершине горы на фоне заката». Каждая такая деталь вносит свою лепту в финальный образ и делает его более живым и проработанным. Не скупитесь на прилагательные, они творят чудеса.
Следующий важный критерий – стилистика. Именно этот блок превращает сухой набор объектов в произведение искусства. Вы хотите получить фотореалистичное изображение, картину маслом в стиле импрессионистов, рисунок углём, кадр из аниме или 3D-рендер? Всё это нужно указать. К слову, можно даже ссылаться на имена конкретных художников или фотографов, чтобы нейросеть попыталась имитировать их манеру. Довольно популярный приём – добавлять маркеры вроде «в стиле Тима Бёртона» или «как на фотографиях Анни Лейбовиц».
Ну и, наконец, технические параметры. Это уже высший пилотаж, но именно он приковывает внимание к работам профессионалов. Сюда относится описание освещения (жёсткий полуденный свет, мягкий свет от свечи, неоновое освещение), ракурса (крупный план, вид с высоты птичьего полёта), а также настроек воображаемой камеры – фокусное расстояние, выдержка, диафрагма. Указание «снято на объектив 85mm f/1.8» может кардинально изменить картинку, добавив ей красивое размытие фона (боке).
Как превратить идею в рабочий запрос?
С чего начинается работа? С определения центральной идеи. Допустим, вы хотите получить изображение кота-аристократа. Это отправная точка. Теперь начинаем нанизывать детали. Какой кот? Сиамский, пушистый, с важным видом. Что он делает? Сидит в кресле у камина. Во что он одет? В бархатный камзол и на шее у него жабо. Какой антураж? Старинная библиотека с высокими стеллажами книг, в воздухе витает пыль, сквозь окно пробивается лунный свет. Какая стилистика? Цифровая живопись, гипердетализация. Собираем всё вместе и получаем добротный, рабочий промт:
«Цифровая живопись, гипердетализация. Пушистый сиамский кот-аристократ в красном бархатном камзоле с жабо важно сидит в старинном кожаном кресле у камина. На фоне – огромная библиотека с книжными полками до потолка. Ночь, сквозь готическое окно светит полная луна, создавая драматические тени».
Звучит сложно? Да, но результат того стоит.
Готовые промты: Примеры для вдохновения
Чтобы было проще окунуться в этот мир, давайте рассмотрим несколько готовых «рецептов». Это не постулаты, а скорее кладезь идей для ваших собственных экспериментов.
Начнём с портрета. Задача – создать максимально реалистичное изображение. Промт может выглядеть так: «Фотореалистичный портрет молодой женщины славянской внешности (25 лет) с длинными русыми волосами, заплетёнными в небрежную косу. Голубые глаза, лёгкая улыбка, на щеках веснушки. Одета в простое льняное платье. Мягкий рассеянный утренний свет. Снято на профессиональную камеру, объектив 85mm, диафрагма f/2.0, высочайшая детализация кожи, 8k». Здесь есть всё: описание внешности, одежды, эмоции, а также мощный блок технических уточнений, который заставит нейросеть выдать качественное фото.
А вот пример для любителей пейзажей. «Эпический пейзаж, горная долина в Норвегии на рассвете. Густой туман стелется по земле, сквозь него пробиваются первые лучи солнца. На переднем плане – древние рунические камни, поросшие мхом. Атмосфера таинственности и спокойствия. Картина маслом в стиле Альберта Бирштадта, панорамный вид, кинематографическое освещение». Использование имени художника и термина «кинематографическое освещение» задаёт нужный тон и настроение.
Ну и, конечно же, предметная съёмка. Довольно сложный жанр. «Макросъёмка старинных карманных часов с открытой крышкой, лежащих на потёртой деревянной поверхности. Видны мельчайшие шестерёнки и сложный механизм. Рядом лежит пожелтевшее письмо с печатью из сургуча. Тёплый ламповый свет, винтажная обработка, блики на металле, высокая детализация». Такие подробные промты позволяют создавать внушительные и атмосферные натюрморты.
Подводные камни и частые ошибки
Путь генератора полон не только открытий, но и разочарований. Одна из главных ошибок – неоднозначность. Нейросеть не умеет читать между строк. Запрос «человек с луком» может выдать как лучника, так и человека с головкой репчатого лука. Поэтому всегда стоит уточнять: «средневековый лучник с длинным луком». Второй подводный камень – перегружённость конфликтующими деталями. Не стоит в одном запросе смешивать стили «кубизм» и «фотореализм» или требовать «солнечный ночной пейзаж». Такие махинации лишь запутают алгоритм.
Кстати, многие модели поддерживают так называемые негативные промты – указание того, чего на изображении быть НЕ должно. Это спасательный круг, когда нейросеть упорно добавляет лишние пальцы, уродливые лица на фоне или водяные знаки. Обычно этот параметр вводится отдельно (через команду –no в Midjourney). Например, «–no уродливое, мутация, лишние конечности».
Впрочем, главный секрет успеха довольно прост. Он заключается в практике. Не бойтесь экспериментировать, менять слова местами, добавлять неожиданные эпитеты или убирать лишнее. Каждая новая генерация – это шаг к пониманию того, как «мыслит» машина. Со временем вы научитесь интуитивно чувствовать, какое слово сработает, а какое только всё испортит.
Главное – не бояться экспериментировать и относиться к процессу как к увлекательной игре, а не как к экзамену. Каждая ошибка – это тоже результат, который помогает лучше понять логику нейросети. Удачи в этом увлекательном путешествии в мир цифрового искусства!