В сети представлено множество нейросетей, способных по текстовому описанию создавать настоящие визуальные шедевры. Буквально за пару минут можно получить изображение, на которое у профессионального художника ушли бы недели кропотливого труда. Однако львиная доля пользователей, впервые столкнувшись с такими инструментами, как Midjourney или Stable Diffusion, получает довольно удручающий результат: кривые лица, шесть пальцев на руках и совершенно плоская, безжизненная композиция. Дело в том, что нейросеть — не волшебник, а скрупулёзный исполнитель, которому нужна предельно точная инструкция. Поэтому, чтобы не разочароваться в технологии, стоит с самого начала научиться составлять правильные запросы или, как их называют, промты.
Что такое промт и зачем он нужен?
Многие обыватели ошибочно полагают, что промт — это просто пара слов, описывающих желаемый объект. Написал «кошка на крыше» — получил кошку на крыше. С одной стороны, это так. Но с другой, результат будет совершенно непредсказуемым и, скорее всего, неэстетичным. Качественный, добротный промт — это подробное техническое задание для искусственного интеллекта, настоящий рецепт будущего изображения. Он диктует не только то, что должно быть нарисовано, но и как именно. В его структуру обычно закладывается несколько ключевых постулатов. Во-первых, это сам объект и его окружение, его действия. Во-вторых, стилистика — от фотореализма до аниме или киберпанка. Ну и, наконец, технические детали: освещение, ракурс, используемая камера и даже настройки объектива.
Где искать вдохновение?
Задача не из лёгких. Конечно, можно часами просиживать на специализированных форумах или в галереях, пытаясь «выцепить» удачные примеры и разобрать их по косточкам. Но есть путь проще и эффективнее. Это специализированные каналы в мессенджерах, например, в Telegram. В представлении многих это просто свалка чужих работ, но на самом деле хороший канал — настоящий кладезь знаний. Там не просто публикуют красивые картинки, но и всегда прилагают к ним полный промт, который использовался для генерации. Это же позволяет не только скопировать готовое решение, но и проанализировать, как тот или иной набор слов влияет на конечный результат. К тому же, вокруг таких каналов часто формируется живое сообщество, где можно задать вопрос и получить дельный совет. Впрочем, не стоит подписываться на первый попавшийся ресурс. Отдавать предпочтение стоит тем, где есть чёткая структура, рубрики и, что немаловажно, разбор сложных запросов.
Промты для Midjourney: Киберпанк и фэнтези
Особый интерес у новичков и опытных пользователей вызывает стилистика, которую невозможно или довольно сложно воссоздать в реальности. Яркий пример — киберпанк. Представьте себе залитые неоном улицы футуристического города, где по мокрому асфальту бегут отражения голографических реклам, а над головой пролетают автомобили. Создать такое фото практически невозможно, а вот сгенерировать — вполне. Для этого нейросети нужно дать подробную инструкцию. Например:
Cyberpunk noir detective walking down a dark rainy alley in Neo-Tokyo, neon signs reflecting in puddles, cinematic lighting, highly detailed, photorealistic, Unreal Engine 5, –ar 16:9
Здесь мы не просто задали персонажа и локацию, но и уточнили антураж (нуарный детектив), освещение (кинематографичное), детализацию и даже движок (Unreal Engine 5), который придаст картинке специфическую эстетику. Другое популярное направление — фэнтези. Скажем, вы грезите об изображении эльфийской волшебницы в зачарованном лесу. Вместо сухого «эльф в лесу» стоит использовать более развёрнутый и атмосферный промт. К слову, вот удачный вариант:
Ethereal elven sorceress with silver hair, intricate glowing runes on her clothes, standing in an ancient mystical forest, volumetric light rays filtering through the canopy, fantasy art by Greg Rutkowski, hyper-detailed, epic scale, –ar 4:5
Что здесь важно? Мы добавили прилагательных, которые творят чудеса: «ethereal» (потусторонняя), «mystical» (мистический). А упоминание конкретного художника (в данном случае Greg Rutkowski, известный своими эпичными фэнтези-артами) даёт нейросети мощнейший стилистический ориентир.
А как насчёт фотореализма?
Добиться максимального сходства с реальной фотографией — ещё одна амбициозная, но выполнимая задача. Здесь на первый план выходят уже не вымышленные миры, а технические параметры съёмки. С чего начинается выбор? С определения того, что мы хотим получить. Допустим, нам нужен атмосферный портрет пожилого мужчины, читающего книгу в старой библиотеке. Чтобы результат не выглядел как пластиковая 3D-модель, в промт нужно заложить фотографические термины. Например:
Candid portrait of an old man with a white beard, wearing tweed jacket, reading a book in a dusty library, soft natural window light, shot on a Sony a7 III with a 50mm f/1.8 lens, shallow depth of field, soulful expression, hyperrealistic, 8K
В этом запросе вся суть в деталях. Указание камеры (Sony a7 III) и конкретного объектива (50mm f/1.8) даёт нейросети понять, какой характер размытия фона (боке) и какую перспективу мы хотим видеть. Фразы «shallow depth of field» (малая глубина резкости) и «natural window light» (естественный свет из окна) окончательно формируют реалистичный образ.
Подводные камни и частые ошибки
Путь генератора изображений усеян не только розами, но и шипами. Есть несколько типичных махинаций, которые совершают новички и которые приводят к плачевному результату. Первая и самая главная ошибка — избыточная сложность. Не стоит пытаться впихнуть в один запрос десять разных объектов и пять конфликтующих стилей. Нейросеть просто запутается. Лучше создать простое, но цельное изображение, чем вычурную и наляпистую кашу. Второй нюанс — игнорирование негативных промтов. Это специальная команда (обычно –no), после которой вы перечисляете то, чего на картинке быть не должно. Это спасательный круг в борьбе с шестью пальцами, уродливыми лицами на заднем плане или лишними конечностями. Ну и, наконец, не стоит бояться экспериментов. Если результат вас не устроил, попробуйте поменять слова местами, заменить один эпитет другим или слегка изменить параметры. Иногда одно-единственное слово способно кардинально преобразить всю композицию.
Поиск хорошего канала с промтами — это серьёзное вложение времени, которое, однако, окупается сторицей. Он станет не просто источником готовых решений, а настоящим учебником, который поможет разложить по полочкам сложную механику взаимодействия с искусственным интеллектом. Не бойтесь копировать, анализировать и видоизменять чужие запросы. Именно так рождается собственный уникальный стиль. Удачи в ваших творческих экспериментах, и пусть нейросеть станет вашим верным помощником.