В сети сегодня можно найти миллионы изображений на любой вкус, от деловых до креативных. Однако львиная доля из них — это давно приевшиеся стоковые фото, которые кочуют с сайта на сайт, вызывая у зрителя лишь лёгкое чувство дежавю. Буквально десятилетие назад генерация уникальных изображений с помощью искусственного интеллекта казалась чем-то из области фантастики, уделом гиков-энтузиастов и крупных корпораций. Сейчас же нейросеть, способная создать фотореалистичную картинку по текстовому описанию, доступна практически каждому. Но чтобы получить действительно качественный и бесплатный результат, нужно освоить искусство составления промтов.
Что такое промт и как он работает?
Многие обыватели считают, что промт — это просто набор ключевых слов, брошённых в специальное окошко. На самом деле всё несколько сложнее и интереснее. Промт — это детальное техническое задание для нейросети, своего рода инструкция для цифрового художника, у которого нет ни глаз, ни личного опыта, но есть доступ к гигантской базе визуальных данных. Чем точнее и образнее будет ваше «ТЗ», тем больше шансов, что итоговая картинка попадёт точно в цель, а не превратится в сюрреалистичное месиво из пикселей. Сложно ли это? И да, и нет. С одной стороны, базовые запросы нейросеть понимает довольно легко. С другой — для создания настоящего шедевра придётся немного попотеть, разложив свою идею по полочкам.
Вся суть в том, что искусственный интеллект не «понимает» слова в человеческом смысле, а ассоциирует их с определёнными визуальными паттернами, которые он видел во время обучения. Поэтому структура запроса имеет колоссальное значение. Сначала мы всегда указываем основной объект или сцену, которую хотим видеть. Далее стоит добавить действие или контекст, чтобы придать картинке динамики. После этого наступает черёд самого важного — стиля, освещения и технических деталей камеры. Именно эти нюансы и отделяют добротную работу от посредственной. Ну и, конечно же, не стоит забывать о так называемых «негативных промтах», но о них чуть позже.
Структура идеального запроса
Задача не из лёгких. Чтобы нейросеть (например, Midjourney или Stable Diffusion) выдала фотореалистичное изображение, а не мультяшную наляпистость, промт должен быть выстроен по определённой логике. В основе любого качественного изображения лежит подробное описание главного объекта. Не просто «девушка», а «молодая девушка с веснушками и рыжими волосами, собранными в небрежный пучок, одетая в тёплый вязаный свитер». Чувствуете разницу? Детализация творит чудеса, помогая ИИ сфокусироваться на конкретном образе.
Далее следует окружение. Где находится наша девушка? Сидит ли она в уютном кресле у камина, или, может, гуляет по осеннему парку? Описание фона добавляет изображению глубину и атмосферу. К тому же, это помогает избежать странных артефактов, когда объект будто висит в пустоте. Следующий важный критерий — стиль. Здесь и кроется изюминка. Можно задать просто «фотография», но лучше уточнить: «кинематографичный кадр», «стиль National Geographic», «модная съёмка для журнала Vogue». Каждое такое уточнение меняет антураж до неузнаваемости. Ну и, наконец, технические детали, которые приковывают внимание ценителей. Это указание на тип объектива (например, 85mm), диафрагму (f/1.8 для красивого размытия фона), тип плёнки и даже разрешение вроде «8K, ultra realistic». Такой добротный детализированный запрос не оставит нейросети шанса на ошибку.
Готовые промты для фотореализма
Разумеется, теория без практики мертва. Давайте рассмотрим несколько конкретных примеров, которые можно взять за основу для своих экспериментов. Эти промты составлены на английском языке, поскольку львиная доля моделей ИИ обучалась именно на англоязычных данных и понимает их гораздо лучше.
Хотите получить изысканный женский портрет? Задача вполне выполнима. Попробуйте такой запрос:
hyper-detailed photorealistic portrait of a beautiful young woman with long wavy hair, soft smile, wearing a white linen shirt, soft natural light from the window, cinematic lighting, 85mm lens, f/1.8, ultra high detail, 8K
Здесь мы указали всё: внешность, одежду, тип освещения (мягкий естественный свет), кинематографичность и даже параметры объектива для создания глубины. Результат будет выглядеть как кадр из дорогого фильма.
А вот для создания впечатляющего пейзажа, от которого захватывает дух, подход немного иной. Здесь солирует природа, а технические детали лишь подчёркивают её величие. Например:
epic landscape photo of Scottish Highlands, dramatic stormy clouds, misty mountains in the background, a lonely winding road, style of National Geographic, golden hour, high dynamic range (HDR), breathtaking view, sharp focus, 8K
В этом промте мы делаем ставку на атмосферу: штормовые облака, туман, золотой час. Упоминание стиля «National Geographic» сразу задаёт определённый стандарт качества и колорита.
Что насчёт предметной съёмки? Здесь свои подводные камни, ведь важна каждая мелочь. Допустим, нам нужно изображение чашки кофе. Запрос может быть таким:
professional product photography of a steaming cup of black coffee on a dark wooden table, coffee beans scattered around, macro shot, soft morning light, shallow depth of field, extremely detailed, commercial photography, 8K
Макросъёмка, рассеянные зёрна, утренний свет — все эти детали работают на создание «вкусной» и продающей картинки, которая ничем не уступит работе профессионального фотографа.
Каких ошибок стоит избегать?
Первая и главная ошибка, на которую натыкается каждый второй новичок, — это расплывчатость и двусмысленность. Запрос «кошка на столе» может сгенерировать что угодно: от рисунка до трёхмерной модели. Не стоит лениться, лучше сразу уточнить: «фотография сиамского кота, спящего на старом письменном столе». С другой стороны медали — избыточная детализация, которая противоречит сама себе. Попытка впихнуть в один промт и «солнечный день», и «неоновый свет ночного города» приведёт нейросеть в замешательство.
Отдельно стоит упомянуть так называемые негативные промты. Это специальное поле (часто обозначается как –no или negative prompt), куда вы вписываете всё, чего на изображении быть НЕ должно. Это ваш спасательный круг. Надоели уродливые руки с шестью пальцами, которые так любят рисовать нейросети? Просто добавьте в негативный промт: «ugly, deformed, extra fingers, bad anatomy». Не хотите, чтобы на картинке были люди? Напишите «no people». Не стоит пренебрегать этим мощным инструментом, ведь он отсекает львиную долю брака и экономит ваше время и нервы. Процесс не сложный, но довольно кропотливый.
И, конечно же, не бойтесь экспериментировать. Иногда самые грандиозные результаты получаются из случайных комбинаций. Не сработал один запрос — немного измените его, поменяйте слова местами, добавьте или уберите какой-нибудь эпитет. Это же не махинации с банковским счётом, здесь ошибки не бьют по кошельку. Воспринимайте общение с нейросетью как диалог с очень талантливым, но немного странным художником, которому нужно всё объяснять на пальцах.
Разумеется, представленные примеры — лишь верхушка айсберга в бездонном океане генеративного искусства. Главный постулат, который стоит запомнить: нейросеть — это не волшебная кнопка «сделать красиво», а мощный инструмент в руках креативного человека. Чем лучше вы научитесь формулировать свои мысли, тем более впечатляющие изображения сможете получать. Экспериментируйте, пробуйте, совмещайте несовместимое, и нейросеть обязательно вас удивит. Удачи в ваших творческих поисках.