Промт для фотографии chatgpt (с примерами готовых промтов)

В сети представлено огромное множество изображений, созданных искусственным интеллектом, и львиная доля из них выглядит, мягко говоря, шаблонно. Глянцевые, но бездушные портреты, однотипные пейзажи, повторяющиеся сюжеты – всё это результат поверхностного общения с нейросетью. Многие пользователи, грезя о создании визуального шедевра, просто бросают в чат пару слов и получают в ответ нечто усреднённое и скучное. Вся суть в том, что нейросеть – это не волшебник, читающий мысли, а невероятно мощный, но скрупулёзный исполнитель, которому нужно предельно точное техническое задание. Но чтобы заставить эту цифровую махину творить настоящие чудеса, нужно научиться говорить с ней на одном языке, освоив искусство составления промтов.

Что такое промт и почему он так важен?

В представлении многих обывателей промт – это просто текстовый запрос. На самом деле, это куда более глубокое понятие. Добротный промт – это подробный сценарий, режиссёрская раскадровка и инструкция по сборке в одном флаконе. Представьте, что вы пытаетесь объяснить художнику свой сон. Если вы скажете «нарисуй красивую девушку в лесу», вы получите его собственную интерпретацию, которая может сильно отличаться от вашей. Но если вы опишете цвет её волос, фасон платья, породу деревьев вокруг, время суток и даже настроение, которое витает в воздухе, результат будет максимально близок к тому, что вы себе вообразили. С нейросетью всё работает точно так же, только вместо кисти и холста у неё – алгоритмы и гигабайты данных. Задача не из лёгких. Ведь нужно разложить по полочкам то, что существует лишь в голове.

Структура идеального запроса

Чтобы получить предсказуемый и качественный результат, не стоит полагаться на удачу. Профессионалы давно вывели формулу эффективного промта, которая включает несколько обязательных компонентов. Начать стоит с главного – с объекта или субъекта. Это может быть что угодно: «старый бородатый волшебник», «блестящий гоночный автомобиль 1960-х годов» или «одинокий маяк на скалистом берегу». Затем нужно поместить нашего героя в определённый антураж, описав его действия и окружение. Например, волшебник может «читать древнюю книгу в заваленной свитками библиотеке», а маяк «противостоять бушующему шторму». Следующий важнейший пласт – стилистика. Хотите ли вы получить фотореалистичное изображение, картину маслом в духе импрессионистов, кадр из аниме студии Ghibli или, может, готический рисунок тушью? Это нужно указать прямо. Ну и, конечно же, изюминка, которая отделяет шедевр от проходной картинки, – детали. Освещение (драматическое, мягкий утренний свет, неоновое), ракурс (крупный план, вид с высоты птичьего полёта), цветовая палитра (тёплая, холодная, монохромная) и даже технические параметры камеры – всё это творит настоящие чудеса.

Как создать фотореалистичное изображение?

Задача получить картинку, неотличимую от настоящей фотографии, – одна из самых частых. Здесь на помощь приходит так называемая «фотографическая» лексика. Допустим, мы хотим сгенерировать изображение кошки. Простое «рыжий кот спит» даст довольно скучный результат. Давайте усложним задачу. Во-первых, уточним детали: «Пушистый рыжий кот породы мейн-кун спит, свернувшись клубком на стопке старинных книг в кожаных переплётах». Во-вторых, добавим окружение: «Кот находится в уютной, залитой солнцем библиотеке, лучи света падают из большого окна, создавая тёплые блики на его шерсти». Ну и, наконец, воспользуемся техническими терминами. В итоге у нас может получиться вот такая добротная команда:

Фотореалистичное изображение, снятое на камеру Canon EOS 5D Mark IV с объективом 85mm f/1.2. Пушистый рыжий мейн-кун спит на стопке старых книг в уютной библиотеке. Тёплый солнечный свет из окна, золотой час, мягкие тени, высокая детализация шерсти, боке на заднем плане.

Разница в результате будет колоссальной. Нейросеть поймёт, какой объектив использовать, чтобы красиво размыть фон, и какое освещение создаст нужную атмосферу.

Магия стиля: от киберпанка до акварели

А что если фотография – это слишком скучно? Возможности стилизации поистине безграничны. Здесь стоит отталкиваться от имён художников, названий художественных течений или просто описательных прилагательных. Возьмём для примера простой сюжет: «рыцарь на коне». Сам по себе он довольно тривиален. Но всё меняется, стоит лишь добавить стилистический вектор. Например, для создания эпического фэнтези-арта можно написать: «Концепт-арт рыцаря в богато украшенных латных доспехах на могучем боевом коне. Они стоят на краю обрыва с видом на грозовое небо и далёкий замок. Стиль Фрэнка Фразетты и Тода Локвуда, драматическое освещение, кинематографическая композиция, высокая детализация». А если хочется чего-то совсем иного? Можно ведь пойти и другим путём, попросив нейросеть изобразить того же рыцаря, но в стиле киберпанк, заменив коня на футуристический байк, а доспехи – на экзоскелет с неоновыми вставками. Или, например, в виде нежной акварельной иллюстрации в духе детских книг. Главное – чётко сформулировать, какой именно визуальный язык вы хотите использовать.

Зачем здесь вообще ChatGPT?

Стоит задать резонный вопрос. Но ведь можно просто пойти в DALL-E 3 или Midjourney и вписать туда свой запрос? Разумеется, можно. Однако вся изюминка интеграции генератора изображений именно с ChatGPT (в его платной версии) в том, что он выступает не просто исполнителем, а творческим партнёром и усилителем идей. Вы можете изложить ему концепцию простыми словами, а он сам превратит её в развёрнутый, профессиональный промт. К примеру, вы пишете: «Хочу картинку, где енот-детектив в шляпе сидит в тёмном офисе». ChatGPT не просто передаст это DALL-E, а сначала расширит и обогатит запрос, предложив что-то вроде: «Нуар-сцена: енот-детектив в фетровой шляпе и плаще сидит за дубовым столом в своём тускло освещённом офисе. На столе стоит старая печатная машинка, дымится чашка кофе. Свет от настольной лампы отбрасывает длинные тени. За окном льёт дождь, его капли стекают по стеклу. Стиль кадра из фильма 1940-х годов, зернистость, высокий контраст». Это же колоссальная разница. Он сам подберёт нужный антураж и технические детали, о которых вы могли и не подумать.

Типичные ошибки новичков

На пути к визуальным свершениям обывателя поджидают подводные камни. Одна из главных ошибок – излишняя краткость и абстрактность. Запросы вроде «сделай красиво» или «футуристический город» обречены на провал. Не стоит скупиться на прилагательные и уточняющие детали. Другая крайность – перегруженность и противоречивость. Не нужно просить нейросеть одновременно нарисовать «минималистичный детализированный пейзаж в стиле барокко и кубизма». Она просто запутается в конфликтующих установках. Ещё один нюанс – нейросеть довольно плохо справляется со сложными взаимодействиями нескольких персонажей и с текстом на изображениях. Так что не стоит требовать от неё нарисовать надпись «С днём рождения!» на торте – скорее всего, получится набор нечитаемых символов. Лучше сосредоточиться на визуальной составляющей. И, конечно же, не бойтесь экспериментировать, меняя одно-два слова в промте и наблюдая, как кардинально меняется результат. Это самый верный путь к пониманию логики машины.

Так что не бойтесь творить, пробовать и ошибаться. Удачи в ваших визуальных экспериментах, и пусть нейросеть станет вашим послушным инструментом в создании настоящих цифровых шедевров.