Промты для chatgpt для изображения (с примерами готовых промтов)

Каждый, кто хоть раз пробовал генерировать изображения с помощью нейросетей, наверняка испытывал это двойственное чувство. С одной стороны – восторг от того, что машина по паре слов способна нарисовать почти всё, что угодно. С другой – лёгкое разочарование, когда результат получается совсем не таким, как рисовалось в воображении: персонажи с шестью пальцами, размытые детали и композиция, вызывающая лишь недоумение. В представлении многих обывателей достаточно бросить в чат пару слов, чтобы получить шедевр. Однако, чтобы нейросеть стала вашим послушным цифровым художником, а не генератором случайных картинок, стоит научиться говорить с ней на одном языке. А начать нужно с искусства составления правильных промтов.

Что такое промт и почему он так важен?

Задача не из лёгких. На первый взгляд кажется, что промт (от англ. prompt – побуждение, подсказка) – это просто текстовый запрос. Но на самом деле это полноценное техническое задание для искусственного интеллекта. Чем точнее и детальнее оно составлено, тем выше вероятность получить впечатляющий и, главное, предсказуемый результат. Многие считают, что нейросеть «думает» образами, но это заблуждение. Она оперирует огромным массивом данных, сопоставляя слова из вашего запроса с миллионами изображений, которые она «видела» во время обучения. Поэтому ваша главная цель – дать ей максимально чёткие и недвусмысленные инструкции, не оставляя пространства для вольной и порой довольно странной интерпретации. Плохой промт – это лотерея. Добротный промт – это почти гарантированный успех.

С чего начинается создание запроса? С определения ключевого объекта. Не стоит писать просто «девушка». Уточните: «молодая девушка со светлыми волосами, собранными в небрежный пучок, в винтажном платье». Уже лучше, не так ли? Далее следует описать действие и окружение. Например, «сидит на деревянном подоконнике в уютной кофейне, за окном идёт дождь». Это задаёт настроение и контекст. Но и это ещё не всё. Львиная доля успеха кроется в стилистических и технических уточнениях, которые для новичка могут показаться настоящими махинациями. Однако именно они творят чудеса, превращая заурядную картинку в произведение искусства.

Структура идеального запроса

Чтобы разложить всё по полочкам, давайте представим промт как многослойный пирог. Первый, самый основной слой – это, безусловно, объект и его описание. Второй слой – это действие и поза, которые добавляют динамики. Третий – фон и атмосфера, создающие нужный антураж. И, наконец, «вишенка на торте» – это стилистические и технические параметры. К ним относятся указания на стиль живописи (например, «в стиле импрессионизма» или «как картина Ван Гога»), тип изображения («фотореалистичное изображение», «акварельный рисунок», «3D-рендер»), а также параметры освещения и камеры.

К слову, освещение – это один из самых мощных инструментов. Такие слова, как «кинематографичное освещение», «мягкий вечерний свет», «неоновые огни», «драматические тени», способны кардинально изменить восприятие сцены. То же самое касается и ракурса. Указав «вид сверху», «крупный план (close-up)» или «снято с нижнего ракурса», вы получаете полный контроль над композицией. И не стоит забывать про детализацию. Волшебные фразы вроде «высокая детализация», «4K», «гиперреализм» заставляют нейросеть более скрупулёзно прорисовывать мелкие элементы. Это же правило касается и указания на конкретных художников или фотографов, чьим стилем вы восхищаетесь.

Отдельно стоит упомянуть так называемые негативные промты. Это спасательный круг в ситуациях, когда ИИ упорно добавляет на изображение что-то лишнее. В современных версиях генераторов, включая DALL-E 3 внутри ChatGPT, можно прямо в запросе указать, чего на картинке быть не должно. Например, если вы устали от наляпистости, можно добавить «без лишних деталей, минимализм». Если не хотите видеть на изображении людей, смело пишите «без людей». А знаменитая проблема с руками решается уточнением «правильная анатомия рук, пять пальцев». Процесс не сложный, но кропотливый.

Примеры готовых промтов: от простого к сложному

Давайте перейдём от теории к практике. Предположим, мы хотим создать изображение кота. Простой запрос «рыжий кот» даст нам… просто рыжего кота. Довольно скучно. Усложним задачу.

Начнём с простого, но уже более детального запроса:

Фотография милого рыжего кота породы мейн-кун, который сладко спит на стопке старых книг. Мягкий солнечный свет падает из окна, создавая тёплую и уютную атмосферу. Высокая детализация шерсти, крупный план.

Здесь мы указали породу, действие, окружение и даже характер освещения. Результат будет несоизмеримо лучше.

А теперь попробуем создать что-то более грандиозное, в фэнтезийном стиле. Например, рыцаря. Промт может выглядеть так:

Кинематографичный кадр: одинокий рыцарь в богато украшенных готических доспехах из тёмной стали стоит на краю скалы. Он смотрит на бушующее море под грозовым небом. Драматическое освещение, брызги волн, ветер развевает его красный плащ. В стиле картин Фрэнка Фразетты, гиперреализм, октановый рендер.

В этом запросе есть всё: объект с деталями, эпичный фон, указание на стиль конкретного художника и даже на тип рендера, что добавит изображению определённой текстуры.

Ну и, конечно же, нельзя не упомянуть абстрактные и сюрреалистичные концепции. Что насчёт такого варианта?

Сюрреалистичная картина маслом, изображающая гигантские шахматные фигуры из хрусталя, парящие в космосе среди туманностей и звёзд. Вдалеке видна планета, похожая на Сатурн, но её кольца состоят из нотных станов. Палитра в холодных синих и фиолетовых тонах с яркими акцентами. В стиле Сальвадора Дали и Яцека Йерки, высочайшая детализация, ощущение сна.

Подобные сложные запросы – это уже высший пилотаж, который позволяет создавать поистине уникальные и завораживающие образы.

Как избежать типичных ошибок?

Главный подводный камень, на который натыкается почти каждый новичок, – это излишняя абстракция или, наоборот, перегружённость конфликтующими деталями. Не стоит писать «красивая картинка» – понятие красоты у вас и у машины может сильно отличаться. Будьте конкретны. С другой стороны, попытка впихнуть в один промт и «стиль аниме», и «гиперреалистичное фото», и «мазки Ван Гога» приведёт к визуальной каше. Нейросеть просто не поймёт, какой из приказов выполнять.

Ещё одна довольно распространённая ошибка – игнорирование «веса» слов. Слова, стоящие в начале промта, обычно имеют больший приоритет для нейросети. Поэтому начинать всегда стоит с самого главного – с основного объекта. А уже потом обвешивать его деталями, как ёлку игрушками. Ну и, само собой, не стоит бояться экспериментировать. Иногда самые неожиданные и, казалось бы, абсурдные сочетания приводят к рождению настоящих шедевров. Ведь в этом и заключается вся прелесть творчества, даже если ваш соавтор – искусственный интеллект.

Не бойтесь пробовать снова и снова, немного изменяя запрос. Иногда замена одного-единственного прилагательного или добавление уточнения про освещение творит настоящие чудеса. Этот процесс похож на работу скульптора, который отсекает всё лишнее от глыбы мрамора, постепенно являя миру свой замысел. Экспериментируйте, будьте смелыми в своих запросах, и цифровой холст обязательно покорится вам. Удачи в творческих поисках.