Написать промт для картинки (с примерами готовых промтов)

В сети представлено множество нейросетей, и неопытному пользователю кажется, что стать крутым цифровым художником сегодня может абсолютно любой желающий. Устав от серых будней, обыватель открывает строку ввода, печатает пару слов о красивой девушке или футуристичном городе, а в ответ получает нечто пугающее, где переплетаются лишние пальцы, слипшиеся глаза и совершенно нелепая композиция. Дело в том, что алгоритмы не умеют читать мысли, они лишь математически обрабатывают текстовые векторы. Но чтобы не ошибиться и получить действительно добротный результат, нужно освоить язык машин.

Базовая механика

Задача не из лёгких. Зависит ли успех от конкретной программы? Конечно, интерфейсы отличаются, но суть везде одинакова. Искусственный интеллект, обученный на миллиардах изображений, опирается именно на точность ваших формулировок. Буквально десятилетие назад генерация осмысленной картинки по тексту казалась магией, а сейчас это довольно рутинный процесс. Вся суть в том, что нейросеть не обладает человеческой фантазией. Ей нужны чёткие, железобетонные ориентиры. К слову, львиная доля неудачных генераций связана именно с абстрактными пожеланиями вроде «сделай красиво и грустно». Чтобы композиция не рассыпалась на пиксели, стоит сразу определить главных героев, задать фон, приправив всё это нужным освещением. Ведь именно грамотно выставленный свет часто выступает той самой изюминкой, которая творит чудеса.

Как выбрать стилистику?

Мазки густой масляной краски, небрежно брошенные на виртуальный холст, или строгая векторная графика — всё это нужно чётко проговаривать вслух. С чего начинается выбор? С определения финальной цели. Описание обычно стартует с указания жанра, где один из самых популярных подходов — создание реалистичных фотографий. Далее следует стилизация под традиционную живопись, требующая имён великих художников или названий течений эпохи Возрождения. Отдельно стоит упомянуть мрачный современный киберпанк, который немыслим без дождя и высоких технологий. Последним в списке идёт трёхмерный рендер, создающий объёмные и пластичные фигуры. А если ещё вспомнить про освещение, то картинка сразу заиграет новыми красками. На холодный неоновый свет, падающий сбоку, система отреагирует куда лучше, чем на просьбу сделать «просто светло». Да и самому автору управлять процессом так гораздо проще.

Анатомия текстового запроса

Слова имеют вес. И всё же многие считают, что достаточно закинуть в бота сотню случайных прилагательных, чтобы получить шедевр, но на самом деле такой подход лишь запутывает электронные мозги.

В начале предложения всегда ставится главный объект, будь то одинокий путник в плаще или величественный старинный замок. Затем, обрастая подробностями, этот объект помещается в среду, обретая почву под ногами. Одежда, поза, мимолётная эмоция на лице — все эти детали вплетаются в текст последовательно. Это надёжно. Потому что проверено. Временем и тысячами попыток. Если же перепутать порядок, то на первый план всплывут совершенно второстепенные вещи, а главная задумка бесследно исчезнет. Разумеется, не стоит перегружать систему взаимоисключающими понятиями (вроде снежной бури в жарких тропиках). К тому же, каждый дополнительный нюанс бьёт по бюджету внимания нейросети. В идеале формулировка читается как стройный рассказ, лишённый мусора.

Нужно ли расписывать мелкие детали?

Нужно ли уходить в микроконтроль? Вовсе нет, если детали не играют решающей роли. Слишком скрупулёзный подход иногда вредит не меньше, чем излишняя краткость. С одной стороны, подробное описание текстуры ткани или узора на пуговицах даёт власть над кадром, с другой — машина может настолько увлечься пуговицами, что забудет нарисовать персонажу голову. Тем более, что актуальные версии отлично додумывают контекст самостоятельно. Натыкаешься порой на потрясающий арт, ожидаешь увидеть там гигантскую простыню текста, а в реальности автор обошёлся десятком слов. Это же правило касается и заднего плана. Нет смысла перечислять каждую травинку на весеннем лугу. Достаточно задать общее настроение, указав время суток и погодные условия. Впрочем, если планируется серьёзное вложение сил в разработку дизайна для видеоигры, то придётся попотеть над каждой заклёпкой на броне.

Примеры промтов для портретов

Теория без практики мало чего стоит. Как же выглядят рабочие, проверенные связки в действительности? Начать нужно с классического женского портрета. Создать его поможет описание молодой девушки с веснушками, облачённой в льняное платье, освещённой мягким утренним солнцем. Далее к этому костяку добавляются технические параметры, такие как съёмка на плёнку, объектив 85 миллиметров, малая глубина резкости и кинематографическая цветокоррекция. В результате получается весьма самобытный кадр, лишённый искусственного глянцевого блеска. А вот мужской суровый портрет тяготеет к совершенно иным словам. Здесь уже солирует контрастное жёсткое освещение. Пожилой моряк с густой бородой, курящий трубку, снятый крупным планом в шторм, дополненный резкими тенями и высокой детализацией пор. Зрелище может получиться удручающее, но невероятно реалистичное. Ложка дёгтя кроется лишь в том, что иногда боты путают количество пальцев, если руки случайно попадают в объектив.

Фантазии о Японии: неоновые улицы

И если с человеческими лицами ситуация более-менее ясна, то с архитектурой дело обстоит сложнее. Узкие улочки ночного Токио, залитые проливным дождём, всегда приковывали внимание творцов. Чтобы перенестись туда, придётся собрать довольно сложную словесную конструкцию. Футуристичный огромный мегаполис, пронизанный яркими вывесками, отражающимися в лужах на асфальте, с толпой людей под прозрачными зонтами. Насыщенная цветовая палитра, гиперреализм, качественный рендер. В представлении многих именно так выглядят идеальные обои для монитора. Конечно, кошелёк не станет легче от попытки сгенерировать и более спокойный, исконно традиционный пейзаж. Деревянный старый храм, окружённый цветущей сакурой, лёгкий утренний туман, умиротворяющая атмосфера, мягкий свет бумажных фонариков. Главное — угадать с палитрой. Ведь тёплые пастельные оттенки сразу задают нужный колоритный антураж, который надолго оседает в памяти.

Кулинарная фотография и натюрморты

Капли ледяного конденсата, медленно стекающие по запотевшему стеклу бокала — такие вещи нейросети обожают рисовать. В сфере фуд-фотографии искусственный разум давно стоит на ногах невероятно твёрдо. Начать генерацию сочного снимка стоит с указания блюда, например, огромного говяжьего бургера на деревянной доске. Во-первых, прописывается расплавленный сыр и хрустящая булочка, во-вторых, добавляется тёмный размытый фон ресторана, ну и, наконец, летящие в воздухе крошки и специи. Венчает всё это великолепие боковое студийное освещение и макросъёмка. Эстетичны ли такие картинки? Само по себе изображение еды не имеет вкуса, но слюнки от таких генераций текут рекой. Не стоит перебарщивать с обилием ингредиентов, иначе салат превратится в неразборчивую мешанину текстур. Изысканный минимализм здесь работает гораздо эффективнее, чем жадное желание показать всё меню разом.

Вредно ли копировать чужие работы?

Многие считают зазорным заглядывать в чужие настройки, но на самом деле в этом нет ничего постыдного. На первых порах изучение открытых галерей станет настоящим кладезем полезной информации. Разбирая чужие тексты по косточкам, начинаешь интуитивно понимать скрытую логику машины. С одной стороны, слепое копирование не развивает собственное видение, с другой — это великолепная тренировка насмотренности. Когда-то скрывать свои параметры считалось нормой в узких кругах гиков, но сейчас большинство площадок поощряют абсолютную открытость. Обе стороны медали имеют право на жизнь в современном бомонде цифровых художников. Однако истинное удовлетворение получаешь лишь тогда, когда самостоятельно собираешь этот сложный пазл из английских слов. Да и полностью уникальный, выстраданный результат ценится куда выше.

Отрицательные запросы

Скрытая угроза. Что делать, если на сгенерированной картинке раз за разом всплывают ненужные артефакты? Выручит негативный промт. Это настоящий спасательный круг для тех, кто устал бороться с хаосом пикселей. Сюда обычно вписывают уродливые пропорции, размытость, чужие водяные знаки, лишние конечности и кривой текст. Безусловно, такие махинации с настройками требуют определённой сноровки. Буквально несколько лет назад о подобном функционале никто не слышал, но сегодня он встроен практически в каждый интерфейс. Не забудьте проверить эти поля перед запуском процесса. Ведь даже одно случайно забытое слово в блоке исключений может кардинально испортить финальный результат. Внести свою лепту может также прямой отказ от конкретных цветов или материалов, что заставит бота искать нестандартные обходные пути. Подводные камни всегда есть, но они легко обходятся опытом.

Эксперименты с генеративными моделями — это грандиозный творческий путь, требующий лишь немного терпения и богатого словарного запаса. Не бойтесь тестировать самые абсурдные и неочевидные сочетания, смешивая исторические эпохи, визуальные стили и материалы в одном бурлящем котле. Постепенно страх чистого текстового поля исчезнет, а алгоритм начнёт понимать ваши задумки с полуслова. Пусть каждый новый созданный кадр попадает точно в цель, а сам процесс порадует домочадцев и коллег отличными визуальными находками!