Промт для генерации изображений на русском (с примерами готовых промтов)

В сети представлено множество невероятных картин, созданных искусственным интеллектом, отчего у простого обывателя часто возникает иллюзия абсолютной простоты этого процесса. Кажется, достаточно вбить пару слов, и машина выдаст настоящий шедевр, достойный лучших галерей мира. На самом деле реальная практика сильно бьёт по бюджету времени, ведь вместо ожидаемой красоты на экране часто появляются нелепые формы, искажённые лица или совершенно неподходящий антураж. Искусственный интеллект всё-таки требует точных инструкций, а не абстрактных фантазий, о которых многие грезят по незнанию. Но чтобы не ошибиться, нужно скрупулёзно разобраться в лингвистических тонкостях общения с генеративными алгоритмами.

Стоит ли писать по-русски?

Понимают ли зарубежные сети великий и могучий? Буквально десятилетие назад это было недостижимой роскошью, но сейчас ситуация в корне изменилась. Когда-то монополия английского языка заставляла пользователей сидеть со словарями, однако сегодня отечественные разработки прекрасно справляются с родной речью. Да и зарубежные системы научились переводить запросы на лету. Разумеется, алгоритмы изначально создавались под определённую лингвистику, поэтому они по-разному улавливают культурные коды. Запрос про избушку на курьих ножках наши модели отрисуют моментально. А вот иностранной нейросети придётся долго и нудно объяснять концепцию славянского фольклора. Тем более, что встроенный переводчик может исказить суть, превратив сказочный домик в куриное барбекю.

Базовая структура текста

С чего начинается выбор? С определения главного объекта. Сначала мы задаём героя сцены, наделяя его конкретными чертами, и прописываем основу:

облачённого в строгий деловой костюм, освещённого тусклым светом уличного фонаря.

Далее следует описание окружения, где этот самый объект крепко стоит на ногах. Вся суть в том, что машина не умеет додумывать контекст адекватно. Если не указать фон, она влепит случайную заливку. Следующий важный критерий охватывает стилистику, будь то масляная живопись или гиперреалистичное фото. Ну и, наконец, финальным штрихом выступают технические параметры, вроде пропорций кадра или детализации. Эти постулаты работают везде. Порядок слов имеет внушительный вес, так как то, что стоит в начале фразы, алгоритм прорисовывает в первую очередь.

Детализация

Блики на мокром асфальте. Именно такие мелочи творят чудеса, превращая плоскую картинку в объёмное полотно. Не стоит скупиться на точные прилагательные, описывая свет и атмосферу. К слову, мягкое закатное освещение даёт совершенно иную глубину по сравнению с резким студийным светом, где фотоны бьют прямо в лоб. Дело в том, что нейросети обучались на миллионах фотографий с правильными тег-разметками. Поэтому фраза:

кинематографичный свет, снято на объектив тридцать пять миллиметров

сработает гораздо лучше, чем просто слово «красиво». Зачастую новички игнорируют этот щепетильный нюанс, получая в итоге пластиковые, мёртвые лица. А ведь именно качественный свет солирует в любой композиции. К тому же правильно подобранная колоритная палитра спасает даже самый слабый сюжет.

Портрет в стиле киберпанк

Как составить рабочий запрос для персонажа? Довольно просто, если разложить всё по полочкам и следовать хронологии создания образа. Сначала мы прописываем основу: молодая девушка хакер сидит за стеклянным столом. Затем добавляем ей атрибуты, описывая неоновые импланты на скулах, переплетённые проводами, светящимися в темноте. После этого задаём окружение, упоминая дождливый ночной город за панорамным окном. Последним в списке идёт стиль и рендер. Можно добавить фразы вроде:

октэйн рендер, детализированная кожа, высокая контрастность

На выходе получается добротный современный киберпанк, который бросается в глаза своей проработанностью. Естественно, с первого раза идеальный результат выпадает редко. Ложка дёгтя кроется в том, что нейросеть может переборщить с неоном, превратив лицо в наляпистость светящихся пятен.

Пейзажи и архитектура

Особый интерес вызывает генерация масштабных сцен. Многие считают, что природе не нужны детали, но на самом деле пейзажи требуют не меньшей дотошности. Взять, к примеру, запрос на создание фэнтезийного замка. Начинать нужно с архитектурного стиля, скажем, готика переплетается с эльфийскими мотивами. Минареты здания сделаны из белого мрамора, а их высота достигает ста метров. Затем мы помещаем эту громадину на край обрыва, омываемого бушующим штормовым морем. И всё же картина будет неполной без погоды. Тяжёлые свинцовые тучи, прорезанные фиолетовыми молниями, зададут нужный грандиозный антураж. Безусловно, стоит добавить указание на эпичное освещение, чтобы подчеркнуть масштаб махинации. Это тяжёлый, но эффективный способ заставить алгоритм выдать по-настоящему качественный кадр.

Стиль лофт в квартире

Интерьер мечты без дизайнера. Зрелище удручающее, если доверить его машине без чётких инструкций. Она просто накидает кирпичей и ржавых труб. Спасательный круг здесь кроется в материалах и фактурах. Задайте чёткие параметры: просторная гостиная, где свет льётся рекой из огромных панорамных окон. Затем расставьте мебель. Пространство, заполненное массивным кожаным диваном, украшенное винтажным ковром, дополненное металлическими светильниками над барной стойкой. Впрочем, не забывайте про мелкие акценты. Разбросанные журналы на столике или чашка дымящегося кофе приковывают внимание зрителя. Удивительно, но именно в таких мелочах кроется изюминка, делающая картинку живой. Да и самому заказчику потом легче ориентироваться в таком эскизе.

Какими бывают ошибки?

Шесть пальцев на руке. Это классическая проблема, с которой сталкивается каждый творец, когда натыкаешься на странные артефакты в готовом изображении. Почему так происходит? Это связано с тем, что алгоритм не понимает анатомию в человеческом смысле. Он просто знает, что на конце руки должна быть кисть с отростками, но их точное количество для него — величина переменная. Конечно, разработчики постоянно улучшают модели, однако полностью искоренить этот дефект пока не удалось. Не стоит перегружать промт отрицательными командами, надеясь спасти ситуацию. Лучше отказаться от сложных ракурсов рук, если они не несут смысловой нагрузки в кадре. Спрячьте их в карманы или за спину героя. Обе стороны медали здесь таковы: либо вы тратите часы на перегенерацию одной конечности, либо хитро обходите ограничение композицией. Подводные камни генерации требуют гибкости ума, иначе кошелёк станет легче из-за платных попыток на серверах.

Подготовка к печати

Здесь обязательно всплывут все огрехи недостаточного разрешения. Если вам нужна картинка для рекламного баннера, стандартного квадрата тысяча на тысячу пикселей не хватит. Придётся использовать апскейлеры, увеличивающие размер изображения (иногда в четыре раза) без потери качества. Само собой, сам промт тоже должен соответствовать задаче. Для стоковой коммерческой фотографии отлично работает связка:

предметная съёмка, флакон дорогих духов на шёлковой ткани, капли воды, студийный свет, макросъёмка

Нужно отметить, что фон должен быть однотонным. Ведь именно он имеет свойство сливаться с объектом, если задать слишком сложную текстуру. Не перебарщивайте с деталями, чтобы дизайнеру потом было проще вырезать предмет. Компактное бюджетное решение – добавить фразу «изолировано на белом фоне», что сэкономит массу нервов на постобработке.

Влияние художников

Обязательно ли указывать конкретные имена авторов? Вовсе нет. Однако отсылки к известным творцам прошлого моментально меняют атмосферу, позволяя окунуться в нужную эпоху. Если вписать в конец запроса фразу «в стиле Ивана Айвазовского», нейросеть тут же начнёт играть с полупрозрачными волнами и драматичным морским светом. А вот упоминание Альфонса Мухи добавит изысканный винтажный орнамент и плавные линии модерна. К первой группе относится классическая живопись, которая тяготеет к реализму и строгой композиции. Далее следует современный цифровой арт, где царствуют яркие цвета и гиперболизация форм. Отдельно стоит упомянуть смешение стилей. Скрестив Ван Гога с эстетикой киберпанка, можно получить абсолютно самобытный результат. Мазки масляной краски, складывающиеся в светящиеся неоновые вывески, выглядят впечатляюще. Главное – угадать с палитрой.

Фуд-фотография

Капли конденсата на запотевшем стекле. Начать стоит прямо с макро-деталей, когда речь заходит о еде. Обычная тарелка борща, описанная двумя словами, выдаст нечто похожее на пластиковый муляж из дешёвой столовой. Настоящий аппетит просыпается от текстур. Поэтому мы пишем:

горячий стейк прожарки медиум, сок медленно стекает по волокнам мяса, рядом лежит веточка свежего розмарина, дымок поднимается вверх

Венчает композицию деревянная разделочная доска с грубой текстурой короеда. В представлении многих генерация еды — процесс лёгкий, но добиться естественности здесь сложнее всего. Не забудьте проверить блики на влажных поверхностях. Если они отсутствуют, блюдо кажется заветренным. Спасает ситуацию команда «боке» или «размытый задний фон», которая концентрирует всё внимание зрителя на самом вкусном кусочке.

Абстракция и концептуализм

Что делать, если нужна не конкретика, а эмоция? Задача не из лёгких. Машины мыслят пикселями, а не чувствами. И всё же передать меланхолию или радость вполне реально, если использовать правильный подход. Вместо прямого описания предметов используются метафоры. Например:

одиночество в огромном городе, холодные синие оттенки, силуэт человека растворяется в густом тумане, минимализм

Правильный подбор слов скрывает в себе настоящий кладезь визуальных метафор. Львиная доля успеха здесь зависит от выбранной цветовой гаммы. Тёплые оранжевые и жёлтые тона ассоциируются с уютом, тогда как стальные и серые навевают тоску. Нельзя не упомянуть и про геометрию кадра. Ломаные линии добавляют тревожности, а плавные изгибы успокаивают глаз. Внести лепту в финальный результат может и правильный выбор материалов. Скажем, стеклянные осколки, парящие в воздухе, символизируют хрупкость, а монолитный бетон — тяжесть бытия. Перевоплощение мысли в пиксели требует философского взгляда.

Достопримечательности России: Кремль

Красная площадь, занесённая снегом. Если нужно сгенерировать знакомое всем место, стоит опираться на исторический реализм, добавляя щепотку художественного вымысла. Собор Василия Блаженного был возведён в шестнадцатом веке, однако в нашем запросе мы можем перенести его в стилистику стимпанка. Медные трубы, оплетающие пёстрые купола, паровые механизмы вместо часов на Спасской башне, летящий дирижабль в пасмурном небе. С воздухообменом дело обстоит сложнее, ведь нужно передать морозную дымку. Для этого прописываем:

густой морозный пар изо рта прохожих, снежинки, летящие прямо в объектив камеры, мягкий свет газовых фонарей

Выручит Г-образный купе ракурс, когда камера смотрит снизу вверх, подчёркивая монументальность строений. Этот вычурный неоднозначный подход позволяет по-новому взглянуть на исконно русские пейзажи, не теряя их узнаваемости. Местный бомонд нейро-художников очень любит такие эксперименты со временем, где пыль медленно оседает на исторических фасадах. Даже маленькое чадо сможет сгенерировать подобную красоту, если задать верный вектор.

Ну, а погружение в мир нейросетей требует терпения и постоянной практики, ведь идеальный результат редко получается с первого клика. Экспериментируйте с прилагательными, меняйте освещение и не бойтесь скрещивать несовместимые стилистики. Удачи в создании ваших собственных визуальных шедевров, пусть каждый сгенерированный кадр запомнится надолго!