Промты для генерации изображений (с примерами готовых промтов)

В сети представлено множество картинок, сгенерированных искусственным интеллектом, однако большинство обывателей, впервые столкнувшись с нейросетями, получают вместо шедевра жуткую мешанину из лишних пальцев и кривых лиц. Когда-то тихое место для гиков сейчас превратилось в настоящий мейнстрим, где каждый пытается создать свой визуальный шедевр. Египетская цивилизация всегда вызывала трепет у исследователей, так и современные технологии вызывают восторг пополам со страхом у неподготовленного пользователя. Многие считают, что машине достаточно бросить пару слов, надеясь на чудо. На самом деле алгоритму требуется чёткое, математически выверенное задание, лишённое двусмысленностей. И всё же этот процесс не сложный, но довольно кропотливый, требующий понимания скрытых механизмов. Поэтому перед погружением в творчество желательно разложить по полочкам саму анатомию правильного запроса.

С чего начинается генерация?

Вбивая в строку первые буквы. С чего начинается выбор правильных слов? С определения главного объекта. Ведь именно он солирует на холсте, забирая львиную долю внимания зрителя. Сначала нейросеть считывает базовое существительное, формируя первичный силуэт, а затем обрастает деталями, нанизывая на этот каркас цвета, текстуры и формы. К слову, не стоит забывать о контексте. Одинокий щенок на абсолютно белом фоне выглядит довольно удручающе. Дело в том, что алгоритму нужно понимать окружающую среду, чтобы выстроить правильную перспективу. Оседает ли пыль на фоне, падает ли снег — всё это формирует антураж. Потому стоит сразу прописывать, где находится персонаж, чем он занят и какие предметы его окружают. Это надёжно. Потому что проверено. Опытом тысяч цифровых художников. Разумеется, наляпистость здесь ни к чему, однако базовая сцена должна быть очерчена предельно ясно.

Формирование базы

Выстроить структуру текстового задания не так уж и сложно. Сначала вводится субъект, наделённый конкретными чертами, облачённый в нужную одежду, помещённый в заданную локацию. Далее следует освещение, прописанное через профессиональные термины вроде жёстких теней или мягких софтбоксов. Следующий важный критерий — стилистика, где указывается направление живописи, тип виртуальной камеры или имя конкретного творца. Последним в списке идёт техническое качество, задаваемое параметрами вроде восьми тысяч пикселей, высокой детализации или кинематографической постобработки. Безусловно, такая последовательность творит чудеса. И всё-таки не стоит гнаться за невероятной длиной текста, вписывая сотни лишних прилагательных. Махинации с длинными запутанными текстами обычно приводят к тому, что машина просто проигнорирует хвост вашего сообщения, оставив лишь первые тридцать слов.

Портретная фотография: колоритный антураж

Лица всегда получаются сложно. А если ещё вспомнить про вечную проблему с руками, то задача для новичка кажется вовсе невыполнимой. Помогают ли тут длинные поэтичные описания? Отчасти да, но главное — угадать с палитрой и светом. Выручит добротный студийный промт, который не сильно ударит по кошельку, если вы используете платные генерации. Начать нужно с прямого указания: крупный план лица молодой девушки, веснушки, рыжие волосы, собранные в небрежный пучок. Затем добавляется магия света. Лицо, освещённое тёплым золотым часом, снятое на объектив восемьдесят пять миллиметров с диафрагмой один и восемь. Ну и, конечно же, стоит добавить маркеры реализма: текстура кожи, плёночное зерно, лёгкая хроматическая аберрация. Впрочем, иногда всплывают непредвиденные артефакты (лишние серьги или размытые зрачки). Да и самим алгоритмам гораздо комфортнее работать с чёткими, короткими фразами, нежели с философскими трактатами обывателя.

Вредно ли перегружать запрос?

Буквально десятилетие назад генерация картинок по тексту была роскошью, доступной лишь в закрытых лабораториях, но сейчас этот спасательный круг есть у каждого дизайнера. Многие новички грезят идеей впихнуть в одну генерацию всё и сразу, пытаясь объять необъятное. В итоге серьёзное вложение времени оборачивается разочарованием, а на экране появляется невразумительная каша из пикселей. Это же правило касается и стилей. Смешивая киберпанк с викторианской эпохой, натыкаешься на откровенную грязь. Естественно, обе стороны медали имеют свои плюсы, но скрупулёзный подход всегда выигрывает у хаоса. Дело в том, что каждое новое слово размывает вес предыдущих, снижая их значимость. Ток, возникший при перегрузке, автомат отсекает мгновенно. Так и нейросеть просто отбрасывает лишнее, спасая свою вычислительную мощность. Нельзя не упомянуть, что для сложных манипуляций с композицией лучше отказаться от огромных полотен текста в пользу специализированных плагинов контроля.

Городской пейзаж в стиле киберпанк

Серый щербатый бетон, прорезанный неоновыми лучами, залитый бесконечным дождём, окутанный густым утренним смогом. Выглядит впечатляюще. Как правильно описать такой самобытный неоднозначный антураж, чтобы машина вас поняла? Стоит начать с времени суток и атмосферы: ночной мегаполис будущего, высотные бруталистские здания, парящие голографические рекламные щиты. Затем обязательно вносим лепту в виде освещения: отражения неона в мокрых лужах, контрастный фиолетовый и оранжевый свет, объёмный густой туман. Ну, а венчает эту конструкцию указание стиля финального рендеринга. К примеру, движок Unreal Engine пять или октановый рендер добавят нужной глубины, превратив плоский набросок в шедевр. Кстати, концепция киберпанка сформировалась в литературе восьмидесятых годов прошлого века. Однако именно сейчас вычислительные мощности позволяют визуализировать эти мрачные миры с пугающей, почти осязаемой точностью.

Отрицательные значения

Зачем нужно указывать то, чего мы не хотим видеть? Ответ кроется в специфике машинного обучения. Нейросети тяготеют к усреднённым, часто изуродованным формам, если их не ограничить. Выручит мощный негативный промт. Он действует как невидимый щит. Один из самых популярных видов такого запроса включает слова вроде уродливый, деформированный, размытый. Далее следует блок анатомических запретов: лишние пальцы, сросшиеся конечности, кривые пропорции. Компактное решение — использовать готовые текстовые инверсии, которые уже содержат в себе тысячи нежелательных параметров. К тому же, это экономит место в основной строке ввода. Тем более, что без качественного негативного фильтра даже самый изысканный запрос рискует превратиться в ложку дёгтя. И всё же не стоит перебарщивать с запретами. Сильное ограничение свободы алгоритма убивает творческий потенциал системы.

Какими бывают художественные стили

Выбор визуальных направлений невероятно велик. Отдельно стоит упомянуть имитацию традиционных, привычных глазу материалов. Акварель, написанная размашистыми мазками, или густое масло на грубом холсте смотрятся очень живо. Если нужен винтажный старинный вид, стоит добавить упоминание конкретной исторической эпохи. Исконно русские мотивы, например, потребуют слов вроде хохлома, деревянное зодчество, сказочная детализированная иллюстрация. К тому же, добавление имени известного художника (почившего много десятков лет назад) кардинально меняет общую цветовую палитру. Бомонд цифровых творцов уже давно бьёт тревогу по поводу нарушения авторских прав, обсуждая эти постулаты на каждом углу. В представлении многих людей машина просто ворует чужие картинки из базы. На самом деле она лишь анализирует математические закономерности и вероятности расположения пикселей.

Стоит ли копировать чужие тексты?

Наряд для избранных. Именно так некоторые авторы относятся к своим удачным текстовым формулам, пряча их от посторонних глаз. Нужно ли часами сидеть над пустым полем ввода, изобретая велосипед с нуля? Вовсе нет. Настоящий кладезь готовых решений давно доступен на специализированных форумах и в открытых галереях. Однако слепое копирование чужих мыслей редко приносит удовлетворение. Гораздо полезнее брать чужой изысканный сложный запрос и менять в нём ключевые переменные. Заменив пушистого кота на механическую бронзовую сову, можно получить совершенно иной результат, сохранив при этом внушительный уровень детализации исходного автора. Тем более, что алгоритмы регулярно обновляются разработчиками. Буквально вчера работавший текст сегодня может выдать вычурный и очень странный результат. Подводные камни всегда кроются в версиях самой языковой модели. Разумеется, старые формулы нуждаются в профилактике (пару раз в год) и адаптации под новые реалии.

Интерьерная визуализация

Архитекторы и дизайнеры тоже внесли свою лепту в развитие нейросетей, используя их для быстрых набросков. С чего начинается создание комнаты? С геометрии пространства. К первой группе относится предметное окружение: просторная гостиная в стиле лофт, кирпичные голые стены, огромные панорамные окна в пол. Следующий важный критерий — меблировка. Кожаный потёртый диван, металлический кофейный столик, свисающие лампы Эдисона. Последним в списке идёт освещение, которое задаёт настроение всему помещению. Естественный дневной свет, падающий слева, глубокие контрастные тени, фотореалистичный рендер в программе Corona. Такие махинации позволяют сэкономить часы работы в сложных трёхмерных редакторах. Не стоит забывать о проверке пропорций мебели на финальном изображении. Ведь иногда алгоритм может поставить стул прямо сквозь массивный дубовый стол.

Практические примеры

Теория без практики мертва, поэтому стоит рассмотреть несколько рабочих, проверенных временем вариантов. Рецепт для макросъёмки довольно прост: стеклянный прозрачный флакон парфюма, стоящий на мокром мшистом камне, окружённый густым папоротником, мягкий утренний свет, размытый зелёный фон. Далее следует концепт-арт для любителей фэнтези. Могучий рыцарь в тёмных тяжёлых доспехах, держащий светящийся рунический меч, суровый взгляд, снежная буря на фоне, эпичное освещение, стиль тёмного фэнтези. Ну и, наконец, изометрическая графика, которая так популярна среди разработчиков мобильных игр. Маленький уютный домик пекаря, парящий остров, дым из трубы, тёплый свет из окон, трёхмерный движок, мультяшный стиль. Эти базовые текстовые конструкции можно модифицировать бесконечно, добавляя щепетильный контроль над каждой незначительной деталью. Главное — угадать с палитрой.

Освоение текстовых генераций требует терпения и готовности к постоянным экспериментам. Не стоит бояться совершать ошибки, сталкиваясь с непониманием искусственного интеллекта, ведь куда полезнее смело тестировать самые безумные сочетания слов. Пусть каждый новый запрос открывает неизведанные, захватывающие грани цифрового искусства, а полученный визуальный результат всегда превосходит смелые ожидания. Удачи в творческих поисках и создании настоящих шедевров!