В сети гуляют сотни потрясающе красивых артов, сгенерированных машинами, и рядовой обыватель часто думает, что получить такой шедевр проще простого. Буквально десятилетие назад мы сами скрупулёзно рисовали кистями в графических редакторах, а сейчас достаточно вбить пару предложений в строку ввода. Многие наивно полагают, что искусственный интеллект читает мысли напрямую и угадывает желания с полуслова, но на самом деле всё обстоит несколько иначе. Эта бездушная махина требует чётких, выверенных инструкций, иначе вместо эпичного фэнтези на экране появится невнятная пугающая наляпистость. Но чтобы не ошибиться в процессе генерации, нужно тщательно разобраться в анатомии текстовых запросов.
Как выстроить правильную структуру?
Начинать нужно с формирования главной идеи. Промт для ии для создания изображения (с примерами готовых промтов) — это не просто хаотичный набор красивых фраз. Дело в том, что алгоритмы мыслят тегами, числовыми весами и визуальными ассоциациями. И всё же, стоит ли писать целые тома текста? Вовсе нет. Если разложить процесс по полочкам, львиная доля успеха кроется в строгой правильной последовательности. Один из самых популярных подходов начинается с определения центрального объекта генерации. Далее следует детальное описание его окружения, проработанного до мельчайших фоновых подробностей. Третьим этапом обычно вписывают характер освещения. Ну и, наконец, финальным штрихом добавляют конкретные технические параметры камеры. Это очень удобно. Ведь конечный результат становится максимально предсказуемым.
Базовый синтаксис
Задача не из лёгких. Нейросеть крайне буквально воспринимает поступающую информацию, из-за чего в работах новичков довольно часто всплывают откровенные логические ошибки. Сперва формулируется само ядро запроса, описывающее конкретное действие или внешний вид персонажа. К слову, не стоит забывать о стиле генерации. Ведь именно он задаёт общую непередаваемую атмосферу. Многие авторы тяготеют к игнорированию фона, оставляя его на откуп случайному алгоритму. Итог в таких ситуациях выглядит впечатляюще крайне редко. Зато добротный детализированный задник творит чудеса.
Стилизованный под суровый киберпанк город, окутанный плотным неоновым светом, залитый проливным дождём, пропитанный мрачной эстетикой, сразу задаёт нужный тон всей композиции.
Разумеется, придётся потратить немало времени на подбор метких синонимов.
Жанры и визуальная стилистика
Сложно ли угадать с жанром с первой попытки? Иногда этот процесс превращается в настоящую лотерею. Натыкаешься на колоритный арт в интернете, пытаешься скопировать стиль, а выходит лишь бледная пародия. Вся суть в том, что разные модели обучались на совершенно разных библиотеках изображений. Настоящий кладезь для поиска референсов — это работы классиков. К первой группе относится классический фотореализм, требующий указания конкретных марок объективов вроде пятидесяти миллиметров или старой плёнки «Кодак». Следующий важный критерий затрагивает современный цифровой арт, где зачастую солируют имена известных концепт-художников. Отдельно стоит упомянуть сложную 3D-графику, созданную в топовых движках наподобие «Unreal Engine пять» или отрендеренную через мощный «Октан». А вот оригинальное название техник живописи вроде густого импасто или лёгкой акварели добавляет работе самобытный исконно ручной шарм. Тем более, что машина отлично понимает такие специфические термины.
Как настроить свет?
Мягкий контровой свет мягко падает на уставшее лицо модели. Именно с таких микроскопических деталей порой строится весь объёмный кадр. Естественно, освещение играет колоссальную роль в восприятии формы любого предмета. Забывать об этом важнейшем нюансе точно не стоит. Сразу бросается в глаза разница между плоским скучным светом и глубокой кинематографичной подсветкой. Во-первых, можно использовать объёмные лучи, пробивающиеся сквозь полузакрытые жалюзи. Во-вторых, отлично работает имитация студийного освещения огромными софтбоксами. Третьим пунктом идёт золотой час перед самым закатом, который всегда добавляет приятных тёплых оттенков. Ну и, наконец, холодная неоновая подсветка делает антураж поистине грандиозным. Именно в этом кроется главная изюминка хорошей картинки. Главное — не перебарщивать с интенсивностью бликов.
Портретная генерация
Человеческие лица всегда приковывают внимание зрителя. Сгенерировать красивого человека довольно просто, однако получить искреннюю живую эмоцию — процесс не сложный, но крайне скрупулёзный и кропотливый. Давайте разберём текстовую структуру на конкретном примере. Начинается портретный запрос с подробного описания молодой женщины, смотрящей прямо в объектив камеры. Её длинные волосы, растрёпанные сильным ветром, освещённые ярким закатным солнцем, украшенные мелкими полевыми цветами, создают очень лёгкий романтичный образ. Впрочем, выбранная одежда тоже имеет огромное значение. Лучше отказаться от вычурных многослойных нарядов, если хочется акцентировать всё внимание на выразительных глазах. Дополняет этот утончённый образ линза на восемьдесят пять миллиметров. Выглядит такой итоговый результат максимально естественно. Ложка дёгтя кроется лишь в кистях рук (алгоритмы до сих пор иногда рисуют по шесть фаланг), но свежие версии справляются с этим всё увереннее.
Архитектура в цифре
Огромный собор был возведён в мрачном готическом стиле, а его острые шпили пронзали низкие свинцовые тучи.
Подобные литературные зарисовки отлично ложатся в основу создания любой архитектуры. Зачастую обычные люди грезят созданием совершенно фантастических инопланетных миров. И здесь нейросети предоставляют поистине безграничные возможности для творчества. Начать стоит с описания общего дальнего плана разрушенного мегаполиса. Далее вплетается густой белёсый туман, низко стелющийся по разбитым асфальтированным дорогам. Последним в списке идёт холодное освещение от огромной полной луны. Это же правило касается и масштабных природных видов. Колоритный горный пейзаж, покрытый густым хвойным лесом, пересечённый бурной горной рекой, заслуживает истинного восхищения. Не скупитесь на мощные эпитеты вроде «монументальный», «величественный» или «безмятежный». Ведь слова задают настроение всему полотну.
Длина текстового запроса
Бомонд промпт-инженеров долгое время ожесточённо спорил о правильной длине текста. Многие считали, что чем больше слов впишешь, тем качественнее выйдет картинка, но на самом деле машина имеет жёсткий лимит внутреннего внимания. Примерно после семидесяти пяти введённых токенов влияние каждого последующего слова стремительно падает вниз. К тому же, обилие противоречивых деталей просто сбивает программу с толку. С одной стороны, всегда хочется расписать каждый миллиметр холста, с другой — это прямой путь к мыльной каше из пикселей. Излишняя щепетильная наляпистость сильно бьёт по бюджету свободного времени. Выручит грамотное использование специальных скобок (для искусственного повышения веса конкретного слова). Словосочетание, аккуратно заключённое в круглые скобки, генератор воспримет как приоритетное. Безусловно, это своеобразный надёжный спасательный круг для сложных многофигурных композиций.
Почему возникают ошибки?
Невидимые подводные камни всегда ждут торопливых новичков. Самая частая досадная проблема кроется в непонимании работы отрицательных запросов. Пользователи пишут «без кривых уродливых лиц», искренне надеясь на технологическое чудо. Но алгоритм намертво цепляется именно за слово «уродливый». Ток, возникший при внезапной перегрузке, автомат отсекает мгновенно, а вот нейросеть так филигранно не умеет. Ей нужно указывать негативные исключения в специальном обособленном поле. Кроме того, часто всплывают хитрые махинации с абстрактными философскими понятиями. Искусственный интеллект совершенно не понимает слово «доброта», ему нужна широкая улыбка, светлые пастельные тона, открытая расслабленная поза. Поэтому свои мысли желательно материализовать в видимые осязаемые физические объекты. Да и самим творческим процессом управлять станет значительно легче.
Постепенно страх перед мигающим курсором в пустой строке бесследно уходит. Освоив эти нехитрые постулаты, можно начать выдавать поистине потрясающие работы, которые не стыдно показать строгим критикам или смело использовать в серьёзных коммерческих проектах. Гораздо полезнее экспериментировать с углами освещения, играть со стилями давно ушедших мастеров живописи и совершенно не бояться ошибаться, ведь каждый новый неудачный запрос вплотную приближает к идеальной выверенной картине. Удачи в освоении цифрового генеративного искусства, пусть созданные визуальные шедевры всегда попадают точно в цель и вызывают искренний неподдельный восторг у каждого случайного зрителя!