Многие обыватели наивно полагают, что искусственный интеллект читает мысли, выдавая настоящие шедевры по одному лишь скупому слову. Ежедневно в сети появляются тысячи блёклых, пластиковых картинок, сгенерированных новичками. Плохой результат — это не всегда вина алгоритма, чаще проблема кроется в скудном описании желаемой стилистики. Устав от суеты в попытках получить идеальную иллюстрацию, пользователи начинают хаотично добавлять в строку ввода всё подряд. А начать стоит с грамотного понимания того, как именно работают слова-модификаторы и визуальные надстройки.
Стоит ли усложнять запрос?
Зачастую именно в деталях скрывается львиная доля успеха. Добавляя к описанию очередное определение, мы не всегда улучшаем итоговый холст. Вбивая в генератор пару десятков разрозненных эпитетов, пользователь довольно часто получает на выходе откровенную наляпистость. Нужно ли лепить все известные художественные направления в одну кучу? Вовсе нет. Вся суть в том, что нейросеть банально путается в противоречивых командах. Буквально пару лет назад машины послушно съедали любые текстовые полотна, но сейчас алгоритмы стали гораздо умнее. А значит, к выбору модификаторов стоит подходить максимально осознанно. Ведь именно точечный, изысканный эффект вносит ту самую изюминку, которая мгновенно приковывает внимание зрителя. К слову, одно меткое определение часто творит чудеса, заменяя собой громоздкие абзацы бессмысленных описаний.
Имитация живописи: от холста до бумаги
Настоящий кладезь вдохновения скрывается в традиционном искусстве. Один из самых популярных видов стилизации — плотная масляная живопись. Далее следует лёгкая водянистая акварель. Отдельно стоит упомянуть строгий угольный набросок. Последним в списке идёт мягкая сухая пастель, идеальная для романтичных пейзажей. Эстетичны ли такие цифровые картины? Безусловно, они выглядят потрясающе. Однако не стоит забывать о композиции и исторических отсылках. Например, весьма добротный классический портрет получится при следующем подходе:
«Пожилой моряк с трубкой, написанный густым маслом, крупный фактурный мазок, стиль Рембрандта, приглушённые тона»
Полученный результат определённо заслуживает истинного уважения. К тому же, визуальный антураж сразу отсылает нас к музейной классике.
Как выбрать правильное освещение?
Свет. Он всегда солирует в кадре. Без правильных теней любая иллюстрация получится неестественно плоской. С чего начинается осознанный выбор? С определения базового настроения сцены. К первой группе относится кинематографический свет, добавляющий глубокие контрастные тени. Следующий важный критерий задаёт объёмное освещение, лучами пробивающееся сквозь густой туман. Компактное решение для ночных городских пейзажей — неоновая подсветка. И всё же, главный нюанс заключается в направлении лучей. Дело в том, что контровой свет позади объекта создаёт красивый ореол, а боковой — жёстко выявляет текстуру материала. Рабочий промт может выглядеть так:
«Девушка в киберпанк-городе, освещённая яркими неоновыми вывесками, объёмный свет сквозь дождь, кинематографичные глубокие тени»
Согласитесь, атмосфера сразу меняется до неузнаваемости.
Технические параметры: рендерные движки
Грезят о максимальной фотореалистичности сегодня многие создатели цифрового контента. Когда-то сложная компьютерная графика была прерогативой голливудских студий, но сейчас махинации с отражениями выполняются за три миллисекунды. Достигается подобная точность путём использования названий профессиональных программ. Изображение, обработанное алгоритмами трассировки лучей, просчитанное движком Unreal Engine (пятой версии), снабжённое глобальным освещением Octane Render, выглядит максимально правдоподобно. Впрочем, есть здесь и свои подводные камни. Слишком вычурный запрос иногда выдаёт откровенно пластиковые, безжизненные лица. Поэтому нет смысла переплачивать машинному ресурсу лишними терминами, ведь виртуальный кошелёк станет легче от потраченных токенов генерации. Пример отличного запроса:
«Спортивный автомобиль на мокрой ночной трассе, Unreal Engine 5, трассировка лучей, 8k разрешение, фотореализм»
Это надёжно. Потому что проверено. Временем.
Фотографический антураж
Цифровой бомонд давно оценил прелесть старой плёнки. Настоящий рай для ценителей винтажной эстетики открывается при указании конкретных моделей камер и объективов. Начать нужно с выбора линзы — макрообъектив отлично спасёт при генерации мелких насекомых. Затем можно добавить эффект «рыбий глаз» для сильного искажения пространства. Ну и, наконец, стоит указать тип плёнки. Замечательно работает имитация Kodak Portra четырёхсотой светочувствительности, дающая тёплые ностальгические оттенки. Заслуживает похвалы тот скрупулёзный подход, с которым алгоритмы копируют даже зернистость старого целлулоида. Тем более, что добавить эти параметры довольно просто. К примеру:
«Уличный музыкант в Нью-Йорке, снято на объектив тридцать пять миллиметров, плёнка Polaroid, потёртые края, лёгкая зернистость»
Получается весьма колоритный винтажный кадр. А если ещё вспомнить про эффект боке, размывающий задний фон, то композиция станет безупречной.
Вредно ли смешивать несовместимое?
Эксперименты. Они всегда манят. Накапав чернил в молоко, мы неизбежно получим хаотичный узор. Это же правило касается и машинного творчества. Многие считают, что слияние жанров рождает шедевры, но на самом деле попытка скрестить мрачный готический хоррор с яркой детской иллюстрацией часто оборачивается полным провалом. С одной стороны, программа честно попытается угодить всем введённым словам, с другой — итоговый монстр будет вызывать лишь недоумение. Ложка дёгтя в подобных экспериментах заключается в потере смыслового фокуса. Ошибки анатомии всплывут моментально, если объединить гиперреализм и кубизм. Рассмотрев обе стороны медали, лучше отказаться от прямого смешивания стилей. Тем более, грандиозный внушительный результат требует внутренней гармонии. Попробуйте использовать плавные переходы:
«Рыцарский замок, построенный из печатных плат, стиль киберпанк переходящий в мрачное фэнтези, приглушённая цветовая гамма»
Так искусственный разум правильно расставит приоритеты.
Эмоциональная окраска
Эмоции задают ритм. Сухой технический текст неизбежно тяготеет к скучным, бездушным стоковым картинкам. А вот внедрение правильного настроения в корне меняет восприятие картины. Во-первых, нужно задать общее ощущение — меланхоличное, тревожное или радостное. Во-вторых, отлично помогают погодные явления, усиливающие драматизм. Процесс этот не сложный, но довольно кропотливый. Ведь машина не чувствует грусти, она лишь подтягивает соответствующие визуальные паттерны из своей базы. Довольно неоднозначный, но красивый результат получается при использовании слова «эфирный» (ethereal). Оно аккуратно окутывает объекты светящейся, призрачной дымкой. Весьма щепетильный подход нужен к модификатору «хаотичный», который легко ломает геометрию пространства. Безопасный промт выглядит следующим образом:
«Одинокий путник в заснеженном лесу, меланхоличное настроение, холодные синие оттенки, эфирное свечение вдалеке»
Зрелище получается поистине удручающее, но невероятно притягательное.
Творческий поиск всегда отнимает время. Да и каждый добавленный в строку эффект способен внести весомую лепту в итоговую сцену, меняя её геометрию до неузнаваемости. Понимая внутреннюю механику работы этих слов-модификаторов, можно легко разложить по полочкам даже самую безумную идею. Не стоит бояться пустых цифровых холстов и неожиданных результатов. Главное — вовремя угадать с палитрой. Смело экспериментируйте с освещением, играйте с объективами, сталкивайте лбами разные эпохи. Пусть каждый сгенерированный вами кадр станет отличным решением для будущих проектов, а процесс создания самобытных иллюстраций принесёт исключительно положительные эмоции. Удачи в поиске того самого идеального промта, который приятно порадует домочадцев и удивит искушённых коллег!