В сети представлено множество невероятно реалистичных цифровых изображений, глядя на которые невольно задумываешься об истинном авторстве каждого мазка или пикселя. Обыватель часто уверен, что для получения шедевра достаточно вбить пару незамысловатых слов, однако суровая реальность быстро бьёт по бюджету времени: вместо желаемого портрета на экране монитора вырисовывается нечто вычурное с искажёнными пропорциями. Дело в том, что машинный разум мыслит совершенно иными категориями, воспринимая наш человеческий текст как строгий набор математических векторов и весовых коэффициентов. Поэтому перед погружением в творческий процесс желательно освоить базовые постулаты составления правильного текстового запроса.
С чего начинается генерация?
Тонкая нить накаливания, вспыхнувшая в старой лампе. Именно с такой крошечной детали часто начинается понимание того, как искусственный интеллект строит композицию. К слову, львиная доля ошибок всплывёт уже на этапе описания главного объекта, если подойти к делу без должной скрупулёзности. Алгоритму нужно чётко понимать, кто именно солирует в кадре, иначе он заполнит пустоты случайным шумом. Сначала прописывается сам субъект с указанием возраста, пола и этнической принадлежности. Далее следует описание его конкретного действия или позы. Следующий важный критерий — одежда и мелкие аксессуары, формирующие общий антураж. Ну и, наконец, венчают эту основу детали фона и окружающей среды.
Визуальный стиль и антураж
Эстетичны ли цифровые картины без указания стиля? Само по себе изображение без чёткого художественного вектора часто тяготеет к банальной наляпистости или напоминает скучное стоковое фото. Кстати, буквально десятилетие назад цифровые художники сутками корпели над текстурами, но сейчас задать нужную атмосферу довольно просто. Главное — угадать с палитрой. Один из самых популярных видов стилизации включает прямое упоминание конкретных художников или фотографов прошлого. Ко второй группе приёмов относится добавление исторической эпохи, меняющее общее настроение снимка. Последним в списке идёт указание техники исполнения, например, плёночной фотографии или классической масляной живописи. Безусловно, добавление фразы вроде «викторианская эпоха» творит настоящие чудеса с итоговым результатом.
Как правильно описать свет?
Задача не из лёгких. Ведь именно свет формирует объём любого предмета. В представлении многих пользователей освещение на картинке появится само собой, однако на самом деле нейросети требуют весьма щепетильных и жёстких указаний. Нужно отметить, что профессиональные операторы годами учатся выставлять софтбоксы в студиях. Нам же достаточно вписать пару нужных терминов, чтобы картинка ожила. Стоит отметить, что мягкий рассеянный свет идеально подходит для женских портретов, сглаживая неровности кожи. А вот для напряжённых драматичных сцен лучше использовать резкое контровое освещение. Это связано с тем, что глубокие тени добавляют композиции внушительный вес. Тем более, можно просто упомянуть «золотой час» или «холодный неоновый свет».
Кадрирование
Фокусным расстоянием виртуального объектива определяется вся геометрия пространства. И всё же, сложно ли управлять этой невидимой камерой? Вовсе нет, если понимать механику процесса. Снимок снизу делает героя невероятно монументальным, возвышая его над зрителем. А съёмка сверху, напротив, визуально уменьшает объект, делая его уязвимым. Естественно, эти махинации с углами обзора давно известны кинематографистам. Знаменитый Орсон Уэллс ещё в тысяча девятьсот сороковом году активно применял экстремальные нижние ракурсы в своих фильмах, полностью меняя зрительское восприятие. Сейчас же эти проверенные временем приёмы успешно перекочевали в нейросети.
Стоит ли добавлять параметры камеры?
Многие считают, что вписывать характеристики настоящей оптики бессмысленно, но на самом деле для достижения фотореализма это настоящий спасательный круг. Само собой, не каждый обязан разбираться в диафрагмах или выдержках. Впрочем, если указать тридцать пять миллиметров, угол обзора станет значительно шире, захватывая больше пространства. Тем более, использование конкретных моделей фотоаппаратов добавляет свою изюминку. Портрет, снятый на плёнку «Кодак», проявленный в химических реактивах (буквально по старым технологиям), приобретает особый самобытный шарм. Не скупитесь на упоминание зернистости или хроматических аберраций. С одной стороны, это кажется излишне сложным, с другой — именно такие дефекты линз убеждают наш мозг в реальности происходящего.
Примеры готовых запросов
Перейдём к практической стороне вопроса и попробуем разложить всё по полочкам. Добротный запрос для создания портрета может выглядеть следующим образом.
К первой части мы относим описание самой модели: молодая девушка с веснушками, облачённая в грубое льняное платье. Далее вписываем окружение, добавляя туманный утренний лес и влажный мох. Отдельно стоит упомянуть освещение, прописав кинематографический свет, пробивающийся сквозь густые ветви деревьев. Последним этапом фиксируем технические детали: объектив восемьдесят пять миллиметров, диафрагма один и два, невероятная детализация.
Натыкаешься на такие результаты в ленте и поражаешься, насколько живо выглядит текстура ткани. Да и самим персонажам хочется сопереживать, настолько они получаются выразительными.
Секреты негативного запроса
Испортить работу довольно легко. Ведь машина часто добавляет лишние конечности или искажает перспективу. Зрелище получается удручающее, если забыть про так называемый негативный промт. Это специальное текстовое поле, куда вписываются слова, запрещающие алгоритму генерировать определённые элементы. Стоит сразу внести туда понятия «размытый», «мультяшный», «асимметричный» или «переэкспонированный». Откажитесь от пустых надежд на то, что искусственный интеллект сам исправит ошибки (он этого не сделает). Ложка дёгтя кроется в том, что нейросеть обучалась на миллионах бракованных картинок из интернета. Поэтому слова «плохая анатомия» или «лишние пальцы» должны стать вашими постоянными спутниками при настройке генерации.
Композиция и финальные штрихи
Правило третей выручает всегда. Это надёжно. Потому что проверено. Огромным количеством поколений фотографов. Смещение главного объекта от центра к краю кадра делает картинку динамичной. К тому же, не стоит перебарщивать с эпитетами. Слова, стоящие в самом начале предложения, имеют наибольший вес для алгоритма. Выручит банальная перестановка слов, если результат упорно не соответствует ожиданиям. Внесите свою лепту в композицию, добавив направляющие линии или рамки из объектов на переднем плане.
Постижение нового визуального языка требует определённого терпения и хорошей насмотренности. Не бойтесь скрупулёзно экспериментировать с парадоксальными сочетаниями слов, меняйте освещение и ракурсы, словно настоящий режиссёр на голливудской площадке. Пусть каждый новый сгенерированный образ радует глаз глубокой детализацией, а освоенный навык написания точных текстов станет отличным решением для любых творческих задач. Перевоплощение завершено.