В сети представлено множество сгенерированных изображений, где влюблённые пары выглядят откровенно пластиковыми и безжизненными. Идеально симметричные лица с пустым взглядом довольно быстро приедаются глазу искушённого зрителя, а анатомические аномалии вызывают лишь разочарование. Плохой результат в генерации — это не всегда вина самой нейросети или устаревшей модели. В большинстве случаев корень проблемы кроется в скудном, лишённом всякой художественной ценности текстовом описании. Ведь именно слова служат тем самым спасательным кругом, который вытягивает алгоритм из пучины случайных пикселей. Но чтобы не ошибиться, нужно тщательно продумать каждую деталь будущего кадра.
С чего начинается создание?
Задача не из лёгких. Формирование качественного запроса требует определённой насмотренности. Буквально пару лет назад для получения приемлемой картинки хватало двух-трёх английских слов, но сейчас правила игры кардинально изменились. Настоящий кладезь удачных генераций открывается лишь тем, кто умеет выстраивать словесную архитектуру. Сначала алгоритму скармливают общую атмосферу сцены, далее прописывают внешность главных героев, затем добавляют стилистику одежды, ну и, наконец, полируют всё это указанием конкретной модели объектива. Это же правило касается и портретов. Разумеется, обыватель часто игнорирует техническую сторону вопроса. И всё-таки вносить свою лепту в процесс настройки освещения придётся.
Стиль гранж в интерьере
Мягкий свет от неоновой вывески падает на скулы, подчёркивая лёгкую небритость и усталый взгляд. Начинать сложный абзац стоит именно с такой мелкой детали, чтобы машина сразу уловила нужное настроение. К слову, гранжевая стилистика творит настоящие чудеса, когда нужно уйти от приторной глянцевой картинки. Стоит отметить, что для создания подобного антуража в запрос нужно вплетать маркеры потёртости и лёгкой небрежности. Не стоит перегружать сцену лишними предметами на заднем фоне. Откажитесь от сложных декораций. Лучше сосредоточить внимание на фактуре одежды.
В качестве примера отличным решением станет следующий текст.
«Кинематографичный кадр молодого человека и девушки в тускло освещённом баре, плёночная фотография на тридцатимиллиметровый объектив. Парень, облачённый в добротный кожаный пиджак, сидит вполоборота, его волосы слегка растрёпаны. Девушка нежно касается его плеча. На фоне размыты силуэты старых кирпичных стен и винтажных плакатов. Глубокие тени, зернистость плёнки «Кодак», мрачная, но тёплая цветовая палитра.»
На самом деле, именно указание типа плёнки добавляет изображению ту самую изюминку, о которой грезят многие создатели контента.
Какими бывают ошибки?
Многие считают, что чем длиннее текст, тем качественнее получится фотография, но на самом деле алгоритм попросту теряет фокус. Излишняя наляпистость описания сильно бьёт по бюджету внимания нейросети. В итоге натыкаешься на откровенный визуальный мусор. Всплывут лишние конечности, искажённые пропорции или совершенно абсурдные предметы гардероба. Дело в том, что искусственный интеллект пытается угодить всем словам одновременно. Поэтому лучше отказаться от перечисления десятка мелких украшений на шее партнёра. Главное — поймать химию между персонажами.
Отдых в Исландии: северный колорит
Исторически сложилось так, что концепция суровой, но романтичной съёмки на природе обрела популярность в середине двадцатого века, когда фотографы начали массово выходить из душных студий. Например, знаменитые кадры из экспедиций тысяча девятьсот шестидесятых годов задали моду на естественность. И сейчас эстетика дикой природы солирует в запросах многих пользователей. Безусловно, создать самобытный кадр на фоне бушующего океана довольно просто, если соблюдать правильную последовательность.
Сначала мы обозначаем суровый северный пейзаж, затем одеваем пару в тёплые вязаные свитеры, а после накладываем эффект пасмурного неба. Готовый промт может звучать так.
«Широкоугольная пейзажная фотография пары, стоящей на пляже с чёрным песком в Исландии. Высокий мужчина с аккуратной бородой, одетый в толстый шерстяной свитер грубой вязки, обнимает спутницу со спины. Ветер развевает их волосы. Холодный дневной свет, реалистичная текстура кожи, пасмурное небо, высокая детализация, снято на камеру «Сони Альфа», диафрагма два и восемь.»
Нужно отметить, что именно этот колоритный контраст между холодной природой и теплом объятий приковывает внимание зрителя.
На какой объектив снимать?
Стоит ли вдаваться в оптические характеристики? Да, и это критически важно. В представлении многих пользователей достаточно написать «красивое фото», однако без указания фокусного расстояния результат будет совершенно непредсказуемым. Львиная доля успешных генераций опирается на фотографические термины. Естественно, для портретных снимков лучше всего подходят значения в пятьдесят или восемьдесят пять миллиметров. Это надёжно. Ведь такие параметры красиво размывают задний фон, выделяя лица. К тому же, правильная оптика убирает нежелательные искажения лиц, делая их более человечными.
Детализация
Корпус камеры, снабжённый качественным сенсором, дополненный светосильным объективом, способен передать каждую пору на коже. Но в мире нейросетей эту работу выполняют правильные эпитеты. Не скупитесь на упоминание фактуры. Словосочетания вроде «реалистичная кожа», «заметные поры» или «микродетали» работают безотказно. Впрочем, здесь тоже есть свои подводные камни. Если перестараться, лица станут слишком грубыми, словно вырубленными из камня. Обе стороны медали нужно учитывать, балансируя между идеальностью и суровым реализмом.
Городская прогулка: динамика улиц
Сложно ли передать движение в статичном кадре? Вовсе нет, если добавить немного размытия на фон. Когда-то чёткость по всему полю кадра считалась эталоном, сейчас же эстетика тяготеет к лёгкому несовершенству. Для создания уличной романтики отлично подойдёт следующий запрос.
«Уличная фотография пары, идущей за руку по залитому дождём ночному Токио. Мужчина в строгом длинном пальто смотрит на спутницу, она искренне смеётся. Влажный блестящий асфальт отражает неоновые вывески. Эффект движения на заднем фоне, кинематографичное освещение, яркий контрастный цвет.»
Тем более, что такой вычурный неоновый свет скрадывает мелкие артефакты генерации. Да и самим персонажам этот яркий городской антураж добавляет харизмы. Ну а если вам хочется чего-то более спокойного, всегда можно перенести действие в парижское кафе ранним утром, заменив неон на мягкий солнечный свет.
Скрупулёзный подход
Любые сложные махинации с настройками требуют терпения. Иногда приходится генерировать десятки вариантов, прежде чем машина выдаст тот самый исконно правильный результат. Не стоит расстраиваться, если первые попытки окажутся неудачными. Специфика нейросетей такова, что в них всегда присутствует элемент случайности. И всё-таки, методично меняя слова местами, добавляя новые прилагательные или убирая лишние детали, можно добиться грандиозного эффекта. Не забывайте экспериментировать с ракурсами. Укажите «вид сверху» или «съёмка с нижнего ракурса», и композиция заиграет совершенно иными красками.
Создание идеального изображения — процесс не быстрый, но невероятно увлекательный. Щепетильный подбор каждого слова в итоге окупится сторицей, когда на экране монитора появится живая, дышащая эмоциями сцена. Удачи в ваших творческих экспериментах, пусть каждый сгенерированный кадр вызывает только искренний восторг.