В сети представлено множество сгенерированных картинок, от которых у неискушённого зрителя буквально захватывает дух. Буквально десятилетие назад подобная детализация казалась абсолютной фантастикой, но сейчас нейросети выдают готовые цифровые шедевры за считанные секунды. Зрелище, безусловно, впечатляющее и завораживающее. Однако при детальном и скрупулёзном рассмотрении львиная доля этих изображений сразу выдаёт своё искусственное происхождение неестественно пластиковыми лицами или совершенно нелогичным освещением. И всё же добиться настоящей, живой фотографичности вполне реально. Но чтобы не ошибиться, нужно кардинально пересмотреть подход к составлению текстовых запросов.
С чего начинается магия?
Задача не из лёгких. В создании действительно правдоподобного кадра солирует именно техническая грамотность автора, а не буйная фантазия. Сразу же стоит отметить, что современные генераторы изображений мыслят категориями математических тегов. К слову, многие считают, будто достаточно вписать заветное слово «реализм», но на самом деле машина отчаянно нуждается в точных физических уточнениях. Ведь именно свойства оптики формируют конечное восприятие кадра человеческим глазом. Поэтому нет никакого смысла просто просить нарисовать красивую девушку на фоне вечернего города. Гораздо эффективнее сработает текст, написанный сухим языком профессионального студийного фотографа.
Свет и тень
Освещение — это настоящий спасательный круг для любой изначально плоской картинки. Не стоит скупиться на детальное описание характера падающих лучей. Мягкий рассеянный свет из большого окна отлично подойдёт для спокойных, меланхоличных портретов. А вот жёсткое полуденное солнце лучше оставить для динамичной уличной моды. К тому же, довольно часто новички напрочь забывают указывать время суток. Это огромная ошибка. Потому что безвозвратно упускается нужная атмосфера. Запрос для нейросети можно сформулировать следующим образом:
«Погрудный портрет пожилого уставшего мужчины, снято в золотой час, боковое контровое освещение, глубокие резкие тени на правой щеке»
Звучит довольно просто, но результат гарантированно поразит даже заядлых скептиков.
Плёночная эстетика
Кодак Портра четыреста появилась на рынке в самом конце девяностых годов прошлого века, мгновенно завоевав сердца миллионов. Когда-то громоздкие фотоаппараты пылились в каждом доме, сейчас же этот добротный аналоговый антураж стал признаком настоящего стиля. Искусственный интеллект, обученный на огромных массивах данных, отлично знает особенности цветопередачи всех популярных старых плёнок. Безусловно, добавление названия конкретной кассеты в структуру текста навсегда избавит кадр от излишней, режущей глаз цифровой стерильности. Плёночное зерно, аккуратно добавленное алгоритмом, бережно скроет неестественную гладкость кожи. Нельзя не упомянуть, что именно лёгкая оптическая неидеальность делает изображение по-настоящему живым. Простой обыватель вряд ли сходу поймёт причину, но подсознательно сразу поверит сгенерированной картинке.
Как выбрать объектив?
Обязательно ли прописывать параметры линзы? Вовсе нет, но без этого кадр потеряет глубину. Для просторных, захватывающих дух пейзажей отлично подойдут стёкла с фокусным расстоянием в двадцать четыре миллиметра. А если требуется выхватить эмоцию из шумной толпы, стоит внимательно присмотреться к классическим портретникам на восемьдесят пять миллиметров. Впрочем, главная изюминка всегда кроется в правильной глубине резкости. Силуэт, отделённый от фона, размытого в мягкое боке, снятого на максимально открытой диафрагме со значением один и два, выглядит невероятно объёмно. Тем более, что такой изящный приём моментально отсекает лишний визуальный мусор на заднем плане.
Вредно ли идеализировать внешность?
Абсолютная геометрическая симметрия всегда с головой выдаёт машинную работу. Слишком идеальные, выверенные до пикселя черты лица воспринимаются нашим мозгом как тревожный, неестественный сигнал. Конечно, каждому автору хочется получить красивого главного героя, однако ложка дёгтя в виде изъянов здесь просто необходима. Мелкие мимические морщинки, россыпь веснушек на носу, неровности текстуры или растрёпанные холодным ветром волосы вносят ту самую заветную лепту реализма. Естественно, не стоит перебарщивать с откровенными уродствами. Вполне достаточно вежливо попросить алгоритм добавить лёгкую природную асимметрию. Это ничуть не испортит эстетику, но добавит сотню очков к визуальной достоверности.
Детализация
Окружение решает всё. Изолированный однотонный фон уместен исключительно в стерильных условиях коммерческой студии. Блуждая по тематическим форумам, довольно часто натыкаешься на головы, буквально висящие в белой пустоте. Настоящий же кладезь для искомого реализма кроется в совершенно случайных предметах на заднем фоне. Жёлтое такси, проезжающее мимо, случайный сутулый прохожий с чёрным зонтом, отражение яркой неоновой вывески в грязной луже — всё это формирует плотную достоверную среду. К слову, именно грамотная многоплановость заставляет зрителя останавливать взгляд и рассматривать готовую работу часами.
Архитектура промта
Пора разложить по полочкам накопленную теорию и перейти к реальной практике. Один из самых популярных рабочих вариантов для брутального мужского портрета строится так:
«Крупный план лица, испачканный сажей пожарный, уставший пронзительный взгляд, снято на объектив пятьдесят миллиметров, чёрно-белая плёнка Илфорд Дельта, драматичный верхний свет, падающий сквозь решётку, высокая детализация пор кожи»
Далее следует удачный пример для атмосферной уличной фотографии. Здесь текстовый запрос формируется немного иначе:
«Молодая девушка в жёлтом плаще переходит дождливую улицу в ночном Токио, случайный репортажный кадр, снято на старую мыльницу, яркая вспышка прямо в лоб, пересвеченные участки на скулах, кинематографичная атмосфера, смазанное движение автомобилей на фоне»
Ну и, наконец, замыкает этот ряд уютный интерьерный снимок. Тут лучше прописать:
«Просторная светлая гостиная в лучах мягкого утреннего солнца, золотистые пылинки в воздухе, снято на широкоугольный объектив, контрастные тени от деревянных жалюзи на кирпичной стене, фотореализм»
Стоит ли экономить?
Выбор правильной нейросетевой платформы во многом определяет итоговое качество генерации. Безусловно, на современном рынке есть масса доступных бесплатных решений. Конечно, покупка мощной современной видеокарты или оформление платной подписки на продвинутый сервис сильно бьёт по бюджету, однако итоговый результат окупает все потраченные средства. Серьёзное финансовое вложение в инструменты открывает долгожданный доступ к самым тонким настройкам параметров генерации. В урезанных бесплатных версиях слишком часто всплывут критические ошибки анатомии (например, лишние пальцы). К тому же, закрытый код дешёвых платформ не позволяет использовать важные плагины для жёсткого контроля поз персонажей. Кошелёк, безусловно, станет легче, но сэкономленные нервные клетки стоят гораздо дороже.
Ошибки генерации
Какие же подводные камни коварно поджидают начинающих творцов? В первую очередь, это бессмысленное избыточное нагромождение совершенно несочетаемых художественных стилей. Сложные словесные махинации с десятками абстрактных понятий вроде «эпичный», «божественный» или «супер-пупер-детализированный» лишь непоправимо портят исходник. Нейросеть начинает откровенно путаться в показаниях. В итоге на свет вылезает жуткая визуальная наляпистость. А ведь мы упорно стремимся к спокойной естественности. Откажитесь от этих пустых вычурных эпитетов в пользу строгих физических терминов. Да и алгоритмам так гораздо проще переваривать поступающую информацию.
Обработка
Капли дождя на стекле, добавленные поверх сгенерированной картинки, творят настоящие чудеса восприятия. Ручной постпродакшен ещё никто не отменял. Буквально несколько лет назад сырой, выданный машиной результат считался финальным и неприкосновенным, но сейчас зрительские требования многократно возросли. Искусственный интеллект всё ещё сильно тяготеет к излишней, кислотной насыщенности оттенков. Немного снизив глобальный контраст в любом графическом редакторе, можно добиться пугающего сходства с настоящим плёночным снимком. Да и добавление лёгких хроматических аберраций по самым краям кадра пойдёт изображению только на пользу. Окунуться с головой в суровый мир цифровой фотографии без этих финальных мелких штрихов практически невозможно.
Постоянно экспериментировать с порядком слов в тексте придётся каждому. Изучение классических работ признанных мастеров фотографии здорово поможет расширить визуальный словарный запас и кристально ясно понять механику построения правильного кадра. Не стоит бояться совершать глупые ошибки на старте, ведь именно из них постепенно складывается собственный, узнаваемый авторский стиль. Подбирайте новые виртуальные объективы, смело меняйте погодные условия в своих запросах и внимательно наблюдайте за сложным поведением света. Удачи в создании по-настоящему живых изображений, этот увлекательный творческий процесс обязательно порадует потрясающими результатами и запомнится надолго.