В сети представлено множество красочных изображений, сгенерированных нейросетями, от которых у неподготовленного зрителя буквально рябит в глазах. Складывается стойкое ощущение, что среднестатистический обыватель жаждет исключительно буйства красок, напрочь забывая о глубокой, скрупулёзной проработке теней. А ведь именно отсутствие цвета зачастую творит чудеса, заставляя нас вглядываться в фактуру, геометрию и скрытые эмоции персонажей. И всё же создать добротный монохромный кадр довольно сложно, поскольку машина изначально тяготеет к стандартным, усреднённым и весьма пёстрым решениям. Но чтобы не ошибиться в своих творческих порывах, нужно с самого первого слова задать алгоритму жёсткие, бескомпромиссные рамки.
Эстетика монохрома
Задача не из лёгких. Почему же искусственный интеллект так неохотно выдаёт глубокий чёрный цвет по умолчанию? Дело в том, что в базовых моделях львиная доля обучающей выборки состоит из современных цифровых фотографий с автоматическим, выверенным балансом белого. Естественно, алгоритм маниакально пытается раскрасить всё, на что вы натыкаетесь в процессе генерации, превращая строгий нуар в цирковую афишу. Буквально десятилетие назад качественная чёрно-белая плёнка была для фотографов серьёзным вложением, но сейчас кошелёк станет легче разве что от ежемесячной подписки на продвинутую нейросеть. К слову, излишняя цветовая наляпистость часто выступает своеобразной ширмой, маскирующей грубые огрехи композиции. В монохроме же обе стороны медали видны сразу, без прикрас. Поэтому перед генерацией стоит задуматься о правильном построении кадра, отбросив всё лишнее.
Как выбрать сюжет?
Капли холодного дождя на мутном стекле, освещённые тусклым уличным фонарём, прорисовываются умным алгоритмом всего за три миллисекунды. С таких мелких, фактурных деталей и стоит начинать свои эксперименты, чтобы понять логику машины. Не стоит гнаться за масштабными батальными сценами или пытаться уместить в один квадрат толпу танцующих людей. Ведь электронный разум обязательно запутается в конечностях или исказит перспективу так, что зрелище получится поистине удручающим. К первой группе удачных сюжетов можно смело отнести крупный план человеческого лица, изборождённого глубокими морщинами. Далее следует монументальная архитектура, где всегда солирует строгая геометрия линий, подчёркнутая резким светом. Отдельно стоит упомянуть минималистичные природные мотивы вроде одинокого засохшего дерева на фоне плотного тумана. Ну и, наконец, отличной базой станут натюрморты со стеклянной посудой, преломляющей свет.
Архитектура запроса
С чего начинается действительно рабочий текстовый посыл? С определения базового стиля, эпохи и конкретной виртуальной камеры. Текстовая команда, обогащённая техническими терминами, приправленная названиями культовых объективов, дополненная указанием типа проявки, всегда даёт поразительный результат. Сначала мы детально прописываем сам объект, потом задаём направление освещения, а затем уже накидываем стилистические фильтры. Разумеется, здесь не обойтись без упоминания конкретных мастеров визуального искусства прошлого века. Если добавить в запрос имя Питера Линдберга или легендарного Ансела Адамса, атмосфера готового кадра моментально изменится до неузнаваемости. К тому же, правильный набор слов выступает как настоящий спасательный круг, если нейросеть вдруг начинает генерировать откровенную мазню. Впрочем, длина описания далеко не всегда гарантирует качество, поэтому лучше отказаться от бессмысленных повторений.
Портретная съёмка в стиле нуар
Наряд для избранных. Пытаясь облачиться в строгий классический костюм начала двадцатого века, сгенерированный персонаж часто теряет человеческую реалистичность, превращаясь в манекен. Однако грамотный текстовый запрос легко решает эту распространённую проблему. Вот пример готовой, проверенной конструкции:
«крупный план мужчины пятидесяти лет, резкий боковой свет, глубокие тени на лице, сигаретный дым, стиль нуар, кинематографичное освещение, чёрно-белая плёнка Ilford HP5, объектив 50 миллиметров, диафрагма 1.8»
Это работает. Потому что проверено. Временем и тысячами потраченных кредитов. Такой скрупулёзный подход позволяет буквально вытащить из бездушного алгоритма настоящую, живую эмоцию. Да и самому автору гораздо интереснее наблюдать, как из цифровой пустоты проступает колоритный, самобытный характер. Безусловно, здесь кроются свои подводные камни, вроде слишком идеальной кожи, однако такие недочёты легко устраняются.
Стоит ли добавлять шум?
Обязательно ли искусственно портить картинку зернистостью? Вовсе нет, выбор всегда остаётся исключительно за создателем. Многие считают цифровой шум пережитком прошлого, но на самом деле именно он придаёт изображению тот самый исконно плёночный, тёплый антураж. Когда-то первые энтузиасты часами сидели в тёмных, душных комнатах, колдуя над химическими реактивами, чтобы добиться идеальной фактуры. Сегодня же достаточно просто добавить в конец запроса ёмкую фразу «heavy film grain» или «ISO 3200». В представлении обывателей идеальная глянцевая картинка выглядит дорого и привлекательно. Однако в чёрно-белом формате без лёгкой шероховатости она быстро становится откровенно пластмассовой и скучной. Тем более, что зерно отлично скрывает мелкие артефакты генерации, которые непременно всплывут при детальном рассмотрении. Ну, а главная изюминка такого подхода заключается в абсолютной непредсказуемости итогового результата.
Пейзажи и городские джунгли
Изысканный архитектурный ансамбль требует особого внимания к деталям. Именно в городских сюжетах фантазия нейросети часто льётся рекой, создавая несуществующие стили и нарушая базовые законы физики. Чтобы получить добротный, атмосферный пейзаж, стоит использовать следующий промт:
«узкая мощёная улица европейского города после сильного дождя, отражения в лужах, контрастный свет от одинокого уличного фонаря, высокая детализация, стиль Анри Картье-Брессона, объектив 35 миллиметров, сильный контраст, monochrome»
Местный бомонд, возможно, не оценит столь мрачный и меланхоличный подход, но настоящие эстеты гарантированно придут в восторг. И всё же не стоит перегружать сцену лишними, отвлекающими деталями вроде летящих птиц, мусорных баков или бегущих собак. Машина уж точно попытается впихнуть их в самые неподходящие места, испортив общую композицию. Внести лепту в создание шедевра поможет лишь строгий минимализм.
Техническая отладка
Процесс этот не быстрый. Зачастую первый же блин выходит комом, и грандиозный авторский замысел разбивается о глухое непонимание искусственного интеллекта. Здесь на сцену выходят отрицательные промты, которые не сильно ударят по кошельку, но сэкономят массу нервов. В них стоит максимально жёстко прописать такие параметры, как «color, sepia, bad anatomy, blur, overexposed, text, watermark». Этот внушительный защитный барьер надёжно отсекает попытки ИИ добавить тёплые жёлтые оттенки или размыть задний фон там, где в этом нет никакой необходимости. Своеобразным венцом технической настройки всегда выступает соотношение сторон кадра. Для широких кинематографичных сцен отлично подходит формат 16:9, тогда как классические портреты куда лучше смотрятся в пропорции 4:5. Любой, даже самый незначительный нюанс имеет огромный вес, когда мы пытаемся разложить по полочкам сложные алгоритмические махинации.
Ошибки и артефакты
Трещины на старой штукатурке, подсвеченные косыми солнечными лучами, могут внезапно превратиться в щупальца неизведанного монстра. С такими сюрпризами периодически сталкивается каждый, кто решает окунуться в мир нейросетевого искусства. Вычурный декор зданий алгоритм часто превращает в нечитаемую кашу, а руки персонажей традиционно остаются главной ложкой дёгтя в любой генерации. Чтобы избежать подобных казусов, не скупитесь на уточняющие слова, описывающие позу и положение тела. Забавно, что когда в кадре появляется маленькое чадо, нейросеть начинает паниковать ещё сильнее, искажая пропорции лица. Подобные постулаты цифровой генерации нужно просто принять как данность и не опускать руки после первых неудач. Ведь даже если персонаж на картинке едва стоит на ногах из-за кривой анатомии, следующий запрос обязательно исправит эту оплошность. Важно лишь методично менять вводные данные.
Поиск своего уникального, неповторимого визуального языка требует колоссального терпения и определённой насмотренности. Не стоит расстраиваться или впадать в уныние, если первые десятки монохромных генераций отправятся прямиком в корзину, пополнив кладбище неудачных идей. Экспериментируйте с виртуальными объективами, смело меняйте угол падения воображаемого света и никогда не бойтесь добавлять в сцену глубокие, почти угольные тени. Пусть каждая созданная вами фотография обретёт неповторимую, плотную атмосферу, а грамотно составленный промт станет отличным решением и запомнится надолго.