Плохой сон – это не всегда ночные кошмары, для опытного нейро-художника это сгенерированные изображения, где бравые солдаты сверкают голливудскими улыбками посреди стерильных траншей. Зрелище, прямо скажем, удручающее. Ведь картинка, слишком уж вылизанная и чистая, моментально бросается в глаза, выдавая бездушный машинный код буквально с первых секунд. Буквально десятилетие назад абсолютный фотореализм в компьютерной графике казался недостижимой магией, но сейчас нейросети выдают грандиозный результат за три-четыре секунды. Однако цифровой бомонд прекрасно понимает, что добиться эффекта грязной, настоящей, пропахшей порохом реальности — задача не из лёгких. А начать стоит с полного отказа от примитивных базовых настроек.
Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸
Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.
Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL
С чего начинается выбор?
Пылинки на линзе. Именно с таких мельчайших, незначительных деталей выстраивается густая атмосфера. К слову, львиная доля успеха кроется в правильном выборе самой нейронной модели. Известная Midjourney шестой версии откровенно тяготеет к кинематографичности и красивому свету, тогда как Stable Diffusion (при наличии правильных чекпоинтов) позволяет скрупулёзный разбор и помогает разложить по полочкам каждую пуговицу на разгрузочном жилете. Сложно ли добиться исторической правды? Да, но результат того стоит. Нужно отметить, что искусственный интеллект довольно часто путается в исторических эпохах. Ведь если просто написать слово «солдат», на выходе получится некая усреднённая наляпистость из совершенно разных веков. А вот детальный, продуманный текст творит чудеса. Ну и, конечно же, не стоит забывать о правильном соотношении сторон для будущего кадра.
Анатомия запроса
Формируется добротный реалистичный кадр определённым, строго заданным набором текстовых переменных. Начинать нужно с описания самого бойца, которому предстоит облачиться в тяжёлый камуфляж, измазаться окопной грязью и выглядеть уставшим после многокилометрового марш-броска. Далее следует уточнить тип освещения. К первой группе относится жёсткий контровой свет, во-вторых, можно использовать мягкое рассеянное освещение пасмурного неба, ну и, наконец, добавить лёгкие эффекты старой плёночной камеры. И всё же многие считают, что достаточно пары общих слов, но на самом деле обе стороны медали заключаются в строгом балансе между объектом и фоном. Впрочем, не стоит перебарщивать со спецэффектами. Иначе композиция станет слишком вычурной.
Окопы Фландрии: историческая достоверность
В 1917 году пехотинцы неделями утопали в траншеях, а британские военные корреспонденты тратили часы, чтобы запечатлеть этот мрак на огромные, неповоротливые камеры. Дело в том, что машинный мозг не знает этой боли. Чтобы окунуться в ту страшную эпоху, автору предстоит внести лепту в виде предельно конкретных деталей. Например, вписать в строку плотные тканевые обмотки на ногах, винтовку Ли-Энфилд, тяжёлый брезентовый противогаз на груди. Естественно, для современных локальных конфликтов антураж подбирается совершенно иной. Тут уже уверенно солирует кевлар, модульные разгрузочные жилеты, тактические очки. Безусловно, каждая подобная мелочь имеет колоссальный вес. Венчает этот внушительный арсенал правильно подобранная, мрачная локация.
Как избежать пластикового лица?
Идеальная, невероятно гладкая кожа моментально бьёт по бюджету доверия любого искушённого зрителя. Как заставить алгоритм нарисовать по-настоящему живого человека? На помощь приходят весьма специфические медицинские и косметические термины. Довольно часто надёжный спасательный круг кроется в словах вроде «skin pores», «exhausted face», «grime and sweat». Кстати, добавление в текстовую строку конкретного возраста (например, «forty years old veteran») кардинально меняет вектор генерации. А если ещё вспомнить про микровыражения лица, то уставший пехотинец оживает прямо на глазах. Нельзя не упомянуть, что лёгкая, естественная асимметрия черт лица всегда приковывает внимание. Разумеется, не нужно делать из обычного парня жуткого монстра, но глубокие шрамы или грубая недельная щетина добавят нужный колоритный реалистичный вид.
Освещение и оптика
Выбор виртуального объектива. Задача крайне важная. Ведь именно он задаёт перспективу и глубину резкости. Снимая лицевой портрет на фокусное расстояние в восемьдесят пять миллиметров, размытый задний план мы получаем автоматически. Тем более, что добавление названия конкретной фотоплёнки (Kodak Portra 400 или Ilford HP5 для монохромного варианта) сразу накидывает сотню очков к общей атмосферности. К тому же, стоит поэкспериментировать с виртуальной скоростью затвора. Размытые капли холодного дождя или летящие латунные гильзы требуют предельно короткой выдержки. Само собой, в строку генерации желательно вписать «shot on 35mm lens», «cinematic lighting», «depth of field». Это серьёзное вложение в качество итогового рендера. А правильно выставленный свет льётся рекой, подчёркивая грубую текстуру ткани.
Вредно ли перегружать запрос?
Многие обыватели грезят огромными, бесконечными абзацами текста, наивно думая, что программа всё это корректно переварит. Но есть и минусы. Нейросеть зачастую просто теряет смысловой фокус на последних словах. Вся суть в том, что вес токенов распределяется алгоритмами крайне неравномерно. Поэтому самые важные элементы конструкции стоит ставить в самое начало. Сначала описывается главный объект, затем прописываются мелкие детали внешности, после чего формируется фон, и в самом конце фиксируются технические параметры камеры. Это же правило касается и блока исключений (негативного промпта). Отрицательные значения вроде «clean clothes», «perfect makeup», «smiling» работают как швейцарские часы. Да и самим вычислительным мощностям гораздо комфортнее работать с чёткой, понятной структурой.
Практические примеры
Перейдём непосредственно к практике. Один из самых популярных видов запроса строится на крупном портретном плане:
«Close up portrait of a tired military soldier, dirty face, heavy rain, wearing tactical gear, muddy helmet, holding rifle, warzone background, dramatic lighting, volumetric fog, shot on 85mm lens, f/1.8, photorealistic, 8k, highly detailed»
Следующий важный критерий — сумасшедшая динамика. Для напряжённого экшена отлично подойдёт:
«Full body shot, special forces operator running through ruined city street, debris flying, explosions in background, motion blur, cinematic color grading, raw photo, realistic»
Отдельно стоит упомянуть исторические, самобытные реконструкции. Здесь прекрасно выручит:
«WW2 american infantry soldier resting in a snowy trench, smoking a cigarette, freezing weather, worn out uniform, Leica M3 photography, black and white, heavy grain»
Последним в списке идёт ночной, скрытный бой, где главная визуальная изюминка — это неоновое освещение:
«Night ops, soldier with night vision goggles down, green glow, tactical laser sight, dark forest environment, stealth, ultra realistic, low light photography»
Щепетильный контроль
Оружие в руках искусственного интеллекта. Часто натыкаешься на откровенный технический брак. Довольно сложно заставить программу с первого раза правильно нарисовать пальцы на спусковом крючке или точные заводские пропорции ствола. Обязательно ли править эти недочёты руками? Почти всегда. Обидные ошибки обязательно всплывут в самых неожиданных, случайных местах. Слившиеся воедино стволы (иногда сразу по три штуки), кривые оптические прицелы, оружейные магазины совершенно неоднозначной формы. Однако, если использовать функцию Inpainting, махинации с точечной доработкой не займут много сил. Кроме того, стоит задуматься о качественных референсах. Подгруженное базовое изображение не сильно ударит по кошельку вашего свободного времени, зато жёстко задаст правильную композицию, а пыль реалистично оседает на броне. Ну, а если вы работаете в Midjourney, параметр стилизации лучше держать на низких значениях, чтобы избежать лишней, ненужной живописности.
Подготовка к публикации
Сырой, только что сгенерированный результат. Он редко бывает абсолютно безупречным, оставляя пространство для манёвра. Даже самый изысканный сложный запрос периодически выдаёт мелкие артефакты, и тут есть один нюанс. Исконно генеративный, неприятный шум аккуратно убирается в классических графических редакторах. Тем более, лёгкая профессиональная цветокоррекция собирает разрозненную картинку воедино, превращая своё цифровое чадо в шедевр. Заслуживает истинного уважения тот автор, который не ленится добавить немного цифрового зерна или тёмную виньетку уже после завершения генерации. Ведь нейросеть — это лишь послушный инструмент, а финальный лоск всегда наводит живой человек. Крепко стоит на ногах тот специалист, который понимает эти базовые постулаты. И покупка платной подписки на сервисы в таком случае означает, что ваш виртуальный кошелёк станет легче не зря, превращаясь в настоящий кладезь возможностей.
Создание сурового, правдоподобного военного образа требует огромного терпения и колоссальной насмотренности. Главное — угадать с палитрой. Нет смысла переплачивать за дорогие курсы по составлению запросов, достаточно просто внимательно изучать работы других талантливых авторов. Не стоит гнаться за идеальной резкостью каждого отдельного пикселя, ведь настоящая фронтовая фотография всегда немного несовершенна. Удачи в бесконечных поисках того самого, безупречного кадра, который по-настоящему захватит дух, передаст всю тяжесть момента и запомнится зрителям надолго.