В сети представлено множество многоэтажных инструкций по генерации изображений, но на практике львиная доля этих мануалов разбивается о специфику конкретной нейросети. Совершенно иного подхода к построению текстового запроса требует гугловская модель, которая мыслит не столько художественными образами, сколько техническими параметрами. Удивительно, но чтобы не ошибиться и получить предсказуемый результат, желательно полностью пересмотреть свои привычные шаблоны и начать общаться с машиной на языке профессиональных фотографов.
Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸
Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.
Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL
Базовый синтаксис
Прямо с указания формата кадра и типа камеры начинается грамотный современный запрос. Обязательно ли писать талмуды текста на три абзаца? Вовсе нет. Искусственный интеллект тяготеет к чёткой, почти математической структуре, где каждое слово несёт смысловой вес. Пишите ёмко. Ведь система цепляется за конкретные визуальные маркеры. Довольно часто обыватель совершает ошибку, нагромождая абстрактные эпитеты, хотя стоит лишь выстроить правильную цепочку. Главный объект вводится первым, следом прописывается его окружение, отдельным блоком идёт схема освещения, ну и, наконец, указываются технические параметры объектива. К слову, именно такой скрупулёзный подход творит чудеса. Отличным примером станет запрос:
«A cinematic wide shot of a solitary astronaut walking on a black sand beach, crashing waves, stormy dark sky, neon blue bioluminescence in the water, shot on 35mm lens, Kodak Portra 400, muted cinematic colors, 8k resolution»
И всё же не забывайте менять параметры плёнки под нужную эпоху.
Как добиться фотореализма?
Многие считают, что для идеальной картинки достаточно дописать в конце заветное слово «photorealistic», но на самом деле эта стратегия давно изжила себя. Ложка дёгтя кроется в том, что как визуальный шум воспринимают такие слова современные алгоритмы. А вот упоминание конкретной физики света даёт внушительный результат, лишённый искусственной глянцевости. Не скупитесь на реальные оптические термины. Отлично выручит точное указание диафрагмы или фокусного расстояния для формирования глубины пространства. К тому же, стоит всегда уточнять характер теней, чтобы избежать пластиковой наляпистости на лицах. Попробуйте использовать такой промт:
«Street photography of an elderly mechanic smoking a cigar in a dimly lit garage, grease on hands, dramatic rim lighting from a neon sign outside, shallow depth of field, f/1.8, Fujifilm XT4, highly detailed skin texture, raw photo»
Эстетичны ли такие резкие контрастные кадры? Само по себе обилие деталей не гарантирует шедевра, но атмосферу передаёт безошибочно. Дело в том, что физически корректное размытие фона заставляет зрителя безусловно верить в реальность происходящего.
Портретная съёмка в студии
Лица решают всё. При генерации людей махинации с промтами часто сводятся к борьбе со слишком ровной, безжизненной кожей. Безусловно, нейросеть здесь выступает как настоящий кладезь возможностей, если правильно направить её вычислительные мощности. Дополняет добротный классический образ лёгкая асимметрия черт, которую стоит прописывать отдельным словосочетанием. Естественно, не стоит забывать про блики в глазах (catchlights), которые мгновенно оживляют взгляд модели. Образец рабочего запроса:
«Editorial fashion portrait of a freckled ginger woman with messy short hair, wearing a chunky oversized wool turtleneck, soft Rembrandt lighting, dark grey studio backdrop, sharp focus on eyes, 85mm portrait lens, Phaseone XF, natural skin blemishes, high end retouching style»
Буквально десятилетие назад подобная детализация была роскошью даже для топовых ретушёров, но сейчас создание портрета занимает около четырёх секунд. Тем более, что можно легко менять цвет фона одним словом, не прибегая к сложным маскам выделения.
Как выбрать стиль освещения?
Работа со светом исторически начиналась с театральных подмостков, где софиты формировали настроение сцены. В искусственном интеллекте же именно световая схема солирует в итоговом изображении. Заслуживает истинного уважения способность машины понимать разницу между жёстким полуденным солнцем и мягким рассеянным светом из окна. С одной стороны, можно положиться на случай, с другой — лучше взять контроль в свои руки и направить виртуальные источники света. Не стоит перегружать запрос взаимоисключающими терминами вроде «яркий тропический закат и мрачный студийный софтбокс». Изюминка кроется в гармонии. Запрос может выглядеть так:
«A sleek modern sports car parked on a wet asphalt road at night, illuminated by cyberpunk pink and cyan neon lights, volumetric fog, cinematic lighting, sharp reflections on the metallic car paint, anamorphic lens flare»
Это же правило касается и предметной макросъёмки. Ведь именно направленный боковой луч выявляет фактуру материала, будь то ворсистый бархат или холодная поцарапанная сталь.
Достопримечательности виртуальных миров: экстерьеры будущего
Масштабные сцены всегда приковывают внимание. Архитектурный рендер — это сложный жанр, где моментально всплывут любые искажения перспективы или ошибки в пропорциях. Главный нюанс при работе с массивными строениями заключается в правильном масштабировании элементов относительно друг друга и добавлении объектов-ориентиров для оценки размеров. Разумеется, в реальной жизни возведение грандиозного небоскрёба (около сотни этажей) серьёзно бьёт по бюджету застройщика, а в нашем случае кошелёк станет легче разве что на пару токенов оплаты. Обратите внимание на такую конструкцию:
«A brutalist concrete mansion integrated into a steep cliffside, overlooking a misty pine forest, hyper-realistic architectural rendering, golden hour soft sunlight hitting the concrete texture, large panoramic glass windows reflecting the sky, ivy growing on walls, aerial drone shot»
Сложно ли добиться нужного угла обзора при рендере зданий? Да, иногда система упорно ставит виртуальную камеру на землю. Помогут слова-маркеры вроде «bird’s-eye view» или «low angle shot», которые жёстко фиксируют ракурс.
Стоит ли усложнять композицию?
Совмещение нескольких разноплановых объектов в одном кадре часто превращается в настоящее испытание для генератора. Лучше отказаться от сомнительной идеи впихнуть в одну картинку сразу пятнадцать смысловых центров. Однако творческий бомонд часто грезит эпическими полотнами, забывая про базовые правила третей и золотое сечение. Вся суть в том, что алгоритмы пока слабо понимают пространственное взаимодействие сложных, перекрывающих друг друга предметов. Но есть и спасательный круг. Метод точного позиционирования через пространственные предлоги творит настоящую магию. Используйте этот шаблон:
«A vintage leather armchair sitting in the middle of an abandoned greenhouse, overgrown with tropical ferns, rays of dusty sunlight filtering through broken glass roof panels, moody cinematic atmosphere, rule of thirds, symmetrical framing»
Рассматривая обе стороны медали, мы видим очевидное правило. Излишняя пустота делает кадр откровенно скучным, а перегруженность ломает пространственную логику. Поэтому всегда стоит искать золотую середину, фокусируясь на центральном объекте.
Животные в дикой природе
Поведение фауны передать через пиксели бывает мучительно трудно. Да и самим зверькам комфортнее находиться в привычной густой среде обитания, которую нейросеть прорисовывает с потрясающей достоверностью. Обязательно ли указывать конкретный вид дерева на заднем плане? Вовсе нет, но общую климатическую зону обозначить строго стоит. В представлении многих пользователей генерация животных сводится к банальным статичным позам, однако скрытые возможности инструмента способны на большее. Не стоит перебарщивать с человеческими эмоциями на мордах хищников, чтобы не получить карикатурного персонажа из диснеевского мультфильма. Запечатлеть замершее резкое движение поможет прямое указание высокой скорости затвора. Попробуйте скопировать этот текст:
«National Geographic style wildlife photography, a majestic Bengal tiger stalking through tall dry yellow grass, intense golden eyes looking directly at camera, morning mist, shallow depth of field, f/2.8, shot on 600mm telephoto lens, hyper-detailed fur texture, cinematic nature lighting»
Исконно природные, немного приглушённые цвета здесь играют решающую роль. Ведь пережжённый цифровой контраст моментально выдаст искусственное происхождение снимка.
Блюда в ресторанах: фуд-фотография
Еда должна вызывать мгновенное физическое желание её съесть. Если уж вы решили сгенерировать кулинарный изысканный шедевр, навсегда забудьте про плоское фронтальное освещение. В коммерческой фуд-фотографии контровой задний свет льётся рекой, сочно подчёркивая текстуру густых соусов и хрустящую свежесть зелени. Впрочем, алгоритм великолепно справляется с реалистичным дымком над горячим мясом или мелкими каплями конденсата на ледяном бокале. Нужно отметить, что направленная левитирующая динамика в кадре сильно оживляет статичную композицию. Тестируйте этот промт:
«Commercial food photography of a juicy wagyu beef burger with melting cheddar cheese, crispy bacon, fresh lettuce, dynamic flying ingredients, dark moody background, spot lighting highlighting the food, steam rising, high resolution, culinary magazine cover style»
Отдельно стоит упомянуть сопутствующий реквизит. Потёртые деревянные доски, мятая крафтовая бумага, небрежно рассыпанные специи или грубый лён на заднем плане добавляют тот самый неповторимый самобытный колорит. Процесс тонкой настройки такого кадра не сложный, но весьма кропотливый.
Эксперименты с текстовыми запросами — это всегда увлекательный выход за рамки привычного визуального мышления. Смело меняйте виртуальные объективы, играйте с ушедшими эпохами, не бойтесь нарушать классические академические правила освещения и постоянно комбинируйте стили, чтобы в итоге нащупать свой собственный уникальный почерк. Пусть каждый сгенерированный кадр точно бьёт в поставленную коммерческую или творческую задачу, а сам процесс создания изображений приносит только искреннее удовольствие и радует глаз.