В сети представлено огромное количество генераций, поражающих воображение своей детализацией, однако за каждым таким шедевром скрывается скрупулёзный текстовый запрос. Многие обыватели грезят идеей вбить пару слов и получить готовый арт, но суровая реальность быстро расставляет всё по местам. Исконно правильная структура требует понимания весов, работы с токенами и грамотного использования негативных установок. Часто натыкаешься на откровенный брак, где у людей по шесть пальцев, а перспектива уходит в бесконечность. Но чтобы не ошибиться, нужно всегда иметь под рукой добротный рабочий каркас, который останется лишь адаптировать под конкретную задачу.
Нереальный визуал и кинематографичное видео в пару кликов 🎬
Нужен крутой концепт-арт, реалистичная анимация или профессиональный апскейл? Теперь у вас есть единый доступ к лучшим визуальным нейросетям планеты: Midjourney, Runway, Kling и Sora. Улучшайте качество готовых роликов до максимума с помощью встроенных ИИ-инструментов. Никаких сложных настроек, мощного ПК или зарубежных карт. Всё работает прямо в браузере или в Telegram-боте!
Откройте новые горизонты для творчества. Жмите на ссылку, регистрируйтесь и создавайте шедевры 👉 https://clck.ru/3RNCRL
Портретная фотография: эстетика и свет
Задача не из лёгких. Довольно часто генерация лиц людей превращается в настоящую лотерею, где львиная доля результатов отправляется прямиком в корзину из-за пластиковой кожи или сломанной анатомии. Ведь именно портрет приковывает внимание зрителя в первую очередь. К слову, буквально пару лет назад добиться реалистичной текстуры эпидермиса было практически невозможно без долгих часов в графических редакторах, но сейчас ситуация кардинально изменилась. Поможет здесь чёткий изысканный запрос. Один из самых популярных рабочих вариантов звучит так:
raw photo, a close up portrait of a 30 y.o beautiful woman, highly detailed, 85mm lens, f/1.8, golden hour lighting, cinematic natural skin texture, masterpiece, best quality
Далее следует добавить уточнения по одежде, заставив модель облачиться во что-то конкретное, вписав это перед параметрами объектива. Для детских фото ваше сгенерированное чадо потребует особого внимания к параметру возраста, иначе пропорции лица «уползут». Разумеется, не стоит забывать о негативном поле. Туда стоит отправить такую конструкцию:
(deformed iris, deformed pupils, semi-realistic, cgi, 3d, render, sketch, cartoon, drawing, anime:1.4), text, close up, cropped, out of frame, worst quality, low quality, jpeg artifacts, ugly, duplicate, morbid, mutilated, extra fingers, mutated hands, poorly drawn hands, poorly drawn face, mutation, deformed, blurry, dehydrated, bad anatomy, bad proportions, extra limbs, cloned face, disfigured, gross proportions
Творит чудеса этот набор отменно. Кошелёк станет легче только от оплаты аренды облачного сервера, если вы генерируете не на домашнем ПК.
Как добиться киношной картинки?
Что насчёт фасона? Точнее, атмосферы кадра. Лучший вариант — использовать терминологию профессиональных операторов. Дело в том, что алгоритмы отлично понимают названия плёнок и типы освещения. Это связано с тем, что в обучающей выборке присутствовал огромный пласт размеченных кадров из кинематографа. Естественно, для получения грандиозного результата придётся немного поэкспериментировать и рассмотреть обе стороны медали. Безусловно, хорошим стартом станет такой английский текст:
cinematic shot, futuristic cyberpunk city street at night, neon lights, rain reflections, a lone figure walking, blade runner style, anamorphic lens, 35mm photograph, film grain, muted colors, moody atmosphere, 8k resolution, photorealistic
И всё-таки изюминка кроется именно в параметре «film grain» — он убирает ту самую наляпистость и цифровую стерильность. А если ещё вспомнить про соотношение сторон, то лучше выставлять разрешение тысяча двести восемьдесят на семьсот двадцать пикселей. Зрелище получается впечатляющим. Да и самим зрителям приятнее смотреть на кадр с привычными киношными пропорциями. Впрочем, иногда всплывут артефакты в виде лишних источников света, но они довольно просто убираются с помощью инпейнта.
Архитектурный рендер
Кирпичная шероховатая кладка, нагретая лучами послеполуденного солнца. С таких мелких деталей обычно начинается проработка интерьерных и экстерьерных сцен. Архитектурная визуализация тяготеет к максимальной строгости форм. В представлении многих дизайнеров процесс не сложный, но кропотливый. Ведь машина часто искажает перспективу, и большая часть визуального мусора оседает именно на прямых линиях. Не стоит перегружать запрос лишними художественными эпитетами, лучше сосредоточиться на материалах. К первой группе относится такой проверенный промт:
architectural photography, modern minimalist living room, huge windows with forest view, concrete floor, white leather sofa, wooden coffee table, daylight, soft shadows, octane render, unreal engine 5, architectural digest, hyperdetailed, realistic lighting
Здесь мягкий свет льётся рекой сквозь панорамные окна. Следующий важный критерий — отсутствие людей в кадре, для этого в негативный блок вносится слово «human, people, silhouette». Кстати, десятилетие назад подобный рендер просчитывался бы железом несколько суток (около семидесяти часов), а сейчас результат появляется за пятнадцать секунд. Вторая группа — экстерьеры. Дом, увенчанный многоскатной крышей, облицованный клинкером, окружённый стриженным газоном… Описать это можно так:
exterior architectural photography, modern two-story luxury house, wooden and dark metal facade, large glass panels, twilight lighting, warm interior lights, manicured lawn, gravel driveway, 8k, photorealistic
Ну и, конечно же, не нужно скупиться на количество шагов сэмплинга — ставьте минимум сорок. Это надёжно. Потому что проверено. Временем.
Стоит ли усложнять негативный промт?
Вовсе нет. Многие считают, что огромная простыня из сотен слов в отрицательном запросе — это универсальный спасательный круг. На самом деле, переизбыток ограничений лишь путает математическую модель. ИИ начинает игнорировать важные аспекты, пытаясь угодить всем запретам одновременно, и генерация теряет свой колоритный самобытный характер. Вся суть в том, что нейросеть выделяет определённый вес каждому токену. Тем более, что длинные списки сильно бьют по бюджету токенов. Оптимально применять короткие, но ёмкие конструкции, усиленные скобками. Кроме того, для стилизованных изображений отлично работает лаконичный набор:
(worst quality, low quality:1.4), monochrome, zombie, overexposure, watermark, text, bad anatomy, bad hand, extra hands, missing fingers
Разложить по полочкам этот нюанс желательно ещё на этапе освоения интерфейса, изучив основные постулаты. А вот если нужно сгенерировать сложную технику, то последним в списке идёт запрет на асимметрию: «asymmetry, broken parts». Но есть здесь и свои подводные камни. Например, если персонаж не стоит на ногах, а сидит или лежит, стандартный негатив может отсечь половину тела.
Коммерческая фуд-фотография: сочные детали
Капли конденсата на холодном стакане или пар над свежей выпечкой. Сразу бросается в глаза, когда нейросеть улавливает физику света на продуктах. Для генерации еды стоит использовать максимальную конкретику, где солирует текстура. Запрос может выглядеть так:
commercial food photography, a juicy double cheeseburger on a rustic wooden board, melting cheddar cheese, crispy bacon, fresh lettuce, sesame bun, flying flour dust, splashing droplets, moody dark background, studio strobe lighting, macro lens, 100mm, highly detailed, 8k, food magazine cover
С одной стороны, модель легко рисует бургеры, с другой — часто путает количество булочек или слоёв мяса. Тут выручит использование дополнительных масок. Обойдётся такая махинация затратами видеопамяти, однако результат того стоит, даже если у вас бюджетный компьютер. Ложка дёгтя кроется в том, что некоторые исконно региональные блюда алгоритм может превратить во что-то неоднозначное. Да и самим шеф-поварам будет сложно узнать своё творение без использования натренированных моделей.
Иллюстрации в стиле дарк-фэнтези: мрачная эстетика
Бомонд цифровых художников часто обращается к этому направлению для создания концепт-артов. Эстетичны ли такие мрачные картины? Само по себе обилие теней не отличается красотой, но щепетильный подход к композиции меняет всё. Венчает такие генерации обычно сложный вычурный доспех или готическая архитектура. Чтобы получить внушительный результат, стоит использовать такой шаблон:
dark fantasy concept art, a terrifying necromancer standing in a graveyard, glowing green eyes, wearing ragged black robes, holding a skull staff, heavy fog, full moon, gothic ruins in background, greg rutkowski style, frank frazetta, dramatic chiaroscuro lighting, intricate details, 8k, digital painting
Нельзя не упомянуть, что имена известных авторов всё ещё работают превосходно. Хотя и существуют споры об авторских правах, но для личных проектов это настоящий кладезь стилистики. Окунуться в эту атмосферу поможет и добавление конкретных цветов — например, «crimson red and deep teal». Заслуживает истинного уважения то, как алгоритм смешивает эти оттенки.
Экспериментируя с текстовыми вводами, важно помнить о балансе между фантазией и технической точностью. Каждый добавленный токен вносит свою лепту в финальное изображение, и порой удаление всего одного слова кардинально меняет всю композицию. Безусловно, представленные выше шаблоны станут отличным фундаментом. Вдумчивый подход к составлению запросов обязательно порадует домочадцев и строгих заказчиков качественными артами. Удачи в бесконечных творческих поисках, пусть каждая новая генерация превосходит предыдущую. Перевоплощение завершено.