В сети представлено множество невероятно детализированных картинок, сгенерированных нейросетями, и у обывателя складывается ложное впечатление, будто шедевр рождается буквально по щелчку пальцев. На самом деле за каждым выверенным рендером стоят часы кропотливой работы, подбора правильных весов и непрерывной борьбы с визуальными галлюцинациями алгоритма. Львиная доля времени уходит именно на шлифовку текстового запроса, где одно случайно добавленное слово способно полностью разрушить выстроенную композицию. Ведь нейросеть мыслит не цельными художественными образами, а токенами, цепляясь за самые неожиданные и второстепенные детали. Но чтобы не ошибиться в этой щепетильной настройке, стоит заранее вооружиться проверенными формулами и понять внутреннюю логику цифрового художника.
Зачем переплачивать за нейросети? Экономьте сотни долларов каждый месяц 💸
Оплачивать Midjourney, премиум-версии ChatGPT, видео- и аудио-генераторы по отдельности — это безумно дорого и неудобно. Этот сервис решает проблему! Получите полный пакет премиум-моделей (более 90 топовых нейросетей) по цене одной доступной подписки. Безлимитные возможности, никаких скрытых платежей и сгорающих токенов при активном тарифе.
Перестаньте платить за 10 разных сайтов. Выбирайте выгоду и творите без ограничений 👉 https://clck.ru/3RNCRL
Как добиться фотореализма?
Прямо с указания конкретной модели объектива стоит начинать создание фотографической сцены. Выбор оптики здесь довольно велик и напрямую влияет на перспективу. Снимаете крупный портрет? Тогда логично использовать 85mm lens. А вот для широких пейзажных планов лучше подойдёт 35mm. К слову, банальное словосочетание «ultra realistic» давно перестало работать должным образом, выдавая ту самую пластиковую наляпистость вместо живой картинки. Намного эффективнее прописывать тип плёнки, марку камеры и условия освещения. Отличный рабочий пример выглядит так:
«A street portrait of a tired mechanic in neon Tokyo, shot on Fujifilm Superia 400, 50mm lens, cinematic lighting, raw style –ar 16:9»
Это надёжно. Потому что проверено. Временем. И всё-таки не стоит забывать про суффикс –style raw, который буквально спасает от чрезмерной «вылизанности», заложенной в систему по умолчанию.
Предметная съёмка
Задача не из лёгких. Ведь коммерческий рендер требует скрупулёзного внимания к бликам, теням и фактуре материалов. Буквально десятилетие назад это было роскошью, требовавшей аренды студии и работы целой команды осветителей, но сейчас нейросеть творит чудеса. Конечно, добиться идеального мокапа с первого раза практически невозможно, однако правильный синтаксис значительно упрощает дело. К первой группе успешных запросов относится студийный свет с мягкими тенями. Далее следует жёсткое направленное освещение для создания драматичного эффекта. Попробуйте такой вариант:
«Minimalist flatlay of organic skincare cosmetics on a travertine stone, soft studio lighting, macro photography, neutral pastel colors, highly detailed –v 6.0»
Тем более, что именно такой изысканный визуальный ряд сейчас пользуется огромным спросом у брендов. С одной стороны, мы задаём чёткую геометрию, с другой — полностью контролируем атмосферу через тип света. Да и самим дизайнерам комфортнее работать с чистыми фонами без лишнего шума.
Стоит ли экономить слова?
Короткий лаконичный текст. Именно он довольно часто выдаёт самые непредсказуемые и живые результаты. Многие считают, что расписывание каждой пылинки в кадре гарантирует получение шедевра, но на самом деле алгоритм просто теряется в обилии инструкций. Оседает в памяти машины лишь начало запроса, тогда как длинный хвост описания практически игнорируется. Если вы хотите получить добротный результат, лучше отказаться от огромных полотен текста. Эффективнее использовать связки через двойное двоеточие для жёсткого распределения весов. Например:
«Cyberpunk city::2, rainy night, neon reflections, flying cars::-0.5»
Ну и, конечно же, не нужно бояться коротких фраз вроде «A lone astronaut walking on a mirror-like ocean, golden hour, ethereal vibe». Зрелище удручающее, если система начинает лепить лишние руки или предметы из-за сильной перегруженности промта. Поэтому скупость в словах часто становится тем самым спасательным кругом.
Архитектура и экстерьеры
В представлении многих генерация здания сводится к перечислению строительных материалов. Однако такой подход чреват получением скучной, абсолютно плоской картинки. Начинать нужно с архитектурного стиля, эпохи и типа освещения. Дело в том, что именно свет формирует объём любого строения. Хороший колоритный дизайн тяготеет к естественному освещению на закате или сложной системе интерьерной подсветки, пробивающейся сквозь окна. Кстати, отличной изюминкой станет указание конкретного журнала или архитектурного бюро. Заслуживает истинного уважения такой запрос:
«Exterior of a modern brutalist concrete villa built on a rocky cliff, huge glass windows, warm interior lighting, sunset hour, architectural photography in the style of Dezeen, 8k resolution –ar 16:9»
Естественно, на финальном рендере всплывут некоторые артефакты в виде странных лестниц, ведущих в никуда, но общая атмосфера грандиозного строения будет передана безупречно.
Технические параметры
Скрытые махинации. Они открываются только тем энтузиастам, кто готов бесконечно экспериментировать с суффиксами в самом конце строки. Разумеется, базовые соотношения сторон всем давно известны, но истинный бомонд цифрового искусства активно использует параметры странности и хаоса. Сильно ли они меняют исходную картину? Да, иногда до полной неузнаваемости. Параметр –c (значения от 0 до 100) отвечает за разнообразие сетки из четырёх первичных картинок. Если задать высокое значение, то все четыре варианта будут кардинально отличаться друг от друга композицией. А вот суффикс –w вносит самобытный, порой откровенно пугающий сюрреализм в генерацию. Не стоит перебарщивать с высокими цифрами, иначе результат серьёзно ударит по эстетическому восприятию. Довольно интересно работает комбинация:
«A retro-futuristic diner on Mars, neon lights, 1950s style –c 20 –w 150 –s 50»
Исконно человеческая фантазия вряд ли способна сходу выдать подобные нестандартные сочетания форм и кислотных оттенков.
Иллюстрации и графика
Здесь безоговорочно солирует векторная графика и традиционные художественные техники. Бумага, тушь, плотная акварель, линогравюра — всё это алгоритм понимает превосходно. Чтобы получить добротный рисунок, нет смысла прописывать настройки фотокамеры, достаточно указать саму технику. Отдельно стоит упомянуть имя конкретного художника, чей узнаваемый стиль вы хотите позаимствовать. К слову, смешивание двух кардинально разных авторов даёт тот самый грандиозный эффект, который так ценится в индустрии. Например:
«A whimsical treehouse deep in a glowing mushroom forest, watercolor and ink, in the style of Studio Ghibli mixed with Arthur Rackham, highly detailed, cozy atmosphere –ar 3:4 –niji 6»
Вся суть в том, что специализированный аниме-движок (вызываемый через –niji) намного лучше справляется с тонкими контурными линиями и стилизованной рисовкой. Безусловно, иногда бот генерирует вычурный шум вместо мелких деталей фона, но пара перегенераций обычно решает эту проблему. Да и кошелёк станет легче только в плане списанных минут быстрого времени GPU.
Бесшовные паттерны
Настоящий кладезь для дизайнеров обоев, тканей и упаковочной бумаги. Сгенерировать текстуру, которая будет идеально стыковаться сама с собой со всех четырёх сторон, довольно просто благодаря одному короткому суффиксу. Добавляет магию параметр –tile. При создании подобных изображений нужно мыслить ритмом и плотностью заполнения холста. Корпус узора, усиленный флористическими мотивами, отрисованный в пастельных тонах, снабжённый золотыми вкраплениями, всегда смотрится выигрышно. Попробуйте использовать такой промт:
«Seamless pattern of vintage botanical illustrations, ferns and wildflowers, dark green background, William Morris style, intricate details –tile –v 6.0»
Это роскошно. Ведь полученный квадрат можно бесконечно дублировать в любом графическом редакторе без видимых швов. Откажитесь от добавления теней или градиентов на задний план, так как они испортят бесшовность при склейке.
Портретная стилизация
Лица пожилых людей всегда вызывают особый, неподдельный интерес у криэйторов. Это связано с тем, что глубокие морщины, выраженная пигментация и пористая текстура кожи демонстрируют всю вычислительную мощь генератора. Многие грёзят о создании идеальных симметричных моделей (словно с обложки модного глянца), однако именно в мелких несовершенствах кроется настоящая, живая красота. Чтобы приковать внимание зрителя к глазам персонажа, стоит добавить в текстовый запрос упоминание дефектов старой плёнки или особенностей драматичного освещения. Рабочий и проверенный вариант:
«A cinematic tight close-up portrait of an elderly Scottish fisherman with deep wrinkles, weathered skin, wearing a yellow raincoat, natural overcast lighting, shot on 35mm film, dramatic shadows, highly detailed –style raw –v 6.0»
Обе стороны медали здесь предельно очевидны. С одной стороны, мы получаем пугающий своей гиперреалистичностью рендер. С другой — полностью теряем контроль над мелкими деталями заднего фона, который безжалостно размывается в глубоком боке. Впрочем, для выразительного портрета это только в плюс.
Персонажи
Наряд для избранных. Именно так можно назвать стабильные, многоракурсные концепт-арты, созданные нейросетью. Разложить по полочкам внешность выдуманного героя довольно сложно, ведь генератор так и норовит изменить черты его лица при малейшем смене ракурса. Выручит добавление фразы «character sheet» или «multiple poses». Сначала формируется общая стойка персонажа. Затем прорисовывается тактическая экипировка или магическая броня. И лишь в самом конце накладываются сложные текстуры ткани и мелкие царапины на металле. Этот внушительный трюк заставляет искусственный интеллект выдавать сразу несколько видов одного и того же объекта на одном большом холсте. Оцените мощь такого запроса:
«Character concept art of a cybernetic rogue, full body, multiple poses, turnaround sheet, wearing tactical gear, cyberpunk city background, digital painting, trending on ArtStation –ar 16:9»
Нужно отметить, что использование одинакового зерна (через параметр –seed) тоже вносит свою весомую лепту в стабилизацию визуального образа при последующих генерациях. Конечно, процесс этот не быстрый, но чертовски увлекательный. Придётся потратить немало усилий, чтобы облачить своего героя в идеально сидящий костюм.
Постоянная практика, помноженная на наблюдательность, решает абсолютно всё. Синтаксис и восприятие слов нейросетью меняются с выходом каждой новой, более продвинутой версии, старые хитрости быстро перестают работать, а на их место приходят новые, ещё не изученные нюансы. Не бойтесь ломать устоявшиеся текстовые структуры, смело скрещивайте несовместимые художественные стили и намеренно ошибайтесь в классических пропорциях. Ведь именно в моменты неожиданных технических сбоев алгоритм часто выдаёт свои самые гениальные, ни на что не похожие полотна. Смелые, порой безумные эксперименты с текстовыми запросами обязательно приведут к созданию потрясающих визуальных миров, а собранная библиотека личных промтов станет отличным решением для будущих масштабных проектов!