В сети гуляет огромное количество однотипных изображений, сгенерированных нейросетями, от которых обыватель уже начинает откровенно уставать. Грезят идеальным результатом многие авторы, однако на практике львиная доля времени уходит на мучительный подбор точных формулировок и борьбу с пластиковым глянцем, который так бросается в глаза. Плохой сон — это далеко не всегда результат тяжёлого дня, порой это следствие многочасовых попыток заставить алгоритм нарисовать правильные пальцы или корректную геометрию теней. Но чтобы не ошибиться, нужно осознать, что готовые текстовые конструкции требуют адаптации под конкретный движок.
Все топовые нейросети в одной подписке! 🚀
Устали оплачивать десятки сервисов отдельно и постоянно включать VPN? Появилась платформа, которая объединяет более 90 передовых ИИ в одном окне. Пишите тексты с новейшими версиями GPT и Claude, создавайте шедевры в Midjourney и генерируйте видео в Sora и Kling. Тексты, изображения, видео и музыка — всё работает на любых устройствах без «танцев с бубном».
Попробуйте бесплатно прямо сейчас! Переходите по ссылке и получите бонусные токены для старта 👉 https://clck.ru/3RNCRL
Стилистика киберпанка
Сложно ли уйти от банального неона? Да, но результат того стоит. Ведь именно этот сеттинг тяготеет к излишней наляпистости, если пустить генерацию на самотёк. Один из самых популярных подходов начинается с указания конкретной камеры и типа плёнки, далее следует детальное описание грязных улиц, после чего добавляются эффекты влажного асфальта и дыма. Например, отличный добротный запрос звучит так:
«cinematic shot, 35mm lens, portrait of a tired female cyborg mechanic, oil smudges on face, worn heavy exoskeleton, damp dark alleyway background, highly detailed trash on ground, neon reflections in puddles, rim lighting, 8k resolution, volumetric fog»
Разумеется, здесь солирует именно сочетание фокусного расстояния объектива и погодных условий.
Капли дождя стекают по металлическому визору, искажая отражение рекламных вывесок. Чтобы добиться такой внушительной детализации, не стоит перегружать алгоритм абстрактными понятиями вроде «эпичный» или «прекрасный». Лучше отказаться от пустых эпитетов в пользу физических свойств материалов. К слову, буквально пару лет назад художники вписывали десятки имён известных иллюстраторов с ArtStation, но сейчас такой подход лишь размывает фокус. Да и самому цифровому мозгу комфортнее работать с чёткими указаниями на фактуру.
Как добиться фотореализма?
Многие считают, что достаточно добавить тег «реализм», но на самом деле это приводит лишь к усреднённой журнальной картинке, лишённой жизни. Вся суть в том, что настоящая фотография несовершенна. Изображение, снабжённое лёгким плёночным зерном, дополненное хроматической аберрацией, украшенное микроскопическим размытием на краях линзы, выглядит куда убедительнее гладкого рендера. Естественно, свою лепту вносит и свет, который в правильных руках творит чудеса.
Наряд для избранных. Это в полной мере касается макросъёмки текстур кожи или ткани. Полноценный рабочий промт формируется через указание конкретной модели фотоаппарата.
«Medium format photography, Hasselblad H6D-100c, raw photo, portrait of an elderly fisherman, deep wrinkles, sun-damaged skin, salt in beard, natural overcast lighting, seaside background out of focus, hyper-detailed eyes, subsurface scattering, Kodak Portra 400»
Нужно отметить, что именно упоминание плёнки «Kodak» даёт ту самую тёплую, слегка винтажную цветопередачу. Впрочем, если нужна более холодная гамма, имеет смысл попробовать «Fujifilm Superia».
Мрачное фэнтези
Антураж тёмных миров всегда приковывал внимание цифровых творцов, а цифровой бомонд и вовсе сделал этот стиль одним из самых востребованных. Зрелище удручающее, но невероятно притягательное, когда на экране вырисовываются исполинские руины древних замков. Тем более, что здесь можно смело использовать вычурный изысканный дизайн брони и оружия, заставляя персонажа облачиться во что-то поистине пугающее. Главное — угадать с палитрой. Не скупитесь на описание атмосферных явлений, таких как клубящийся туман, пепел, падающий с неба, или искры от костра.
Запрос должен позволить зрителю с головой окунуться в атмосферу безысходности.
«Concept art, dark fantasy, grimdark style, imposing gothic cathedral ruins, overgrown with black thorns, a lone knight in tarnished plate armor kneeling, holding a glowing cursed broadsword, heavy mist, monochromatic palette with red accents, dramatic shadows, rough oil painting strokes»
Безусловно, здесь колоссальную работу выполняет указание на грубые мазки масляной краски. Это же правило касается и любых других артов, где требуется сымитировать традиционные холсты, ведь без текстуры мазка нейросеть скатится в цифровое мыло.
Стоит ли усложнять освещение?
Обязательно ли расписывать каждый источник света в студии? Вовсе нет. Однако грамотная работа с тенями мгновенно избавляет от пресловутой плоскости, превращая чадо ваших экспериментов в шедевр. Дело обстоит так: ещё в эпоху классической голландской живописи мастера поняли силу светотени, а Рембрандт и вовсе сделал её своей визитной карточкой в семнадцатом веке. И всё же переносить этот исторический опыт в промты нужно со скрупулёзной осторожностью. Всплывут досадные ошибки, если смешать студийный свет и палящее естественное солнце в одном предложении без чёткого разделения планов.
Выручит направленный жёсткий свет. Начинать построение сцены желательно с главного источника, во-вторых, добавлять мягкий заполняющий контур, ну и, наконец, прописывать цветные рефлексы. Образец для фешн-съёмки:
«Fashion editorial, high fashion model, sharp facial features, minimalist white dress, stark chiaroscuro lighting, split lighting technique, harsh shadows on right side of face, soft blue fill light, pitch black background, 85mm lens, cinematic depth of field»
Кстати, использование профессиональных терминов вроде «split lighting» (разделяющее освещение) алгоритм считывает превосходно, что избавляет от необходимости писать длинные описания.
Архитектурные концепты
С геометрией пространств дело обстоит гораздо сложнее, чем с портретами. Алгоритм часто начинает плодить лишние окна, нарушать перспективу или игнорировать законы гравитации. Чтобы избежать подобных махинаций со стороны движка, процесс создания текста лучше разложить по полочкам хронологически. Сначала закладывается массивный фундамент и общий объём здания, затем возводятся несущие стены и крыша с указанием материалов, после чего прорубаются панорамные окна и добавляются мелкие детали фасада. Только в самом конце настраивается окружение, в котором оседает пыль мегаполиса.
Массивный брутальный фасад. Именно он венчает большинство современных антиутопических пейзажей, поражая воображение своей монументальностью.
«Architectural visualization, brutalist building, raw concrete texture, massive geometric shapes, cantilevered terraces, overgrown with hanging vines, warm sunset light hitting the concrete, tiny human figures for scale, clear sky, octane render, architectural photography, 16k»
К тому же, добавление фразы «tiny human figures for scale» (маленькие фигуры людей для масштаба) заставляет сеть соблюдать правильные пропорции этих грандиозных строений.
Оптимизация весов
Ювелирная работа. Это требует огромного терпения. Потому что результат абсолютно непредсказуем. Довольно часто одно-единственное слово полностью перетягивает на себя генерацию, разрушая первоначальную задумку. В таких неоднозначных ситуациях спасательным кругом становятся скобки и цифры, регулирующие вес токена. Само собой, синтаксис зависит от конкретной платформы (Midjourney, Stable Diffusion или DALL-E), но базовые постулаты схожи. Выделение приоритетных элементов — это щепетильный труд, который не сильно ударит по кошельку в плане платных минут генерации, так как брака становится в разы меньше.
Не стоит перебарщивать с максимальными значениями весов. В противном случае картинка просто развалится на цветовой шум или выдаст жуткие артефакты. Оптимальный взвешенный вариант выглядит так:
«(masterpiece:1.2), (photorealistic:1.1), 1girl, solitary witch in dark forest, (glowing green eyes:1.4), holding a lantern, ancient twisted trees, (heavy fog:1.3), muted colors, high contrast»
А если ещё вспомнить про негативные промты, куда вписываются все нежелательные элементы, то чистота эксперимента возрастает кратно. Ложка дёгтя здесь заключается лишь в том, что каждый апдейт нейросети слегка меняет её чувствительность к этим математическим значениям.
Исконно акварельная техника
Впитывающая шероховатая бумага мгновенно забирает пигмент, оставляя полупрозрачные цветные разводы. Имитация этого сложного физического процесса в цифровой среде заслуживает истинного уважения. Самобытный колоритный рисунок получается только тогда, когда в запросе детально учтены особенности растекания краски. Подводные камни кроются в том, что искусственный интеллект тяготеет к чётким контурам и обожает делать линии слишком резкими. А вот сгладить этот неприятный нюанс помогает использование специфических терминов из традиционной живописи, которые заставляют пигмент «расплываться».
Мягкость форм выступает на первый план.
«Watercolor illustration, delicate washes, blooming watercolor technique, portrait of a red fox sleeping curled up, soft edges, splatters of orange and teal paint, cold pressed watercolor paper texture, minimalist white background, ethereal and dreamy aesthetic»
Ну и, конечно же, упоминание фактуры картона (cold pressed paper) даёт ту самую изюминку, без которой цифровой арт остаётся просто скучной, плоской штамповкой. Грамотно составленный текст, где продуманы обе стороны медали, всегда стоит на ногах гораздо увереннее случайного набора слов. Удачи в покорении нейросетевых алгоритмов, пусть каждый ваш запрос генерирует исключительно потрясающие визуальные миры!