В сети представлено множество галерей с якобы готовыми запросами для генерации изображений, от которых рядовой обыватель приходит в полный восторг. С одной стороны, обилие текстовых формул должно облегчать работу инженерам, с другой — львиная доля этих подборок выдаёт откровенно грязный результат с поехавшей анатомией. Буквально год назад для получения сносной картинки хватало пары слов, но сейчас алгоритмы требуют предельно скрупулёзного подхода к синтаксису. А если ещё вспомнить постоянные обновления моделей, то голова идёт кругом от поиска нужных параметров. Но чтобы не ошибиться в генерации, нужно собрать собственную базу проверенных текстовых конструкций.
Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈
Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.
Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL
Где искать вдохновение?
Сложно ли найти добротный рабочий шаблон? Безусловно, процесс этот отнимает массу времени. Наткнувшись на красивый арт в сообществе, первым делом обращаешь внимание на освещение. Дело в том, что именно свет солирует в удачном кадре. Кстати, многие авторы скрывают свои наработки, опасаясь конкуренции и банального плагиата. Впрочем, настоящим спасательным кругом становятся открытые библиотеки вроде Civitai или закрытые серверы энтузиастов. Там среди тысяч мусорных сообщений оседает настоящий кладезь полезных токенов. Да и самим художникам комфортнее обмениваться опытом в живой, неформальной среде. Не стоит сбрасывать со счетов и агрегаторы. Однако слепо копировать их всё-таки не стоит, лучше вдумчиво адаптировать строки под свои текущие нужды. Ведь бездумный копипаст быстро заводит в тупик.
Портретная съёмка в нейросетях
Резкие тени на скулах. Прорисованные поры кожи. Блики в глазах. Всё это задаётся набором конкретных команд. Для получения реалистичного женского портрета отлично срабатывает связка из указания фокусного расстояния, названия плёнки и типа освещения. Запрос, например, может начинаться с описания девушки тридцати лет, облачённой в строгий твидовый костюм, сидящей за столиком в парижском кафе. Далее следует прописать объектив, скажем, восемьдесят пять миллиметров. Потом добавляем конкретную марку, пусть это будет Kodak Portra 400. Ну и, наконец, замыкаем конструкцию мягким утренним светом.
Зрелище получается удручающее, если забыть про негативные веса. Ведь именно этот инструмент отсекает наляпистость и отталкивающие пластиковые текстуры.
К тому же, добавление параметров вроде кинематографичного освещения и объёмного тумана творит чудеса с глубиной сцены.
Предметная генерация
Задача не из лёгких. Особенно если речь идёт о коммерческой фуд-фотографии или макросъёмке ювелирных изделий. В представлении многих достаточно написать «красивое кольцо», однако алгоритм выдаст нечто невразумительное. Начать нужно с точного позиционирования объекта в кадре. Сперва задаём главный предмет, окружённый сопутствующим тематическим антуражем. Затем прописываем макрообъектив в сто миллиметров. Следом фиксируем диафрагму на значении f/2.8 для мягкого, естественного размытия заднего фона. Разумеется, не лишним будет указать студийный свет, выставленный под углом сорок пять градусов. Всплывут ли ошибки при такой схеме? Естественно, с первого раза идеальный глянцевый блик не получится. Но путём изменения мощности виртуальных софтбоксов результат быстро приходит в норму. Стоит немного покрутить веса токенов, и картинка оживает.
Архитектура Токио: неоновые улицы
Капли дождя на раскалённом асфальте. Именно с такой мелкой детали обычно стартует создание атмосферного городского пейзажа. Японская столица всегда приковывала внимание цифровых художников и позволяла окунуться в киберпанк. Когда-то тихое место сейчас превратилось в кипящий мегаполис, и нейросети отлично улавливают этот визуальный контраст. Запрос формируется из описания узкого переулка Синдзюку, густо залитого неоновым светом. В качестве камеры отлично подходит средний формат Hasselblad. Исконно восточные цвета, смещённые в сторону бирюзового и пурпурного, задаются параметрами цветокоррекции прямо в тексте. Конечно, генератор часто тяготеет к излишней детализации мусора на улицах, однако это легко исправляется снижением значимости соответствующих слов. Тем более, что именно лёгкая небрежность вносит свою лепту в общую самобытную картину. А вот вычурный идеализм лишь вредит жанру.
Как избежать пластикового эффекта?
Идеально гладкие лица грезят в кошмарах любого нейро-фотографа. Вся суть в том, что базовые веса моделей обучены на сильно отретушированных снимках из журналов. Не стоит скупиться на слова вроде «несовершенства кожи» или «сырое фото». К первой группе спасительных модификаторов относятся шумы аналоговой плёнки. Следующий важный критерий — отсутствие студийного перфекционизма в позах моделей. Отдельно стоит упомянуть использование правильных алгоритмов выборки (обычно выбирают DPM++ 2M Karras).
Не перегружайте строку сотней бесполезных эпитетов вроде шедевра или лучшего качества. Внимание машины они лишь сбивают.
Намного лучше работает указание конкретного года съёмки. Фотография тысяча девятьсот девяносто пятого года автоматически получит нужный зернистый фильтр. Да и сама композиция станет более приземлённой.
Ограничения и негативные веса
Без них никуда. Это своеобразный щит от галлюцинаций искусственного интеллекта. Многие новички игнорируют поле ввода для исключений, но на самом деле именно там кроется секрет чистой картинки. Начинать заполнение обратного словаря желательно с отсечения мутаций и лишних конечностей. Далее в ход идут технические ограничения на размытие, водяные знаки и артефакты сжатия. Запрет на чрезмерную насыщенность цветов и 3D-рендеры идёт в этом списке последним. При перегрузке основного промта лишние детали отсекает именно эта нижняя строка. Сложные махинации с кодом здесь не нужны. К слову, в сети можно найти готовые текстовые инверсии, заменяющие сотни слов одним коротким триггером. И всё-таки полностью полагаться на них не стоит. Периодически базу исключений нужно чистить и обновлять. Иначе в кадр проникнет неприятный, мыльный налёт.
Динамика в кадре
Заморозить движение крайне сложно. Требуется щепетильный подбор глаголов и обстоятельств образа действия. Спортивный автомобиль, входящий в крутой поворот, требует указания короткой выдержки. Скорость, возникшую в результате дрифта, отлично подчеркнёт размытие фона. Для этого вписываем параметр «motion blur» и указываем выдержку в одну тысячную секунды. Нужно отметить, что брызги воды или летящая пыль значительно усиливают эффект присутствия. Камера, расположенная низко к земле, добавит агрессивности ракурсу. Безусловно, кузов машины может получиться слегка искажённым из-за динамики. Но этот досадный нюанс легко правится инструментами локальной перерисовки. Не забывайте экспериментировать с направлением источника света, чтобы чётче выделить аэродинамические линии.
Стоит ли копировать чужие запросы?
Обязательно ли изобретать велосипед? Вовсе нет. Многие считают зазорным брать чужие наработки, но на самом деле это лучший способ понять механику генерации. Разложив сложный многоэтажный промт по полочкам, можно быстро выявить закономерности взаимодействия токенов. Но есть и обе стороны медали. Чужой колоритный стиль быстро приедается и становится узнаваемым. Поэтому скопированный базис желательно модифицировать до неузнаваемости. Сначала заменяется главный субъект. Позже переписывается окружение. Завершающим штрихом полностью меняется стилистика освещения. Таким образом, первоначальная конструкция служит лишь надёжным каркасом. Да и сам процесс адаптации довольно увлекателен. Не сильно ударит по кошельку и использование бесплатных локальных интерфейсов, где можно бесконечно экспериментировать с чужими формулами. Главное — вовремя остановиться.
Поиск своего визуального языка сквозь дебри текстовых команд — процесс не быстрый, но крайне захватывающий. Безусловно, с выходом новых версий моделей часть старых трюков перестанет работать. Тем более, нейросети развиваются просто внушительными темпами, ломая устоявшиеся постулаты. Однако понимание основ композиции, физики оптики и поведения света всегда останется крепким фундаментом для любого специалиста. Экспериментируйте с выдержкой, не бойтесь добавлять странные материалы в описание и смело миксуйте плёночные профили. Собранная личная коллекция удачных формул обязательно порадует превосходными результатами и сэкономит массу нервов на будущих коммерческих проектах.