В сети представлено огромное количество невероятных изображений, сгенерированных искусственным интеллектом, от которых у рядового пользователя буквально захватывает дух. Многие считают, что для создания подобного шедевра достаточно написать пару случайных слов, но на самом деле за каждой красивой картинкой кроется весьма скрупулёзный труд. Буквально десятилетие назад машинное обучение выдавало лишь абстрактные цветные пятна, а сейчас алгоритмы способны соревноваться с профессиональными художниками и именитыми фотографами. Вся суть в том, что нейросеть понимает нас абсолютно буквально, не додумывая смыслы там, где они не прописаны чётко. А если ещё вспомнить про особенности разных версий генеративных моделей, задача усложняется многократно. Но чтобы не ошибиться и получить желаемый результат, нужно грамотно формулировать техническое задание, превращая разрозненные мысли в точный текстовый запрос.
Как выбрать стилистику?
Задача не из лёгких. С чего начинается выбор? С определения базового направления, в котором будет работать искусственный интеллект. Один из самых популярных видов запросов подразумевает фотореализм, где алгоритм имитирует объектив конкретной камеры, снимающей при определённых настройках. Далее следует цифровой арт, тяготеющий к ярким краскам и нарочитой нереалистичности происходящего. Отдельно стоит упомянуть имитацию традиционной живописи, когда машина старательно воспроизводит мазки масляной краски или лёгкость акварели. Последним в перечне идёт трёхмерная графика, напоминающая кадры из современных анимационных фильмов. Естественно, смешивать эти направления в одном запросе не стоит. Ведь результат получится грязным и невыразительным. Лучше остановиться на чём-то одном.
Освещение
Без правильного света любой добротный детальный концепт превратится в плоскую картинку. К слову, именно этот нюанс чаще всего игнорирует обыватель, когда пытается создать свой первый шедевр. Стоит отметить, что нейросети отлично понимают фотографические термины. Сначала можно задать мягкий утренний свет, пробивающийся сквозь листву деревьев. Затем добавить контровое освещение, создающее светящийся контур вокруг главного героя. Ну и, наконец, усилить эффект объёмными лучами, прорезающими пыльный воздух старого помещения. Это же правило касается и студийной съёмки. Разумеется, придётся прописать наличие софтбоксов, цветных фильтров и отражателей. Зрелище получается впечатляющее, когда холодный синий неон с одной стороны контрастирует с тёплым оранжевым светом с другой.
Композиция и ракурс
Сложно ли выстроить кадр текстом? Да, но результат того стоит. В представлении многих пользователей машина сама выберет лучший угол, однако на практике искусственный интеллект часто центрирует объект, делая композицию невероятно скучной. Поэтому не скупитесь на кинематографические термины. Для начала стоит задать общий план, чтобы показать масштаб происходящего и окружающий антураж. Затем можно сместить фокус, используя съёмку снизу вверх, что придаст объекту внушительный монументальный вид. А вот оригинальное название ракурса «с высоты птичьего полёта» творит чудеса, когда нужно показать раскинувшийся мегаполис. К тому же, не стоит забывать про правило третей. Хотя и прописать его текстом довольно сложно, грамотное указание расположения объектов в кадре серьёзно улучшает восприятие итоговой работы. Главное достояние хорошего промта — чёткая структура.
Портрет в киберпанке: детализация
Капли дождя медленно стекают по стеклу неоновой витрины, за которой скрывается мрачный переулок. Именно с такой мелкой детали часто начинается создание атмосферного портрета в стиле киберпанк. Чтобы получить колоритный запоминающийся образ, нужно разложить по полочкам каждую деталь. Сначала мы описываем самого персонажа, облачённого в кожаную куртку с металлическими вставками. Затем добавляем аугментации, светящиеся провода и голографические интерфейсы, отражающиеся в его глазах. Тем более, что именно такие мелочи приковывают внимание зрителя. К первой группе атрибутов можно отнести оружие или гаджеты, которые герой держит в руках. Ко второй — элементы окружения, вроде пролетающих мимо дронов или рекламных вывесок. Львиная доля успеха здесь зависит от того, насколько скрупулёзно вы пропишете материалы. Металл должен блестеть, кожа — иметь потёртости, а неон — излучать мягкое свечение.
Стоит ли экономить слова?
Казалось бы, чем короче запрос, тем больше свободы у нейросети. Но есть и минусы. Обязательно ли расписывать всё до мельчайших подробностей? Вовсе нет. Однако короткие фразы часто приводят к непредсказуемым результатам, где всплывут анатомические ошибки или логические несостыковки. С одной стороны, излишняя наляпистость текста путает алгоритм, с другой — недостаток информации заставляет его брать шаблоны из обучающей выборки. Поэтому оптимальный объём составляет от тридцати до семидесяти слов. И всё-таки, каждое слово должно иметь вес. Откажитесь от пустых эпитетов вроде «красивый» или «хороший». Замените их на конкретные характеристики. Вместо абстрактной красоты лучше использовать термины вроде «симметричное лицо», «золотое сечение» или «детализированная текстура кожи». Это не сильно ударит по кошельку времени, но значительно повысит качество генерации.
Исторический портрет
Римская империя всегда вызывала неподдельный интерес у творцов. Сочиняя промт для исторического сюжета, стоит окунуться в эпоху с головой. Например, доспехи легионера, выкованные из бронзы, украшенные чеканкой, скреплённые кожаными ремнями, выглядят на изображениях невероятно реалистично, если использовать правильные термины. Безусловно, здесь солирует фактура материалов. Грубая шерсть туники, блестящий металл гладиуса, пыль на походных сандалиях. А начать нужно с окружения. Пусть это будет залитый солнцем Форум, где мраморные колонны отбрасывают резкие тени на брусчатку. Впрочем, не стоит перебарщивать с массовкой. Алгоритм пока ещё с трудом справляется с толпами людей, превращая их лица в жуткие маски. Лучше сосредоточиться на одном или двух персонажах, проработав их до идеала. Настоящий кладезь идей для таких запросов можно найти в книгах по истории искусств.
Архитектурный пейзаж
Поиск идеального дома для многих начинается с визуализации. Выбор стилей здесь поистине огромный. Начать стоит с классического шале, затерянного в заснеженных Альпах. Деревянный сруб, покрытый толстым слоем снега, освещённый тёплым светом из окон, создаёт невероятное ощущение уюта. Следующий важный критерий — окружение. Густой еловый лес, возвышающиеся на заднем плане горы, лёгкая дымка морозного тумана. Само собой, нужно уточнить время суток. Пусть это будут сумерки, когда небо окрашивается в глубокие синие тона, а снег искрится в свете фонарей. Да и самим зрителям комфортнее рассматривать контрастные изображения. Если же вы тяготеете к современности, спасательный круг в виде стиля хай-тек всегда придёт на помощь. Бетон, стекло, строгие геометрические формы и панорамные окна, в которых отражается закатное солнце.
Подводные камни генерации
Процесс этот не сложный, но крайне кропотливый. Неоднозначный пугающий результат часто получается при попытках сгенерировать руки или сложные механизмы. Дело в том, что нейросети не понимают анатомию и физику, они лишь копируют паттерны. Исконно проблемным местом остаются пальцы (их часто бывает шесть или семь), а также пересечения объектов. Как избежать этих ошибок? К сожалению, стопроцентного рецепта нет. Однако можно использовать хитрые махинации с ракурсом. Например, прописать, что руки спрятаны в карманы или находятся за спиной. Также выручит крупный план лица, когда конечности просто не попадают в кадр. Ну, а если вы генерируете сложный механизм, готовьтесь к тому, что шестерёнки будут висеть в воздухе. Это тяжёлый, но весьма увлекательный процесс проб и ошибок, который требует терпения.
Практические примеры
Ложка дёгтя в любом обучении — отсутствие практики. Поэтому давайте рассмотрим конкретные текстовые конструкции. Для создания реалистичного портрета девушки в кафе можно использовать такой запрос.
Фотореалистичный портрет молодой женщины, сидящей за столиком в парижском кафе, пьющей кофе. Мягкий утренний свет, глубина резкости, объектив пятьдесят миллиметров, кинематографическая цветокоррекция, высокая детализация кожи, плёночное зерно.
А вот запрос для создания фантастического пейзажа.
Инопланетный город, парящий в облаках, водопады, падающие в бездну, фиолетовое небо с двумя лунами, биолюминесцентные растения, стиль цифровой живописи, эпичное освещение, разрешение восемь тысяч пикселей.
Обе стороны медали здесь — это точность и фантазия. Вычурный сложный текст не всегда даёт лучшую картинку, но он направляет алгоритм в нужное русло. Нельзя не упомянуть и про генерацию интерьеров.
Роскошная гостиная в стиле ар-деко, тёмные изумрудные стены, золотые акценты, бархатный диван, хрустальная люстра, мраморный пол, реалистичные тени, архитектурная фотография, мягкий заполняющий свет.
Каждое слово здесь вносит свою лепту в итоговый результат. Оседает в памяти и запрос на создание еды, которая часто используется в рекламе.
Сочный бургер с говяжьей котлетой, расплавленный сыр, свежие листья салата, капли соуса на деревянной доске, макросъёмка, тёмный фон, студийное освещение, пар над мясом.
Зрелище получается настолько аппетитным, что хочется немедленно перекусить. Скрупулёзный подбор слов здесь играет решающую роль. Экспериментируйте с различными стилями, комбинируйте неожиданные элементы и не бойтесь ошибаться. Удачи в создании ваших цифровых шедевров, пусть каждая генерация приносит только положительные эмоции и порадует домочадцев!