В сети представлено множество завораживающих картинок, сгенерированных нейросетями, и обыватель часто верит, что создать подобный шедевр можно буквально парой слов. На практике же грандиозный концепт часто оборачивается нелепой мазнёй с шестью пальцами и кривыми лицами, что сильно бьёт по энтузиазму начинающего творца. Плохой результат — это далеко не всегда вина алгоритма, чаще проблема кроется в непонимании машинной логики. В памяти пользователей прочно оседает миф о том, что искусственный интеллект читает мысли. Вся суть в том, что программа воспринимает текст как набор математических весов, а не как полёт свободной художественной фантазии. Но чтобы не ошибиться, нужно скрупулёзно изучить анатомию текстового запроса, превратив случайную генерацию в контролируемый процесс.
С чего начинается выбор? С определения базы
Холст ещё пуст. А курсор одиноко мигает в строке ввода. Начать нужно с самого главного — с чёткого понимания того, кто именно станет центральным объектом будущей композиции. Буквально десятилетие назад цифровое искусство требовало долгих часов работы стилусом, но сейчас львиная доля успеха зависит от точности текстовых формулировок. Стоит отметить, что первый шаг заключается в описании субъекта. Далее следует уточнить действие или позу, заставив колоритный персонаж двигаться, сидеть или смотреть вдаль. Ну и, наконец, замыкает эту базовую тройку окружение, задающее атмосферу всему полотну. Это же правило касается и абстрактных идей. Ведь именно фон часто солирует, создавая нужный антураж. Сложно ли удержать все эти переменные в голове? Да, но привычка формируется довольно быстро.
Как выбрать стилистику?
Задача не из лёгких. Многие считают, что достаточно набросать красивых эпитетов, но на самом деле хаотичный текст только путает электронные мозги. Построение грамотной фразы происходит строго линейно. Сначала смысловое ядро формируется, затем накладывается стилистика, определяемая конкретным направлением искусства, и завершается весь процесс техническими параметрами. Обязательно ли соблюдать такую последовательность? Вовсе нет. Однако именно такая логика творит чудеса, когда нужно получить предсказуемое изображение. К слову, опытные пользователи часто начинают с указания типа медиума. К первой группе относится классическая фотография. Во-вторых, можно запросить реалистичный карандашный набросок. Последним в списке идёт трёхмерный рендер. Выбор формата мгновенно отсекает тысячи ненужных вариантов.
Освещение и ракурс
Освещение колоссальную роль играет, и нет смысла забывать о его влиянии на настроение картинки. Мягкий рассеянный свет, льющийся из окна, кардинально отличается от жёсткого неонового свечения ночного мегаполиса. Тем более, что современные алгоритмы отлично понимают профессиональные фотографические термины. Естественно, запрос, усиленный упоминанием «золотого часа», дополненный студийными вспышками, подсвеченный контровым светом, выдаст куда более глубокий объём. А вот наляпистость оттенков часто портит добротный изначальный концепт. Откажитесь от идеи смешивать в одном котле все цвета радуги. Лучше ограничиться двумя-тремя гармонирующими тонами (например, изумрудным и медным), чтобы изюминка работы не потерялась в визуальном шуме. Да и самому зрителю приятнее смотреть на сбалансированный кадр.
Особенности создания персонажей
Одежда и экипировка заслуживают отдельного внимания. Облачиться в блестящие рыцарские доспехи или примерить рваные джинсы? Машина нарисует всё, что угодно, если правильно задать текстуры. Хлопок, шёлк, потёртая кожа или холодный металл — материал обязательно нужно прописывать словами. Корпус кибернетического робота, усиленный рёбрами жёсткости, отлитый из матового полиамида, снабжённый светящимися датчиками, выглядит на экране невероятно реалистично именно благодаря инструментальному подходу к описанию. Да и самому автору гораздо интереснее продумывать такие мелочи. Ведь дьявол кроется в деталях. И всё же, не стоит перебарщивать со сложными украшениями на первых этапах.
Портретная генерация: подводные камни
Лица людей всегда вызывают больше всего сложностей у новичков. Зрелище удручающее, когда вместо прекрасной девы на мониторе появляется нечто с асимметричными глазами и лишними зубами. Дело в том, что наш мозг невероятно щепетилен к пропорциям человеческого тела, и малейшая ошибка сразу бросается в глаза. Разумеется, нейросети постоянно совершенствуются. Но есть и минусы, которые приходится обходить хитростями. Не перегружайте описание внешности мелкими деталями сразу. Пусть алгоритм сначала построит правильную, крепкую анатомию. Затем, используя функции дорисовки, можно будет добавить шрамы, веснушки или сложный макияж. Впрочем, иногда проще сгенерировать десяток вариантов и выбрать один удачный. Главное — запастись терпением.
Что насчёт примеров? Разбираем практику
Чужой опыт — это настоящий кладезь знаний. Разложить по полочкам теорию полезно, но практические формулы работают безотказно. Один из самых популярных видов генерации — это реалистичный женский портрет. Для него отлично подойдёт следующий текст:
молодая девушка с короткими волосами, смотрящая прямо в объектив, одетая в толстый вязаный свитер, освещённая мягким утренним светом, снятая на объектив пятьдесят миллиметров, фотография высокого разрешения
Результат обычно выглядит впечатляюще. К тому же, этот каркас легко менять под свои нужды, заменяя лишь базовые переменные. Исконно русские мотивы можно добавить, поменяв свитер на традиционный сарафан.
Другой полюс. Фантастические пейзажи требуют совершенно иного подхода. Здесь выручит такой набор слов:
заброшенный готический замок на вершине скалы, окутанный густым туманом, зловещее багровое небо, стая воронов, стиль тёмного фэнтези, высокая детализация, эпическое освещение
В представлении многих это звучит слишком коротко. Однако именно лаконичность не даёт алгоритму запутаться во второстепенных элементах. Обе стороны медали важны: и богатая фантазия, и строгое самоограничение. Вычурный стиль здесь только навредит.
Интерьерные зарисовки
Ну и, конечно же, нельзя не упомянуть интерьерные концепты, о которых так грезят многие дизайнеры.
Уютная светлая гостиная в скандинавском стиле, деревянный дубовый пол, белый диван с жёлтыми подушками, большие панорамные окна с видом на заснеженный лес, реалистичный рендер, мягкие тени
Этот скрупулёзный текстовый код позволяет каждому примерить на себя роль настоящего архитектора. Ремонт при таких раскладах не сильно ударит по кошельку, по крайней мере на этапе визуализации идей. Кстати, покупка мощной видеокарты для локальных генераций — это серьёзное вложение, которое бьёт по бюджету. Поэтому многие выбирают облачные сервисы, где кошелёк станет легче лишь на стоимость месячной подписки. Индустрия крепко стоит на ногах, предлагая решения на любой вкус.
Вредно ли перегружать текст деталями?
Безусловно, соблазн вписать все пришедшие в голову слова льётся рекой. Когда-то, на заре развития генеративных технологий (буквально пару лет назад), длинные полотна случайных тегов помогали улучшить качество. Сейчас же ситуация изменилась кардинально. Современные модели тяготеют к естественному языку, и словесный мусор только мешает. Нет смысла тратить символы на бессмысленные конструкции вроде «очень красиво», «шедевр» или «лучшее качество». Машина совершенно не понимает субъективной оценки. Ей нужны исключительно сухие факты. А если ещё вспомнить про жёсткое ограничение на количество токенов, то становится очевидно: каждое слово должно вносить свою лепту.
Отрицательные значения и фильтры
Венчает процесс создания так называемый негативный промт. Что он делает? Отсекает всё то, что вы категорически не хотите видеть на итоговом холсте. К тому же, это довольно просто реализовать на практике. Достаточно прописать слова вроде «размытость», «искажения», «лишние конечности» или «водяные знаки», чтобы они навсегда исчезли из генерации. Это тяжёлый, но крайне эффективный способ контроля непослушной программы. Ведь ошибки обязательно всплывут, если не поставить жёсткие рамки. Часто натыкаешься на мысль, что идеальный код можно написать с первого раза. Но есть и своя ложка дёгтя. Неоднозначный подход алгоритмов к интерпретации слов заставляет постоянно корректировать вводные данные. Само собой, стопроцентно идеальных формул не существует. Творческий процесс требует постоянных экспериментов, хитрых махинаций с настройками и мелких правок.
Чтобы с головой окунуться в процесс, потребуется внушительный объём свободного времени. Постижение языка машин требует усидчивости, но каждая новая попытка делает этот самобытный инструмент чуточку понятнее. Вырастить своё цифровое чадо без ошибок практически невозможно, но именно этот нюанс приковывает внимание исследователей. Не стоит бояться совершать ошибки, лучше смело комбинировать стили и нарушать привычные правила. Обязательно сохраняйте удачные текстовые находки в личную копилку, чтобы потом быстро извлекать их в нужный момент. Удачи в поисках того самого идеального кадра, который обязательно завоюет сердца зрителей и порадует самих домочадцев!