Промты для мальчика

В сети представлено множество откровенно мусорных запросов, когда речь заходит о генерации детских персонажей. Обыватель часто вбивает примитивное словосочетание, ожидая шедеврального портрета, а на выходе получает жутковатую куклу с неестественной пластиковой кожей. Дело в том, что нейросети довольно плохо понимают анатомические пропорции маленького человека без жёстких технических спецификаций. А если ещё вспомнить про особенности сложного студийного освещения, то задача и вовсе кажется невыполнимой. Но чтобы не ошибиться, нужно с самого начала задать правильный вектор композиции.

Как выбрать стилистику?

Прядь светлых волос, выбившаяся из-под старой кепки, подсвеченная тёплым закатным солнцем. Именно с таких мелких деталей обычно начинается добротный реалистичный портрет. Сложно ли добиться кинематографической картинки? Безусловно, процесс потребует серьёзного терпения. Ведь львиная доля удачных генераций строится исключительно на тонкой настройке света. К первой группе успешных запросов смело относится фотографический стиль. Здесь безоговорочно солирует оптика. Стоит всегда указывать названия конкретных линз. Например, объектив с фокусным расстоянием восемьдесят пять миллиметров вкупе с диафрагмой один и четыре творит чудеса, размывая задний план до красивого мягкого боке. Разумеется, не стоит забывать про тип используемой плёнки. Тот же «Kodak Portra 400» добавит изображению теплоты.

А вот студийный свет требует совершенно иного подхода. Обязательно ли прописывать каждый отдельный источник? Вовсе нет. Однако указание жёсткого рисующего света сбоку сильно меняет визуальный объём лица. К тому же, лучше навсегда отказаться от абстрактных понятий вроде «красивый мальчик». Нейросеть выдаст вычурный прилизанный результат. Гораздо эффективнее прописать точный возраст от семи до девяти лет, добавив веснушки или лёгкую растрёпанность причёски. Это же правило касается подбора одежды. Потёртый деним, грязные кроссовки, объёмная худи — конкретика спасает картинку от визуальной наляпистости. Впрочем, иногда хочется уйти в глубокую стилизацию. Далее следует обратить пристальное внимание на различные иллюстративные подходы.

Киберпанк и фэнтези

Буквально десятилетие назад детальный концепт-арт персонажа занимал у цифрового художника долгие недели, но сейчас нейросети выдают готовый результат за пару десятков секунд. Зарождался жанр киберпанка в литературе восьмидесятых, опираясь на мрачные неоновые антиутопии. Сегодня эта атмосферная эстетика отлично ложится на детских персонажей. Мальчик, облачённый в громоздкую технологичную куртку, увешанный толстыми проводами, подсвеченный холодным синим неоном, вызывает настоящий восторг. Стоит отметить, что для алгоритмов отлично работают текстовые токены вроде «glowing cybernetic implants» или «rainy neon streets». Ну, а ложка дёгтя кроется в чрезмерной перегруженности кадра. Не стоит перебарщивать с мелкими деталями заднего плана.

Настоящий рай для фантазии. Ведь классическое фэнтези позволяет бесконечно играть с фактурами. И всё же создать самобытный образ эльфийского чада довольно сложно. Махинации с промтами тут обычно сводятся к детальному описанию тканей. Лён, грубая потёртая кожа, тяжёлые металлические заклёпки на поясе. Ну и, конечно же, магия. В сети можно найти немало отличных примеров, где ребёнок держит в руках загадочный светящийся артефакт. Чтобы такой кадр не выглядел плоско, нужно обязательно использовать сильный контровой свет. Светящаяся сфера, бросающая тёплые оранжевые блики на лицо, приковывает внимание зрителя моментально. К слову, стилистика «dark fantasy» делает итоговую картинку более взрослой и серьёзной.

Настройки камеры

Многие обыватели считают, что достаточно вписать банальное «8k resolution», но на самом деле алгоритмам нужны реальные физические параметры съёмки. Натыкаешься иногда на совершенно плоские, лишённые жизни лица. Это связано с тем, что полностью отсутствует указание ракурса. Съёмка снизу делает фигуру более внушительной. А вот ракурс сверху, напротив, подчёркивает детскую хрупкость. Естественно, для передачи динамики лучше использовать длинную выдержку. Размытый фон, передающий стремительное движение бегущего ребёнка, отлично оживляет статичный кадр. Тем более, что современные визуальные модели превосходно понимают команду «motion blur». Настоящий спасательный круг для тех, кто ищет жизни в холодных пикселях.

Процесс сборки идеального запроса сильно напоминает настройку реального плёночного фотоаппарата. Сначала выбирается крупность плана, затем выставляется свет, позже добавляется эмоциональное настроение, и только в самом конце прописываются сухие технические суффиксы.

Нет абсолютно никакого смысла переплачивать за дорогие платные генераторы, если не освоена эта фундаментальная база. Даже в бесплатных версиях можно легко добиться изысканного результата. Главное — избегать противоречащих друг другу стилей в одной строке запроса. Смешивание нежной акварели с жёстким гиперреализмом часто даёт неоднозначный, грязный исход.

Сюжетные линии

Мрачный готический замок на заднем фоне задаёт совершенно иное настроение, нежели залитая солнцем зелёная лужайка. Антураж решает практически всё. Само собой, генерация сложных многофигурных сцен серьёзно бьёт по бюджету токенов в коммерческих сетях. Поэтому каждый элемент фона должен нести чёткую смысловую нагрузку. Если мальчик увлечённо читает книгу, тёплый свет должен падать именно на открытые страницы. Отражённый от старой бумаги мягкий свет подчёркивает скрупулёзный подход автора к построению кадра. Кстати, использование готовых референсных изображений через параметр «image to image» серьёзно экономит нервы. Это тяжёлый, но невероятно эффективный способ добиться портретного сходства с конкретным реальным лицом.

Зрелище откровенно удручающее, когда у персонажа внезапно появляются лишние пальцы или сливаются глаза. Подводные камни генерации человеческих конечностей отлично известны каждому практикующему автору. Выручит грамотно составленный негативный промт — своеобразный защитный фильтр от жутких мутаций. Туда обязательно отправляются стоп-слова вроде «mutated hands», «extra limbs», «deformed». Нельзя не упомянуть и про исключительно текстовые генерации. Создание литературной истории о мальчике для больших языковых моделей требует не меньшей аккуратности. Здесь главная изюминка кроется в описании сложного характера. Запрос «напиши про смелого мальчика» работает из рук вон плохо. Гораздо лучше описать его конкретные действия. Например, попросить нейросеть показать, как герой преодолевает свой страх темноты через ночной диалог с выдуманным другом.

Стоит ли экономить слова?

Короткие рубленые фразы. Они иногда бьют гораздо точнее бесконечных длинных абзацев. Однако для нейросетей последних итераций длинный нарративный текст постепенно становится нормой. И всё-таки перегружать бота лишними эпитетами не стоит. Каждое вписанное слово забирает на себя определённую часть машинного веса. Если написать пять разных синонимов слова «красивый», алгоритм моментально забудет про указанную одежду. Да и самому автору потом довольно сложно разобраться в огромной простыне текста. Разложить по полочкам структуру запроса помогает чёткое разделение через запятые или вертикальные черты. Местный бомонд нейро-арта давно использует математические веса для отдельных слов (например, выделяя цвет глаз круглыми скобками и цифрами).

Эмоции и позирование

Улыбка до ушей или максимально задумчивый взгляд? На лице маленького ребёнка эмоции читаются совершенно иначе, чем у взрослого человека. В жутковатый оскал часто превращается слишком широкая улыбка. Поэтому стоит использовать более тонкие, деликатные формулировки. «Лёгкая ухмылка», «сосредоточенно смотрит вдаль», «прищурился от яркого солнца». Такие описательные фразы алгоритм переваривает гораздо адекватнее. К тому же, положение тела в пространстве напрямую влияет на восприятие. Мальчик, сидящий на корточках с длинной деревянной палкой в руках, выглядит максимально естественно. Вся суть в том, что статичные позы «по стойке смирно» напрочь убивают живую динамику кадра. Окунуться в настоящую атмосферу беззаботного детства помогают именно такие непринуждённые моменты. Алгоритм часто тяготеет к симметрии, поэтому асимметричные позы приходится выбивать силой.

Генерация предыстории

Текстовые модели тоже нуждаются в жёстких логических рамках. Создание достоверной легенды для персонажа — процесс не самый сложный, но крайне кропотливый. Буквально пару лет назад мы искренне радовались простым связным текстам, но сейчас от языковых моделей требуют глубокого психологизма. Чтобы прописать интересный бэкграунд мальчика для будущей книги или видеоигры, нужно обязательно задать сеттинг, внутренний конфликт и личную мотивацию. Иначе на выходе получится абсолютно картонный герой. Запрос должен содержать конкретную сценарную задачу. Например, лучше попросить описать раннее утро одиннадцатилетнего сорванца, скрывающего от строгих родителей найденную на улице бродячую собаку. Обе стороны медали проявятся моментально: и сильный страх наказания, и огромное чувство ответственности. Львиная доля таких сюжетов обычно навсегда оседает в скрытых папках, если изначально не задать правильный тон повествования.

Эксперименты с составлением промтов всегда требуют большого количества времени и хорошей визуальной насмотренности. Заведите себе отдельный текстовый документ для сохранения удачных комбинаций направленного света и конкретных объективов. Этот ценный список станет настоящим кладезем полезной информации в моменты творческого кризиса и поможет собрать колоритный образ буквально за пару минут. Удачи в создании по-настоящему живых персонажей, пусть каждый новый задуманный кадр радует глаз и получается без лишних правок.