Промт для генерации фото ребёнка (с примерами готовых промтов)

В сети, признаться, представлёно огромное множество изображений, генерируемых нейросетями, и среди них львиную долю занимают фотографии детей. Ведь что может быть трогательнее, милых детских личик, заливистого смеха или задумчивых взглядов, верно? Многие грезят о создании идеального образа малыша, будь то для иллюстрации книги, дизайна открытки или просто для вдохновения, но натыкаются на вполне ожиданные трудности: не всегда удаётся добиться того самого, живого и искреннего выражения, которое отличает настоящий снимок. Но чтобы не ошибиться в возможностях ИИ и получить результат, что будет радовать глаз, нужно освоить искусство составления промтов.

Зачем вообще нужны сложные промты для детей?

Казалось бы, достаточно просто написать «photo of a baby», и нейросеть выдаст сотни изображений, но всегда ли они будут такими, как нам бы хотелось? Вовсе нет. Голый, не приукрашенный промт часто приводит к довольно типовым, иногда даже неестественным картинкам: то анатомия хромает, то взгляд пустой, то антураж вовсе не тот. Дело в том, что модели обучены на миллиардах данных, среди которых есть и фото стоковых детей, и рекламные изображения, и арт-концепты, и даже мемы. Без чётких указаний ИИ может «смешать» эти стили, выдав что-то усреднённое и безликое, не говоря уже о пресловутой «нейросетевой эстетике», которая сразу бросается в глаза. Стоит ли мириться с такими компромиссами, когда можно добиваться шедевров?

Что закладываем в основу хорошего промта?

С чего начинается выбор? С определения того, какой именно ребёнок нам нужен, в какой обстановке он должен находиться и какую эмоцию должен выражать. По сути, промт – это как режиссёрский сценарий для нейросети, где каждый штрих важен. Здесь нет мелочей. А если ещё вспомнить, что детские образы – это огромный простор для фантазии, становитется очевидно, что детализация – наш лучший друг. Безусловно, потребуется некая доля скрупулёзности, однако итоговый результат обычно окупает все приложенные усилия.

Возраст и пол: Какими бывают наши маленькие герои?

Возраст и пол, само собой, – это базовые параметры. Не стоит думать, что достаточно просто указать «baby» или «child», ведь это слишком размытые понятия. Ведь младенец, дошкольник и подросток – это совершенно разные типажи, с различными пропорциями, мимикой, да и вообще жизненными сценариями. Один из самых популярных запросов – это «newborn baby» (новорождённый) или «infant» (младенец). Далее следует «toddler» (малыш, который только начинает ходить, 1–3 года), затем «preschooler» (дошкольник, 3–5 лет), «school-aged child» (ребёнок школьного возраста, 6–12 лет) и «teenager» (подросток). Нужно отметить, что использование английских терминов, как правило, даёт более стабильный и предсказуемый результат, поскольку большинство моделей обучены на англоязычных данных. Дополняет образ, конечно же, уточнение пола: «boy» или «girl», а иногда даже и «gender-neutral child», если нет строгих предпочтений.

Эмоции и выражения: Как передать живые чувства?

Эмоции – это, пожалуй, одна из самых сложных, но при этом важнейших частей. Ведь именно они делают изображение живым и приковывают внимание. С воздухообменом дело обстоит сложнее, но эмоции нейросеть «читает» весьма неплохо. От «smiling happily» (счастливо улыбающийся) до «curious expression» (любопытное выражение), от «joyful laughter» (радостный смех) до «thoughtful gaze» (задумчивый взгляд). Стоит использовать прилагательные и наречия, которые максимально точно описывают нюансы: «playful», «mischievous», «sleepy», «serious», «innocent», «shy». Главное – не переборщить с количеством эмоций в одном промте, иначе можно получить странную, гибридную мимику.

Обстановка и фон: Где будет разворачиваться история?

Фон играет не менее значимую роль, ведь он задаёт антураж и помогает рассказать целую историю. В представлении многих достаточно просто указать «on the grass» или «in a room», но это снова путь к шаблонам. Попробуйте детализировать: «in a sunlit meadow with wildflowers» (на залитом солнце лугу с полевыми цветами), «cozy nursery with wooden toys» (уютная детская с деревянными игрушками), «bustling playground with other children» (оживлённая детская площадка с другими детьми), «winter wonderland with snowflakes falling» (зимняя сказка со снегопадом). А если ещё добавить детали освещения – «golden hour light» (свет «золотого часа») или «soft studio lighting» (мягкое студийное освещение), то картина станет ещё живее.

Стиль и качество: Что делает изображение шедевром?

Ну, а стилистика и техническое качество – это уже высший пилотаж. Тут нейросеть творит чудеса, если её правильно направить. Хотите фотореализм? Пишите «photorealistic», «ultra-detailed», «8k». Нужно что-то более художественное? «Watercolor painting» (акварель), «oil on canvas» (масло на холсте), «cartoon style» (мультяшный стиль), «anime style», «pixar animation style». Не стоит забывать про качество камеры или линзы: «shot on Canon EOS R5», «cinematic lens flare», «bokeh effect». Это же правило касается и глубины резкости, и даже зернистости изображения.

Как сочетать елементы? Примеры готовых промтов

Придумывать свои промты – это, разумеется, увлекательно, но иногда хочется начать с чего-то готового. Наряд для избранных. Это как отправная точка, которую потом можно дорабатывать, подстраивать под свои нужды.

Начнём с нежного образа:

«A 6-month-old baby girl, sleeping peacefully in a wicker basket, wrapped in a soft knitted blanket, natural light, shallow depth of field, warm tones, photorealistic, ultra-detailed, soft focus, dreamlike atmosphere, cozy, –ar 16:9»

Здесь мы видим точный возраст, пол, состояние (спит), окружение (корзина, одеяло), освещение (натуральное, тёплое), технические параметры (малая глубина резкости, фотореализм) и даже соотношение сторон.

Попробуем что-то более динамичное:

«A joyful 4-year-old boy, with bright blue eyes, playing in a splash pad, water droplets frozen mid-air, motion blur, sunny day, vibrant colors, close-up portrait, high-speed photography, dynamic composition, captured with a Sony Alpha 7 IV, –ar 3:2»

Это уже про энергию: возраст, пол, конкретная черта (яркие глаза), действие (играет в брызгалках), детали (капли воды, размытие движения), погода (солнечный день), палитра (яркие цвета), тип кадра (крупный план), техника съёмки (скоростная), композиция, модель камеры.

И, наконец, что-то атмосферное:

«A contemplative 8-year-old girl, sitting by a window, reading a vintage storybook, rainy day outside, warm interior lighting, soft shadows, cozy ambience, cinematic feel, chiaroscuro lighting, painted with oils on canvas, –ar 4:3»

Тут мы играем на контрастах: задумчивая девочка, чтение старой книги, дождливая погода за окном, тёплое освещение внутри. Есть игра со светом и тенью (chiaroscuro – светотень), кинематографичное ощущение и художественный стиль (масло на холсте).

Подводные камни и как их обойти?

Есть и минусы. Одной из главных проблем при генерации детей часто становитеся неестественная анатомия или «лишние» пальцы, что, впрочем, свойственнно ИИ и для взрослых изображений. Не стоит расстраиваться, это нормально. Что насчёт фасона? Лучший вариант – это перегенерация с небольшими изменениями в промте или использование негативных промтов. Если нейросеть постоянно выдаёт нечто странное, попробуйте добавить «deformed hands», «extra limbs», «mutated fingers» в негативный промт. К тому же, всегда стоит экспериментировать с порядком слов: более важные характеристики ставьте в начало промта. А если что-то не получается, попробуйте разделить сложный промт на несколько более простых, генерируя отдельные элементы и потом комбинируя их. Ведь это же правило касается и работы над ошибками.

Стоит ли гнаться за идеалом?

Искусство создания промтов – это бесконечный процесс проб и ошибок, изучения и экспериментов. Не стоит гнаться за идеалом с первого раза; нет смысла переплачивать своими нервами. Помните, что каждый нейросетевой генератор имеет свои особенности, и промт, который отлично работает в Midjourney, может дать совершенно другой результат в Stable Diffusion или DALL-E. С каждой новой попыткой вы будете лучше понимать, как «мыслит» ИИ, и научитесь более точно формулировать свои желания. Удачи в творчестве, пусть каждая сгенерированная фотография ребёнка приносиТ радость и вдохновение!