Многие из нас в детстве, да и в зрелом возрасте, грезили о создании собственного мира, населённого уникальными персонажами. Кто-то рисовал их в тетрадях, кто-то придумывал целые биографии. Буквально десятилетие назад воплощение таких фантазий в качественном визуальном исполнении было уделом профессиональных художников или очень упорных любителей. Но сейчас, с появлением нейросетей, способных генерировать изображения, эта мечта стала доступна практически каждому. Однако, чтобы магия сработала, нужно знать правильное заклинание — промт. А начать стоит с разбора его анатомии.
Что такое промт для нейросети?
На самом деле, всё довольно просто. Промт (от англ. prompt) — это текстовый запрос, техническое задание, которое вы даёте искусственному интеллекту. В представлении многих обывателей это выглядит как «Нарисуй мне красивую аниме-девочку». Но на практике такие общие фразы приводят к совершенно непредсказуемым и зачастую удручающим результатам. Чтобы получить именно того персонажа, который живёт в вашем воображении, запрос должен быть детализированным, точным и структурированным. Это не столько приказ, сколько подробный рецепт, где каждое слово — ингредиент, влияющий на конечный вкус блюда. Задача не из лёгких, но вполне решаемая.
Базовые составляющие: из чего лепить образ?
С чего начинается создание персонажа? С определения его основы. Первое, с чего всё стартует — это указание на главный объект в кадре. Чаще всего используются простые и понятные теги вроде `1girl` или `1boy`, чтобы нейросеть сфокусировалась на одном герое. К слову, здесь же можно добавить и возрастные маркеры, например, `loli` для маленькой девочки или `shota` для мальчика, хотя с этим стоит быть осторожнее, так как некоторые платформы могут блокировать подобный контент. Главное — заложить фундамент, на который будут нанизываться остальные детали.
Следующий важнейший пласт — внешность. И вот тут-то и начинается настоящее творчество. Что насчёт волос? Тут детали решают всё. Нужно отметить, что недостаточно просто написать `black hair`. Для хорошего результата стоит уточнить их длину (`long hair`, `short hair`), причёску (`ponytail`, `braid`, `messy hair`) и даже отдельные элементы, вроде чёлки (`blunt bangs`). То же самое касается и глаз — цвет (`blue eyes`), форма (`sharp eyes`) и даже выражение (`bored expression`, `happy smile`) вносят колоссальную лепту в характер персонажа. Не стоит пренебрегать этими нюансами, ведь именно они оживляют картинку.
Далее следует одежда. Она не просто прикрывает тело, а рассказывает историю. Школьная форма (`school uniform`, `sailor collar`), фэнтезийная броня (`fantasy armor`, `glowing armor`) или современная уличная одежда (`hoodie`, `jeans`, `sneakers`) моментально помещают героя в определённый сеттинг. К тому же, не стоит забывать про аксессуары. Очки (`glasses`), ожерелье (`necklace`), серьги (`earrings`) или, скажем, меч за спиной (`sword on back`) — это те самые изюминки, которые приковывают внимание и делают образ завершённым и добротным.
Ну и, конечно же, антураж. Персонаж, парящий в белой пустоте, выглядит скучно и неестественно. Окружение задаёт настроение и контекст. Поэтому в промт стоит добавлять описание фона: ночной город с неоновыми вывесками (`neon city at night`), заколдованный лес (`enchanted forest`), уютная комната (`cozy room`) или поле боя (`on the battlefield`). Иногда даже погода, вроде дождя (`rain`) или падающего снега (`falling snow`), способна творить чудеса, добавляя изображению драматизма или, наоборот, умиротворения.
Как нейросеть понимает «красиво»?
Обязательно ли вводить слова вроде «шедевр»? Вовсе нет, но это помогает. Дело в том, что нейросети обучаются на гигантских массивах данных, где изображения часто снабжены оценками и тегами. Такие слова, как `masterpiece`, `best quality`, `highly detailed`, `ultra-detailed`, работают как фильтры, заставляя алгоритм обращаться к лучшим образцам из своей «библиотеки». Это своего рода допинг для генерации, который повышает детализацию, проработку света и общую эстетику. Разумеется, это не панацея, но львиную долю посредственных результатов они отсекают.
С другой стороны медали находится негативный промт. Это спасательный круг для художника. Сюда вы вписываете всё, чего НЕ хотите видеть на изображении. Самые распространённые примеры — `low quality`, `worst quality`, `blurry`, `jpeg artifacts`. Кроме того, в негативный промт часто добавляют маркеры, исправляющие типичные ошибки нейросетей: `bad hands`, `extra fingers`, `mutated hands`, `deformed`, `bad anatomy`. Таким образом вы как бы строите забор, не позволяя генератору забредать на территорию брака и визуального шума. Процесс не сложный, но кропотливый.
Готовые промты: примеры для вдохновения
Чтобы разложить всё по полочкам, давайте рассмотрим несколько конкретных примеров. Представим, что мы хотим создать классическую девочку-волшебницу, полную энергии и магии. Её образ должен быть ярким, динамичным и сказочным. В таком случае текстовый запрос мог бы выглядеть следующим образом:
masterpiece, best quality, 1girl, solo, magical girl, long pink hair, twin tails, sparkling blue eyes, happy smile, intricate magical dress, holding a glowing staff, dynamic angle, particle effects, fantasy background, enchanted castle in distance
Здесь мы видим чёткую структуру: сначала задаём качество, потом — главного героя, его внешность, одежду, атрибуты и, наконец, динамику кадра и фон.
А если хочется чего-то более мрачного и технологичного? Например, киберпанк-самурая, одиноко стоящего под дождём в неоновом переулке. Задача совершенно иная. Здесь на первый план выходит атмосфера. Пробуем так:
masterpiece, ultra-detailed, 1boy, lone samurai, black short hair, sharp red eyes, stoic expression, wearing a futuristic kimono with glowing patterns, cybernetic arm, holding a katana, standing in a dark alley, neon signs, reflections on wet pavement, rain, moody lighting, cyberpunk
В этом промте солируют уже не яркие цвета, а игра света и тени (`moody lighting`), а также специфические детали сеттинга (`cybernetic arm`, `neon signs`), которые и создают нужный колоритный антураж.
Ну и, наконец, давайте окунёмся в мир спокойной фэнтези, вдохновлённой работами студии Ghibli. Нам нужен добрый лесной эльф, гармонично вписанный в природу. Запрос будет тяготеть к мягкости и естественности:
best quality, Studio Ghibli style, 1girl, elf, long silver hair in a braid, gentle green eyes, serene expression, simple green tunic, holding a wooden flute, sitting on a mossy rock, enchanted forest, sunbeams filtering through trees, soft lighting, peaceful atmosphere
Ключевую роль здесь играет указание на стиль (`Studio Ghibli style`), которое кардинально меняет всю визуальную палитру, делая её более пастельной и живописной.
Эксперименты с промтами — это кладезь для творчества. Не бойтесь смешивать стили, добавлять неожиданные детали и менять параметры. Иногда одна маленькая поправка может полностью преобразить результат. Удачи в создании ваших уникальных персонажей!