Каждый, кто ведёт блог, развивает социальные сети или просто создаёт контент, рано или поздно сталкивается с одной и той же проблемой – поиском изображений. Бесплатные фотостоки уже набили оскомину своими однотипными улыбчивыми моделями и стерильными интерьерами, а услуги профессионального фотографа или иллюстратора могут серьёзно ударить по кошельку. Буквально несколько лет назад эта дилемма казалась неразрешимой, но сегодня на помощь приходят нейросети, способные генерировать практически любое изображение по текстовому описанию. Однако чтобы не разочароваться в результате, нужно освоить искусство составления правильного запроса, или промта.
Что такое промт и зачем он нужен?
В представлении многих обывателей работа с нейросетью выглядит как магия: написал «красивый закат», и машина тут же выдала шедевр. На самом деле всё немного сложнее. Промт – это не просто пожелание, а самое настоящее техническое задание для искусственного интеллекта. Чем детальнее и точнее оно будет составлено, тем выше вероятность получить именно ту картинку, которая родилась в вашем воображении. Стоит отнестись к этому процессу скрупулёзно. Ведь нейросеть не умеет читать мысли, она лишь анализирует введённые слова и ищет между ними логические и визуальные связи на основе гигантского объёма данных, на которых её обучали. Поэтому расплывчатый запрос даст такой же расплывчатый, а зачастую и совершенно нелепый результат.
Чтобы получить добротный, качественный визуал, нейросеть нужно направить. С чего начинается этот путь? С определения базовых элементов, из которых, как из кирпичиков, будет складываться будущая картинка. В основе любого удачного изображения лежит чётко описанный объект. Это своего рода ядро, вокруг которого мы будем наращивать детали. Далее следует продумать действие или состояние этого объекта, что он делает или в каком положении находится. Ну и, конечно же, не стоит забывать про антураж – фон и окружение, которые создают нужную атмосферу. Согласитесь, «кот» и «рыжий кот, спящий на стопке старых книг у камина» – это два совершенно разных по уровню детализации запроса.
Как выбрать стиль изображения?
Пожалуй, самый интересный и творческий этап – это выбор стилистики. Именно он определяет львиную долю настроения и восприятия картинки. Стили можно условно разделить на несколько больших групп. Первая – фотореализм. Здесь всё просто: мы просим нейросеть создать изображение, максимально похожее на настоящую фотографию. К слову, для этого часто используют уточнения вроде «photorealistic», «hyperrealistic», «8K», а также указывают параметры воображаемой камеры (например, «Canon EOS 5D Mark IV, 50mm f/1.8 lens»). Этот подход идеален для превью, которые должны вызывать доверие и выглядеть документально.
Следующая внушительная категория – цифровая живопись и иллюстрация. Тут уж простор для фантазии поистине безграничен. Хотите картинку в духе концепт-арта для видеоигр? Пожалуйста. Мечтаете о превью, стилизованном под акварельный рисунок или набросок углём? Тоже не проблема. Для этого в промте указываются маркеры вроде «digital painting», «concept art», «watercolor style», «steampunk» или «cyberpunk». Такие изображения приковывают внимание своей самобытностью и колоритным исполнением. Главное – не переборщить, смешивая в одном запросе сразу несколько противоречащих друг другу стилей. Иначе получится визуальная какофония.
Ну и, наконец, третья группа – имитация стилей конкретных художников или направлений в искусстве. Нейросети обучены на миллионах произведений, поэтому могут с лёгкостью воссоздать манеру Ван Гога, Сальвадора Дали или эстетику ар-нуво. Однако здесь есть свои подводные камни. Во-первых, стоит учитывать этическую сторону вопроса, ведь речь идёт об имитации чужого творчества. Во-вторых, результат может получиться довольно неоднозначным, если исходный объект и выбранный стиль совсем не сочетаются. Впрочем, для смелых экспериментов это отличный инструмент.
Примеры готовых промтов: от простого к сложному
Задача не из лёгких. Чтобы разложить всё по полочкам, давайте рассмотрим несколько практических примеров для разных задач. Допустим, вам нужно превью для статьи на тему «Основы инвестирования для начинающих». Запрос мог бы звучать так: «Молодой мужчина в деловом кэжуал-стиле сидит за современным минималистичным столом, анализирует графики на экране ноутбука, в фоне – светлый лофт-офис с большими окнами, фотореализм, мягкий дневной свет, кинематографично». Здесь есть всё: объект, действие, детализированный фон и технические уточнения по свету и стилю.
Другой случай – пост в социальные сети о путешествии в Италию. Хочется чего-то атмосферного и уютного. Попробуем такой промт: «Узкая улочка старого итальянского города на закате, брусчатка мокрая после дождя, на стенах домов вьётся плющ, вдали виден силуэт собора, тёплый золотой свет от фонарей, стиль – цифровая живопись, картина маслом, высокая детализация». Такой запрос создаст не просто картинку, а целую историю, в которую зрителю захочется окунуться. Он творит чудеса с воображением.
А что насчёт превью для YouTube-канала про технологии? Нужен броский, современный и немного футуристичный визуал. Запрос может быть следующим: «Макросъёмка процессора на материнской плате, по дорожкам бегут неоновые синие и оранжевые огни, фон тёмный и размытый, кинематографическое освещение, киберпанк-эстетика, гипердетализация». Этот промт делает ставку на технические детали, игру света и популярный стиль, что гарантированно привлечёт внимание целевой аудитории.
Типичные ошибки новичков
На пути к идеальному изображению многих поджидают одни и те же грабли. Главная ошибка – это абстрактность. Запросы вроде «счастливая семья» или «успешный бизнес» слишком общие, и нейросеть сгенерирует самый избитый и шаблонный образ. Не стоит бояться конкретики. Вместо «счастливая семья» напишите «отец и маленькая дочь собирают конструктор на ковре в залитой солнцем гостиной». Разница будет колоссальной.
Вторая ловушка – перегруженность. Иногда в попытке создать шедевр пользователи вписывают в промт десяток разных стилей, взаимоисключающих деталей и цветов. В итоге нейросеть просто не понимает, что от неё хотят, и результат выглядит наляписто и нелепо. Лучше придерживаться одного-двух гармонирующих стилей и чёткой концепции. Ну и, конечно же, не стоит забывать про «негативные промты» – специальные команды, которые говорят нейросети, чего на изображении быть НЕ должно (например, «уродливые лица, мутации, лишние пальцы»). Это спасательный круг, который помогает отсечь львиную долю брака.
Экспериментируйте, смешивайте стили, добавляйте неожиданные детали и не бойтесь исправлять неудачные запросы. Именно такой скрупулёзный подход и превращает набор слов в маленький визуальный шедевр, который зацепит взгляд и украсит любой ваш материал. Удачи в ваших творческих поисках.