Промт для фото с кошкой (с примерами готовых промтов)

В сети представлено бесчислённое множество изображений кошек – от забавных мемов до произведений искусства, которые приковывают внимание на долгие часы. Буквально десятилетие назад создание подобного контента было прерогативой фотографов и художников, требовало оборудования, навыков и времени. Но сейчас, с появлением нейросетей, способных генерировать картинки по текстовому описанию, каждый может почувствовать себя творцом. Однако, чтобы машина поняла ваш замысел и выдала нечто впечатляющее, а не очередного крипового мутанта, ей нужен точный и грамотный «приказ». Поэтому стоит разложить по полочкам, как составить тот самый идеальный запрос.

Что такое промт и как он работает?

Задача не из лёгких, но вполне решаемая. Промт (от английского prompt – «побуждение», «команда») – это текстовое описание, инструкция для искусственного интеллекта, по которой он создаёт изображение. В представлении многих обывателей это просто набор слов, но на самом деле это куда более тонкий инструмент. Представьте, что вы даёте задание очень талантливому, но крайне буквальному художнику, который не умеет читать мысли. Чем подробнее и яснее вы обрисуете ему задачу, тем ближе к вашим ожиданиям окажется результат. Сложно ли это? Вовсе нет. Вся суть в том, чтобы понять логику машины и говорить с ней на одном языке. А язык этот состоит из конкретики, деталей и правильной структуры.

Основа любого добротного промта держится на нескольких китах. Во-первых, это главный объект – в нашем случае, кошка. Нужно сразу указать её породу, окрас, возможно, даже возраст. Во-вторых, необходимо описать действие или позу: кошка спит, играет с клубком, смотрит в окно или важно восседает на троне. В-третьих, колоссальную роль играет окружение, антураж. Где находится животное? В уютной комнате у камина, в футуристическом городе, на цветущем лугу? Ну и, наконец, самый творческий пласт – стилистика. Именно она превращает просто картинку в произведение.

Структура идеального запроса

Чтобы получить предсказуемо качественный результат, не стоит полагаться на удачу. Лучше с самого начала выстроить промт по определённой схеме, которая доказала свою эффективность. Это не строгий закон, а скорее проверенный временем рецепт.

Начать стоит с главного объекта и его подробного описания. Не просто «кошка», а «пушистый рыжий мейн-кун с зелёными глазами и кисточками на ушах». Такая детализация сразу отсекает львиную долю нежелательных вариантов. Далее следует действие и эмоция. Например, «спокойно дремлет, свернувшись клубком на стопке старинных книг». Это добавляет изображению нарратив, маленькую историю.

Следующий важный критерий – окружение. Здесь тоже не стоит скупиться на подробности. Вместо «в комнате» лучше написать «в залитой солнечным светом библиотеке с высокими деревянными стеллажами». К слову, детали интерьера или пейзажа могут кардинально изменить атмосферу. Отдельно стоит упомянуть освещение. Это один из мощнейших инструментов для создания настроения. Мягкий свет от камина, холодное неоновое свечение, золотые лучи заката – всё это задаёт тон изображению. Ну и, конечно же, не забываем про технические параметры: стиль художника (например, «в стиле Ивана Айвазовского» или «в стиле студии Ghibli»), тип камеры, объектив и даже настройки вроде детализации.

Стоит ли усложнять?

Возникает резонный вопрос: а нужно ли так всё усложнять? Может, достаточно написать «милый котёнок» и получить желаемое? Иногда – да. Но результат будет лотереей. Короткие и общие запросы нейросеть интерпретирует на основе самых популярных изображений из своей базы данных, поэтому результат часто получается довольно шаблонным и безликим. С одной стороны, это быстро. С другой – вы отдаёте львиную долю творческого контроля на откуп алгоритму.

Подробный, скрупулёзно составленный промт – это ваш режиссёрский пульт. Каждое слово, каждая запятая в нём работают на воплощение именно вашей, уникальной идеи. Тем более что сложные запросы позволяют комбинировать, казалось бы, несочетаемые вещи и получать по-настоящему самобытные арты. Хотите сиамского кота в доспехах самурая на фоне цветущей сакуры, нарисованного в технике масляной живописи? Пожалуйста. А бенгальского котёнка-киборга, спящего на серверной стойке под светом неоновых ламп? Тоже возможно. Именно в таких махинациях и кроется вся прелесть генеративного искусства. Так что ответ однозначен: усложнять не просто стоит, а необходимо, если вы грезите о чём-то большем, чем очередная стоковая картинка.

Примеры промтов для разных стилей

Давайте перейдём от теории к практике. Разложить всё по полочкам помогут конкретные примеры, которые можно использовать как основу для собственных экспериментов.

Начнём с самого, пожалуй, востребованного направления – фотореализма. Задача – получить изображение, неотличимое от настоящей фотографии. Здесь на первый план выходят технические детали.

Промт: «Сверхдетализированная фотография бенгальской кошки, сидящей на подоконнике во время дождя, капли на стекле, мягкий рассеянный свет, взгляд в камеру, боке на фоне городских огней. Снято на Sony A7 III, объектив 85mm f/1.4, кинематографическое освещение, фотореализм, 8К».

Совершенно иной антураж творит чудеса в жанре фэнтези. Здесь можно дать волю воображению, смешивая магию и грацию кошачьих.

Промт: «Эпическая цифровая живопись. Величественный чёрный кот с аметистовыми глазами сидит на троне из резного обсидиана в огромном готическом зале, тусклый свет от магических кристаллов, на полу рунические символы, атмосфера тайны и могущества. Стиль Грега Рутковски, высокая детализация, фэнтези-арт».

А вот для любителей неона, технологий и мрачного будущего подойдёт киберпанк. Контраст живого существа и бездушных технологий всегда выглядит впечатляюще.

Промт: «Сфинкс с имплантами и светящимися синими линиями на коже лежит на горе из микросхем, фон – ночной мегаполис с голографической рекламой, неоновое освещение, дождь, отражения в лужах, киберпанк, стиль Syd Mead, детализированный, мрачная атмосфера».

Ну и, конечно же, нельзя обойти стороной стиль, который греет душу миллионам – рисовку в духе студии Ghibli. Он идеально подходит для создания милых и уютных сцен.

Промт: «Пушистый рыжий котёнок спит на полянке, заросшей клевером, рядом лежит большая красная ягода, мягкий солнечный свет пробивается сквозь листву, акварельная текстура, тёплые пастельные тона. Аниме-стиль студии Ghibli, Хаяо Миядзаки, уютная и добрая сцена».

Какие ошибки портят результат?

Даже с хорошей структурой можно наткнуться на подводные камни, которые испортят всю генерацию. Первая и самая частая ошибка – двусмысленность. Не стоит писать «кот с мышкой», потому что нейросеть может нарисовать как животное с его добычей, так и кота с компьютерной мышью. Всегда уточняйте.

Вторая ловушка – стилистическая какофония. Попытка смешать в одном запросе «стиль Ван Гога», «фотореализм», «аниме» и «детский рисунок» приведёт к хаосу. Модель просто не поймёт, какой из приказов главный, и выдаст нечто среднее и невнятное. Зрелище получается довольно удручающее. Лучше выбрать одно, максимум два совместимых направления.

Наконец, не стоит перегружать промт незначительными деталями, особенно если они противоречат друг другу. Указание «крошечный котёнок размером с дом» скорее запутает алгоритм, чем поможет ему. Главное – соблюдать логику внутри своего вымышленного мира.

Теперь, вооружившись этими знаниями, вы можете творить. Экспериментируйте, меняйте детали в готовых промтах, добавляйте неожиданные элементы и ищите свою собственную изюминку. Процесс этот не сложный, но кропотливый, и наградой за него станут по-настоящему впечатляющие изображения. Удачи в создании вашего цифрового шедевра.