Часто ли вы задумывались, почему у одних пользователей нейросеть выдаёт настоящие шедевры, достойные галерей современного искусства, а у других — невнятное месиво из пикселей и лишних конечностей? В сети представлено множество руководств, но большинство из них упускает самое главное: общение с искусственным интеллектом — это не диктовка сухого приказа, а скорее попытка объяснить слепому художнику, какой именно сон вы увидели прошлой ночью. Многие новички совершают одну и ту же ошибку, полагая, что машина поймёт их с полуслова, однако на практике всё оказывается гораздо сложнее. Но чтобы не ошибиться и заставить алгоритмы работать на полную мощность, нужно освоить искусство составления грамотных текстовых запросов, или, как их называют в профессиональной среде, промтов.
С чего начинается выбор? С определения того, что именно должно оказаться в центре композиции. Начать нужно с главного объекта, будь то старый викинговский корабль в штормовом море или крошечный футуристичный робот, собирающий цветы на поляне. Сложно ли составить идеальный запрос с первого раза? Да, это требует определённой сноровки, но результат того стоит. Стоит отметить, что нейросети (будь то Midjourney, Stable Diffusion или DALL-E) тяготеют к конкретике, поэтому вместо расплывчатого «красивый пейзаж» лучше использовать уточнение «заснежённые пики гор под лучами заходящего солнца». К слову, именно на этом этапе оседает львиная доля неудачных генераций, когда автор ленится прописать детали.
Анатомия текста: Из чего состоит запрос?
Обычно добротный современный промт строится по принципу слоёного пирога, где каждый слой отвечает за свой аспект визуализации. Во-первых, мы задаём сам субъект, описывая его максимально подробно, включая одежду, позу и даже выражение лица, если речь идёт о человеке. Далее следует контекст или окружение, ведь объект не может висеть в пустоте. Это может быть заброшенная викторианская библиотека с пыльными полками или же неоновый мегаполис будущего, где капли дождя светятся от рекламных вывесок. К тому же нельзя забывать про стиль, ведь именно он задаёт общее настроение всей работе. Будет ли это гиперреализм, напоминающий снимок на дорогую зеркалку, или же вычурный масляный мазок в духе импрессионистов — решать только вам.
Отдельно стоит упомянуть освещение, которое многие незаслуженно обходят стороной. А ведь именно свет творит чудеса, превращая плоскую картинку в объёмное глубокое полотно. Для создания драматизма отлично подойдёт «кинематографичное освещение» или «контровой свет», а если хочется чего-то мягкого и уютного, то выручит «золотой час» или «рассеянный утренний свет». Ну и, конечно же, технические параметры венчают эту конструкцию. Упоминание конкретных объективов, например, «85mm f/1.8», подскажет нейросети, что вы ждёте красивое размытие заднего фона, характерное для портретной съёмки.
Стилистика и свет: Как оживить картинку?
Эстетичны ли изображения, созданные без указания стиля? Само по себе полотно может выглядеть неплохо, но в нём будет отсутствовать та самая изюминка, которая приковывает внимание. В представлении многих пользователей достаточно добавить слово «красиво», но на самом деле это бесполезный шум. Гораздо эффективнее работают отсылки к конкретным техникам или именам великих мастеров. Одним из самых популярных направлений сегодня является киберпанк с его колоритной палитрой, но не менее востребован и так называемый «лоу-фай» (lo-fi) стиль, привносящий нотку ностальгии. Следующий важный критерий — это детализация. Если вы хотите видеть каждую ворсинку на свитере или крошечные морщинки в уголках глаз, стоит использовать маркеры вроде «высокая детализация» или «текстура кожи».
Особый интерес вызывает работа с негативными промтами, то есть списком того, чего на картинке быть не должно. Это своего рода спасательный круг, помогающий избежать появления шести пальцев на руке или странных деформаций лиц на заднем плане. Хотя и современные модели стали намного умнее, но «ложка дёгтя» в виде артефактов всё ещё может всплыть в самый неподходящий момент. Обычно в этот список вписывают слова «уродство», «лишние конечности», «плохая анатомия» или «размытый текст». Безусловно, это не даёт стопроцентной гарантии, но шансы на успех повышаются в разы.
Примеры для творчества: Готовые рецепты
Для тех, кто только начинает свой путь в мире генеративного искусства, полезно иметь под рукой готовые шаблоны, которые можно адаптировать под свои нужды. Допустим, нам нужен портрет. В этом случае запрос может выглядеть так:
«Портрет пожилого моряка с глубокими морщинами, седая борода, одет в добротный шерстяной свитер, фон — туманный причал, кинематографичное освещение, стиль гиперреализм, снято на 35mm».
Совсем другой антураж получится, если мы захотим создать нечто фэнтезийное. Можно попробовать следующий вариант: «Величественный замок на парящем острове, каскадные водопады, золотистые облака, стиль цифровой живописи, высокая детализация, мягкое закатное солнце». А если вам ближе минимализм, то описание «одинокое дерево посреди бескрайнего лавандового поля, минималистичный стиль, пастельные тона, 8k разрешение» станет отличным решением.
Кстати, довольно часто возникают ситуации, когда нужно создать архитектурный объект. Тогда стоит прибегнуть к такой формулировке: «Футуристичный дом в лесу, зеркальные стены, отражающие высокие сосны, вечернее время, внутренняя подсветка помещений, стиль био-тек, фотореалистичность». Ну и, наконец, для любителей киберпанка подойдёт описание «узкая улочка ночного Токио, обилие неоновых вывесок, отражения в лужах, киберпанк-эстетика, эффект плёночного зерна, высокая контрастность». Нужно отметить, что каждое слово в этих примерах не случайно. Ведь именно так мы выстраиваем логическую цепочку для машины, ограничивая её фантазию нужными нам рамками.
Подводные камни: Чего стоит избегать
Обязательно ли писать длинные простыни текста на английском? Вовсе нет, но практика показывает, что большинство популярных нейросетей всё-таки лучше понимают именно английский язык, так как обучались преимущественно на нём. Если ваш уровень владения языком Шекспира далёк от совершенства, на помощь придут онлайн-переводчики. Однако не стоит перебарщивать с количеством прилагательных. Если в запросе будет слишком много противоречивых эпитетов, нейросеть может попросту «растеряться» и выдать нечто среднее, что не устроит ни одну из сторон медали.
Ещё один нюанс касается авторских прав и имён художников. Буквально пару лет назад это было нормой — добавлять имена известных иллюстраторов для придания картинке определённого шарма. Сейчас же этические постулаты меняются, и многие разработчики стараются ограничивать прямое копирование стилей живых авторов. Лучше описывать саму технику: «густые мазки мастихином», «акварельные разводы» или «чёткая векторная графика». Это же правило касается и чрезмерно сложных конструкций. Сложные предложения с деепричастными оборотами лучше разбивать на простые фразы, разделённые запятыми. Это надёжно. Потому что проверено. Временем.
С чего начать практику?
Начать стоит с простых экспериментов, постепенно усложняя свои запросы новыми деталями. Не бойтесь ошибаться и генерировать десятки вариантов ради одного-единственного удачного кадра. Процесс этот не сложный, но кропотливый, требующий усидчивости и определённого вкуса. Разумеется, со временем у вас выработается свой собственный стиль общения с ИИ, появятся любимые «ключики» и секретные добавки, которые сделают ваши работы узнаваемыми среди тысяч других. Текст — это всего лишь инструмент, а настоящим творцом всё равно остаётся человек, который направляет безликую мощь алгоритмов в русло своей фантазии.
Постепенно вы заметите, как меняется ваше восприятие визуального контента. Вы начнёте видеть свет, композицию и текстуры там, где раньше обыватель заметил бы просто «красивую картинку». Это увлекательное путешествие в мир цифрового творчества только начинается, и каждый новый промт — это шаг в неизведанное. Удачи в ваших творческих поисках, и пусть каждая генерация станет настоящим произведением искусства, которое порадует и вас, и ваших зрителей. Перевоплощение завершено.