Негативный промт для

Многим профи до боли знакома ситуация, когда выверенный до запятой запрос выдаёт откровенный визуальный мусор. Казалось бы, веса расставлены скрупулёзно, грандиозный замысел сформирован, а на выходе получается удручающее зрелище. Вся суть в том, что нейросети мыслят ассоциативно, подтягивая из скрытого пространства все возможные артефакты. Плохая генерация — это не всегда вина позитивного ввода. Поэтому перед запуском процесса желательно выстроить непробиваемую стену из запретов.

Ваш личный ИИ-отдел маркетинга, который работает 24/7 📈

Ускорьте создание контента в 10 раз! Этот мульти-ИИ сервис позволяет писать безупречные продающие посты, генерировать уникальные фото для соцсетей, создавать рекламные промо-ролики с нуля и писать для них музыку в пару кликов. Идеальное решение для предпринимателей, маркетологов и SMM-специалистов. Всё в едином удобном интерфейсе — больше не нужно переключаться между десятком вкладок.

Делегируйте рутину искусственному интеллекту и увеличивайте продажи. Начните работу здесь 👉 https://clck.ru/3RNCRL

Зачем отсекать лишнее?

Задача не из лёгких. Задавать вопрос о целесообразности ограничений нужно сразу. Помогает ли длинная простыня из минус-слов? Да, но только при осознанном подходе. Буквально пару лет назад это было настоящим шаманством, но сейчас процесс стал более предсказуемым. Львиная доля успешных генераций в Stable Diffusion строится именно на грамотном подавлении шума. Ведь именно негативный блок работает как скульптор, отсекающий от мрамора вычурный брак.

К слову, многие полагают, что достаточно написать одно слово, и магия случится. На самом деле всё обстоит куда сложнее, и обыватель часто натыкается на стену непонимания алгоритма. Нейросеть тяготеет к искажённым паттернам из обучающей выборки. Поэтому вычищать приходится целые пласты смыслов, чтобы исконно чистая идея не потерялась. А если ещё вспомнить про специфику чекпоинтов, то становится ясно одно. Универсального решения просто не существует. Приходится собирать добротный рабочий каркас под каждую конкретную задачу индивидуально.

Базовые токены

Прямо с порога классические маркеры низкого качества отправляются в поле ввода. К первой группе относится технический брак, куда входят:

worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, blurry

Далее следует стилистический мусор, который безжалостно портит реалистичные портреты:

illustration, 3d, sepia, painting, cartoons, sketch

Отдельно стоит упомянуть анатомические дефекты, всплывающие довольно часто при работе с людьми. Последним в списке идёт искажение цвета и света, которое выражается через:

bad shadow, oversaturated, poorly lit

Впрочем, собирать весь этот кладезь знаний в одну кучу не всегда целесообразно. Это перегружает модель. Ведь лимиты токенов никто не отменял. И всё-таки надёжный базовый блок, состоящий из:

(worst quality:1.4), deformed, ugly, cropped

творит настоящие чудеса. Разумеется, для фотореализма этот колоритный набор придётся корректировать.

Анатомические искажения: спасательный круг

Спасти руки от превращения в жуткие щупальца — главная боль любого создателя контента. Эстетичны ли такие мутации? Зрелище вызывает истинное отторжение. Деформированные конечности солируют на многих работах новичков, разрушая весь антураж. Начинать борьбу стоит с точечных ударов:

bad anatomy, bad hands, missing fingers, extra digit, fewer digits

Тем более, что современные алгоритмы стали лучше понимать контекст, но всё ещё нуждаются в строгих рамках.

Не стоит забывать и про лица, которые часто грезят о симметрии, но получают хаос. Глаза, смотрящие в разные стороны, исправляются связкой:

cross-eyed, poorly drawn face, mutated, cloned face

Конечно, длинный список слов не гарантирует идеального результата с первой попытки, однако он значительно повышает шансы. И вот тут на помощь приходят эмбеддинги, спасающие положение. Тот же EasyNegative вносит огромную лепту в стабилизацию картинки. Кошелёк станет легче от покупки мощной видеокарты, но спасённые нервы того безусловно стоят.

Как выбрать вес токена?

Цифры решают многое. Выручит грамотная расстановка акцентов через круглые скобки. Обязательно ли выкручивать значения до максимума? Вовсе нет. Слишком сильный ограничитель убивает композицию напрочь, делая её скучной. Лучше отказаться от крайностей и остановиться на значениях от 1.2 до 1.5, чтобы не сломать логику. К примеру, изысканный портрет спасёт комбинация:

(mutated hands and fingers:1.4), (deformed iris, deformed pupils:1.3)

А вот для ослабления влияния применяются квадратные скобки. Это же правило касается и смешивания токенов. С одной стороны, можно попытаться разложить по полочкам каждую деталь, с другой — лаконичный вызов эмбеддинга сработает эффективнее. Ну и, конечно же, не стоит сбрасывать со счетов синтаксис автоматической подмены на разных шагах генерации. Эта хитрая махинация позволяет сперва задать общую форму, а затем отсечь мелкие дефекты вроде:

extra legs, bad proportions

Промпты для Midjourney: параметры

Управление в дискорд-боте строится по совершенно иным лекалам. Здесь бал правит параметр «–no», который бросается в глаза в самом конце запроса. С отсечением стилей дело обстоит довольно просто: бот реагирует на короткие и ёмкие запреты. Безусловно, писать трактаты тут бессмысленно. Достаточно добавить в конец строки:

–no 3d, cartoon, ugly, blur, text

Многие пытаются засунуть в Midjourney те же конструкции, что и в Stable Diffusion, получая на выходе непредсказуемую наляпистость. А ведь алгоритм шестой версии требует кристально чистого языка. Не перегружайте систему бессмысленными эпитетами. Естественно, если вы добиваетесь фотографической точности, нужно исключить:

plastic, render, unreal engine, cgi

Ложка дёгтя кроется в том, что бот иногда игнорирует запреты, если позитивная часть слишком слабая.

Борьба за реализм

Наряд для избранных. Именно так можно назвать идеально сгенерированную текстуру без пластикового блеска, в которую может облачиться цифровой персонаж. Чтобы избежать эффекта дешёвой куклы, стоит добавить в минус-слова:

airbrushed, smooth skin, plastic, doll, overretouched

Да и самим моделям не помешает немного естественных изъянов, чтобы цифровой бомонд выглядел живее. К тому же, глянцевые лица, льющиеся рекой из соцсетей, давно набили оскомину.

Само собой, добиться фактурной кожи (с порами и микротенями) без подавления сглаживания практически невозможно. Внушительный список ограничений выглядит так:

(smooth skin:1.2), (retouched:1.2), CGI, render, digital painting, oil

Кстати, свет тоже нуждается в корректировке. Пересвеченные зоны убивают объём напрочь. Поэтому смело вписывайте:

overexposure, blown out highlights, flat lighting

Этот щепетильный подход творит чудеса, возвращая фотографиям исконно аналоговое звучание.

Копирование шаблонов

Вслепую брать гигантские полотна текста — сомнительная затея. Подводные камни всплывут незамедлительно при первой же попытке. Дело в том, что каждый шаблон писался под конкретную задачу. То, что идеально вычищает фон на аниме-иллюстрациях, напрочь уничтожит детализацию на архитектурном рендере.

С чего начинается выбор? С определения конечной цели. Не скупитесь на время для тестирования отдельных блоков. Впрочем, держать под рукой пару-тройку добротных заготовок никто не запрещает. Просто не стоит забывать о необходимости их постоянной адаптации. Тем более, что многие старые токены сейчас работают как паразитный шум, который серьёзно бьёт по бюджету времени. И всё-таки регулярная ревизия своих библиотек — обязательная рутина. Обе стороны медали нужно учитывать всегда.

Архитектура и интерьеры

Сразу к делу: кривые стены и сливающиеся в кашу окна отсекаются с огромным трудом. Впечатляющий просторный интерьер легко испортить неверной перспективой, которая разрушает грандиозный замысел. Избежать этого поможет набор:

distorted perspective, crooked walls, merged furniture, impossible geometry, bad architecture

Кроме того, искусственный интеллект обожает плодить лишние источники света там, где они не нужны.

Бороться с этим нюансом довольно просто, используя:

multiple suns, illogical lighting, floating objects

Нужно отметить, что при генерации мебели часто возникают проблемы с опорами. Стоит добавить:

missing legs, broken furniture, asymmetric

чтобы стул уверенно стоял на ногах. Этот неоднозначный, но эффективный набор ограничений заставит модель придерживаться законов физики. Ведь именно реалистичная геометрия приковывает внимание к качественному рендеру.

Тексты и водяные знаки

Надписи на изображениях до сих пор остаются слабым местом большинства алгоритмов генерации. Изюминка композиции может быть легко разрушена кривыми иероглифами в углу, где обычно оседает копирайт. Чтобы самобытный текст не лез в кадр, используйте жёсткую связку:

text, watermark, signature, logo, font, typography, username

Да, полностью исключить появление странных символов на футболках тяжело, но минимизировать их количество вполне реально.

Многим кажется, что достаточно одного слова, но на самом деле нейросеть обучалась на стоковых фото. И там эти знаки присутствуют в обилии. Поэтому масштабный запрет на любую типографику не сильно ударит по кошельку видеопамяти, но спасёт композицию. Ну, а если вам нужно сгенерировать чистый лист бумаги, придётся проявить максимальную настойчивость.

Укрощение нейросетей требует терпения и тонкого понимания скрытых механизмов генерации. Составление грамотного блока ограничений — это тяжёлый, но эффективный способ удержать контроль над алгоритмом. Не бойтесь тестировать смелые гипотезы, убирать лишнее и собирать свои собственные комбинации. Каждое такое серьёзное вложение времени обязательно окупится качественным результатом. Удачи в создании поистине потрясающих визуальных шедевров, которые запомнятся надолго.