Буквально десятилетие назад создание детализированных картин по короткому текстовому описанию казалось недостижимой магией из фантастических фильмов, а сейчас нейросети прочно вошли в повседневную рутину обывателя. Ежедневно в сети натыкаешься на миллионы поразительных шедевров, сгенерированных за доли секунды, от которых откровенно захватывает дух. В представлении многих процесс этот тривиален: достаточно бросить чат-боту пару несвязных слов, и машина тут же выдаст полотно мирового уровня. Опровергая это заблуждение, стоит признать, что искусственный интеллект требует математически точных инструкций, иначе вместо искусства получится невнятная наляпистость. Но чтобы не ошибиться в общении с алгоритмом, нужно тщательно выверять каждую фразу, превращая хаотичные мысли в строгий, понятный для системы машинный код.
С чего начинается выбор?
С определения главной задачи. Формирование грамотного запроса для телеграм-бота требует определённой сноровки. Процесс этот не сложный, но довольно кропотливый, требующий внимания к мелочам. Ведь бездушная машина не умеет читать мысли. Сначала задаётся центральный объект, дополненный характером освещения, усиленный стилистическими маркерами, завершённый строгими техническими параметрами камеры. Внести лепту в итоговый результат может даже случайно поставленный предлог или неверно выбранный падеж. К слову, львиная доля новичков совершенно забывает про задний фон, из-за чего главный герой нелепо повисает в абсолютном белом вакууме. А стоит всего лишь добавить упоминание о шумной залитой дождём улице или мрачном туманном лесе, как плоская картинка моментально оживает. Это же правило касается и анатомических пропорций. Разумеется, нет смысла перегружать строку ввода десятками витиеватых синонимов, лучше ограничиться хлёсткими, бьющими точно в цель существительными.
Как создать колоритный портрет?
Задача не из лёгких. Потому что лица. Человеческие. Алгоритм часто безжалостно искажает физиологию, если предоставить ему слишком много творческой свободы. Выручит тут добротный детализированный промт, разбитый на чёткие смысловые блоки. К примеру, можно попросить виртуального художника нарисовать следующее:
молодую девушку с растрёпанными рыжими волосами, облачённую в тяжёлое изумрудное платье, стоящую под проливным дождём неонового мегаполиса
Звучит довольно просто, однако результат творит чудеса, если подкрепить фантазию терминами из реальной фотографии. Фокусное расстояние объектива в пятьдесят миллиметров, открытая диафрагма один и восемь, кинематографичный боковой свет от мерцающей уличной вывески — эти слова непременно станут спасательным кругом для вашего виртуального портрета. Тем более, что именно такой скрупулёзный технический подход отсекает лишнюю цифровую вычурность. Впрочем, иногда хочется получить что-то исконно наше, домашнее и самобытное. Запрос тогда конструируется иначе:
уставший пожилой кузнец у пылающего горна, раскалённые искры летят во все стороны, мягкий тёплый контровой свет, суровый фотореализм, порыстая текстура кожи
Естественно, с первой же попытки безупречное лицо выпадает редко (иногда машина дорисовывает лишние пальцы), но пара повторных генераций обычно решает эту заминку.
Пейзажная генерация
Крошечная прозрачная капля холодной росы на пожелтевшем кленовом листе. Именно с таких незначительных, на первый взгляд, деталей порой начинается конструирование грандиозного природного полотна. И всё же генерация ландшафтов тяготеет к подавляющей масштабности. Чтобы получить на экране смартфона внушительный заснеженный горный хребет, придётся разложить по полочкам всё: конкретное время суток, нюансы погоды, тип кучевых или перистых облаков. Попробуйте отправить боту следующее сообщение:
острые пики Альп на морозном рассвете, густой молочный туман низко стелется по долине, первые пробивающиеся лучи солнца окрашивают свежий снег в нежно-розовый оттенок, снято на широкоугольный дрон, сверхвысокое разрешение
Зрелище удручающее вы после этого точно не получите, скорее наоборот — картинка приковывает внимание зрителя намертво. Нужно отметить, что использование названий реально существующих локаций колоссально помогает нейросети. Одно дело просить нарисовать абстрактный лес, и совершенно другое — вековые секвойи национального парка Йосемити. Да и самим вычислительным мощностям гораздо проще опираться на существующие терабайты фотографий, чем изобретать природу с нуля.
Стиль гранж в интерьере
Эстетичны ли такие суровые помещения? Само по себе обшарпанное жилое пространство не отличается дворцовой красотой, но правильно составленный запрос меняет восприятие до неузнаваемости. Архитектурные и дизайнерские промты требуют от пользователя особой пространственной точности. Дело в том, что искусственные мозги часто путаются в сложной геометрии комнат, ломая перспективу. Проектирование виртуальной студии начинается с базовых материалов:
голые бетонные стены, местами обнажённая старая кирпичная кладка, потёртый винтажный кожаный диван в самом центре, свисающие с потолка индустриальные светильники Эдисона
К тому же, добавление указаний на мягкий вечерний свет, падающий из огромных панорамных окон, слегка смягчает индустриальную грубость интерьера. Нельзя не упомянуть, что подобные дизайнерские изыскания — это серьёзное вложение личного времени. Ваш кошелёк станет легче только при условии покупки платной подписки на продвинутую модель, однако во многих чатах бесплатные попытки льются рекой. Безусловно, стоит тщательно избегать взаимоисключающих указаний вроде «ослепительно светлый и одновременно мрачный подвал», иначе на картинке непременно всплывут грубые логические артефакты.
Достопримечательности Италии: Римский Колизей
Следование исторической достоверности — ещё одна весьма неоднозначная грань работы с графическими ботами. Когда-то возведение этого циклопического амфитеатра длилось долгих восемь лет, а финальное строительство было помпезно завершено в восьмидесятом году нашей эры. Сегодня же воссоздать его былое великолепие можно за три короткие секунды. Однако машина по неопытности часто примешивает к античной величественной архитектуре совершенно неуместные современные элементы, вроде припаркованных туристических автобусов. Избежать этого конфуза поможет жёсткий, привязанный к конкретной эпохе промт. Пишем в строку чата:
древнеримский Колизей в период своего наивысшего расцвета, на песчаной арене сражаются гладиаторы, каменные трибуны полностью заполнены ликующими людьми, строгая историческая реконструкция, палящий яркий солнечный день
На самом деле, именно уточнение об отсутствии современных зданий на заднем плане (вписанное в настройки исключений) играет здесь первую скрипку. Отдельно стоит упомянуть критическую важность настройки теней, ведь жёсткое полуденное солнце южной Европы создаёт резкие перепады света, которые делают изысканный античный антураж поразительно объёмным.
Вредно ли увлекаться стилизацией?
Настоящий безграничный рай для буйной фантазии легко может трансформироваться в визуальный хаос. Устав от скучной суеты гиперреализма, многие пользователи искренне грезят абстракциями и начинают бездумно смешивать несовместимые вещи. Незыблемые постулаты хорошего художественного вкуса здесь нарушаются сплошь и рядом. Один из самых популярных пользовательских подходов – создание изображений в духе кисти всемирно известных живописцев. Текстовая команда «портрет пушистого кота в стиле Ван Гога, густые мазки масляной краски, завихрения звёздной ночи на фоне» гарантированно выдаёт потрясающе колоритный результат. Далее следует повальное увлечение японской аниме-стилистикой, где для качественного результата требуются маркеры наподобие «анимационная студия Гибли, прорисованные акварельные фоны, мягкие контуры персонажей». Последним в этом перечне идёт сложное трёхмерное моделирование, когда чату скармливают технические фразы «движок Unreal Engine пятого поколения, сложный октановый рендер, объёмное рассеянное освещение». Обе стороны медали при таком подходе вполне очевидны: с одной стороны обыватель получает колоссальное жанровое разнообразие, с другой — огромный риск потерять первоначальную глубокую мысль за непроходимым обилием фильтров. Нет смысла перебарщивать со стилями, лучше остановиться на одном мощном направлении, в котором и будет гордо солировать ваш центральный объект.
Коммерческое применение
Съёмка ресторанной еды или каталожных товаров. Наряд для избранных. Именно здесь щепетильный коммерческий подход нужен как ни в какой другой сфере. Многие искренне считают, что сгенерировать вызывающий аппетит сочный бургер довольно просто. Вовсе нет. Виртуальное жареное мясо поразительно часто выглядит как дешёвый глянец или кусок пластика. Спасёт эту удручающую ситуацию лишь прямое упоминание макросъёмки и профессионального фуд-стайлинга. Качественный, проверенный на практике запрос конструируется так:
огромный говяжий бургер на массивной деревянной доске, горячий расплавленный сыр Чеддер медленно стекает по румяной котлете, мелкие капли конденсата на свежем хрустящем листе салата, глубокий тёмный фон, студийное профессиональное освещение мягким софтбоксом
Это надёжно. Потому что проверено. Многократным опытом. Ну и, конечно же, не забудьте после генерации внимательно проверить картинку на наличие странных артефактов вроде лишних кунжутных семечек, магическим образом висящих прямо в воздухе. Подобные хитрые махинации с продуктами питания не сильно ударят по скромному бюджету малого бизнеса, успешно заменяя услуги дорогостоящего фуд-фотографа. Главное неоспоримое достояние таких искусственных картинок — математически идеальная композиция, которую нейросеть выстраивает строго по правилу третей. Выглядит действительно впечатляюще.
Санитарный контроль
С микробиологией дело обстоит намного сложнее… Шутка, мы всё-таки обсуждаем картинки. А если говорить предельно серьёзно, то точечная очистка цифрового мусора на сгенерированной фотографии — это истинная изюминка профессионального, осознанного промтинга. Огромная ложка дёгтя обязательно испортит весь шедевр, если по неосторожности забыть про минус-слова. Практически в любых продвинутых чатах для этого предусмотрен специальный параметр (или отдельная строка), безжалостно отсекающий всё визуально ненужное. Во-первых, туда прописывают физическое уродство и мутации, во-вторых, нежелательное мыльное размытие, ну а напоследок — искажённые перспективы и неправильные пропорции тела. Механика работы этого инструмента предельно проста: пользователь буквально прямым текстом говорит нейросети, чего в кадре категорически быть не должно. Связано это с тем, что алгоритм изначально обучался на миллиардах совершенно несовершенных, любительских изображений из интернета, и его бурную фантазию нужно постоянно искусственно ограничивать. И всё-таки, даже самый скрупулёзный, выверенный до буквы минус-запрос никогда не гарантирует стопроцентного отсутствия мелких шероховатостей (особенно это касается генерации кистей рук или сложных переплетающихся текстур). Откажитесь от наивных иллюзий, что всё всегда будет получаться идеально с первого же робкого клика.
Подготовка к отправке
Финальный аккорд перед нажатием кнопки «Enter». Именно здесь многие совершают досадную ошибку, отправляя сырой, не вычитанный текст. Кроме того, бомонд цифровых художников настоятельно рекомендует использовать английский язык при общении с ботами, так как львиная доля моделей лучше понимает именно его. Русскоязычные запросы часто переводятся встроенными алгоритмами криво, безвозвратно теряя заложенные тонкие смыслы. Ну и, наконец, не стоит пренебрегать весомостью расставленных слов. То, что стоит в самом начале предложения, машина воспринимает как абсолютный приоритет, а фразы в конце промта учитывает лишь по остаточному принципу. Переместите самое важное описание вперёд, и результат вас приятно удивит.
Долгий путь освоения искусства составления текстовых команд требует немалого терпения, но впечатляющий финальный результат с лихвой окупает все потраченные нервы и усилия. Каждый новый отправленный запрос быстро становится вашим личным маленьким открытием, позволяя с лёгкостью визуализировать самые смелые и безумные фантазии. Не бойтесь ежедневно экспериментировать с описаниями, смело комбинируйте разные исторические эпохи, фотографические объективы и стили, шаг за шагом подбирая свой личный, неповторимый авторский почерк. Пусть каждая сгенерированная иллюстрация максимально точно передаёт вашу изначальную задумку, а увлекательный процесс общения с алгоритмом приносит исключительно позитивные эмоции и служит мощным источником вдохновения для новых творческих побед!