В сети существует великое множество нейросетей для генерации изображений, однако отечественные разработки вызывают всё больший интерес у рядовых пользователей. Буквально десятилетие назад создание картины по текстовому описанию казалось настоящей магией из фантастических фильмов, но сейчас умный помощник от Яндекса делает это за считанные секунды. Плохой сгенерированный кадр — это не всегда вина глупого алгоритма, чаще всего проблема кроется в косноязычных формулировках. Многие считают создание картинок через чат-бота забавой на пару вечеров, но на самом деле инструмент таит в себе внушительный потенциал для дизайнеров, блогеров и обычных мечтателей. Устав от суеты стандартных фотостоков, весь цифровой бомонд ищет новые способы визуализации своих грандиозных идей. Но чтобы не разочароваться в результате, нужно научиться разговаривать с искусственным интеллектом на его языке.
Стоит ли бояться алгоритмов?
Экран смартфона загорается, и на месте пустого диалогового окна медленно проступает довольно вычурный сюрреалистичный пейзаж. Вся суть в том, что Алиса использует встроенную диффузионную модель, которая поначалу генерирует визуальный шум, а затем скрупулёзный математический процесс выстраивает из него осмысленную композицию. Сложно ли управиться с этой технологией? Разумеется, на первых порах придётся немного поэкспериментировать с фразами. Ведь именно от точности заданных слов зависит львиная доля успеха генерации. К слову, отечественный искусственный интеллект прекрасно понимает русский язык, поэтому мучиться с зарубежными переводчиками не придётся. А если ещё вспомнить про стоимость подписок на западные аналоги, то кошелёк станет легче у тех, кто до сих пор за них платит, тогда как встроенная функция Яндекса работает абсолютно бесплатно. Тем более, что база постоянно обучается на миллионах картин, фотографий и рисунков.
С чего начинается выбор?
С определения главного объекта композиции. Не стоит пытаться впихнуть в одно короткое сообщение сразу десяток персонажей с разными характерами и позами. Машина тяготеет к понятным и структурированным описаниям, где на первом месте стоит главный герой, а уже затем расписывается окружающий антураж. Обязательно ли указывать художественный стиль? Вовсе нет. Однако без конкретных указаний финал может получиться слишком обобщённым, а то и откровенно нелепым. К тому же искусственный разум очень чутко реагирует на уточнения по свету и цветовой гамме. Впрочем, лучше отказаться от абстрактных понятий вроде «красиво» или «необычно», заменив их на вполне осязаемые фотографические термины. Сначала мы прописываем объект, затем уточняем его действия, потом добавляем освещение тёплыми лучами закатного солнца, ну и, наконец, полируем всё это указанием нужного направления живописи.
Добротный портрет
С генерацией лиц дело обстоит сложнее, да и махинации с настройками здесь требуются вполне серьёзные. Один из самых популярных запросов в сети обычно звучит так:
«крупный план девушки с рыжими волосами, веснушки, мягкий утренний свет, фотореализм, объектив пятьдесят миллиметров»
Далее следует более мрачный атмосферный вариант, когда мы просим нарисовать пожилого моряка с густой бородой, курящего трубку на фоне штормового моря, где солирует кинематографичное освещение и тёмные тона. Третьим в нашем списке идёт создание профессионального аватара, где важен строгий деловой стиль. Для этого стоит написать: «молодой мужчина в тёмно-синем костюме, сидит за дубовым столом в светлом офисе, размытый задний фон, студийный свет, высокое разрешение». Ну и, конечно же, нельзя не упомянуть сказочные образы, которые точно порадуют ваше чадо. Ведь дети грезят картинками в духе: «маленькая девочка в красном плаще идёт по заснеженному лесу, держит в руках светящийся фонарь, сказочная атмосфера, стиль цифровой живописи».
Вредно ли усложнять запрос?
Многоэтажные конструкции из сотен слов. Это тяжело. Потому что нейросеть банально теряет нить повествования. С одной стороны, щепетильный подход позволяет учесть каждую мелочь, с другой — чрезмерная наляпистость описания часто приводит к откровенному графическому браку. Лишние конечности или искажённые пропорции лица обязательно всплывут, если перегрузить бота противоречивыми деталями. Безусловно, Алиса всеми силами старается угодить пользователю, но её возможности не безграничны. Не стоит забывать про правило золотой середины: тридцать-сорок точно подобранных слов творят чудеса гораздо эффективнее, чем целый абзац бессвязного текста. И всё же, если результат вас категорически не устраивает, не нужно сразу опускать руки и закрывать приложение. Стоит лишь немного перефразировать предложение, сместив акценты на другие важные детали. Впрочем, иногда именно случайные ошибки алгоритма придают картинке ту самую самобытную изюминку.
Пейзажи и архитектура
Живая природа и величественные здания всегда удавались искусственному интеллекту на славу. К первой группе относится генерация классических природных красот. Довольно просто получить изысканный колоритный вид, попросив бота создать заснеженные пики Альп на рассвете, где густой туман оседает в низине, а яркие насыщенные цвета подчёркивают гиперреализм сцены. Следующий важный критерий — умение работать с городской средой. Тут выручит запрос про оживлённую улицу Токио под проливным дождём, дополненную неоновыми вывесками в лужах и выдержанную в стилистике киберпанка вечернего времени. Отдельно стоит отметить интерьерные фантазии, которые часто используют профессиональные дизайнеры для поиска свежего вдохновения. Вы можете смело скормить Алисе текст про уютную гостиную в скандинавском стиле, снабжённую панорамными окнами с видом на сосновый бор, пылающим камином и реалистичной визуализацией. Последним в этом перечне идёт исторический антураж. Настоящий кладезь для любителей старины скрывается в фразах наподобие:
«узкая мощёная улочка Праги девятнадцатого века, газовые фонари, экипаж вдалеке, сепия, масляная живопись»
Стилизация в Алисе: киберпанк и фэнтези
Стиль гранж, нежная акварель или даже суровый советский ретрофутуризм — встроенный генератор понимает огромное множество направлений. А вот оригинальное название художественного течения лучше писать без орфографических ошибок, иначе алгоритм может серьёзно запутаться. В представлении многих обывателей нейросети рисуют только пластиковые и безжизненные картинки. Это не так. Достаточно добавить в текстовое поле фразу «в стиле картин Ван Гога» или «карандашный набросок», как изображение мгновенно обретает живой характер. Например, для получения футуристичного кадра стоит попробовать создать робота-самурая на фоне разрушенного мегаполиса, окружённого летящими искрами и закованного в толстую металлическую броню. А если хочется с головой окунуться в магический мир, то отличной базой станет древний замок на парящем острове под фиолетовым небом с двумя лунами. Ложка дёгтя кроется лишь в том, что некоторые редкие художественные направления (вроде кубизма или дадаизма) искусственный разум пока смешивает довольно хаотично.
Достопримечательности России: архитектура
Родные просторы всегда вдохновляли художников, а теперь они приковывают внимание и современных цифровых творцов. Огромный интерес вызывает генерация знакомых мест в совершенно необычных условиях. Сначала мы просим нарисовать зимнюю Красную площадь, затем добавляем массивные элементы стимпанка, дополняем сцену пролетающими в небе дирижаблями, ну и, наконец, заливаем всё это золотистым светом уходящего солнца. Собор Василия Блаженного был объявлен достроенным в тысяча пятьсот шестьдесят первом году, однако на этом его визуальная история не закончилась. Вы можете смело облачить этот грандиозный памятник архитектуры в неоновые вывески, написав: «храм в Москве, киберпанк, голографические проекции, дождливая ночь, отражения в лужах». Не перегружайте сцену мелкими туристами на переднем плане, лучше позволить самому зданию солировать в кадре. Тем более, что Алиса отлично знает пропорции и формы подавляющего большинства отечественных достопримечательностей.
Предметная съёмка
Создание отдельных предметов требует максимально щепетильного подхода от автора. Вещи ведь не обладают эмоциями, поэтому вся прелесть кадра кроется исключительно в освещении и материалах. Сначала мы просим нарисовать старинную шкатулку, затем накладываем текстуру потрескавшегося красного дерева, потом украшаем её витиеватыми золотыми вензелями, ну и, наконец, заливаем композицию мягким светом из окна. Кажется, что звучит это довольно просто, но подводные камни обязательно всплывут при попытке сгенерировать прозрачное стекло или воду. Дело в том, что нейросети часто путаются в сложных физических преломлениях лучей. Чтобы обойти эту неоднозначную проблему, стоит использовать слова «студийная макросъёмка», «отражение света» или «чёткие блики на гранях». Отличный результат получится, если написать:
«хрустальный бокал с красным вином на дубовом столе, напиток льётся рекой из бутылки, капли летят в воздухе, тёмный фон, профессиональное фото»
Да и самим объектам всегда комфортнее находиться в естественной для них среде, а не висеть в пустом чёрном вакууме.
Технические настройки
Качество итогового изображения напрямую зависит от тех самых технических маркеров, которые вы добавите в самом конце своего сообщения. Само собой, слова вроде «высокое разрешение восемь ка» или «максимальная детализация» вносят весомую лепту в финальную генерацию. Но есть и обратная сторона медали. Иногда излишняя цифровая резкость напрочь убивает художественную атмосферу, делая добротный современный арт слишком плоским и стерильным. При работе с освещением лучше избегать общих фраз, отдавая предпочтение жёсткой конкретике. Вы можете легко управлять тенями, прописывая «контровой свет», «мягкое боковое освещение» или даже «тусклый свет от старой восковой свечи». Вся суть в том, что алгоритм обучался на настоящих фотографиях, где эти параметры были чётко размечены живыми людьми. К слову, не стоит пренебрегать и указанием типа виртуальной камеры. Использование фраз, усиленных упоминанием объектива на тридцать пять миллиметров, дополненных эффектом плёночного зерна и снабжённых правильной выдержкой, помогает добиться великолепных оптических искажений.
Творческий процесс создания изображений с помощью обычных текстовых команд требует от человека определённой визуальной насмотренности и запаса терпения. Каждая новая сгенерированная картинка расширяет границы нашего воображения, помогая находить неожиданные решения для самых разных задач, от оформления личного блога до создания концепт-артов. Не бойтесь ломать устоявшиеся стереотипы, смешивая исконно классические сюжеты с агрессивным киберпанком или добавляя абсурдные детали в привычные скучные пейзажи. Ведь именно в таких смелых экспериментах часто рождаются истинные шедевры цифрового искусства, которые поражают воображение зрителей. Желаю неиссякаемого вдохновения, пусть каждый ваш запрос бьёт точно в цель, а полученный результат обязательно порадует глаз и станет отличным решением для будущих проектов!