Множество невероятных шедевров представлено в глобальной сети, глядя на которые невольно задаёшься вопросом об их происхождении. Часто обыватель ошибочно полагает, что достаточно написать пару общих слов, а умная машина сама додумает всё остальное. Виной алгоритма плохой результат становится далеко не всегда, ведь чаще всего реальная проблема кроется в скудном описании. Искусственный интеллект творит чудеса только в том случае, если получает чёткие, выверенные инструкции без лишней словесной воды. Но чтобы не ошибиться, нужно сперва разложить по полочкам саму структуру текстового запроса.
Стоит ли писать на родном языке?
Сложно ли общаться с генеративными сетями по-русски? Да, иногда возникают досадные трудности перевода, но результат того определённо стоит. Буквально десятилетие назад автоматическая генерация казалась научной фантастикой, однако сейчас отечественные модели прекрасно понимают великий и могучий. И всё же западные аналоги часто требуют английского, поэтому наши соотечественники регулярно прибегают к помощи онлайн-переводчиков. Дело в том, что прямой машинный перевод иногда сильно искажает изначальный смысл, превращая изысканный творческий замысел в откровенную нелепицу. К слову, именно на этом этапе всплывут первые серьёзные подводные камни. Ведь алгоритм воспринимает слова буквально, не считывая тонких метафор. Тем более, что отечественные нейросети уже давно научились распознавать сложный русский синтаксис (включая запутанные деепричастные обороты). А вот оригинальное название того или иного стиля лучше всё-таки оставлять без перевода.
Архитектура запроса
Задача не из лёгких. Формирование грамотного описания требует определённого времени и терпения. Словно малое чадо, нейросеть требует постоянного контроля и направления. Начинать работу следует с определения главного объекта, который солирует в кадре. Далее к нему постепенно добавляются детали визуального окружения, задающие правильный антураж. Затем наступает этап кропотливого выбора освещения, плавно перетекающий в точную настройку виртуальной камеры. Завершает этот процесс указание общей стилистики, будь то строгий фотореализм или вычурный гранж. Сначала обычно прописывают само действие главного героя, во-вторых, фиксируют его повседневную одежду, ну и, наконец, передают эмоциональное настроение сцены. Не стоит забывать про технические параметры генерации, ведь базовые постулаты композиции никто не отменял. Наляпистость здесь совершенно ни к чему, поэтому лучше отказаться от взаимоисключающих понятий вроде «очень яркая тёмная ночь». Это надёжно. Потому что проверено. Опытом тысяч цифровых художников.
Как выбрать стиль?
А вот с визуальным оформлением дело обстоит намного сложнее. Многие новички считают, что нейросети сами подберут идеальный художественный фильтр, но на самом деле без прямого указания итоговая картинка получится пустой. Естественно, львиная доля пользователей с самого начала тяготеет к фотореализму. Это же так здорово, когда сгенерированный портрет практически невозможно отличить от работы профессионального студийного фотографа. Разумеется, для достижения такого мощного эффекта стоит использовать конкретные слова вроде «ультрареалистично», «разрешение восемь ка» или «кинематографичный свет». Творческий бомонд давно оценил эти технологии, поскольку они здорово экономят время. Следующий важный критерий — историческая эпоха. Окунуться в далёкое прошлое довольно просто, добавив упоминание конкретного года. Самобытный ретро-стиль сразу бросается в глаза неискушённому зрителю. Ну, а для любителей смелых экспериментов настоящим спасательным кругом станет упоминание имён известных классических живописцев.
Портретная съёмка в студии
Мягкий свет падает на лицо. Именно с таких мелких, казалось бы, незначительных деталей рождается грандиозный визуальный опыт. Попробуем создать добротный женский портрет, который приковывает внимание буквально с первой секунды. В поле ввода отправляется следующий текст:
«Крупный план показывает портрет двадцатилетней рыжеволосой девушки. Усыпанное веснушками лицо выражает спокойствие, а изумрудные глаза смотрят прямо в объектив. Девушка решила облачиться в плотный вязаный свитер горчичного цвета. Размытый фон состоит из осеннего леса и падающих золотых листьев. Естественное освещение дополняется контровым светом на волосах. Сцена снята на объектив пятьдесят миллиметров при диафрагме один и восемь. Требуется высочайшая детализация и профессиональная цветокоррекция».
Безусловно, такой щепетильный подход всегда творит чудеса. Лицо модели венчает композицию, а сильно размытый задник добавляет изображению необходимой глубины. Серьёзное вложение средств потребовалось бы при заказе такой съёмки у профи, а тут мы получаем её совершенно бесплатно.
Пейзажи и архитектура
Зрелище удручающее, когда вместо красивого ночного мегаполиса на экране появляется невнятное серое месиво. Множество таких картинок оседает на жёстких дисках разочарованных пользователей. Чтобы этого избежать, стоит проявить максимум фантазии, чтобы она лилась рекой. Пример удачного запроса:
«Узкая мощёная улица находится в колоритном старинном европейском городке. Идёт сильный проливной дождь, поэтому в лужах отражается свет тёплых жёлтых фонарей. По бокам расположены двухэтажные каменные дома. Их черепичные крыши намокли, а в окнах уютно горит свет. Ночная атмосфера передаёт мрачное, но уютное настроение. Стиль киберпанк здесь смешан с викторианской эпохой. Кадр выглядит кинематографично благодаря неону и объёмному туману при разрешении шестнадцать ка».
Внушительный мрачный город здесь уверенно стоит на ногах и задаёт тон всему цифровому произведению. К тому же, добавление плохой погоды оживляет скучную статику. Конечно, генерация сложных многоуровневых архитектурных форм часто требует мощных вычислительных ресурсов, однако итоговый результат действительно поражает воображение.
Предметная съёмка еды
Выглядит впечатляюще. Особенно когда речь заходит о кулинарных изысках, которые так любят генерировать владельцы ресторанов. Внести лепту в создание вкусной картинки, которая не сильно ударит по кошельку малого бизнеса, поможет правильный свет. Пробуем так:
«Свежий бургер с сочной говяжьей котлетой лежит на деревянной разделочной доске. Расплавленный сыр чеддер медленно стекает по горячему мясу. Хрустящие листья салата контрастируют с каплями воды на красных помидорах. Размытый интерьер бара служит задним фоном. Тёмный ключ и направленный студийный свет подчёркивают густой пар. Он поднимается от горячего мяса в стиле макросъёмки и фуд-фотографии высокого разрешения».
Изюминка этого описания — аппетитные фактуры. Тёплый пар, холодные капли, грубое старое дерево. Обе стороны медали здесь учтены: объект выглядит не только эстетически красивым, но и абсолютно съедобным. Впрочем, добиться правильного расположения кунжута на булочках бывает довольно сложно, поэтому каждый мелкий нюанс имеет значение.
Вредно ли перегружать текст?
Махинации с тонкими настройками не всегда проходят гладко для рядового пользователя. Не стоит перегружать свой текст лишними цветастыми эпитетами, иначе алгоритм просто запутается в расставленных приоритетах. Лучше отказаться от чересчур абстрактных философских понятий при составлении промта, ведь постоянно натыкаешься на одни и те же ошибки. Дело в том, что вычислительная машина не понимает слова «духовность», «свобода» или «нежность» в их прямом человеческом смысле. Вся суть в том, что ей остро нужны понятные визуальные маркеры этих сложных чувств. Вместо «нежности» стоит написать «мягкий розовый свет, плавные изогнутые линии, пушистые белые облака». Не скупитесь на детальное описание физических материалов. Глянцевым пластиком, отражающим стеклом, дорогим бархатом, текстурным деревом — именно этими материалами задаётся объём, кардинально меняющий итоговую атмосферу картинки. К слову, исторические фотографические факты тоже сильно помогают. Камера обскура была изобретена много веков назад, но упоминание старинных методов съёмки до сих пор добавляет кадрам приятного винтажного шарма.
Санитарный контроль
Ложка дёгтя в бочке цифрового мёда — это когда на безупречно сгенерированном человеке вдруг оказывается шесть длинных пальцев. О таких результатах многие только грезят в страшных снах. Полностью исключить такие жутковатые артефакты пока практически невозможно. Но минимизировать их появление можно довольно просто, добавив так называемый негативный промт. Алгоритм сначала отсекает уродливые формы, затем удаляет деформированные пропорции, после чего стирает лишние конечности. Далее следует очистка от размытых текстур, сменяющаяся удалением напечатанного текста, ну и, наконец, финальный рендер избавляется от водяных знаков. Не забудьте проверить орфографию перед отправкой. Искусственный интеллект крайне чувствителен к нелепым опечаткам. Кроме того, стоит активнее экспериментировать с математическими весами слов, если выбранная платформа это функционально позволяет. Ведь одно единственное неоднозначный термин способен мгновенно перечеркнуть весь первоначальный замысел. Да и самим творцам гораздо приятнее получать чистый результат, от которого кошелёк станет легче только в переносном, радостном смысле.
Процесс генерации не сложный, но весьма кропотливый. Насмотренность и регулярная практика постепенно выведут ваши визуальные эксперименты на совершенно новый профессиональный уровень. Создание бюджетных, но качественных изображений сродни написанию классической картины, только вместо привычных кистей здесь выступают правильно подобранные текстовые команды. Настоящий кладезь скрытых возможностей открывается перед теми, кто не боится смело пробовать новые словесные связки и нестандартные ракурсы. Удачи в освоении нейросетей, пусть каждый ваш запрос превращается в настоящий шедевр, который обязательно порадует домочадцев и удивит коллег!