В сети представлено множество замысловатых руководств по общению с искусственным интеллектом, где обыватель натыкается на глухие стены непонятного программного кода. Казалось бы, что может быть проще обычного спелого тропического плода? И всё-таки именно этот привычный сладкий перекус внезапно стал идеальным полигоном для тестирования истинных возможностей современных генеративных сетей. Буквально десятилетие назад мысль о том, чтобы часами просить бездушную машину нарисовать или детально описать подобную мелочь, казалась абсолютным абсурдом, но сейчас на таких простых понятных вещах строится глубинное понимание сложных математических алгоритмов. А начать стоит с предельно грамотного составления базовой текстовой команды.
В чём кроется смысл?
Задача не из лёгких. Ведь заставить упрямый алгоритм выдать нечто по-настоящему изысканное бывает довольно сложно. С одной стороны, можно просто запросить красивую картинку, с другой — итоговый результат выйдет невероятно пресным. Вся суть в том, что нейросети мыслят заученными паттернами, а стандартный скупой текст выдаст самую банальную пластиковую фотографию. Спасательный круг — это внимание к мельчайшим деталям освещения. Настоящая магия начинается там, где в дело решительно вступают точные описания шероховатой текстуры, мягкого контрового света или конкретной исторической эпохи. К слову, львиная доля по-настоящему успешных генераций опирается именно на скрупулёзный подбор неочевидных эпитетов. И если раньше именитые художники тратили долгие годы на изучение правильной светотени, то сегодня достаточно правильно сформулировать свою мимолётную мысль.
Текстовые запросы: философский контекст
Жёлтая изогнутая кожура. С этой незначительной мелкой детали стартует абсолютное большинство проверок на креативность продвинутых диалоговых ботов. Нужно отметить, что обученная нейронная сеть прекрасно понимает человеческую иронию. Один из самых популярных видов запросов начинается с просьбы написать трагичную историю от лица переспелого плода, оказавшегося на холодном кухонном столе. Далее следует задать машине жанр глубокой экзистенциальной драмы. Затем необходимо поручить боту добавить тяжёлые размышления о скоротечности бытия на фоне угрожающе гудящего блендера. Последним в списке идёт требование завершить короткий рассказ совершенно неожиданным комичным поворотом событий. Это надёжно. Потому что проверено. Временем. Впрочем, не стоит перебарщивать с тяжеловесными философскими терминами, иначе итоговый текст станет абсолютно нечитаемым.
Как выбрать стиль изображения?
Стиль гранж в интерьере часто дополняется странными арт-объектами, а наш подопытный фрукт отлично впишется в этот мрачный антураж. Обязательно ли использовать сложные профессиональные термины? Вовсе нет. Однако для фотореализма потребуется запрос, насыщенный сухими техническими параметрами.
Тут выручит макросъёмка, объектив пятьдесят миллиметров, холодный студийный свет, капли утренней росы на пористой кожице, разрешение восемь тысяч пикселей.
Следующий важный критерий — грамотная художественная стилизация под разные направления искусства. Киберпанк-направление тяготеет к неоновому свечению, поэтому стоит прописать хромированный металлический корпус, подсвеченный синими светодиодами, парящий над голографической рекламной витриной. Отдельно стоит упомянуть абстрактную живопись. Здесь уверенно солирует чистая экспрессия: размашистые густые мазки масляной краски, контрастные глубокие фиолетовые тени, ломаная кубистическая форма. Ну и, наконец, классический сюрреализм, где объект гигантских исполинских размеров величественно возвышается над выжженной пустыней, а вокруг него медленно оседает красная марсианская пыль.
Синтаксический контроль
Нагромождение лишних слов часто творит чудеса со знаком минус, быстро превращая красивую картинку в грязную кашу. Неопытный обыватель часто уверен, что сотня эпитетов сработает лучше десятка, но на самом деле алгоритм просто теряется в информационном шуме. Тем более, что излишняя визуальная наляпистость быстро бьёт по бюджету доступных токенов. Разумеется, лучше сразу отказаться от откровенно противоречивых взаимоисключающих команд в одной строке. Если прописать одновременно акварельную прозрачную лёгкость и суровую тёмную графику игрового движка, на финальном рендере неизбежно всплывут жуткие подводные камни в виде графических артефактов. Главное — вовремя угадать с доминирующей цветовой палитрой. Нельзя не упомянуть скандальный арт-объект итальянца Маурицио Каттелана. Инсталляция была продана за сто двадцать тысяч долларов в две тысячи девятнадцатом году (сумма действительно внушительная), однако сама идея банально примотанного скотчем к белой стене съедобного фрукта стала настоящим неисчерпаемым кладезем для интернет-мемов. Желательно попытаться воссоздать этот грандиозный арт-абсурд, попросив обученную нейросеть приклеить его толстой синей изолентой к стальной обшивке космического корабля.
Достопримечательности виртуальности: банан-гигант
Слегка потемневший коричневый кончик. Именно с него мы начинаем заворожённо рассматривать странную архитектурную генерацию, где колоритный тропический гость гордо венчает стеклянную крышу современного небоскрёба. Когда-то тихое провинциальное место сейчас превратилось бы в шумный центр притяжения тысяч туристов, появись такой добротный самобытный монумент на реальной городской площади. Кстати, сложные архитектурные промты тоже заслуживают истинного глубокого уважения среди цифровых творцов. Отличной практикой станет попытка сгенерировать высотное офисное здание в форме изогнутого полумесяца, облицованное прочным жёлтым полимером, снабжённое широкими панорамными окнами, украшенное висячими зелёными террасами на крыше. Зрелище получается удручающее или поистине гениальное? Зависит исключительно от вкуса смотрящего. Безусловно, такая смелая вычурная архитектура моментально приковывает внимание любого прохожего. Да и самим инженерам иногда крайне полезно с головой окунуться в ничем не ограниченный полёт фантазии. А вот действительно подходящее оригинальное название для такого масштабного смелого проекта придумать бывает довольно сложно.
Механики генерации: Midjourney и ChatGPT
Нельзя не упомянуть разницу в восприятии текста разными алгоритмами. Если текстовый бот обожает длинные витиеватые рассуждения, то графический генератор предпочитает сухую выжимку фактов. К первой группе относится создание объёмных описаний, где нужно буквально разложить по полочкам каждую эмоцию.
Запрос может содержать просьбу описать богатый внутренний мир нашего съедобного героя, его первобытные страхи перед острым ножом или мечты о возвращении на родную экваториальную ветку.
Следующий важный критерий относится уже к визуальным сетям. Здесь уверенно работает строгая структура, нарушая все классические постулаты привычной литературы. Желательно выносить самые значимые визуальные маркеры в самое начало строки, а технические параметры камеры оставлять напоследок. Местный цифровой бомонд обязательно оценит такой щепетильный скрупулёзный подход к настройке фокусного расстояния. И всё-таки, переносить правила из одной среды в другую не стоит, иначе непременно возникнут ошибки.
Стоит ли использовать коммерческий подход?
Многие маркетологи искренне считают, что рекламные продающие тексты должны быть всегда предельно серьёзными, но на самом деле лёгкий абсурдный юмор часто продаёт товары в разы лучше. Команда начинается с того, что бот должен написать подробный весёлый сценарий рекламного телевизионного ролика, где главный харизматичный герой — спортивный подтянутый фрукт в модных солнцезащитных очках. С этого нелепого предложения легко стартует вполне добротный коммерческий креатив. Естественно, кошелёк станет ощутимо легче, если нанимать под эту задачу целую толпу профессиональных именитых сценаристов, а тут умная нейросеть скромно вносит свою весомую лепту почти бесплатно (иногда всего за пару минут). Не стоит сильно скупиться на яркие живые эмоции в составленном запросе. Обязательно стоит попросить бота описать сладкий вкус так, чтобы случайные читатели моментально грезят о немедленной покупке. Это же правило касается и описания физических свойств. Свежая ароматная мякоть, мгновенно тающая во рту, заряжающая бодрящей энергией на добрых три часа активной работы. Тем более, такой нестандартный смелый подход уж точно не сильно ударит по кошельку начинающего экономного предпринимателя. Обе стороны медали здесь предельно очевидны: колоссальная экономия денежных средств и совершенно бесконечный бесперебойный поток свежих маркетинговых идей.
Махинации с кодом
Даже рядовой пользователь может почувствовать себя настоящим хакером, если начнёт регулярно применять так называемые негативные промты. Это удобно. Ведь финальный результат перестанет зависеть от случайных капризов математической модели. Нужно отметить, что отсечение лишних нежелательных элементов часто работает намного эффективнее прямого лобового описания. Например, если нет желания видеть в кадре обезьян, пальмы или густые джунгли, желательно просто прописать эти слова с минусом в самом конце длинной командной строки. Кроме того, серьёзное влияние на картинку оказывает параметр стилизации, который задаётся специальными числовыми значениями от нуля до тысячи. Ну и, конечно же, не стоит забывать про правильное соотношение сторон. К тому же, вертикальные вытянутые форматы отлично подходят для генерации обоев на телефон, а широкие горизонтальные рамки идеально впишутся в дизайн масштабной презентации. Все эти тонкие невидимые нюансы обязательно дадут о себе знать на этапе финальной постобработки изображения.
Создание выверенных текстовых команд для искусственного интеллекта постепенно превращается в полноценное востребованное ремесло, требующее недюжинной фантазии и математической точности. Долгий поиск той самой идеальной формулировки может занять определённое время, однако каждая новая удачная попытка сильно расширяет узкие границы нашего привычного восприятия. Само собой, даже самый странный абсурдный эксперимент со спелым жёлтым плодом способен стать крепким фундаментом серьёзного коммерческого проекта или просто поднять упавшее настроение в хмурый дождливый день. Определённо стоит экспериментировать с формами, нет смысла бояться смешивать несочетаемые исторические эпохи и поручать бездушной машине самые откровенно безумные творческие задачи. Пусть каждая новая необычная генерация приятно порадует домочадцев и заставит любимое чадо улыбнуться, а нестандартный смелый подход к повседневному творчеству навсегда отвадит от рутины. Перевоплощение завершено!