Промт для соединения фото (с примерами готовых промтов)

Кто из нас, глядя на два совершенно разных изображения, не мечтал создать из них нечто третье, абсолютно новое и гармоничное? Буквально десятилетие назад для подобных махинаций требовалось виртуозное владение графическими редакторами, уйма времени и художественное чутьё. Сегодня же в мир цифрового искусства ворвались нейросети, готовые выполнить эту работу за считаные минуты, смешивая кота и космос, портрет и пейзаж, акварель и готику. Однако, чтобы этот творческий тандем человека и машины сработал как надо, нейросеть нужно правильно попросить. А начать стоит с освоения искусства составления промтов для соединения изображений.

Базовый принцип: Как нейросеть «видит» задачу

Задача не из лёгких. В представлении многих обывателей, соединение двух фото – это что-то вроде наложения полупрозрачных слоёв в Photoshop. Но на самом деле всё куда интереснее и сложнее. Когда вы «скармливаете» нейросети два исходника, она не просто их смешивает. Она анализирует оба изображения, раскладывая их на концепции, стили, объекты, цветовые палитры и композиционные решения. А затем, опираясь на эти данные и ваше текстовое описание, она синтезирует совершенно новое изображение, которое вобрало в себя черты обоих «родителей». Это скорее не коллаж, а генетический эксперимент, где результат может быть весьма непредсказуемым, но оттого и более захватывающим.

Сложно ли этим управлять? Вовсе нет. Главное – понять логику машины. Нейросеть, по сути, ищет общие знаменатели и пытается элегантно их объединить. Если вы даёте ей портрет человека в красном платье и фотографию осеннего леса, она может взять позу и силуэт от человека, а цветовую палитру и текстуру – от пейзажа. Результатом может стать девушка, платье которой будто соткано из багряных листьев. Поэтому перед генерацией всегда стоит задать себе вопрос: какие именно элементы из каждой фотографии я хочу увидеть в финале? Это поможет точнее сформулировать текстовую часть запроса.

Как правильно подготовить исходники?

Качество генерации напрямую зависит от того, что вы даёте нейросети на входе. Мусор на входе – мусор на выходе, этот постулат здесь работает безотказно. Поэтому к выбору исходных изображений стоит подойти скрупулёзно. Во-первых, они должны быть достаточно чёткими и контрастными. Не стоит брать размытые, тёмные или «шумные» кадры, где основной объект теряется на фоне. Чем яснее нейросеть «увидит» то, что вы хотите соединить, тем лучше будет результат. На задний план и мелкие детали она, как правило, обращает мало внимания, фокусируясь на центральных фигурах и самых заметных элементах.

Во-вторых, формат и способ загрузки. Большинство сервисов, таких как Midjourney, работают через загрузку изображений в свой чат (например, в Discord) и последующее копирование прямой ссылки на файл. Ссылка эта должна заканчиваться на расширение картинки, такое как .jpg, .png или .gif. Просто загрузите нужные файлы в любой диалог, кликните по картинке и скопируйте её URL-адрес. К слову, не стоит переживать за сложность фона. Если вам нужен только силуэт кошки с одной фотографии, а со второй – текстура звёздного неба, умный алгоритм, скорее всего, поймёт вашу задумку и не станет врисовывать в космос диван, на котором эта кошка сидела.

Что писать в самом промте?

Вот мы и подошли к самому интересному. Сам по себе промт для соединения фото довольно прост по своей структуре. Сначала вы вставляете одну за другой прямые ссылки на ваши изображения, разделённые пробелом. После ссылок ставится пробел, и начинается текстовая часть – ваше прямое указание нейросети, что именно вы хотите получить. А вот здесь уже открывается настоящий кладезь возможностей для творчества. Текстовый промт служит путеводной звездой для искусственного интеллекта. Без него нейросеть попытается смешать всё со всем, и результат будет похож на случайную мешанину.

Что насчёт деталей? В текстовом описании вы можете указать желаемый стиль, атмосферу, цветовую гамму и даже конкретные детали, которые нужно подчеркнуть. Например, если вы соединяете портрет девушки и фото цветущей сакуры, можно дописать: «девушка с волосами из розовых лепестков сакуры, в стиле аниме Хаяо Миядзаки, нежные пастельные тона». Такое уточнение направит креативность нейросети в нужное русло. Ну и, конечно же, не стоит забывать про технические параметры, которые ставятся в самом конце промта. Один из самых важных – это «вес» изображения (--iw), который регулирует, какой из исходников будет доминировать. Другой полезный параметр – соотношение сторон (--ar), позволяющий задать нужный формат, например, вертикальный (--ar 2:3) или горизонтальный (--ar 16:9).

Примеры готовых промтов

Теория – это хорошо, но без практики она мертва. Давайте разложим по полочкам несколько конкретных сценариев, чтобы логика стала кристально ясной. Эти примеры помогут набить руку и понять основные механики.

Представим, что наша цель – создать сюрреалистичный портрет, объединив викторианскую даму и образ туманного, загадочного леса. Берём две соответствующие картинки. Промт может выглядеть так:

[ссылка_на_фото_дамы] [ссылка_на_фото_леса] portrait of a ghost victorian woman emerging from the misty enchanted forest, ethereal atmosphere, translucent dress, muted colors, photorealistic, cinematic lighting --ar 3:4 --iw 0.8

Здесь мы просим создать портрет призрачной леди, которая «проявляется» из леса, задаём атмосферу, указываем на полупрозрачность платья и приглушённые цвета. Параметр --iw 0.8 говорит сети чуть больше ориентироваться на текстовое описание, чем на стиль исходников.

Другой популярный приём – перенос стиля. Допустим, у вас есть фотография вашего кота, и вы хотите стилизовать её под картину Ван Гога «Звёздная ночь». Загружаем фото кота и репродукцию картины. Промт будет довольно лаконичным:

[ссылка_на_фото_кота] [ссылка_на_«Звёздную_ночь»] a cat in the style of Van Gogh's Starry Night, oil painting, expressive brushstrokes --ar 4:3 --iw 1.5

В этом случае мы повышаем вес изображений (--iw 1.5), чтобы нейросеть максимально точно скопировала и позу кота, и вихреобразные мазки художника, создав органичный синтез.

Ну и, наконец, соединение несовместимого – объекта и текстуры. Хотите увидеть классический автомобиль, корпус которого сделан из мрамора? Легко. Находим фото ретро-авто и красивую текстуру мрамора с прожилками. Запрос будет следующим:

[ссылка_на_фото_авто] [ссылка_на_текстуру_мрамора] a vintage muscle car made entirely of white marble with golden veins, studio shot, hyperrealistic, octane render, reflective surface --ar 16:9

Тут мы чётко указываем, что машина должна быть сделана из мрамора, и добавляем технические уточнения для получения фотореалистичного студийного снимка.

Какие ошибки чаще всего допускают новички?

Подводные камни, конечно, есть. И на них натыкается львиная доля начинающих экспериментаторов. Первый и самый частый промах – игнорирование текстового описания. Многие просто вставляют две ссылки и ждут чуда. Иногда оно случается, но чаще всего результат выглядит сырым и невнятным. Не ленитесь написать хотя бы пару слов о том, что вы ждёте от генерации. Это же правило касается и параметра веса --iw. Без него нейросеть будет смешивать стили и объекты в равной пропорции, что не всегда приводит к желаемому итогу.

Вторая распространённая ошибка – перегруженный промт. Не стоит пытаться впихнуть в одно описание десяток противоречащих друг другу стилей и деталей. «Портрет в стиле киберпанк, готика, импрессионизм и детского рисунка» скорее запутает нейросеть, чем поможет ей. Лучше сосредоточиться на одной-двух ключевых идеях. Ну и третья ложка дёгтя – это ожидание стопроцентного сходства. Нейросеть – не копировальный аппарат. Она творит, интерпретирует и фантазирует. Поэтому лицо с вашего исходного портрета, скорее всего, изменится. Но ведь в этой непредсказуемости и кроется вся изюминка творческого процесса.

Эксперименты с соединением изображений – это не просто технический навык, а настоящее искусство. Здесь нет строгих правил и единственно верных решений. Каждый новый промт – это маленькое приключение с непредсказуемым финалом. Главное – не бояться пробовать, менять текстовые описания, играть с параметрами и давать волю своей фантазии. Удачи в ваших творческих поисках, и пусть результаты превзойдут все ожидания.