В сети можно найти миллионы изображений врачей, но львиная доля из них – это бездушные стоковые фотографии с пластиковыми улыбками и неестественными позами. Такие картинки вызывают скорее не доверие, а ощущение фальши. Они давно приелись и стали маркером контента, сделанного на скорую руку. Для сайта клиники, блога о здоровье или научной статьи нужен живой, убедительный образ, который приковывает внимание. Удивительно, но с появлением нейросетей эта проблема решается, если знать, как правильно сформулировать запрос. А начать стоит с разбора анатомии идеального промта.
С чего начинается грамотный промт?
Многие считают, что достаточно написать «доктор в больнице», и нейросеть тут же выдаст шедевр. Но на самом деле такой короткий запрос – прямой путь к очередному шаблонному изображению. Задача не из лёгких. Чтобы получить добротный, реалистичный результат, текстовую команду нужно строить из нескольких смысловых блоков. Во-первых, это сам объект, то есть наш врач. Во-вторых, необходимо описать его действие или состояние – что он делает, какие эмоции испытывает. В-третьих, стоит продумать окружение, тот самый антураж, в котором находится персонаж. Ну и, наконец, последний, но не по значению, компонент – это стилистика и технические параметры съёмки. Именно комбинация этих четырёх элементов творит чудеса.
Детализация образа: создаём живого персонажа
Начать нужно с самого доктора. Кто он? Мужчина или женщина? Какого возраста? Молодой интерн с горящими глазами или умудрённый опытом профессор с сединой на висках? Не стоит пренебрегать и этнической принадлежностью, если это важно для контекста. К слову, указание национальности (например, «Japanese doctor» или «Hispanic female doctor») помогает нейросети отойти от европеоцентричных стандартов, которые в ней заложены по умолчанию. Отдельно стоит упомянуть одежду. Белый халат – это классика, но не единственное решение. Это может быть хирургический костюм (scrubs) определённого цвета, строгая деловая одежда для главврача или даже повседневный стиль, если мы изображаем психотерапевта.
Что насчёт эмоций? Улыбка – это хорошо, но не всегда уместно. Вдумчивый, сосредоточенный взгляд хирурга, изучающего рентгеновский снимок, вызовет больше доверия, чем дежурная голливудская улыбка.
Можно запросить сочувствующее выражение лица у педиатра, который общается с маленьким пациентом, или уверенное и спокойное – у кардиолога. Все эти нюансы превращают сгенерированную «куклу» в человека, которому хочется верить. Это же правило касается и позы: вместо статичного стояния можно указать «доктор, который сидит за столом и что-то пишет» или «врач, идущий по коридору клиники».
Как задать правильный антураж?
Окружение играет не меньшую роль, чем сам персонаж. Где именно находится наш врач? Это может быть и футуристическая лаборатория с голограммами, и уютный кабинет с деревянными панелями в стиле середины прошлого века, и стерильно чистая операционная, залитая холодным светом хирургических ламп. Описание фона добавляет изображению глубины и повествования. Не забудьте про детали. Разбросанные на столе медицинские инструменты, книжные полки с научной литературой, плакаты с анатомическим строением человека на стене – всё это работает на создание нужной атмосферы.
Особый интерес вызывает работа со светом. Вместо стандартного освещения можно попросить нейросеть имитировать «мягкий свет из окна» (soft window light) для создания тёплой и доверительной обстановки или «драматическое кинематографическое освещение» (dramatic cinematic lighting) для более напряжённого и серьёзного сюжета. Ракурс тоже имеет значение. Крупный план (close-up shot) сосредоточит внимание на лице и эмоциях врача, средний план (medium shot) покажет его взаимодействие с окружением, а общий план (full-body shot) позволит оценить всю сцену целиком.
Стилистика и технические параметры
Этот блок – кладезь инструментов для тонкой настройки. Здесь мы говорим нейросети, какой именно результат хотим видеть. Самый популярный запрос – «photorealistic», он заставляет ИИ стремиться к максимальной схожести с настоящей фотографией. Можно пойти дальше и указать модель камеры, например, «shot on Canon EOS R5» или «Leica M11 photo», что повлияет на цветопередачу и глубину резкости. Для придания изображению особой атмосферы можно добавить «глубокий боке» (deep bokeh), размывающий фон и акцентирующий внимание на главном герое.
Ну и, конечно же, не стоит забывать про технические команды, которые обычно добавляют в конец промта. Команда «–ar» (от aspect ratio) задаёт соотношение сторон. Например, «–ar 16:9» подойдёт для баннера на сайт, а «–ar 3:4» – для вертикального поста в социальных сетях. Параметр «–v» позволяет выбрать версию алгоритма генерации (например, «–v 6.0» для последней версии Midjourney), а «–s» отвечает за степень стилизации. Чем выше значение «–s», тем более художественным и менее реалистичным будет результат. Впрочем, для фото врача лучше придерживаться низких значений стилизации.
Готовые промты для вдохновения
Теория – это хорошо, но без практики она мертва. Давайте разложём по полочкам несколько готовых, довольно удачных промтов.
Начнём с образа дружелюбного семейного доктора. Нам нужен портрет женщины средних лет, располагающей к себе. Вот пример запроса: «Photorealistic portrait of a friendly female general practitioner, 45 years old, caucasian, with a warm, reassuring smile, wearing a light blue medical scrub over a white t-shirt, sitting in a bright, modern, and clean office with green plants in the background, soft natural afternoon light from a window, medium shot, shot on Sony A7 IV, deep bokeh, –ar 4:5 –v 6.0». Здесь мы видим исчерпывающее описание: возраст, эмоция, одежда, детализированный фон, тип освещения и конкретные технические параметры, которые вместе создают очень живой и тёплый образ.
Теперь создадим образ хирурга – сосредоточённого и уверенного в себе мужчины. Промт может выглядеть так: «Cinematic shot of a focused male surgeon, around 50 years old, of Asian descent, in a sterile operating room, wearing blue surgical scrubs, a cap, and a mask pulled down, looking intently at an X-ray film against a light box, dramatic key lighting from the side, intense and professional atmosphere, high detail, photorealistic, shot on RED camera, –ar 16:9». Этот запрос делает ставку на атмосферу. Слова «cinematic», «dramatic key lighting», «intense atmosphere» и упоминание профессиональной кинокамеры RED настраивают нейросеть на создание кадра, похожего на сцену из качественного медицинского сериала.
А вот пример для создания образа мудрого педиатра, общающегося с ребёнком. Задача сложнее, ведь в кадре уже два персонажа. «Heartwarming photo of a kind elderly male pediatrician with gray hair and glasses, gently listening to a young girl’s chest with a stethoscope, the doctor has a patient and caring expression, the scene is in a colorful and child-friendly examination room with cartoon drawings on the wall, soft and warm lighting, Canon EOS R5 photography, hyper-realistic, –ar 3:2». Изюминка этого промта – в акценте на эмоциях и взаимодействии. Слова «heartwarming», «gently», «patient and caring expression» напрямую указывают нейросети на то настроение, которое мы хотим передать.
Что делать, если результат не устраивает?
Даже самый скрупулёзный промт не всегда даёт идеальный результат с первой попытки. Что же делать? Во-первых, не стоит бояться кнопки «сгенерировать заново». Иногда нейросети просто нужно несколько попыток, чтобы поймать нужную волну. Во-вторых, можно прибегнуть к помощи негативных промтов. Это команда «–no», после которой перечисляются вещи, которые вы не хотите видеть на изображении. Например, «–no glasses, beard, harsh shadows» (без очков, бороды, резких теней). Это помогает отсечь нежелательные артефакты. Ну и, наконец, можно точечно менять слова в исходном запросе. Иногда замена «friendly» на «cheerful» или «modern office» на «classic study» кардинально меняет всё изображение.
Процесс создания идеального изображения с помощью нейросети – это не столько техническая задача, сколько творческий поиск. Не бойтесь экспериментировать, смешивать стили, добавлять неожиданные детали. Ведь именно в этих махинациях с текстом и рождаются по-настоящему запоминающиеся и убедительные образы. Удачи в ваших творческих поисках.