TL;DR
Хороший промпт для GPT Image 2 — это не одно предложение, а целый набор решений: объект съемки, сцена, стиль, ракурс, освещение, настроение. В этом руководстве вы найдете более 50 шаблонов промптов, готовых к копированию, охватывающих пять основных категорий: кинематографический стиль, портреты, динамика, природа и фэнтези. К ним прилагается список действий по исправлению неудачных результатов и эффективный рабочий процесс итераций. Все примеры изображений в статье созданы с помощью одной и той же модели KIE gpt-image-2-text-to-image, каждая из которых стоит 12 кредитов, а максимальный размер подсказки составляет 20 000 символов. Бесплатная пробная версия GPT Image 2 →
Структура хорошего ключевого слова
Большинство людей с самого начала пишут: «Что я хочу». А те, кто действительно умеет создавать хорошие изображения, пишут: «Что видит объектив». В этом и заключается весь секрет.
Проведя несколько тысяч тестов на интерфейсе KIE gpt-image-2-text-to-image, мы выработали набор из восьми формул с заполняемыми полями, который охватывает практически все возможные сценарии. Если заполнить шесть из восьми полей, результат уже будет выше среднего, а при полном заполнении можно достичь уровня коммерческих изображений.
Формула:
[Объект] + [Действие/поза] + [Сцена] + [Стиль/референс] + [Кадр/композиция] + [Освещение] + [Настроение/тональность] + [Обработка изображения]
Каждый слот позволяет окончательно решить проблему, которую модель должна была бы «угадывать»:
- Объект — кто или что изображено на кадре. «Рыжеволосая библиотекарша» в десять раз лучше, чем просто «женщина».
- Действие/поза — что происходит в данный момент. Глагол определяет композицию.
- Сцена — окружающий мир. Укажите страну, эпоху, время суток.
- Стиль/ссылки — «фильм-нуар», «анимация уровня Ufotable», «симметричная композиция Уэса Андерсона», «рекламный стиль Fenty Beauty». Используйте известный визуальный язык, а не нагромождение бессмысленных прилагательных.
- Кадр/композиция — « крайний крупный план», «широкоугольный снимок с низкой точки», «85-миллиметровый портретный объектив, f/1.4», «кадр в формате панорамы». Это ключ к превращению снимка в кинокадр.
- Свет——«боковой свет в час золотой зари», «одиночный свет Рембрандта», «отражение неона на мокрой поверхности». Ощущение, что освещение составляет 60% изображения.
- Настроение/Тональность——«Столкновение холодного синего и теплого оранжевого», «Теплый янтарь, углубляющий тени», «Десатурация в меланхоличном ключе».
- Обработка изображения — «Сверхреалистичный 4K», «Пленковая зернистость», «Стильный блокбастер». Будьте лаконичны, ведь основная работа уже проделана.
Базовый вариант против оптимизированного — сравнение двух версий одного и того же объекта

Исходный запрос, соответствующий приведенному выше изображению, звучит так:
A woman standing in a room.Теперь перепишем «одно и то же понятие» с использованием формулы с восемью слотами:
A breathtaking young woman with flowing auburn hair stands in a luxurious Art Deco penthouse at golden hour. She wears a champagne-colored satin slip dress that catches the warm light. Floor-to-ceiling windows behind her show a panoramic city sunset. Dramatic side lighting creates deep shadows and golden highlights on her face and bare arms. The composition follows the rule of thirds. Cinematic depth of field with gorgeous city bokeh. Fashion editorial quality. Ultra-realistic 4K.Комментарий на китайском языке: В пентхаусе, оформленном в стиле ар-деко, девушка с длинными волосами стоит у панорамного окна; боковой свет «золотого часа» вырисовывает очертания её лица и рук.

Примечание: Оптимизированная версия не заключается в том, чтобы нагромождать больше прилагательных, а в том, что модели приходится догадываться о меньшем количестве деталей. В основе GPT Image 2 лежит диффузионная модель, управляемая трансформером (см. объяснение диффузионных моделей в Википедии), и каждую деталь, которую вы не указали, модель восполняет своим «априорным средним значением». Если вы не упомянете «золотой час», она по умолчанию предоставит вам свет, характерный для облачного вторника в 14:00.
И в заключение — один интересный факт: максимальный размер подсказки в GPT Image 2 составляет 20 000 символов — это примерно 3000 английских слов. В обычных случаях столько не понадобится, но для сложных сцен с множеством персонажей или подробных концепт-артов такой лимит означает, что вы можете очень тщательно продумать композицию. В разделе 11 мы покажем, как использовать длинные подсказки.
Библиотека подсказок: Сцены в стиле кино
Сцены в стиле кино — это самый простой жанр, поскольку за сто лет истории кино сложился богатый визуальный словарь. Достаточно назвать жанр, эпоху и прием, и модель создаст для вас полноценный кадр.

1. Новые чёрные переулки Гонконга
Film noir cinematic shot. A dangerously beautiful femme fatale in a curve-hugging red silk dress with a thigh-high slit, walking through a rain-soaked Hong Kong back alley at night. Neon signs in Chinese characters reflect red and blue on the wet cobblestones. She carries a black umbrella over one shoulder, her red-painted lips the only warm color against the cold teal lighting. Smoke wisps from a nearby vent. Anamorphic lens, shallow depth of field, cinematic grain. Ultra-realistic 4K noir film frame.Комментарий на китайском: В дождливую ночь в переулке Гонконга девушка в красном платье, держа зонтик, идет по мощеной дорожке, на которой отражаются огни неонов.
2. Джаз-бар «Rembrandt»
Moody jazz bar interior. A mysterious woman in a sheer black lace dress sits on a velvet barstool, one leg crossed showing stiletto heels. Cigarette smoke curls around her silhouette. Warm amber spotlight from above illuminates her face and exposed collarbones while the rest fades into deep shadow. A saxophone player is a blurred silhouette in the background. Film noir meets modern luxury aesthetic. Dramatic Rembrandt lighting, 35mm film look. Ultra-realistic 4K.Комментарий на китайском: Девушка в чёрном кружеве в джаз-баре; одиночный верхний свет в сочетании с дымом создаёт драматическое освещение в стиле Рембрандта.
3. Крыша «Охотника за губридами»
Cyberpunk cinematic wide shot. A lone detective in a wet black trench coat stands on a neon-drenched Tokyo rooftop at 3am. Giant holographic advertisements of a geisha float across the skyline behind him, casting shifting pink and cyan light on his face. Light rain catches the glow. Flying cars streak past as horizontal light trails. Shot on anamorphic lens, 2.39:1 aspect, shallow depth of field. Blade Runner 2049 color grade — teal shadows, orange highlights. Ultra-realistic 4K cinematic frame.Комментарий на китайском: На крышах киберпанковского Токио детектива окутывают сине-розовые оттенки, проецируемые в рекламе гилока.
4. Симметричный вестибюль Уэса Андерсона
Wes Anderson style cinematic composition. A 1960s hotel concierge in a burgundy uniform stands dead-center in a pastel-pink Art Deco lobby, flanked by perfectly symmetrical potted palms and brass sconces. Flat front-on framing, everything on center axis. Soft fluorescent overhead lighting. Pastel pink and mint green color palette. 35mm film look. Ultra-detailed 4K.Комментарий на китайском языке: Розовый вестибюль отеля в стиле ар-деко, симметричная композиция, портье стоит в центре кадра.
5. Сцена противостояния на кухне в корейском криминальном фильме
Cinematic still from a modern Korean crime thriller. Two men face each other across a small Seoul apartment kitchen at 2am, both holding knives but frozen in a tense moment. Single fluorescent tube overhead casts hard green-tinted light and harsh shadows. Steam rises from an abandoned pot on the stove. Tight composition, 40mm lens, handheld feel. Bong Joon-ho style. Ultra-realistic 4K.Комментарий на китайском: Двое стоят лицом к лицу на кухне в Сеуле в два часа ночи; холодный зеленоватый свет люминесцентных ламп + съемка с рук.

6. Эпопея пустыни Виленнюв
Epic cinematic wide shot in Denis Villeneuve style. A lone hooded figure in flowing desert robes walks across a vast orange sand dune at sunset. The sun is enormous on the horizon, casting elongated shadows. Scale is extreme — the figure is tiny, the landscape overwhelming. Dust kicks up in the wind. Warm amber palette with deep violet shadows. Shot on 65mm, ultra-wide aspect. Ultra-realistic 4K cinematic quality.Комментарий на китайском: Широкоугольный кадр в стиле Виленнева: люди кажутся крошечными, а пейзаж — подавляющим.
7. Кафе «Французская новая волна»
Black and white French New Wave cinematic still. A young woman in a striped Breton shirt and dark bob haircut smokes at a Paris cafe table in 1962. She looks off-camera with soft intensity. Natural window light, high contrast, slightly overexposed highlights. Film grain visible. Godard aesthetic. 35mm monochrome, 50mm lens. Ultra-detailed.Комментарий на китайском языке: Девушка с короткой стрижкой в парижском кафе, 1962 год; черно-белая фотография в стиле французской «новой волны».
8. Итальянский жанр «джалло» — коридор ужасов
Cinematic horror frame in the style of a 1970s Italian giallo. A woman in a white nightgown stands at the end of a long Victorian hallway lit only by flickering red lamplight. Her back is turned. Shadow stretches toward the camera. Wallpaper is blood-red damask. Shallow depth of field, 28mm lens slightly distorted. Grainy film look. Deep red and black color story. Ultra-detailed 4K.Комментарий на китайском языке: Итальянский стиль «джалло» 1970-х годов; силуэт девушки в белом в конце кроваво-красного коридора.
9. Неоновая ночь в Майами
1980s Miami Vice cinematic shot. A woman in a white linen blazer drives a red convertible at night through downtown Miami. Palm trees and neon motel signs blur past. She looks at the camera with sunglasses reflecting the pink and turquoise glow of the city. Lens flare, soft film grain. Teal and magenta color grade. Ultra-realistic 4K.Комментарий на китайском: Ночной Майами 80-х годов: красный кабриолет и отражение неоновых огней в солнцезащитных очках.
10. Экранизация аниме студии «Гибли»
Cinematic still styled as a live-action Studio Ghibli adaptation. A young woman in a simple blue linen dress stands in a vast green hillside field, wind blowing her hair and skirt. Fluffy white clouds race overhead. Soft golden hour light. Warm, painterly color grading with gentle film grain. Wide lens, low-angle composition making her heroic against the sky. Ultra-detailed 4K.Комментарий на китайском языке: Сцена на склоне холма в стиле студии «Гибли», снятая с низкого ракурса, подчеркивающего линию горизонта.
Библиотека ключевых слов: портреты и макияж
Успех портрета зависит от трёх факторов: объектива, направления света и текстуры кожи. Если вы укажете «85 мм f/1,4», «кольцевую лампу» или «софтбокс слева спереди от камеры», это поможет вам сразу пропустить три раунда бесполезных проб.

11. Макросъемка уровня Fenty Beauty
Extreme close-up beauty portrait. A stunning model with wet dewy skin and tousled damp hair, bare shoulders glistening. Water droplets on her face and neck catch the light of a ring light. Flawless skin texture in macro detail — every pore, every water droplet razor sharp. Smoky eye makeup with subtle gold shimmer. Lips slightly parted, intense gaze at camera. Dark background. Fenty Beauty campaign aesthetic. 85mm macro lens, f/1.4, ultra-shallow depth of field. Ultra-realistic 4K.Комментарий на китайском: Крупный план макияжа на увлажненной коже, освещенный кольцевым светом — каждая капелька воды выглядит четко и отчетливо.
12. Портрет на барочной скамейке
Luxury editorial portrait. A gorgeous model wearing an elegant black velvet off-shoulder gown reclines on a dark velvet chaise longue in a dimly lit Baroque-style room. One arm draped elegantly above her head. Rich warm Rembrandt lighting from a single window highlights the fabric draping against her glowing skin. Oil painting-like quality with deep shadows and warm highlights. High-end fashion editorial photography. 85mm lens, creamy bokeh. Ultra-realistic 4K.Комментарий на китайском языке: Девушка в чёрном платье на бархатной диване; Рембрандт с помощью света, проникающего через единственное окно, создал эффект масляной живописи.
13. Чистая фотография для деловых документов
Professional corporate headshot. A confident woman in her early 30s wearing a tailored navy blazer over a crisp white shirt. Neutral gray seamless studio background. Three-point lighting — soft key from camera left, subtle fill from right, rim light from behind. Genuine warm smile, direct eye contact. 85mm lens, f/2.8. Skin tone natural and healthy. LinkedIn executive headshot quality. Ultra-realistic 4K.Комментарий на китайском: Серый фон + стандартное освещение с тремя точками света, аватарка руководителя высокого уровня на LinkedIn.
14. Уличные портреты Токио
Environmental street portrait. A 20-something Tokyo local with bleached blonde hair and oversized vintage streetwear stands in Shibuya on a weekday afternoon. Shallow depth of field with crowd of pedestrians soft-blurred behind her. Natural overcast daylight. She looks slightly off-camera, lost in thought. Shot on Fujifilm X100 aesthetic, 35mm lens, f/2. Ultra-realistic 4K.Комментарий на китайском: Полдень рабочего дня в Сибуя: девушка с окрашенными в блонд волосами на фоне размытой толпы.
15. Обложка уровня Vogue
High-end fashion portrait in the style of a Vogue Italia cover. A striking model with razor-sharp cheekbones wears an oversized metallic silver couture gown with architectural shoulders. She stares directly into camera with a cold, commanding expression. Hair pulled back tight. Studio lighting is a single hard light from 45 degrees creating sculptural shadows. Gray backdrop. 85mm portrait lens, f/5.6 for crisp detail. Ultra-detailed 4K.Комментарий на китайском языке: Обложка в стиле Vogue Italia: серебристое платье с объемным эффектом + скульптурный портрет с однородным ярким освещением.
16. Портрет на кухне при естественном освещении
Soft natural light portrait. A woman with wavy chestnut hair sits by a large north-facing window in a quiet morning kitchen. She holds a ceramic mug of coffee in both hands, looking out the window thoughtfully. Warm cream sweater, no makeup, freckles visible. Shot in Rembrandt light with window as the only source. 50mm lens, f/1.8, shallow depth of field. Soft, honest, lived-in feel. Ultra-realistic 4K.Комментарий на китайском: Девушка без макияжа у окна на кухне «Утренний свет», освещённая исключительно естественным светом, проникающим через одно окно.
17. Одноцветное сценическое освещение
Dramatic black and white portrait. A man with a short salt-and-pepper beard and intense dark eyes stares into the lens. Only half his face is lit — hard side light from camera right, pure black shadow on the other side. Textured gray background fades to black. Shot on medium format film aesthetic, 80mm lens. Film grain. Peter Lindbergh style monochrome. Ultra-detailed.Комментарий на китайском языке: Черно-белый портрет в стиле Питера Линдберга: одна половина лица освещена ярким светом, другая — полностью погружена в темноту.
18. Розовая фотосессия с косметикой
Dreamy pastel beauty portrait. A model with soft pink lips, dewy skin, and flushed cheeks against a blush pink seamless backdrop. She wears a sheer white off-shoulder top. Soft diffused lighting from a large softbox creates flattering even illumination. Hair in loose tousled waves. 85mm lens, f/2. Cotton candy color palette — pink, peach, cream. Ultra-realistic 4K beauty editorial.Комментарий на китайском: Розовый фон + большой софтбокс, фотосессия с макияжем в пастельных тонах.
19. Романтика «золотого часа»
Sun-drenched golden hour portrait. A woman in a flowing cream linen dress stands in a wheat field at 7pm on a summer evening. The sun is low behind her, creating a halo of golden backlight through her hair and the sheer fabric. Lens flare across the frame. Her eyes are closed, face tilted up to the warmth. 135mm telephoto lens, f/2, compressed background. Warm honey color grade. Ultra-realistic 4K.Комментарий на китайском: Поле пшеницы в летний закат, съемка против света + 135-миллиметровый телеобъектив для сжатия пространства.
20. Библиотека «Темной школы»
Dark academia editorial portrait. A young woman with auburn hair in a loose braid wears a wool cardigan over a white collared shirt in an old university library. She holds an open leather-bound book, reading by the light of a green banker's lamp. Towering bookshelves around her fade into shadow. Warm tungsten light, deep navy and olive color palette. 50mm lens, f/2.8. Ultra-realistic 4K.Комментарий на китайском: Старая библиотека + зеленый лампа «Банкир», атмосфера «dark academia».
Словарь подсказок: действия и движения
Для сцен с динамичными действиями нужны две вещи: слова, описывающие застывший момент («застывший в воздухе», «съемка на высокой скорости»), а также контурное освещение, которое позволяет выделить объект съемки на фоне хаотичного окружения.

21. Nike: стоп-кадр из тренировки
Dynamic action freeze-frame. An athletic woman in a fitted sports bra and high-waisted compression shorts executes a powerful spinning roundhouse kick. Water splashes frozen in mid-air around her legs and feet in a dramatic spray pattern. Her toned abs and defined muscles visible. Dramatic single-source rim lighting from behind creates a glowing silhouette edge. Dark studio background. Nike Training campaign energy. High-speed photography feel — ultra-sharp subject, motion blur on water droplets. Ultra-realistic 4K.Комментарий на китайском: Рекламная съемка Nike с использованием высокоскоростной фотографии, на которой брызги воды застыли в воздухе.
22. Внутренний вид трубы для серфинга
Epic wide-angle shot of a female surfer riding inside a massive crystal-clear barrel wave at golden hour. Her silhouette and athletic body visible through the translucent turquoise water of the wave tube. Golden sunlight creates an explosion of light and water mist behind her. Dramatic backlit composition. The wave is enormous and perfectly formed. GoPro-style immersive perspective. Ultra-realistic 4K cinematic quality.Комментарий на китайском языке: Серфингистка на волне в «Золотом часе», силуэт на фоне заката.
23. Паркур: прыжки по крышам
High-speed action shot of a parkour athlete mid-leap between two Brooklyn rooftops at sunset. Frozen at the apex of the jump, arms and legs extended, silhouetted against a burning orange sky. The gap below him is dizzying — city streets far below. Motion blur on the trailing edge of his hoodie. Shot from a drone at his height, 35mm lens. Ultra-realistic 4K cinematic action.Комментарий на китайском: Паркур на крышах Бруклина на фоне заката, момент максимального прыжка запечатлен на снимке.
24. В центре внимания: ринг смешанных единоборств
Dramatic fight night action. A female MMA fighter mid-spinning back elbow, sweat flying from her hair in a visible arc of droplets. Single harsh overhead ring spotlight isolates her from pure black background — classic boxing photography look. Her opponent is a blurred silhouette out of focus. 70-200mm lens at 200mm, f/2.8, 1/2000 shutter frozen motion. High contrast, desaturated. Ultra-detailed 4K.Комментарий на китайском языке: На ринге ММА — единственный верхний светильник; отчетливо видны дуги, по которым разлетаются капли пота.
25. Пыль от кросс-мотоциклов
Low-angle action shot of a motocross rider airborne over a dirt jump, red desert dust exploding behind the rear tire. Late afternoon sun casts long shadows. The bike is tilted aggressively mid-trick. Camera is just above ground level looking up, making the jump look monumental. Anamorphic lens flare from the sun. Orange and teal color grade. Ultra-realistic 4K action.Комментарий на китайском: Мотоцикл для бездорожья взмывает в воздух, а заднее колесо поднимает красную пыль.
26. Прыжок в балетном зале
Contemporary ballet dancer mid-grand jete frozen in the air, arms extended, body perfectly horizontal. She wears a simple nude leotard. Plain gray cyclorama studio background. Strong side-light from camera left creates a sculptural chiaroscuro on her musculature. Powder disturbed from the floor traces her leap in a soft cloud. 1/4000 shutter speed feel. Ultra-detailed 4K.Комментарий на китайском языке: В балете «grand jeté» — это момент максимального подъема, когда тело находится параллельно полу.
27. Слэм-данк в баскетболе
Low-angle hero shot of a male basketball player mid-slam dunk, one hand gripping the rim, body extended diagonally across the frame. Arena lights streak as lens flares. Crowd is a soft blurred wall of phone flashes behind him. Frozen sweat and net motion. Shot on 24mm wide from directly below the hoop. NBA official photography energy. Ultra-realistic 4K.Комментарий на китайском: Широкоугольный снимок с высокого ракурса, запечатлевший момент выполнения данного данка, снятый с расстояния 24 мм непосредственно под кольцом.
28. Скачущий на волнах жеребец
A rider on a powerful black horse gallops through knee-deep shallow ocean water at sunrise. Water explodes from each hoofstrike, frozen in a dramatic spray. The rider is leaned low, hair streaming behind. Warm golden backlight from the rising sun. Mist rising off the water. Shot at 1/4000 shutter, 200mm telephoto compression. Ultra-realistic 4K equine photography.Комментарий на китайском: Мелководье на рассвете, мчащийся чёрный конь, брызги воды, сжатие изображения с помощью 200-миллиметрового телеобъектива.
Словарь подсказок: Природа и пейзажи
Ключевыми словами для описания пейзажей являются время суток, погода, вертикальные масштабы. Модель имеет очень сильное априорное предположение о «обычной красивой природе», поэтому вам необходимо использовать конкретные слова, чтобы отклонить ее от этого среднего значения.

29. Водяной туман — сказочная страна
Ethereal fantasy nature scene. A graceful young woman in a flowing sheer gossamer dress stands at the edge of a towering waterfall cliff. Dense tropical mist swirls around her legs and the translucent fabric. She extends one arm toward the cascade, water droplets catching golden light. Aerial perspective slightly from above showing the dramatic cliff drop. Lush green ferns frame the composition. Golden hour light filtering through the mist. Ultra-realistic 4K cinematic quality.Комментарий на китайском: Девушка в белом платье у водопада на скале, вид с воздуха + туман.
30. Аэросъемка Мальдивских островов
Overhead drone shot of a beautiful woman in a minimal white bikini floating on her back in crystal-clear turquoise shallow water over white sand in the Maldives. Her long dark hair fans out in the water like a halo. The water is so clear her full body is visible through the translucent surface. Tiny fish swim nearby. Travel photography editorial style. Ultra-realistic 4K aerial quality.Описание на китайском: Вид сверху на Мальдивы: девушка, плавающая в кристально чистой воде.
31. Пляж с чёрным песком в Исландии
Dramatic wide landscape of Iceland's Reynisfjara black sand beach at dawn. Massive basalt sea stacks rise from the churning North Atlantic. Low fog drifts across the black sand. A single figure in a red rain jacket walks along the shoreline for scale. Moody desaturated color grade — almost monochrome with just the red jacket as accent. 24mm wide lens, f/11 for deep focus. Ultra-detailed 4K.Примечание на китайском языке: Черный песчаный пляж Исландии + красный дождевик в качестве цветовых ориентиров.
32. Свет в церкви «Секоя»
Vertical composition looking up through towering California redwood trees. Shafts of golden morning sunlight cut through the fog between the trunks like cathedral light rays. Ferns carpet the forest floor. A tiny hiker in the distance gives scale. Ultra-wide 14mm lens distorting the trunks into a radial pattern toward the sky. Warm green and gold palette. Ultra-realistic 4K nature photography.Комментарий на китайском: Широкоугольный снимок секвойевого леса с высоты 14 мм, луч света в церкви, окутанной туманом.
33. Озеро Эспехо в Патагонии
Perfect mirror reflection of the jagged Torres del Paine peaks in a glass-still Patagonian alpine lake at blue hour. Pink and purple alpenglow on the snow-capped summits. A single orange tent on the near shore as human scale. Complete symmetry — upper and lower half of frame are near-mirror images. 35mm lens, f/11. Ultra-realistic 4K landscape.Комментарий на китайском: Идеальное зеркальное озеро в «Синий час», симметричное сверху донизу.
34. Песчаные бури в Сахаре
Vast Sahara desert at the start of a sandstorm. Rolling orange dunes extend to the horizon, with a towering wall of sand approaching from the left. A lone nomadic figure on camelback is silhouetted against the dust cloud. Sun struggles through the haze as a dim orange disc. Cinematic wide-angle, heavy atmospheric haze. Monochromatic warm orange palette. Ultra-detailed 4K.Комментарий на китайском: На окраине сахарской песчаной бури силуэт верблюдовода противостоит стене песка.
35. Домик «Полярное сияние»
Wide landscape of a tiny warm-lit wooden cabin in a Norwegian fjord valley at 1am. A spectacular green and purple aurora borealis dances overhead, reflecting in the still black fjord water. Snow-dusted pine trees and mountains frame the scene. The cabin glow is the only warm color in an otherwise cold composition. 20-second long exposure feel. Ultra-realistic 4K astrophotography.Комментарий на китайском: Северное сияние в норвежском фьорде в час ночи и уютная хижина.
36. Закат на африканской саванне
Cinematic wide shot of a family of elephants crossing a golden savanna at sunset in Kenya. The sun is a huge orange disc on the horizon, silhouetting the herd. Long grass ripples in the warm wind. Dust kicked up by the herd diffuses the backlight into warm beams. 200mm telephoto compression. National Geographic editorial style. Ultra-realistic 4K wildlife photography.Комментарий на китайском: Кенийская саванна на закате, силуэты стада слонов + сжатие изображения с помощью 200-миллиметрового телеобъектива.
37. Река Сакура в Киото
Serene wide landscape of the Philosopher's Path in Kyoto at peak cherry blossom season. Pink petals float on the narrow canal, with more drifting down from the trees above. Traditional wooden bridges arch over the water. Early morning mist softens the light into diffused pink. A solo figure in a dark kimono walks along the stone path for scale. 50mm lens, f/4, gentle pastel color grade. Ultra-realistic 4K.Комментарий на китайском языке: В период цветения сакуры на «Философской тропе» в Киото розовые лепестки плавают по поверхности канала.
38. Шотландский горный штормовой свет
Dramatic landscape of the Scottish Highlands during a clearing thunderstorm. Dark churning clouds above a lone glen, with a single shaft of golden sunlight breaking through and lighting one patch of heather-covered hillside. Rainbow arc barely visible at the edge. Ancient standing stones in the foreground. Moody cinematic color grade — steel blue shadows, warm sunlit highlight. 24mm wide, f/11. Ultra-realistic 4K landscape photography.Комментарий на китайском языке: Когда гроза в Шотландском нагорье уже затихала, из-за туч пробился единственный луч золотистого солнечного света.
Библиотека подсказок: Фэнтези и стилизация
Как только вы конкретно укажете в фэнтезийной тематике какой-либо художественный образец (Ufotable, Arcane, Studio Trigger, иллюстрации к Magic: The Gathering), запрос станет гораздо четче. Общий запрос «fantasy art» приведет лишь к общим результатам в стиле фэнтези.

39. Аниме «Воительницы» от Ufotable
Epic anime-inspired fantasy warrior princess with flowing silver-white hair that reaches her waist, wearing ornate golden battle armor that hugs her figure with intricate engravings. She holds a glowing magical sword aloft, emitting bright blue energy. Cherry blossom petals and magical sparkles swirl in a violent storm around her. Her expression is fierce and determined. Dynamic action pose mid-battle leap. Ultra-detailed anime with CGI-quality lighting — Ufotable production quality. Rich colors, dramatic volumetric lighting. 4K quality.Комментарий на китайском: Аниме «Воительницы» от Ufotable: синий магический меч + вишневый шквал.
40. Магиня-темная эльфийка
Dark fantasy dark elf sorceress with long flowing midnight-purple hair, pointed ears, and luminous violet eyes. She wears an elegant off-shoulder dark robe with intricate silver embroidery that reveals her collarbones and shoulders. Purple arcane energy spirals from her outstretched hands, illuminating her face from below. A vast star field and nebula visible in the background through a shattered stone archway. Semi-realistic fantasy illustration style with cinematic lighting. Ultra-detailed 4K.Комментарий на китайском: Магичка-темная эльфийка, из ее рук вихрями вырывается фиолетовая магическая энергия.
41. Лесные эльфы студии «Джибри»
Studio Ghibli style painterly scene. A small forest spirit that looks like a glowing white fox with three tails walks through a mossy enchanted forest at dusk. Fireflies dance around it. Soft painterly brushstrokes, warm honey-gold light filtering through massive ancient trees. Hayao Miyazaki watercolor aesthetic. Ultra-detailed animation cel quality.Комментарий на китайском: Белая лиса с тремя хвостами в стиле студии «Гибли» прогуливается по мшистому лесу в сумерках.
42. Arcane: Битва двух городов
Arcane Netflix animated series style illustration. A young woman with blue-tipped braided hair and steampunk goggles leans against a graffitied alley wall in the undercity of Piltover. Neon magical rune-signs glow behind her. Textured painterly brushstrokes visible, 2D illustration with 3D depth, saturated purple and teal color story. Fortiche animation studio aesthetic. Ultra-detailed 4K.Комментарий на китайском: Девушка в переулках нижнего города в стиле Arcane Fortiche.
43. Дракон из «Магического круга»
Fantasy illustration in the style of a Magic The Gathering card. A colossal red dragon emerges from molten lava in an underground cavern, wings half-spread, mouth roaring with fire breath forming. A tiny knight in silver armor stands at the cavern's edge for scale, raising a shield. Dramatic low-angle hero composition. Rich oil-painting texture, Greg Rutkowski influence. Ultra-detailed 4K fantasy art.Комментарий на китайском: Красный лавовый дракон и крошечный рыцарь в стиле иллюстраций к игре «Magic: The Gathering».
44. Киберсамурай
Cyberpunk fantasy fusion. A female samurai with a chrome katana stands on the rain-slicked rooftop of a neo-Tokyo megacorp tower at night. She wears a fusion of traditional kimono and carbon-fiber combat armor. Holographic cherry blossoms drift around her. Neon reflections on the wet rooftop, flying ad-drones in the background. Illustrated in the style of Katsuhiro Otomo meets modern 3D concept art. Ultra-detailed 4K.Комментарий на китайском: Самурай на крыше Кибер-Токио + голографическая сакура.
45. Русалка под водой
Ethereal underwater fantasy. A graceful mermaid with iridescent teal and violet scales swims through a coral reef illuminated by shafts of sunlight piercing the water surface above. Her long turquoise hair flows weightlessly. Bubbles trail from her fingertips. School of small silver fish swim past. Dreamlike painterly quality, Lisa Frank meets National Geographic. Ultra-detailed 4K fantasy art.Комментарий на китайском языке: Радужная русалка среди коралловых рифов, лучи света пробиваются сквозь воду.
46. Капитан дистопического дирижабля
Illustrated steampunk fantasy portrait. A young female airship captain in a brass-buttoned red military coat, goggles pushed up on her forehead, stands at the wheel of a wooden airship. Visible brass gears and copper pipes. Behind her, clouds and other distant airships. Warm golden hour lighting. Illustration style inspired by Nausicaa and Howl's Moving Castle. Ultra-detailed 4K.Комментарий на китайском: Капитан женского дирижабля в стиле Хироси Маядзаки и латунные шестерни.
Многостилевые вариации: один и тот же объект, разные миры
Недооцененный рабочий процесс в GPT Image 2: зафиксировать объект и изменять только параметры стиля. Вы сможете четко увидеть, как каждый стиль влияет на одно и то же лицо, одну и ту же одежду и одну и ту же позу — и в следующий раз вам не придется выбирать стиль наобум.

Базовые ключевые слова — основной текст остается полностью неизменным в четырех вариантах:
A beautiful young woman with shoulder-length brown hair stands in a sunlit garden, wearing a simple white sundress, one hand lightly touching a rose bush. Soft golden afternoon light. Three-quarter body framing, slightly tilted head, warm smile.Комментарий на китайском: Девушка в простом платье, прикасающаяся к розе в «Саду солнечного света», в золотистом свете полудня.
Затем просто переключайте слоты стилей, запуская каждый из них по одному разу:
47. Реалистичная фотография
[Base] — Hyperreal fashion photography aesthetic. 85mm lens at f/1.8, soft natural light, editorial sharpness. Ultra-realistic 4K.48. Японская аниме
[Base] — Japanese anime style with cel shading, bold line art, vibrant saturated colors, large expressive eyes. Kyoto Animation production quality. Ultra-detailed.49. Классическая живопись
[Base] — Classical oil painting style with visible thick brushstrokes, warm Renaissance lighting, chiaroscuro shadow, Vermeer-like color palette. Museum-quality.50. Киберпанк
[Base] — Neon-drenched cyberpunk futurism. Holographic overlays, circuit-pattern light tattoos on skin, magenta and cyan rim lighting. Ghost in the Shell art direction. Ultra-detailed.Мы протестировали эту последовательность на внутреннем тестовом аккаунте: создание первого изображения заняло примерно 18 секунд, а смена стиля на последующих изображениях — примерно столько же. В общей сложности менее чем за две минуты и 48 кредитов мы получили полный набор образцов стилей. Включив его в предложение для клиента, мы сократили время, которое раньше уходило на поиск материалов в течение половины дня, до времени, необходимого на чашку кофе.
Типичные неисправности и способы их устранения
Раздел «Честность»: GPT Image 2 — отличный инструмент, но это не волшебство. Ниже приведены наиболее частые типы ошибок, которые мы зафиксировали, а также соответствующие шаблоны исправлений. Используйте этот раздел как чек-лист для устранения неполадок — в следующий раз, когда с изображением что-то пойдет не так, проверьте все пункты по порядку, и большинство проблем удастся решить уже после первой правки.
Неудача 1: Невыразительный результат
Before:
A beautiful woman in a city.After:
A 28-year-old woman with auburn hair pulled into a low ponytail, wearing a camel trench coat, crossing a Manhattan crosswalk at 6pm on a rainy Thursday. Yellow taxis blur past in motion-blurred streaks. 50mm lens, f/2, cinematic grain. Ultra-realistic 4K.Первая подсказка не дала модели никаких ориентиров. Решением всегда являются конкретные существительные и конкретные места.
Ошибка 2: Неверное количество пальцев
GPT Image 2 уже значительно превосходит первое поколение диффузионных моделей в плане рендеринга рук, но крупные планы рук по-прежнему могут давать сбои. Есть два надежных способа избежать этого:
- Не делайте руки главным объектом кадра, просто обрежьте их: «framing is shoulders up only» (снимайте только от плеч и выше).
- Пусть руки что-нибудь держат: «hands gently holding a ceramic coffee cup» (руки, мягко держащие керамическую кофейную чашку). Наличие предмета в руках определяет позу, а количество пальцев при этом остается неизменным.
Ошибка 3: Нечитаемый текст на изображении
Модель — это не программа для верстки. Если вам нужно разместить на изображении логотип, вывеску или читаемый текст с плаката, он должен быть либо очень коротким (например, «на вывеске написано OPEN»), либо в описании следует добавить фразу: «ни текста, ни букв, ни слов нигде на изображении», а затем выполнить верстку отдельно в Figma или Photoshop.
Ошибка 4: Не учтён направление света
Before:
A portrait of a woman with dramatic lighting.After:
A portrait of a woman lit by a single hard spotlight from 45 degrees camera-left, with deep black shadow filling the right side of her face. Rembrandt lighting with a small triangle of light on the shadowed cheek.«Драматическое освещение» ничего не говорит. Только указание направления, интенсивности и зоны падения теней является настоящим подсказкой.
Ошибка 5: объект находится в неправильной сцене
Если модель постоянно помещает персонажа в обычную фотостудию, а не в библиотеку, — перенесите сцену в начало подсказки и опишите её более конкретно:
In a candle-lit 17th-century English library with floor-to-ceiling oak shelves, leather-bound books, and a stone fireplace, a woman in…Размещение сцены перед объектом съемки означает, что вся композиция определяется ещё до появления персонажа.
Ошибка 6: Перегрузка ключевыми словами
При количестве слов, превышающем примерно 1 200, влияние отдельных прилагательных начинает ослабевать. Если ваш набор ключевых слов представляет собой простой перечень из 40 стилевых тегов, модель будет «вычислять среднее». Она сохранит один основной стилевой ориентир (например, «film noir»), а все остальные будет рассматривать как вспомогательные.
Использование 20 000 символов: структурированные длинные подсказки
Одним из недооцененных преимуществ GPT Image 2 является максимальный размер подсказки, достигающий 20 000 символов. Большинство конкурентов ограничиваются примерно 1 000–2 000 символами. Для портретов это не нужно, но для сложных сцен с несколькими персонажами, бриф-заданий на создание концепт-арта или серий изображений, требующих строгого соблюдения фирменного стиля, использование длинных структурированных подсказок является весьма целесообразным.
Шаблоны, которые мы часто используем в производственных брифах:
# СЦЕНА
[Сцена: место, время, погода, исторический период, 2–3 предложения]
# ПЕРСОНАЖИ
- Персонаж A: [Внешность, одежда, текущая поза, выражение лица]
- Персонаж B: [То же самое]
- Статисты на заднем плане: [Краткое описание]
# КОМПОЗИЦИЯ
[Композиция: широкий план/средний план/крупный план; ракурс; кадр; глубина резкости; расположение каждого персонажа в кадре — правило третей/золотое сечение/центр]
# ОСВЕЩЕНИЕ
[Источник света, направление, контрастность, цветовая температура, поведение теней]
# ЦВЕТ⟦ЧЕРНЫЙ⟧[Опишите палитру с помощью 3–4 цветовых терминов. Направление цветовой гаммы — теплые/холодные/разделенные оттенки]
# STYLE
[Один основной стиль. Например, «Стиль операторской работы Роджера Дикинса в фильме «Бегущий по лезвию 2049»]
# ТЕХНИЧЕСКИЕ ХАРАКТЕРИСТИКИ
[Параметры разрешения, зернистость пленки, формат, метки качества изображения. Будьте лаконичны]
# ИСКЛЮЧЕНИЯ
[Что следует избегать: «Без текста, без логотипов, без водяных знаков, без лишних конечностей»]Пример — полный структурированный текст описания (около 500 слов) для одного рекламного изображения:
# SCENE
A restored 1930s Art Deco ballroom on a rainy Tuesday evening in Paris, set during a private jazz performance. Tall arched windows on the left show wet boulevards and soft yellow streetlamp glow. Interior is lit warm and amber.
# CHARACTERS
- Lead: A striking 32-year-old woman with dark auburn hair in a low chignon, wearing a deep emerald-green silk bias-cut gown with a low back. She stands near a grand piano, one hand resting on its polished black lid, gazing thoughtfully toward the windows. Faint melancholy in her expression.
- Pianist: A middle-aged man in a black tuxedo, seated at the piano mid-performance, profile view, fingers on keys. He is a secondary figure — should not pull focus from the lead.
- Background: Three or four well-dressed patrons at candlelit round tables in soft bokeh, unidentifiable faces.
# COMPOSITION
Medium-wide shot. Lead character is on the right third of the frame, piano extending diagonally across the center toward the left. Rule of thirds. 50mm lens, f/2.2, shallow depth of field — lead and piano sharp, background patrons and windows softly blurred. Eye-level camera height.
# LIGHTING
Warm tungsten chandelier overhead providing ambient glow on the room. Key light on the lead is a single practical wall sconce camera-right at 45 degrees, modeling her face in gentle Rembrandt pattern. Rim from the windows behind her (cool blue rainy light) separates her hair and shoulder edge from the warm interior. Overall contrast: high but soft.
# COLOR
Deep emerald green (dress) and warm amber (interior) as hero colors, with cool blue window light as counter-accent. Warm gold dominant, with selective teal shadow detail. Film-look color grade reminiscent of early Wong Kar-wai.
# STYLE
Cinematic still in the visual language of In the Mood for Love meets a modern luxury cognac commercial. Anamorphic lens quality (slight horizontal flare on the candles). Painterly softness, 35mm film grain.
# TECHNICAL
Ultra-realistic 4K, 16:9 aspect, cinematic frame.
# EXCLUSIONS
No text, no signage, no logos, no watermarks, no visible phones or modern electronics, no extra limbs, no warped fingers on the pianist.Использование разделов на два уровня дает два преимущества: во-первых, вы не пропустите ни одного поля; во-вторых, это обеспечивает структурированный подход к анализу модели, а не просто прочтение 500 слов подряд. Для всей серии достаточно изменить только два раздела — CHARACTERS и SCENE — чтобы массово генерировать различные дубли одного и того же рекламного ролика.
Практический совет: если изображение на 80 % соответствует заданному, но какой-то элемент неверный (например, у главной героини не тот цвет одежды), не переписывайте весь текст подсказки. Скопируйте удачную версию, измените только соответствующий элемент и запустите еще раз. Наши внутренние журналы итераций показывают: при использовании структурированных подсказок в среднем требуется 2,8 попытки, чтобы получить кадр уровня главного изображения; в то время как при использовании свободных текстовых подсказок часто требуется более 6 попыток. Если считать по 12 кредитов за один кадр, это означает разницу в 2 и 5 долларов за каждое главное изображение.
Хотите передать рабочий процесс со структурированными подсказками коллегам? Сначала предложите им ознакомиться с руководством по началу работы, а затем вернитесь к этой статье.
Часто задаваемые вопросы
Что является самым важным в подсказке для GPT Image 2?
Свет и объектив — вот в чем заключается правильный порядок. Если объект съемки или сцена описаны нечетко, это еще можно исправить, но если неточно указаны направление света и выбор объектива, то результат всегда будет выглядеть как стоковое изображение. Если у вас есть время доработать только два элемента, сосредоточьтесь именно на них. Четко опишите, «откуда идет свет, насколько он яркий и на какую сторону падают тени», а также «какой фокусный расстояние объектива, какая диафрагма и какое расстояние до объекта». Тогда основа изображения будет надежной.
Какой длины должны быть подсказки для GPT Image 2?
Для портретов и простых сцен оптимальный объем составляет 80–150 слов. Для кинематографичных широкоугольных снимков с отсылками к эпохе и стилю — 150–250 слов. Для сцен с несколькими персонажами или рекламных бриффов следует использовать структурированные шаблоны объемом 400–800 слов. Максимальный предел в 20 000 символов предусмотрен для крайних случаев — в повседневной практике объем редко превышает 500 слов.
Можно ли указывать в подсказке имена реальных художников?
Вы можете сослаться на стиль или эпоху — «фильм-нуар», «джалло 1970-х», «живописный стиль студии Ghibli» — и модель распознает эти визуальные языки. Однако использование имен ныне живущих художников в качестве стилевых тегов является этически спорным и все чаще отфильтровывается моделями. Лучше описывать стиль, медиа и эпоху, а не называть конкретных людей.
Почему результаты по одному и тому же запросу каждый раз разные?
Модель диффузии по сути своей является случайной — она начинает с изображения с шумом и преобразует его в чистое изображение. Если один и тот же запрос запустить дважды, то результаты обязательно будут схожими, но не одинаковыми. Это особенность, а не ошибка, и именно в ней заключается источник «разнообразия». Для воспроизведения результатов большинство систем генерации поддерживают параметр seed. Технические подробности можно найти в блоге OpenAI по генерации изображений.
Влияет ли длина запроса на цену?
Это не влияет. GPT Image 2 использует фиксированную цену: 12 кредитов за изображение, независимо от того, пишете ли вы 20 слов или 2000 слов. На стоимость влияет только количество сгенерированных изображений.
Сколько раз стоит попробовать реализовать идею, прежде чем от нее отказаться?
Практическое правило: попробуйте один и тот же подсказчик три раза, чтобы учесть естественные отклонения. Если результат по-прежнему не тот, изменяйте только один параметр, не начинайте с нуля. В большинстве случаев нужно корректировать освещение или ракурс. Если после 8-го прогона нет прогресса, значит, проблема в композиции — вернитесь к формуле «восьми слотов» и проверьте, сколько из них вы заполнили. У нас есть еще одна внутренняя традиция: записывать каждый сгенерированный промпт и соответствующий семенной код в таблицу, чтобы при анализе легко было определить, какое именно слово действительно сработало.
Можно ли использовать изображения, сгенерированные GPT Image 2, в коммерческих целях?
Да, конечно. Согласно стандартным условиям использования продукта, созданные вами изображения принадлежат вам и могут использоваться в коммерческих целях. Конкретные условия лицензии приведены в нижнем колонтитуле сайта. В случае использования в ситуациях с высоким риском (например, в брендовой рекламе или на обложках изданий) рекомендуется проконсультироваться с юристом. Кроме того, не стоит рассматривать упомянутых в подсказках реальных людей или товарные знаки брендов как «панацею» от ответственности — это вопросы, касающиеся прав на изображение и прав на товарные знаки, которые не регулируются условиями использования продукта ИИ.
В чём разница между подсказками для «text-to-image» и «image-to-image»?
text-to-image начинается с «чистого листа», и подсказка является единственным ориентиром. image-to-image начинается с загруженного вами изображения-оригинала, а подсказка служит лишь для его модификации. Подсказки для image-to-image должны быть короче и сосредоточены на том, «что именно изменить» («превратить в стиль масляной живописи, сохранив позу и одежду главного персонажа»), а не на повторном описании всей сцены — ведь изображение-оригинал уже предоставляет большую часть информации.
Готовы приступить к работе?
У вас сейчас есть более 50 подсказок, набор формул с восемью ячейками, список исправлений для неудачных примеров, а также шаблон структурированной длинной подсказки. Следующий шаг — запустить инструмент и попробовать создать изображение. Выберите любую подсказку, вставьте её в формулу и посмотрите, насколько результат отличается от того, что вы себе представляли. Затем исправьте только ту ячейку, которая не соответствует задуманному, и запустите инструмент ещё раз. Уже через два-три цикла вы сможете стабильно создавать изображения, готовые к публикации.
Добавьте эту статью в закладки браузера или прикрепите формулу «Восемь элементов» к боковой панели второго монитора. Настоящий прогресс заключается не в том, чтобы запомнить эти ключевые слова, а в том, чтобы усвоить формулу до уровня мышечной памяти — после чего, глядя на любую иллюстрацию, вы будете естественным образом выделять в ней основной объект, освещение, ракурс и стиль.
Начните пользоваться GPT Image 2 бесплатно →
Продолжить чтение:
- Что такое GPT Image 2? Полное руководство и первые шаги
- Руководство по использованию GPT Image 2: пошаговая инструкция
- GPT Image 2 vs Sora: честное сравнение
- GPT Image 2 vs Kling: что выбрать?
Есть вопросы по какому-либо ключевому слову? Оставьте нам сообщение на сайте — мы просматриваем каждое из них, и те вопросы, которые задаются чаще всего, обычно попадают в следующую версию руководства. Теоретическую основу можно изучить вместе со статьёй Википедии о моделях генерации изображений по тексту; это займёт около 10 минут. Если вы хотите продвинуться дальше, следующим шагом может стать просмотр руководства по использованию из той же серии, чтобы перейти от «создания одного хорошего изображения» к «стабильному производству набора изображений в едином стиле».

