GPT Image 2 プロンプトガイド:50以上の実践テンプレート(2026年版)

Apr 22, 2026

TL;DR

優れたGPT Image 2のプロンプトとは、単なる一言ではなく、被写体、シーン、スタイル、アングル、光、ムードといった要素を組み合わせた一連の判断の積み重ねです。本ガイドでは、映画のような雰囲気、ポートレート、アクション、自然、ファンタジーの5大カテゴリーを網羅した、50以上のそのままコピーして使えるプロンプトテンプレートを提供します。さらに、失敗した画像の修正チェックリストや、効率的な反復作業フローも併せてご紹介します。記事内のすべてのサンプル画像は、KIEのgpt-image-2-text-to-imageモデルを使用して生成されており、1枚あたり12クレジット、プロンプトの上限は20,000文字です。GPT Image 2を無料でお試しください →


優れたプロンプトの構成要素

多くの人は、まず「自分が何を撮りたいか」を書き出します。しかし、本当に素晴らしい写真が撮れる人は、「レンズが何を捉えているか」を書き出します。これこそが、すべての秘訣なのです。

KIEのgpt-image-2-text-to-image APIで数千回のテストを実施した結果、ほぼすべてのシナリオを網羅する8つのスロット式を確立しました。8つのスロットのうち6つを埋めるだけで平均以上の品質が得られ、すべてを埋めることで商業映画並みのクオリティを実現できます。

公式:

[被写体] + [動作・ポーズ] + [シーン] + [スタイル・参考] + [ショット・構図] + [光] + [ムード・トーン] + [画質調整]

各スロットは、モデルが本来「推測」しなければならなかった問題を、一つずつ確定させる役割を果たしている:

  • 主体——画面の中に誰、あるいは何が描かれているか。「赤髪の司書」は「女性」よりも10倍効果的だ。
  • 動作/姿勢——その瞬間、何をしているか。動詞が構図を決定する。
  • 場面——周囲の世界。国、時代、時間帯を明確に示す。
  • スタイル/参考——「フィルム・ノワール」、「Ufotable制作レベルのアニメ」、「ウェス・アンダーソンの対称構図」、「Fenty Beautyの広告風」。意味のない形容詞を羅列するのではなく、既知の視覚言語を引用する。
  • ショット/構図——「極近接ショット」、「「ローアングル広角」、「「85mmポートレートレンズ、f/1.4」、「「ワイドスクリーンレンズ」。これがスナップショットを映画のワンカットに変える鍵となる。
  • ——「ゴールデンアワーのエッジライト」、「「シングル・レンブラント光」、「「濡れた地面に映るネオンの反射」。光は1枚の画像の60%を占めるような感覚。
  • ムード/トーン——「冷たい青と暖かいオレンジの対比」、「暖かい琥珀色で影を深く」、「彩度を抑えた憂鬱なトーン」。
  • 画質調整——「超リアル4K」、「フィルムグレイン」、「ファッション誌のような質感」。簡潔にまとめましょう。ここまでの作業がすでに大変な重労働でしたから。

基本 vs 最適化――同一対象の2つの比較

GPT Image 2のデフォルトのプロンプトで生成された画像は、構図が平凡で、光の当たり方が均一です
基本プロンプト:「部屋に立っている女性」。被写体がぼやけており、光も淡く、構図も定まっていない――モデルが全く手がかりをつかめない。

上の図に対応する元のプロンプトは:

A woman standing in a room.

ここで、8スロットの公式を使って「同じ概念」を書き直すと:

A breathtaking young woman with flowing auburn hair stands in a luxurious Art Deco penthouse at golden hour. She wears a champagne-colored satin slip dress that catches the warm light. Floor-to-ceiling windows behind her show a panoramic city sunset. Dramatic side lighting creates deep shadows and golden highlights on her face and bare arms. The composition follows the rule of thirds. Cinematic depth of field with gorgeous city bokeh. Fashion editorial quality. Ultra-realistic 4K.

解説:アール・デコ様式のペントハウスで、長い髪をした女性が床から天井までの窓の前に立っている。夕暮れ時の横光が、彼女の顔と腕の輪郭を浮かび上がらせている。

8つのスロットをすべて使用した最適化済みGPT Image 2プロンプトによる画像生成結果
8スロット式に最適化されたプロンプト。同じ主概念でありながら、曖昧な部分がすべて明確に定義されています。

注意:最適化版とは、単に形容詞を詰め込んだものではなく、モデルが推測すべき部分が少なくなったということです。GPT Image 2の基盤となっているのは、トランスフォーマーによって駆動される拡散モデルです(Wikipediaの拡散モデルに関する解説を参照)。あなたが記述しなかった細部については、モデルがその「事前分布の平均値」を用いて補完します。「ゴールデンアワー」と言わなければ、モデルはデフォルトで「曇りの火曜日の午後2時」の光を描き出します。

最後に豆知識を一つ:GPT Image 2のプロンプトの上限は20,000文字——約3,000語です。通常のシーンでは到底使い切れる量ではありませんが、複雑な複数人物のシーンや詳細なコンセプトアートの場合、この上限があることで、構図の決定を非常に細かく行うことが可能になります。第11節では、長いプロンプトの活用方法を実演します。


プロンプトライブラリ:映画のようなシーン

映画的なシーンは、最も表現しやすいジャンルだ。なぜなら、映画史には100年にわたる視覚的な語彙が蓄積されているからだ。ジャンルや年代、ショットを伝えれば、モデルはそれに見合った一枚の映像を再現してくれる。

フィルム・ノワール風のGPT-Image-2プロンプトによる生成画像:雨上がりの香港の裏路地にいる赤い服の女性
ニュー・ノワール調の香港の裏路地。青と赤がぶつかり合う色彩の物語と、ワイドスクリーン風の構図が、作品の情感の大部分を担っている。

1. 新しいブラック・香港の裏路地

Film noir cinematic shot. A dangerously beautiful femme fatale in a curve-hugging red silk dress with a thigh-high slit, walking through a rain-soaked Hong Kong back alley at night. Neon signs in Chinese characters reflect red and blue on the wet cobblestones. She carries a black umbrella over one shoulder, her red-painted lips the only warm color against the cold teal lighting. Smoke wisps from a nearby vent. Anamorphic lens, shallow depth of field, cinematic grain. Ultra-realistic 4K noir film frame.

解説:雨の降る夜の香港の裏路地。赤い服の女性が傘をさし、ネオンの光が反射する石畳の道を歩いている。

2. ジャズバー「Rembrandt」

Moody jazz bar interior. A mysterious woman in a sheer black lace dress sits on a velvet barstool, one leg crossed showing stiletto heels. Cigarette smoke curls around her silhouette. Warm amber spotlight from above illuminates her face and exposed collarbones while the rest fades into deep shadow. A saxophone player is a blurred silhouette in the background. Film noir meets modern luxury aesthetic. Dramatic Rembrandt lighting, 35mm film look. Ultra-realistic 4K.

注釈:ジャズバーにいる黒いレースのドレスを着た女性。単一のトップライトと煙が組み合わさり、レンブラント風のドラマチックな光を作り出している。

3. ブレードランナーの屋上

Cyberpunk cinematic wide shot. A lone detective in a wet black trench coat stands on a neon-drenched Tokyo rooftop at 3am. Giant holographic advertisements of a geisha float across the skyline behind him, casting shifting pink and cyan light on his face. Light rain catches the glow. Flying cars streak past as horizontal light trails. Shot on anamorphic lens, 2.39:1 aspect, shallow depth of field. Blade Runner 2049 color grade — teal shadows, orange highlights. Ultra-realistic 4K cinematic frame.

注釈:サイバーパンクな東京の屋上。ホログラムの芸者広告が放つ青とピンクの光が、探偵を包み込んでいる。

4. ウェス・アンダーソンの対称的なロビー

Wes Anderson style cinematic composition. A 1960s hotel concierge in a burgundy uniform stands dead-center in a pastel-pink Art Deco lobby, flanked by perfectly symmetrical potted palms and brass sconces. Flat front-on framing, everything on center axis. Soft fluorescent overhead lighting. Pastel pink and mint green color palette. 35mm film look. Ultra-detailed 4K.

解説:ピンク色のアール・デコ調のホテルのロビー。正面対称の構図で、コンシェルジュが画面の中央に立っている。

5. 韓国式犯罪映画におけるキッチンでの対峙

Cinematic still from a modern Korean crime thriller. Two men face each other across a small Seoul apartment kitchen at 2am, both holding knives but frozen in a tense moment. Single fluorescent tube overhead casts hard green-tinted light and harsh shadows. Steam rises from an abandoned pot on the stove. Tight composition, 40mm lens, handheld feel. Bong Joon-ho style. Ultra-realistic 4K.

注釈:午前2時、ソウルのキッチンで向かい合う二人。青みがかった蛍光灯の硬い光と、手持ちカメラ風の映像。

ジャズバーで、レンブラントの光に照らされた女性 GPT Image 2 プロンプトによる生成画像
スポットライト1本と立体感のある煙を組み合わせれば、映画のような雰囲気を演出するほぼ万能な近道となる。

6. ヴィルヌーヴの砂漠の叙事詩

Epic cinematic wide shot in Denis Villeneuve style. A lone hooded figure in flowing desert robes walks across a vast orange sand dune at sunset. The sun is enormous on the horizon, casting elongated shadows. Scale is extreme — the figure is tiny, the landscape overwhelming. Dust kicks up in the wind. Warm amber palette with deep violet shadows. Shot on 65mm, ultra-wide aspect. Ultra-realistic 4K cinematic quality.

解説:ヴィルヌーヴ流の砂漠の広角ショット。人物は小さく、風景が圧倒的だ。

7. フランス・ヌーヴェルヴァーグ・カフェ

Black and white French New Wave cinematic still. A young woman in a striped Breton shirt and dark bob haircut smokes at a Paris cafe table in 1962. She looks off-camera with soft intensity. Natural window light, high contrast, slightly overexposed highlights. Film grain visible. Godard aesthetic. 35mm monochrome, 50mm lens. Ultra-detailed.

注釈:1962年、パリのカフェにいるショートヘアの女性。フランス・ヌーヴェルヴァーグ風のモノクロ写真。

8. イタリアのジャッロ・ホラー・コリドー

Cinematic horror frame in the style of a 1970s Italian giallo. A woman in a white nightgown stands at the end of a long Victorian hallway lit only by flickering red lamplight. Her back is turned. Shadow stretches toward the camera. Wallpaper is blood-red damask. Shallow depth of field, 28mm lens slightly distorted. Grainy film look. Deep red and black color story. Ultra-detailed 4K.

解説:1970年代のイタリアのジャッロ・スタイル。血のように赤い廊下の先にある、白い服を着た女性の後ろ姿。

9. マイアミのネオンが輝く夜

1980s Miami Vice cinematic shot. A woman in a white linen blazer drives a red convertible at night through downtown Miami. Palm trees and neon motel signs blur past. She looks at the camera with sunglasses reflecting the pink and turquoise glow of the city. Lens flare, soft film grain. Teal and magenta color grade. Ultra-realistic 4K.

注釈:80年代のマイアミの夜景。赤いオープンカーと、サングラスに映るネオン。

10. スタジオジブリの実写化

Cinematic still styled as a live-action Studio Ghibli adaptation. A young woman in a simple blue linen dress stands in a vast green hillside field, wind blowing her hair and skirt. Fluffy white clouds race overhead. Soft golden hour light. Warm, painterly color grading with gentle film grain. Wide lens, low-angle composition making her heroic against the sky. Ultra-detailed 4K.

注釈:ジブリ風の実写化された丘の風景。ローアングルからの仰角撮影により、地平線が際立っている。


プロンプトライブラリ:ポートレートとメイク

ポートレート撮影の成否は、レンズ、光の当たり方、肌の質感の3点にかかっています。「85mm f/1.4」や「リングライト」、「カメラの左前方のソフトボックス」といった具体的な条件を明記すれば、無駄な試行錯誤を3回も省くことができます。

リングライトの下で輝く肌のクローズアップ――GPT Image 2のプロンプトによるポートレートサンプル
美容広告級のマクロポートレート。「85mm マクロ、f/1.4」――この一文こそが、肌にこのような質感をもたらす真の要因なのです。

11. フェンティ・ビューティー級のマクロ撮影

Extreme close-up beauty portrait. A stunning model with wet dewy skin and tousled damp hair, bare shoulders glistening. Water droplets on her face and neck catch the light of a ring light. Flawless skin texture in macro detail — every pore, every water droplet razor sharp. Smoky eye makeup with subtle gold shimmer. Lips slightly parted, intense gaze at camera. Dark background. Fenty Beauty campaign aesthetic. 85mm macro lens, f/1.4, ultra-shallow depth of field. Ultra-realistic 4K.

解説:潤いのある肌をクローズアップしたメイクアップ写真。リングライトの効果で、一粒一粒の水滴がくっきりと浮かび上がっている。

12. バロック様式の長椅子に腰掛ける人物像

Luxury editorial portrait. A gorgeous model wearing an elegant black velvet off-shoulder gown reclines on a dark velvet chaise longue in a dimly lit Baroque-style room. One arm draped elegantly above her head. Rich warm Rembrandt lighting from a single window highlights the fabric draping against her glowing skin. Oil painting-like quality with deep shadows and warm highlights. High-end fashion editorial photography. 85mm lens, creamy bokeh. Ultra-realistic 4K.

解説:ベルベットのソファに座る黒いドレスの女性。レンブラントの技法で、一筋の光が絵画的な質感を生み出している。

13. 清潔感のあるビジネス用証明写真

Professional corporate headshot. A confident woman in her early 30s wearing a tailored navy blazer over a crisp white shirt. Neutral gray seamless studio background. Three-point lighting — soft key from camera left, subtle fill from right, rim light from behind. Genuine warm smile, direct eye contact. 85mm lens, f/2.8. Skin tone natural and healthy. LinkedIn executive headshot quality. Ultra-realistic 4K.

注釈:グレーの背景+標準的な3点照明。LinkedInの幹部用プロフィール写真。

14. 東京のストリートスナップ

Environmental street portrait. A 20-something Tokyo local with bleached blonde hair and oversized vintage streetwear stands in Shibuya on a weekday afternoon. Shallow depth of field with crowd of pedestrians soft-blurred behind her. Natural overcast daylight. She looks slightly off-camera, lost in thought. Shot on Fujifilm X100 aesthetic, 35mm lens, f/2. Ultra-realistic 4K.

解説:平日の午後、渋谷。金髪に染めた少女と、ぼやけた背景の人混み。

15. 『Vogue』級の表紙

High-end fashion portrait in the style of a Vogue Italia cover. A striking model with razor-sharp cheekbones wears an oversized metallic silver couture gown with architectural shoulders. She stares directly into camera with a cold, commanding expression. Hair pulled back tight. Studio lighting is a single hard light from 45 degrees creating sculptural shadows. Gray backdrop. 85mm portrait lens, f/5.6 for crisp detail. Ultra-detailed 4K.

解説:『Vogue Italia』の表紙のような質感。シルバーの立体的なドレスと、単一の強い光で照らされた彫刻のようなポートレート。

16. 自然光を使ったキッチンでのポートレート

Soft natural light portrait. A woman with wavy chestnut hair sits by a large north-facing window in a quiet morning kitchen. She holds a ceramic mug of coffee in both hands, looking out the window thoughtfully. Warm cream sweater, no makeup, freckles visible. Shot in Rembrandt light with window as the only source. 50mm lens, f/1.8, shallow depth of field. Soft, honest, lived-in feel. Ultra-realistic 4K.

注釈:朝日の差し込むキッチンの窓辺に立つ、すっぴんの女性。片側の窓から差し込む自然光のみを活かして撮影。

17. 単色舞台照明

Dramatic black and white portrait. A man with a short salt-and-pepper beard and intense dark eyes stares into the lens. Only half his face is lit — hard side light from camera right, pure black shadow on the other side. Textured gray background fades to black. Shot on medium format film aesthetic, 80mm lens. Film grain. Peter Lindbergh style monochrome. Ultra-detailed.

解説:ピーター・リンドバーグ風のモノクロポートレート。顔の半分は強い光に照らされ、もう半分は真っ暗になっている。

18. ピンク色のメイク特集

Dreamy pastel beauty portrait. A model with soft pink lips, dewy skin, and flushed cheeks against a blush pink seamless backdrop. She wears a sheer white off-shoulder top. Soft diffused lighting from a large softbox creates flattering even illumination. Hair in loose tousled waves. 85mm lens, f/2. Cotton candy color palette — pink, peach, cream. Ultra-realistic 4K beauty editorial.

注釈:ピンクの背景+大型ソフトボックス、キャンディカラーのメイクアップ写真。

19. ゴールデンアワーのロマンチック

Sun-drenched golden hour portrait. A woman in a flowing cream linen dress stands in a wheat field at 7pm on a summer evening. The sun is low behind her, creating a halo of golden backlight through her hair and the sheer fabric. Lens flare across the frame. Her eyes are closed, face tilted up to the warmth. 135mm telephoto lens, f/2, compressed background. Warm honey color grade. Ultra-realistic 4K.

注釈:夏の夕暮れの麦畑。逆光+135mmの望遠レンズで空間を圧縮。

20. 暗黒学派図書館

Dark academia editorial portrait. A young woman with auburn hair in a loose braid wears a wool cardigan over a white collared shirt in an old university library. She holds an open leather-bound book, reading by the light of a green banker's lamp. Towering bookshelves around her fade into shadow. Warm tungsten light, deep navy and olive color palette. 50mm lens, f/2.8. Ultra-realistic 4K.

注釈:古い図書館+緑色の銀行家ランプ、ダーク・アカデミアの雰囲気。


プロンプトライブラリ:動作と動き

アクションシーンには、瞬間を切り取った表現(「空中で凍りついた」、「高速撮影」)と、エッジライトの2つが必要です。エッジライトは、被写体を雑多な背景から際立たせるために用いられます。

選手が回し蹴りを放つ瞬間を高速で静止させた画像——GPT Image 2 動作プロンプトのサンプル
動きを凍結した肖像。その輪郭を真に浮かび上がらせているのは、あの「背後から差し込むエッジライト」だ。

21. ナイキ トレーニングの静止画

Dynamic action freeze-frame. An athletic woman in a fitted sports bra and high-waisted compression shorts executes a powerful spinning roundhouse kick. Water splashes frozen in mid-air around her legs and feet in a dramatic spray pattern. Her toned abs and defined muscles visible. Dramatic single-source rim lighting from behind creates a glowing silhouette edge. Dark studio background. Nike Training campaign energy. High-speed photography feel — ultra-sharp subject, motion blur on water droplets. Ultra-realistic 4K.

注釈:ナイキの広告用ハイスピード撮影。水しぶきが空中で凍りついたような瞬間。

22. サーファーが波に乗る様子(室内撮影)

Epic wide-angle shot of a female surfer riding inside a massive crystal-clear barrel wave at golden hour. Her silhouette and athletic body visible through the translucent turquoise water of the wave tube. Golden sunlight creates an explosion of light and water mist behind her. Dramatic backlit composition. The wave is enormous and perfectly formed. GoPro-style immersive perspective. Ultra-realistic 4K cinematic quality.

解説:ゴールデンアワーの大波に乗る女性サーファー、逆光のシルエット。

23. パルクール:屋根越え

High-speed action shot of a parkour athlete mid-leap between two Brooklyn rooftops at sunset. Frozen at the apex of the jump, arms and legs extended, silhouetted against a burning orange sky. The gap below him is dizzying — city streets far below. Motion blur on the trailing edge of his hoodie. Shot from a drone at his height, 35mm lens. Ultra-realistic 4K cinematic action.

解説:夕陽に染まるブルックリンの屋上でのパルクール。ジャンプの最高点が切り取られている。

24. 総合格闘技のリングにスポットライトが当たる

Dramatic fight night action. A female MMA fighter mid-spinning back elbow, sweat flying from her hair in a visible arc of droplets. Single harsh overhead ring spotlight isolates her from pure black background — classic boxing photography look. Her opponent is a blurred silhouette out of focus. 70-200mm lens at 200mm, f/2.8, 1/2000 shutter frozen motion. High contrast, desaturated. Ultra-detailed 4K.

注釈:MMAリングの単一トップライト。飛び散る汗の弧がくっきりと見える。

25. オフロードバイクの巻き上げ粉塵

Low-angle action shot of a motocross rider airborne over a dirt jump, red desert dust exploding behind the rear tire. Late afternoon sun casts long shadows. The bike is tilted aggressively mid-trick. Camera is just above ground level looking up, making the jump look monumental. Anamorphic lens flare from the sun. Orange and teal color grade. Ultra-realistic 4K action.

日本語訳:オフロードバイクが空中に飛び上がり、後輪が赤い砂埃を巻き上げた。

26. バレエスタジオでの跳躍

Contemporary ballet dancer mid-grand jete frozen in the air, arms extended, body perfectly horizontal. She wears a simple nude leotard. Plain gray cyclorama studio background. Strong side-light from camera left creates a sculptural chiaroscuro on her musculature. Powder disturbed from the floor traces her leap in a soft cloud. 1/4000 shutter speed feel. Ultra-detailed 4K.

注釈:バレエのグラン・ジェテの最高点で、体が地面と平行になる。

27. バスケットボールのダンクシュート(オーバーヘッド)

Low-angle hero shot of a male basketball player mid-slam dunk, one hand gripping the rim, body extended diagonally across the frame. Arena lights streak as lens flares. Crowd is a soft blurred wall of phone flashes behind him. Frozen sweat and net motion. Shot on 24mm wide from directly below the hoop. NBA official photography energy. Ultra-realistic 4K.

注釈:バスケットの真下から24mmの広角レンズで、ダンクシュートの瞬間を上から捉えたショット。

28. 駿馬が波を駆け抜ける

A rider on a powerful black horse gallops through knee-deep shallow ocean water at sunrise. Water explodes from each hoofstrike, frozen in a dramatic spray. The rider is leaned low, hair streaming behind. Warm golden backlight from the rising sun. Mist rising off the water. Shot at 1/4000 shutter, 200mm telephoto compression. Ultra-realistic 4K equine photography.

解説:日の出時の浅瀬。黒い馬が駆け抜け、水しぶきが飛び散る。200mmの望遠レンズで被写体を圧縮して撮影。


プロンプトライブラリ:自然と風景

風景関連のキーワードは時間帯、天気、垂直方向のスケールです。モデルは「一般的な美しい自然」に対して非常に強い事前知識を持っているため、具体的な言葉を使ってその平均値からモデルを逸脱させる必要があります。

崖の滝のそば、霧の中に立つ女性――GPT Image 2 自然言語プロンプトのサンプル
崖の滝のそば、霧の中に立つ女性。「やや俯瞰」の空撮アングルと「gossamer(薄絹のような)」といった具体的な表現により、モデルがありきたりな印象に陥るのを防いでいる。

29. 滝の霧が醸し出す幻想的な世界

Ethereal fantasy nature scene. A graceful young woman in a flowing sheer gossamer dress stands at the edge of a towering waterfall cliff. Dense tropical mist swirls around her legs and the translucent fabric. She extends one arm toward the cascade, water droplets catching golden light. Aerial perspective slightly from above showing the dramatic cliff drop. Lush green ferns frame the composition. Golden hour light filtering through the mist. Ultra-realistic 4K cinematic quality.

解説:断崖の滝のそばに立つ白いベールをまとった女性。空撮アングル+霧。

30. モルディブの空撮:海に浮かぶ光景

Overhead drone shot of a beautiful woman in a minimal white bikini floating on her back in crystal-clear turquoise shallow water over white sand in the Maldives. Her long dark hair fans out in the water like a halo. The water is so clear her full body is visible through the translucent surface. Tiny fish swim nearby. Travel photography editorial style. Ultra-realistic 4K aerial quality.

説明:モルディブの真上からの俯瞰ショット。透き通った海に浮かぶ女性。

31. アイスランドの黒砂海岸

Dramatic wide landscape of Iceland's Reynisfjara black sand beach at dawn. Massive basalt sea stacks rise from the churning North Atlantic. Low fog drifts across the black sand. A single figure in a red rain jacket walks along the shoreline for scale. Moody desaturated color grade — almost monochrome with just the red jacket as accent. 24mm wide lens, f/11 for deep focus. Ultra-detailed 4K.

注釈:アイスランドの黒い砂浜と赤いレインコートを色彩のアクセントとして。

32. レッドウッドの森の教会の光

Vertical composition looking up through towering California redwood trees. Shafts of golden morning sunlight cut through the fog between the trunks like cathedral light rays. Ferns carpet the forest floor. A tiny hiker in the distance gives scale. Ultra-wide 14mm lens distorting the trunks into a radial pattern toward the sky. Warm green and gold palette. Ultra-realistic 4K nature photography.

説明:14mm広角レンズでセコイアの森を俯瞰し、霧の中に浮かぶ教会の光の束を捉えた。

33. パタゴニアの鏡のような湖

Perfect mirror reflection of the jagged Torres del Paine peaks in a glass-still Patagonian alpine lake at blue hour. Pink and purple alpenglow on the snow-capped summits. A single orange tent on the near shore as human scale. Complete symmetry — upper and lower half of frame are near-mirror images. 35mm lens, f/11. Ultra-realistic 4K landscape.

注釈:『ブルー・アワー』の完璧な鏡のような湖。上下対称。

34. サハラ砂漠の砂嵐

Vast Sahara desert at the start of a sandstorm. Rolling orange dunes extend to the horizon, with a towering wall of sand approaching from the left. A lone nomadic figure on camelback is silhouetted against the dust cloud. Sun struggles through the haze as a dim orange disc. Cinematic wide-angle, heavy atmospheric haze. Monochromatic warm orange palette. Ultra-detailed 4K.

解説:サハラ砂漠の砂嵐の端で、砂の壁を背に、ラクダの騎手のシルエットが浮かび上がる。

35. オーロラ・コテージ

Wide landscape of a tiny warm-lit wooden cabin in a Norwegian fjord valley at 1am. A spectacular green and purple aurora borealis dances overhead, reflecting in the still black fjord water. Snow-dusted pine trees and mountains frame the scene. The cabin glow is the only warm color in an otherwise cold composition. 20-second long exposure feel. Ultra-realistic 4K astrophotography.

日本語の注釈:ノルウェーのフィヨルドで、午前1時のオーロラと温かい小屋。

36. アフリカのサバンナの夕日

Cinematic wide shot of a family of elephants crossing a golden savanna at sunset in Kenya. The sun is a huge orange disc on the horizon, silhouetting the herd. Long grass ripples in the warm wind. Dust kicked up by the herd diffuses the backlight into warm beams. 200mm telephoto compression. National Geographic editorial style. Ultra-realistic 4K wildlife photography.

説明:ケニアの夕暮れの草原、象の群れのシルエット+200mm望遠レンズによる圧縮効果。

37. 京都の桜並木

Serene wide landscape of the Philosopher's Path in Kyoto at peak cherry blossom season. Pink petals float on the narrow canal, with more drifting down from the trees above. Traditional wooden bridges arch over the water. Early morning mist softens the light into diffused pink. A solo figure in a dark kimono walks along the stone path for scale. 50mm lens, f/4, gentle pastel color grade. Ultra-realistic 4K.

注釈:京都の哲学の道の桜の開花シーズンには、運河の水面にピンクの花びらが漂っている。

38. スコットランド・ハイランドの嵐の光

Dramatic landscape of the Scottish Highlands during a clearing thunderstorm. Dark churning clouds above a lone glen, with a single shaft of golden sunlight breaking through and lighting one patch of heather-covered hillside. Rainbow arc barely visible at the edge. Ancient standing stones in the foreground. Moody cinematic color grade — steel blue shadows, warm sunlit highlight. 24mm wide, f/11. Ultra-realistic 4K landscape photography.

注釈:スコットランドの高地で雷雨が去りかけた時、一筋の金色の陽光が暗雲の間から差し込んだ。


プロンプトライブラリ:ファンタジーとスタイリッシュ

ファンタジー作品において、具体的なアートソース(Ufotable、Arcane、Studio Trigger、『マジック:ザ・ギャザリング』のイラストなど)を挙げるだけで、指示は格段に明確になります。漠然とした「ファンタジーアート」という表現では、漠然としたファンタジー画しか返ってこないでしょう。

光り輝く魔剣のファンタジー戦姫――GPT Image 2 アニメプロンプトのサンプル
Ufotableらしいファンタジー戦姫。スタジオ名を挙げるだけで、どんな形容詞を20個並べ立てるよりも説得力がある。

39. Ufotable『戦姫』

Epic anime-inspired fantasy warrior princess with flowing silver-white hair that reaches her waist, wearing ornate golden battle armor that hugs her figure with intricate engravings. She holds a glowing magical sword aloft, emitting bright blue energy. Cherry blossom petals and magical sparkles swirl in a violent storm around her. Her expression is fierce and determined. Dynamic action pose mid-battle leap. Ultra-detailed anime with CGI-quality lighting — Ufotable production quality. Rich colors, dramatic volumetric lighting. 4K quality.

注釈:Ufotable級のアニメ『戦姫』、青い魔剣+桜の嵐。

40. ダークエルフの女性魔法使い

Dark fantasy dark elf sorceress with long flowing midnight-purple hair, pointed ears, and luminous violet eyes. She wears an elegant off-shoulder dark robe with intricate silver embroidery that reveals her collarbones and shoulders. Purple arcane energy spirals from her outstretched hands, illuminating her face from below. A vast star field and nebula visible in the background through a shattered stone archway. Semi-realistic fantasy illustration style with cinematic lighting. Ultra-detailed 4K.

注釈:ダークエルフの女性メイジ。紫色のアーケインエネルギーが彼女の手から渦を巻いて放たれる。

41. ジブリの森の精霊

Studio Ghibli style painterly scene. A small forest spirit that looks like a glowing white fox with three tails walks through a mossy enchanted forest at dusk. Fireflies dance around it. Soft painterly brushstrokes, warm honey-gold light filtering through massive ancient trees. Hayao Miyazaki watercolor aesthetic. Ultra-detailed animation cel quality.

解説:ジブリ風の三尾の白狐が、夕暮れの苔むした森を散策している。

42. Arcane 双城の戦い

Arcane Netflix animated series style illustration. A young woman with blue-tipped braided hair and steampunk goggles leans against a graffitied alley wall in the undercity of Piltover. Neon magical rune-signs glow behind her. Textured painterly brushstrokes visible, 2D illustration with 3D depth, saturated purple and teal color story. Fortiche animation studio aesthetic. Ultra-detailed 4K.

注釈:Arcane Fortiche スタイルの街の路地裏の少女。

43. マジック:ザ・ギャザリングのドラゴン

Fantasy illustration in the style of a Magic The Gathering card. A colossal red dragon emerges from molten lava in an underground cavern, wings half-spread, mouth roaring with fire breath forming. A tiny knight in silver armor stands at the cavern's edge for scale, raising a shield. Dramatic low-angle hero composition. Rich oil-painting texture, Greg Rutkowski influence. Ultra-detailed 4K fantasy art.

注釈:マジック:ザ・ギャザリング風のイラストで描かれた「溶岩の赤竜」と「小さな騎士」。

44. サイバー戦士

Cyberpunk fantasy fusion. A female samurai with a chrome katana stands on the rain-slicked rooftop of a neo-Tokyo megacorp tower at night. She wears a fusion of traditional kimono and carbon-fiber combat armor. Holographic cherry blossoms drift around her. Neon reflections on the wet rooftop, flying ad-drones in the background. Illustrated in the style of Katsuhiro Otomo meets modern 3D concept art. Ultra-detailed 4K.

注釈:サイバー東京の屋上に立つ女武士+ホログラムの桜。

45. 水中の人魚

Ethereal underwater fantasy. A graceful mermaid with iridescent teal and violet scales swims through a coral reef illuminated by shafts of sunlight piercing the water surface above. Her long turquoise hair flows weightlessly. Bubbles trail from her fingertips. School of small silver fish swim past. Dreamlike painterly quality, Lisa Frank meets National Geographic. Ultra-detailed 4K fantasy art.

解説:サンゴ礁に浮かぶ虹色のマーメイド。水面から光が差し込んでいる。

46. スチームパンク飛行船の船長

Illustrated steampunk fantasy portrait. A young female airship captain in a brass-buttoned red military coat, goggles pushed up on her forehead, stands at the wheel of a wooden airship. Visible brass gears and copper pipes. Behind her, clouds and other distant airships. Warm golden hour lighting. Illustration style inspired by Nausicaa and Howl's Moving Castle. Ultra-detailed 4K.

注釈:宮崎駿風の女性飛行船の船長と真鍮の歯車。


多様なスタイルの展開:同じ主人公、異なる世界

GPT Image 2における見過ごされがちなワークフロー:被写体を固定し、スタイルのパラメータのみを変更する。これにより、同じ顔、同じ服装、同じポーズに対して、各スタイルがどのような効果をもたらすかがはっきりと分かります。これで、次にスタイルを選ぶ際に当て推量に頼る必要はなくなります。

4分割スタイルの比較:写実、アニメ、油絵、サイバーパンク――GPT Image 2のプロンプト
同じテーマに基づく4つのスタイル。このバリエーションは、クライアントにスタイル案を提示する前にムードボードを作成するのに最適です。

基本プロンプト——4回の生成において主体を完全に一致させる:

A beautiful young woman with shoulder-length brown hair stands in a sunlit garden, wearing a simple white sundress, one hand lightly touching a rose bush. Soft golden afternoon light. Three-quarter body framing, slightly tilted head, warm smile.

注釈:陽光が降り注ぐ庭園で、バラに触れる白いドレス姿の女性。黄金色の午後の光。

その後、スタイルスロットを切り替えるだけで、各スロットを1回ずつ実行します:

47. 写実写真

[Base] — Hyperreal fashion photography aesthetic. 85mm lens at f/1.8, soft natural light, editorial sharpness. Ultra-realistic 4K.

48. 日本のアニメ

[Base] — Japanese anime style with cel shading, bold line art, vibrant saturated colors, large expressive eyes. Kyoto Animation production quality. Ultra-detailed.

49. 古典油絵

[Base] — Classical oil painting style with visible thick brushstrokes, warm Renaissance lighting, chiaroscuro shadow, Vermeer-like color palette. Museum-quality.

50. サイバーパンク

[Base] — Neon-drenched cyberpunk futurism. Holographic overlays, circuit-pattern light tattoos on skin, magenta and cyan rim lighting. Ghost in the Shell art direction. Ultra-detailed.

社内テストアカウントでこの一連の処理を実行したところ、最初の画像の生成には約18秒かかり、その後のスタイル切り替えにかかる時間もほぼ同様でした。合計で2分未満、48クレジットで、完全なスタイルのムードボード一式が完成しました。これをクライアントへの提案に盛り込めば、本来なら半日かかっていた素材の検索作業を、コーヒーを一杯飲むほどの時間に短縮できることになります。


よくある失敗例と対処法

「正直な話」の章:GPT Image 2は非常に便利ですが、魔法ではありません。ここでは、最も頻繁に発生する失敗のパターンと、それに対応する修正テンプレートを紹介します。この章をトラブルシューティングのチェックリストとして活用してください。次回画像生成で失敗した際は、順を追って確認すれば、ほとんどの問題は最初の修正で解決できるはずです。

失敗例 1:平凡で特徴のない出力

Before:

A beautiful woman in a city.

After:

A 28-year-old woman with auburn hair pulled into a low ponytail, wearing a camel trench coat, crossing a Manhattan crosswalk at 6pm on a rainy Thursday. Yellow taxis blur past in motion-blurred streaks. 50mm lens, f/2, cinematic grain. Ultra-realistic 4K.

最初のプロンプトでは、モデルが頼りにできる手がかりが何も与えられていません。解決策は常に具体的な名詞と具体的な場所です。

失敗例 2:指の本数が間違っている

GPT Image 2は手の描写において、第1世代の拡散モデルよりもはるかに優れていますが、手のクローズアップでは依然として失敗する可能性があります。確実な回避策は2つあります:

  • 手を主役にしてはいけない。最初からカットする:「framing is shoulders up only」(肩から上だけを撮影する)。
  • 手に何かを持たせる:「hands gently holding a ceramic coffee cup」。物を持つことで姿勢が決まり、指の配置も自然になる。

失敗例 3:画像内の文字が文字化けしている

このモデルはレイアウトソフトではありません。図面にロゴ、看板、ポスターなどの読み取り可能なテキストを配置する場合は、極力短くするか(例:「a sign reads OPEN」)、あるいは説明文に**「画像内のどこにもテキスト、文字、言葉は含まない」**と明記し、FigmaやPhotoshopで別途レイアウトを行ってください。

失敗例 4:光の方向が考慮されていない

Before:

A portrait of a woman with dramatic lighting.

After:

A portrait of a woman lit by a single hard spotlight from 45 degrees camera-left, with deep black shadow filling the right side of her face. Rembrandt lighting with a small triangle of light on the shadowed cheek.

「ドラマチックな照明」だけでは何も伝えていない。方向、光の硬さ、影の広がりを明確に示してこそ、真のヒントとなる。

失敗例 5:被写体が不適切なシーンに写り込んでいる

もしモデルが、人物を図書館ではなく汎用的なスタジオに繰り返し配置してしまう場合は――シーンをプロンプトの先頭に移動させ、より具体的に記述してください:

In a candle-lit 17th-century English library with floor-to-ceiling oak shelves, leather-bound books, and a stone fireplace, a woman in…

被写体を前景に配置することは、登場人物を画面に入れる前に構図全体を決定づけることに等しい。

失敗例 6:プロンプトの過剰使用

1,200語を超えると、個々の形容詞の影響力は薄れ始めます。もしプロンプトが40個のスタイルタグを羅列しただけのものなら、モデルは「平均値」を算出します。主要なスタイルのアンカー(例えば「フィルム・ノワール」)を1つ残し、他はすべて補助的な要素として扱います。


20,000文字をフル活用:構造化された長文プロンプト

GPT Image 2の過小評価されがちな利点の一つは、プロンプトの上限が20,000文字にも及ぶことです。競合製品の多くは1,000~2,000文字程度に制限されています。人物画では必要ありませんが、複数の人物が登場する複雑なシーンやコンセプトアートのブリーフ、あるいはブランドの一貫性が求められるシリーズ画像などにおいては、構造化された長いプロンプトを活用する価値は十分にあります。

制作ブリーフでよく使うテンプレート:

# シーン
[シーン:場所、時間、天候、時代背景、2~3文]

# 登場人物⟦改行⟧- キャラクターA:[外見、服装、現在の姿勢、表情]⟦改行⟧- キャラクターB:[同上]⟦改行⟧- 背景のエキストラ:[簡単な説明]

# 構図
[構図:広角/中景/クローズアップ;カメラアングル;ショット;被写界深度;画面内での各キャラクターの位置 — 三分割法/黄金比/中央配置]

# LIGHTING
[光源、方向、硬さ、色温度、影の挙動]

# COLOR
[3~4つの色彩用語を用いてカラーパレットを説明してください。配色の傾向 — 暖色系/寒色系/分離配色]

# STYLE
[主なスタイルの参考例。例:「『ブレードランナー 2049』におけるロジャー・ディーキンスの撮影スタイル」]

# TECHNICAL
[解像度の修飾語、フィルムの粒状感、画角、画質に関するタグ。簡潔にまとめる]

# 除外事項
[避けるべきもの:「テキストなし、ロゴなし、透かしなし、余分な手足なし」]

例――広告メイン画像1枚用の完全な構造化プロンプト(約500語):

# SCENE
A restored 1930s Art Deco ballroom on a rainy Tuesday evening in Paris, set during a private jazz performance. Tall arched windows on the left show wet boulevards and soft yellow streetlamp glow. Interior is lit warm and amber.

# CHARACTERS
- Lead: A striking 32-year-old woman with dark auburn hair in a low chignon, wearing a deep emerald-green silk bias-cut gown with a low back. She stands near a grand piano, one hand resting on its polished black lid, gazing thoughtfully toward the windows. Faint melancholy in her expression.
- Pianist: A middle-aged man in a black tuxedo, seated at the piano mid-performance, profile view, fingers on keys. He is a secondary figure — should not pull focus from the lead.
- Background: Three or four well-dressed patrons at candlelit round tables in soft bokeh, unidentifiable faces.

# COMPOSITION
Medium-wide shot. Lead character is on the right third of the frame, piano extending diagonally across the center toward the left. Rule of thirds. 50mm lens, f/2.2, shallow depth of field — lead and piano sharp, background patrons and windows softly blurred. Eye-level camera height.

# LIGHTING
Warm tungsten chandelier overhead providing ambient glow on the room. Key light on the lead is a single practical wall sconce camera-right at 45 degrees, modeling her face in gentle Rembrandt pattern. Rim from the windows behind her (cool blue rainy light) separates her hair and shoulder edge from the warm interior. Overall contrast: high but soft.

# COLOR
Deep emerald green (dress) and warm amber (interior) as hero colors, with cool blue window light as counter-accent. Warm gold dominant, with selective teal shadow detail. Film-look color grade reminiscent of early Wong Kar-wai.

# STYLE
Cinematic still in the visual language of In the Mood for Love meets a modern luxury cognac commercial. Anamorphic lens quality (slight horizontal flare on the candles). Painterly softness, 35mm film grain.

# TECHNICAL
Ultra-realistic 4K, 16:9 aspect, cinematic frame.

# EXCLUSIONS
No text, no signage, no logos, no watermarks, no visible phones or modern electronics, no extra limbs, no warped fingers on the pianist.

セクション分けには2つの利点があります。1つ目は、あなた自身がどの項目も漏れなく記入できるようにすること。2つ目は、モデルに対して構造化された解析の入り口を提供し、500語もの文章を一気に書き連ねるのではなく、整理された形式で情報を提供できることです。このシリーズ全体では、「CHARACTERS」と「SCENE」の2つのセクションを変更するだけで、同じCMの異なるカットを一括で生成することができます。

実践的なアドバイス:画像のレンダリングが80%ほど正しいものの、特定の要素(例えばヒロインの服の色が間違っているなど)が不適切な場合、プロンプト全体を書き直さないでください。成功したプロンプトをコピーし、該当する部分のみを修正して、もう一度実行してください。当社の内部イテレーションログによると、構造化されたプロンプトでは平均2.8回でメイン画像レベルの1フレームが得られるのに対し、自由形式のプロンプトでは6回を超えることがよくあります。1枚あたり12クレジットと仮定すると、これはメイン画像1枚あたり2ドルと5ドルの差に相当します。

構造化プロンプトのワークフローを同僚に引き継ぎたいですか?まずは入門ガイド]を読んでもらい、その後でこの記事に戻ってきてください。


よくある質問

GPT Image 2のプロンプトで最も重要なのは何ですか?

光とレンズ――この順序が重要です。被写体や背景の描写が多少曖昧でも挽回は可能ですが、光の方向やレンズの選択が曖昧だと、仕上がりは常にストック写真のような仕上がりになってしまいます。もし時間をかけて細かく調整できるのが2箇所だけなら、その2箇所に集中してください。「光がどの方向から差し込んでいるか、光の硬さはどうか、影がどちら側に落ちているか」を明確にし、さらに「何mmのレンズか、絞り値はどれくらいか、被写体との距離はどれくらいか」を明確に記述すれば、1枚の画像の基礎はしっかり固まります。

GPT Image 2のプロンプトはどのくらいの長さにすべきですか?

ポートレートやシンプルなシーンの場合、80~150語が最適な範囲です。時代やスタイルを反映した映画的な広角ショットの場合は、150~250語です。複数の人物が写るシーンや広告のブリーフについては、構造化されたテンプレートを使用し、400~800語とします。20,000文字の上限は極端なケースに備えて設定されていますが、日常的な使用では500語を超えることはほとんどありません。

プロンプトに実在するアーティストの名前を入れてもいいですか?

特定のスタイルや時代――「フィルム・ノワール」、「1970年代のジャッロ」、「スタジオジブリの絵画的な作風」など――を指定すれば、モデルはそれらの視覚的表現を認識します。しかし、存命の芸術家の名前をそのままスタイルタグとして使用することは、倫理的にグレーゾーンであり、モデル側でもフィルタリングされるケースが増えています。個人名を挙げるのではなく、スタイル、媒体、時代を記述する方が望ましいです。

なぜ同じプロンプトでも結果が毎回異なるのですか?

拡散モデルは本質的にランダムな性質を持っています。つまり、ノイズ画像から出発し、ノイズを除去して画像を生成する仕組みです。同じプロンプトを2回実行すれば、必然的に類似しているものの異なる結果が得られます。これはバグではなく、モデル固有の特性であり、「多様性」の源でもあります。結果を再現したい場合、ほとんどの生成システムではシードパラメータがサポートされています。技術的な背景については、OpenAIの画像生成ブログ]を参照してください。

プロンプトの長さは価格に影響しますか?

影響はありません。GPT Image 2は定額制を採用しており、1枚あたり12クレジットです。入力する文字数が20文字でも2,000文字でも料金は変わりません。コストに影響するのは、生成する画像の数だけです。

あるアイデアは、何回試してから諦めるべきか?

経験則:同じプロンプトを3回試して自然なばらつきを確認し、それでもうまくいかない場合は1つのパラメータのみを変更し、最初からやり直さないこと。修正が必要なのは、ほとんどの場合、光線やカメラアングルです。8回試しても進展がない場合は、構成に問題があります。その場合は、8つの要素の公式に戻って、実際にいくつ埋まっているかを確認してください。社内では、生成されたプロンプトと対応するシードを毎回表に記録する習慣があります。そうすることで、振り返りの際にどの単語が実際に効果を発揮したかを簡単に把握できます。

GPT Image 2で生成された画像は商用利用できますか?

はい、可能です。製品の標準利用規約に基づき、生成された画像の所有権はあなたに帰属し、商用利用も可能です。具体的なライセンス条項については、サイトフッターに記載されている内容に準拠してください。リスクの高い用途(ブランド広告、出版物の表紙など)については、弁護士に相談することをお勧めします。また、プロンプトに言及された実在の人物やブランド商標を、免責の根拠として扱わないでください。これらは肖像権や商標権の問題であり、AI製品の利用規約の適用範囲外となります。

text-to-image と image-to-image のプロンプトにはどのような違いがありますか?

text-to-imageはノイズから始まり、プロンプトが唯一の指針となります。image-to-imageはアップロードした参考画像から始まり、プロンプトはその画像を修正するためのものです。image-to-imageのプロンプトはより短く、「何を変更するか」(「油絵風に変更し、被写体のポーズと服装はそのままにする」)に焦点を当てるべきであり、シーン全体を改めて描写する必要はありません。参考画像がすでに大部分の要素を提供しているからです。


準備はできましたか?

今、あなたの手元には50以上のプロンプト、8つのスロットからなる公式、失敗事例の修正リスト、そして構造化された長文プロンプトのテンプレートがあります。次のステップは、ツールを開いて実際に1つ実行してみることです。適当に1つ選んで貼り付け、出力結果が頭の中のイメージとどれくらい違うかを確認してください。そして、ずれているスロットだけを修正して、もう一度実行します。2、3回繰り返すだけで、「そのまま納品できる」レベルの画像を安定して生成できるようになります。

この記事をブラウザのお気に入りに登録するか、あるいは「八槽位」の公式をセカンドモニターの横に貼っておきましょう。真のスキルアップとは、これらのキーワードを覚えることではなく、公式を筋肉記憶として身につけることです。そうすれば、どんな参考画像を見ても、自然と被写体、光、構図、スタイルを分解できるようになります。

GPT Image 2を無料で始める →

続きを読む:

特定のプロンプトについて質問がありますか?サイト内からメッセージをお寄せください。すべてのメッセージを確認しており、特に質問の多いものは、次回のガイドに反映されることがよくあります。理論的な背景については、Wikipediaの「テキスト生成画像モデル」の項目]と併せてお読みください(所要時間は約10分です)。さらにスキルを向上させたい場合は、同シリーズのチュートリアルをご覧ください。「良い画像を1枚生成する」というワークフローを、「統一感のある画像セットを安定して生成する」レベルへとアップグレードできます。

GPT Image 2 チーム

GPT Image 2 チーム

AIによる画像・動画生成