TL;DR
Una buona prompt per GPT Image 2 non è una semplice frase, ma un insieme di decisioni: soggetto, ambientazione, stile, inquadratura, illuminazione, atmosfera. Questa guida ti offre oltre 50 modelli di prompt pronti da copiare, che coprono cinque categorie principali: stile cinematografico, ritratti, azione, natura e fantasy, corredati da una lista di soluzioni per correggere i risultati non soddisfacenti e da un flusso di lavoro efficiente per l'iterazione. Tutte le immagini di esempio nel testo utilizzano lo stesso modello KIE gpt-image-2-text-to-image, con un costo di 12 crediti per immagine e un limite massimo di 20.000 caratteri per prompt. Prova gratuita di GPT Image 2 →
L'anatomia di una buona frase chiave
La maggior parte delle persone inizia subito scrivendo «cosa voglio». Chi invece riesce a scattare foto davvero belle scrive «cosa vede l'obiettivo». Questo è tutto il segreto.
Dopo aver eseguito migliaia di test sull'interfaccia KIE gpt-image-2-text-to-image, abbiamo elaborato una serie di formule a otto slot in grado di coprire praticamente ogni scenario. Compilando sei degli otto slot si ottiene già un risultato superiore alla media, mentre compilando tutti gli slot si raggiunge uno standard pari a quello dei film commerciali.
Formula:
[Soggetto] + [Azione/Posizione] + [Ambiente] + [Stile/Riferimento] + [Inquadratura/Composizione] + [Illuminazione] + [Atmosfera/Tonalità] + [Ritocco dell'immagine]
Ogni slot serve a fissare definitivamente una questione che il modello avrebbe altrimenti dovuto "indovinare":
- Soggetto — Chi o cosa è presente nell'immagine. "Bibliotecaria dai capelli rossi" è dieci volte meglio di "donna".
- Azione/Posizione — Cosa sta facendo in quel momento. Il verbo determina la composizione.
- Ambiente — Il mondo circostante. Specificare il Paese, l'epoca, l'ora.
- Stile/Riferimenti — "film noir", "animazione in stile Ufotable", "composizione simmetrica alla Wes Anderson", "stile pubblicitario Fenty Beauty". Richiamare un linguaggio visivo conosciuto, invece di accumulare aggettivi privi di significato.
- Inquadratura/Composizione — " primo piano", "grandangolo dal basso", "obiettivo da ritratto 85 mm, f/1.4", "obiettivo anamorfico". È questo il segreto per trasformare uno scatto in un fotogramma cinematografico.
- Luce——"luce di contorno dell'ora d'oro", "luce Rembrandt singola", "riflessi al neon sul terreno bagnato". La luce incide per il 60% sull'atmosfera di un'immagine.
- Atmosfera/Tonalità——"Contrasto tra blu freddo e arancione caldo", "Ombre accentuate da ambra calda", "Tonalità malinconica desaturata".
- Ritocco della qualità dell'immagine——"4K iperrealistico", "grana della pellicola", "foto da rivista di moda". Siate concisi, il lavoro più impegnativo è già stato fatto in precedenza.
Fondamenti vs Ottimizzazione: un confronto in due fasi sullo stesso argomento

Il prompt originale corrispondente all'immagine qui sopra è:
A woman standing in a room.Ora riscriviamo "lo stesso concetto" utilizzando la formula a otto slot:
A breathtaking young woman with flowing auburn hair stands in a luxurious Art Deco penthouse at golden hour. She wears a champagne-colored satin slip dress that catches the warm light. Floor-to-ceiling windows behind her show a panoramic city sunset. Dramatic side lighting creates deep shadows and golden highlights on her face and bare arms. The composition follows the rule of thirds. Cinematic depth of field with gorgeous city bokeh. Fashion editorial quality. Ultra-realistic 4K.Nota in cinese: In un attico in stile Art Déco, una donna dai capelli lunghi è in piedi davanti alla vetrata, mentre la luce del tramonto ne disegna i contorni del viso e delle braccia.

Nota: la versione ottimizzata non consiste nell'aggiungere più aggettivi, ma nel ridurre la quantità di informazioni che il modello deve dedurre da solo. GPT Image 2 si basa su un modello di diffusione guidato da un transformer (vedi la spiegazione di Wikipedia sui modelli di diffusione); per ogni dettaglio che non hai specificato, il modello utilizzerà la sua "media a priori" per completarlo. Se non dici "ora d'oro", ti darà di default una luce da martedì pomeriggio alle 14:00 con cielo nuvoloso.
Infine, ecco una curiosità: il limite massimo per i prompt di GPT Image 2 è di 20.000 caratteri, ovvero circa 3.000 parole in inglese. In condizioni normali non è affatto necessario arrivare a questo limite, ma nel caso di scene complesse con più personaggi o di immagini concettuali dettagliate, questa possibilità consente di definire le scelte compositive in modo molto minuzioso. Nella sezione 11 vedremo come utilizzare i prompt lunghi.
Libreria di prompt: scene dal sapore cinematografico
Le scene in stile cinematografico sono la categoria più facile da ricreare, poiché la storia del cinema ha accumulato un vocabolario visivo lungo un secolo. Basta indicare il genere, l'epoca e l'inquadratura, e il modello ti restituirà un fotogramma di tutto rispetto.

1. I vicoli di Hong Kong in una nuova veste
Film noir cinematic shot. A dangerously beautiful femme fatale in a curve-hugging red silk dress with a thigh-high slit, walking through a rain-soaked Hong Kong back alley at night. Neon signs in Chinese characters reflect red and blue on the wet cobblestones. She carries a black umbrella over one shoulder, her red-painted lips the only warm color against the cold teal lighting. Smoke wisps from a nearby vent. Anamorphic lens, shallow depth of field, cinematic grain. Ultra-realistic 4K noir film frame.Nota in cinese: In una notte piovosa nei vicoli di Hong Kong, una donna vestita di rosso attraversa il selciato illuminato dai riflessi delle luci al neon, con un ombrello in mano.
2. Jazz Bar Rembrandt
Moody jazz bar interior. A mysterious woman in a sheer black lace dress sits on a velvet barstool, one leg crossed showing stiletto heels. Cigarette smoke curls around her silhouette. Warm amber spotlight from above illuminates her face and exposed collarbones while the rest fades into deep shadow. A saxophone player is a blurred silhouette in the background. Film noir meets modern luxury aesthetic. Dramatic Rembrandt lighting, 35mm film look. Ultra-realistic 4K.Nota in cinese: La donna in pizzo nero nel jazz bar; l'illuminazione a punto singolo e il fumo creano un effetto di luce drammatica in stile Rembrandt.
*3. Il tetto di Blade Runner
Cyberpunk cinematic wide shot. A lone detective in a wet black trench coat stands on a neon-drenched Tokyo rooftop at 3am. Giant holographic advertisements of a geisha float across the skyline behind him, casting shifting pink and cyan light on his face. Light rain catches the glow. Flying cars streak past as horizontal light trails. Shot on anamorphic lens, 2.39:1 aspect, shallow depth of field. Blade Runner 2049 color grade — teal shadows, orange highlights. Ultra-realistic 4K cinematic frame.Nota in cinese: Su un tetto di Tokyo in stile cyberpunk, il detective è avvolto dai colori blu e rosa della pubblicità olografica di una geisha.
4. L'atrio simmetrico di Wes Anderson
Wes Anderson style cinematic composition. A 1960s hotel concierge in a burgundy uniform stands dead-center in a pastel-pink Art Deco lobby, flanked by perfectly symmetrical potted palms and brass sconces. Flat front-on framing, everything on center axis. Soft fluorescent overhead lighting. Pastel pink and mint green color palette. 35mm film look. Ultra-detailed 4K.Nota in cinese: Hall di un hotel in stile Art Déco dai toni rosa, con una composizione simmetrica frontale; il concierge si trova al centro dell'immagine.
5. Il confronto in cucina in un film poliziesco coreano
Cinematic still from a modern Korean crime thriller. Two men face each other across a small Seoul apartment kitchen at 2am, both holding knives but frozen in a tense moment. Single fluorescent tube overhead casts hard green-tinted light and harsh shadows. Steam rises from an abandoned pot on the stove. Tight composition, 40mm lens, handheld feel. Bong Joon-ho style. Ultra-realistic 4K.Nota in cinese: Alle due del mattino, due persone si fronteggiano nella cucina di Seul, sotto la luce fredda e verdastra delle lampade fluorescenti e con riprese dal punto di vista soggettivo.

6. L'epopea del deserto di Villeneuve
Epic cinematic wide shot in Denis Villeneuve style. A lone hooded figure in flowing desert robes walks across a vast orange sand dune at sunset. The sun is enormous on the horizon, casting elongated shadows. Scale is extreme — the figure is tiny, the landscape overwhelming. Dust kicks up in the wind. Warm amber palette with deep violet shadows. Shot on 65mm, ultra-wide aspect. Ultra-realistic 4K cinematic quality.Nota in cinese: Un grandangolo desertico alla Villeneuve, con i personaggi minuscoli e il paesaggio imponente.
7. Il caffè della Nouvelle Vague
Black and white French New Wave cinematic still. A young woman in a striped Breton shirt and dark bob haircut smokes at a Paris cafe table in 1962. She looks off-camera with soft intensity. Natural window light, high contrast, slightly overexposed highlights. Film grain visible. Godard aesthetic. 35mm monochrome, 50mm lens. Ultra-detailed.Nota in cinese: Una donna dai capelli corti in un caffè di Parigi nel 1962, in bianco e nero nello stile della Nouvelle Vague francese.
8. Il corridoio dell'orrore del giallo italiano
Cinematic horror frame in the style of a 1970s Italian giallo. A woman in a white nightgown stands at the end of a long Victorian hallway lit only by flickering red lamplight. Her back is turned. Shadow stretches toward the camera. Wallpaper is blood-red damask. Shallow depth of field, 28mm lens slightly distorted. Grainy film look. Deep red and black color story. Ultra-detailed 4K.Nota in cinese: Stile giallo italiano degli anni '70; la silhouette di una donna in bianco in fondo a un corridoio rosso sangue.
9. Notte al neon a Miami
1980s Miami Vice cinematic shot. A woman in a white linen blazer drives a red convertible at night through downtown Miami. Palm trees and neon motel signs blur past. She looks at the camera with sunglasses reflecting the pink and turquoise glow of the city. Lens flare, soft film grain. Teal and magenta color grade. Ultra-realistic 4K.Nota in cinese: Il panorama notturno di Miami negli anni '80: una decappottabile rossa e gli occhiali da sole che riflettono le luci al neon.
10. Adattamenti live-action dei film dello Studio Ghibli
Cinematic still styled as a live-action Studio Ghibli adaptation. A young woman in a simple blue linen dress stands in a vast green hillside field, wind blowing her hair and skirt. Fluffy white clouds race overhead. Soft golden hour light. Warm, painterly color grading with gentle film grain. Wide lens, low-angle composition making her heroic against the sky. Ultra-detailed 4K.Nota in cinese: Una scena in stile Studio Ghibli girata in live-action su una collina, con una ripresa dal basso che mette in risalto la linea dell'orizzonte.
Libreria di prompt: Ritratti e trucco
Il successo o il fallimento di un ritratto dipende da tre fattori: l'obiettivo, la direzione della luce e la texture della pelle. Specificare "85 mm f/1,4", "lampada anulare" o "softbox a sinistra della fotocamera" ti aiuterà a saltare direttamente tre cicli di tentativi inutili.

11. Macro in stile Fenty Beauty
Extreme close-up beauty portrait. A stunning model with wet dewy skin and tousled damp hair, bare shoulders glistening. Water droplets on her face and neck catch the light of a ring light. Flawless skin texture in macro detail — every pore, every water droplet razor sharp. Smoky eye makeup with subtle gold shimmer. Lips slightly parted, intense gaze at camera. Dark background. Fenty Beauty campaign aesthetic. 85mm macro lens, f/1.4, ultra-shallow depth of field. Ultra-realistic 4K.Nota in cinese: Primo piano di un trucco sulla pelle umida, illuminato da luci circolari, con ogni gocciolina di acqua nitidamente definita.
12. Ritratto su panca barocca
Luxury editorial portrait. A gorgeous model wearing an elegant black velvet off-shoulder gown reclines on a dark velvet chaise longue in a dimly lit Baroque-style room. One arm draped elegantly above her head. Rich warm Rembrandt lighting from a single window highlights the fabric draping against her glowing skin. Oil painting-like quality with deep shadows and warm highlights. High-end fashion editorial photography. 85mm lens, creamy bokeh. Ultra-realistic 4K.Nota in cinese: La donna in abito nero sulla panca di velluto; la luce proveniente dall'unica finestra crea l'effetto di un dipinto ad olio.
13. Foto tessera professionale
Professional corporate headshot. A confident woman in her early 30s wearing a tailored navy blazer over a crisp white shirt. Neutral gray seamless studio background. Three-point lighting — soft key from camera left, subtle fill from right, rim light from behind. Genuine warm smile, direct eye contact. 85mm lens, f/2.8. Skin tone natural and healthy. LinkedIn executive headshot quality. Ultra-realistic 4K.Nota in cinese: sfondo grigio + illuminazione standard a tre punti, foto profilo di un dirigente di alto livello su LinkedIn.
14. Ritratti di strada a Tokyo
Environmental street portrait. A 20-something Tokyo local with bleached blonde hair and oversized vintage streetwear stands in Shibuya on a weekday afternoon. Shallow depth of field with crowd of pedestrians soft-blurred behind her. Natural overcast daylight. She looks slightly off-camera, lost in thought. Shot on Fujifilm X100 aesthetic, 35mm lens, f/2. Ultra-realistic 4K.Nota in cinese: Un pomeriggio di un giorno feriale a Shibuya, una ragazza dai capelli biondi sfumati si staglia contro lo sfondo sfocato della folla.
15. Copertina in stile Vogue
High-end fashion portrait in the style of a Vogue Italia cover. A striking model with razor-sharp cheekbones wears an oversized metallic silver couture gown with architectural shoulders. She stares directly into camera with a cold, commanding expression. Hair pulled back tight. Studio lighting is a single hard light from 45 degrees creating sculptural shadows. Gray backdrop. 85mm portrait lens, f/5.6 for crisp detail. Ultra-detailed 4K.Nota in cinese: La copertina di Vogue Italia presenta un abito argentato tridimensionale e un ritratto scultoreo illuminato da una luce intensa.
16. Ritratto in cucina con luce naturale
Soft natural light portrait. A woman with wavy chestnut hair sits by a large north-facing window in a quiet morning kitchen. She holds a ceramic mug of coffee in both hands, looking out the window thoughtfully. Warm cream sweater, no makeup, freckles visible. Shot in Rembrandt light with window as the only source. 50mm lens, f/1.8, shallow depth of field. Soft, honest, lived-in feel. Ultra-realistic 4K.Nota in cinese: Una donna al naturale davanti alla finestra della cucina di Chen Guang, illuminata esclusivamente dalla luce naturale che entra da una finestra su un lato.
17. Luce teatrale monocromatica
Dramatic black and white portrait. A man with a short salt-and-pepper beard and intense dark eyes stares into the lens. Only half his face is lit — hard side light from camera right, pure black shadow on the other side. Textured gray background fades to black. Shot on medium format film aesthetic, 80mm lens. Film grain. Peter Lindbergh style monochrome. Ultra-detailed.Nota in cinese: Ritratto in bianco e nero in stile Peter Lindbergh, con metà del volto illuminato da una luce forte e l'altra metà completamente in ombra.
18. Servizio fotografico di bellezza in rosa
Dreamy pastel beauty portrait. A model with soft pink lips, dewy skin, and flushed cheeks against a blush pink seamless backdrop. She wears a sheer white off-shoulder top. Soft diffused lighting from a large softbox creates flattering even illumination. Hair in loose tousled waves. 85mm lens, f/2. Cotton candy color palette — pink, peach, cream. Ultra-realistic 4K beauty editorial.Nota in cinese: Sfondo rosa + grande softbox, servizio fotografico di bellezza dai toni pastello.
19. Un momento d'oro romantico
Sun-drenched golden hour portrait. A woman in a flowing cream linen dress stands in a wheat field at 7pm on a summer evening. The sun is low behind her, creating a halo of golden backlight through her hair and the sheer fabric. Lens flare across the frame. Her eyes are closed, face tilted up to the warmth. 135mm telephoto lens, f/2, compressed background. Warm honey color grade. Ultra-realistic 4K.Nota in cinese: Un campo di grano al tramonto estivo, controluce + teleobiettivo da 135 mm per comprimere lo spazio.
20. La biblioteca della Scuola Oscura
Dark academia editorial portrait. A young woman with auburn hair in a loose braid wears a wool cardigan over a white collared shirt in an old university library. She holds an open leather-bound book, reading by the light of a green banker's lamp. Towering bookshelves around her fade into shadow. Warm tungsten light, deep navy and olive color palette. 50mm lens, f/2.8. Ultra-realistic 4K.Nota in cinese: Vecchia biblioteca + lampada da scrivania verde, atmosfera dark academia.
Libreria di prompt: azioni e movimenti
Le scene d'azione richiedono due elementi: parole che descrivono l'istante congelato («congelato a mezz'aria», «ripresa ad alta velocità») e luci di contorno, che servono a far risaltare il soggetto da uno sfondo caotico.

21. Nike Training Freeze Frame
Dynamic action freeze-frame. An athletic woman in a fitted sports bra and high-waisted compression shorts executes a powerful spinning roundhouse kick. Water splashes frozen in mid-air around her legs and feet in a dramatic spray pattern. Her toned abs and defined muscles visible. Dramatic single-source rim lighting from behind creates a glowing silhouette edge. Dark studio background. Nike Training campaign energy. High-speed photography feel — ultra-sharp subject, motion blur on water droplets. Ultra-realistic 4K.Nota in cinese: Riprese al rallentatore in stile pubblicitario Nike, con gli spruzzi d'acqua congelati nell'aria.
22. Interno del tubo dell'onda
Epic wide-angle shot of a female surfer riding inside a massive crystal-clear barrel wave at golden hour. Her silhouette and athletic body visible through the translucent turquoise water of the wave tube. Golden sunlight creates an explosion of light and water mist behind her. Dramatic backlit composition. The wave is enormous and perfectly formed. GoPro-style immersive perspective. Ultra-realistic 4K cinematic quality.Descrizione in cinese: Una surfista all’interno di un tubo gigante durante il momento d’oro, silhouette in controluce.
23. Salto acrobatico sui tetti
High-speed action shot of a parkour athlete mid-leap between two Brooklyn rooftops at sunset. Frozen at the apex of the jump, arms and legs extended, silhouetted against a burning orange sky. The gap below him is dizzying — city streets far below. Motion blur on the trailing edge of his hoodie. Shot from a drone at his height, 35mm lens. Ultra-realistic 4K cinematic action.Nota in cinese: Parkour sui tetti di Brooklyn al tramonto, con un'immagine che immortala il punto più alto del salto.
24. I riflettori sul ring delle arti marziali miste
Dramatic fight night action. A female MMA fighter mid-spinning back elbow, sweat flying from her hair in a visible arc of droplets. Single harsh overhead ring spotlight isolates her from pure black background — classic boxing photography look. Her opponent is a blurred silhouette out of focus. 70-200mm lens at 200mm, f/2.8, 1/2000 shutter frozen motion. High contrast, desaturated. Ultra-detailed 4K.Nota in cinese: Unica luce dall'alto sul ring di MMA; le traiettorie delle gocce di sudore sono chiaramente visibili.
25. Polvere sollevata dalle moto da cross
Low-angle action shot of a motocross rider airborne over a dirt jump, red desert dust exploding behind the rear tire. Late afternoon sun casts long shadows. The bike is tilted aggressively mid-trick. Camera is just above ground level looking up, making the jump look monumental. Anamorphic lens flare from the sun. Orange and teal color grade. Ultra-realistic 4K action.Nota in cinese: La moto da cross si libra in aria, mentre la ruota posteriore solleva una nuvola di polvere rossa.
26. Un balzo nella sala da ballo
Contemporary ballet dancer mid-grand jete frozen in the air, arms extended, body perfectly horizontal. She wears a simple nude leotard. Plain gray cyclorama studio background. Strong side-light from camera left creates a sculptural chiaroscuro on her musculature. Powder disturbed from the floor traces her leap in a soft cloud. 1/4000 shutter speed feel. Ultra-detailed 4K.Nota in cinese: nel grand jeté del balletto, il punto più alto è raggiunto quando il corpo è parallelo al suolo.
27. Schiacciata in sospensione nel basket
Low-angle hero shot of a male basketball player mid-slam dunk, one hand gripping the rim, body extended diagonally across the frame. Arena lights streak as lens flares. Crowd is a soft blurred wall of phone flashes behind him. Frozen sweat and net motion. Shot on 24mm wide from directly below the hoop. NBA official photography energy. Ultra-realistic 4K.Nota in cinese: Scatto grandangolare da 24 mm dell'istante della schiacciata, ripreso da sotto il canestro.
28. Cavallo al galoppo sulle onde
A rider on a powerful black horse gallops through knee-deep shallow ocean water at sunrise. Water explodes from each hoofstrike, frozen in a dramatic spray. The rider is leaned low, hair streaming behind. Warm golden backlight from the rising sun. Mist rising off the water. Shot at 1/4000 shutter, 200mm telephoto compression. Ultra-realistic 4K equine photography.Nota in cinese: Mare poco profondo all’alba, un cavallo nero che galoppa sollevando spruzzi d’acqua; effetto di compressione ottenuto con un teleobiettivo da 200 mm.
Libreria di prompt: Natura e paesaggi
Le parole chiave relative ai paesaggi sono ora del giorno, condizioni meteorologiche, scala verticale. Il modello ha un forte pregiudizio verso la "bellezza naturale generica"; è necessario utilizzare termini specifici per allontanarlo da quella media.

29. Il paradiso della nebbia della cascata
Ethereal fantasy nature scene. A graceful young woman in a flowing sheer gossamer dress stands at the edge of a towering waterfall cliff. Dense tropical mist swirls around her legs and the translucent fabric. She extends one arm toward the cascade, water droplets catching golden light. Aerial perspective slightly from above showing the dramatic cliff drop. Lush green ferns frame the composition. Golden hour light filtering through the mist. Ultra-realistic 4K cinematic quality.Descrizione in cinese: Una donna vestita di bianco in riva a una cascata sul precipizio, ripresa dall'alto + nebbia.
30. Riprese aeree delle Maldive
Overhead drone shot of a beautiful woman in a minimal white bikini floating on her back in crystal-clear turquoise shallow water over white sand in the Maldives. Her long dark hair fans out in the water like a halo. The water is so clear her full body is visible through the translucent surface. Tiny fish swim nearby. Travel photography editorial style. Ultra-realistic 4K aerial quality.Descrizione: Una donna che galleggia nelle acque cristalline, vista dall'alto proprio sopra le Maldive.
31. La costa della sabbia nera islandese
Dramatic wide landscape of Iceland's Reynisfjara black sand beach at dawn. Massive basalt sea stacks rise from the churning North Atlantic. Low fog drifts across the black sand. A single figure in a red rain jacket walks along the shoreline for scale. Moody desaturated color grade — almost monochrome with just the red jacket as accent. 24mm wide lens, f/11 for deep focus. Ultra-detailed 4K.Nota in cinese: La spiaggia di sabbia nera islandese e l'impermeabile rosso fungono da punti di riferimento cromatici.
32. La luce della chiesa di Redwood
Vertical composition looking up through towering California redwood trees. Shafts of golden morning sunlight cut through the fog between the trunks like cathedral light rays. Ferns carpet the forest floor. A tiny hiker in the distance gives scale. Ultra-wide 14mm lens distorting the trunks into a radial pattern toward the sky. Warm green and gold palette. Ultra-realistic 4K nature photography.Descrizione in cinese: Foto grandangolare da 14 mm di una foresta di sequoie, con un fascio di luce che illumina una chiesa avvolta dalla nebbia.
33. I laghi a specchio della Patagonia
Perfect mirror reflection of the jagged Torres del Paine peaks in a glass-still Patagonian alpine lake at blue hour. Pink and purple alpenglow on the snow-capped summits. A single orange tent on the near shore as human scale. Complete symmetry — upper and lower half of frame are near-mirror images. 35mm lens, f/11. Ultra-realistic 4K landscape.Nota in cinese: Il lago perfettamente specchiato nel momento blu, simmetrico dall’alto al basso.
34. Tempesta di sabbia nel Sahara
Vast Sahara desert at the start of a sandstorm. Rolling orange dunes extend to the horizon, with a towering wall of sand approaching from the left. A lone nomadic figure on camelback is silhouetted against the dust cloud. Sun struggles through the haze as a dim orange disc. Cinematic wide-angle, heavy atmospheric haze. Monochromatic warm orange palette. Ultra-detailed 4K.Nota in cinese: Ai margini di una tempesta di sabbia nel Sahara, la sagoma di un cammelliere che sfida il muro di sabbia.
35. La capanna dell'aurora boreale
Wide landscape of a tiny warm-lit wooden cabin in a Norwegian fjord valley at 1am. A spectacular green and purple aurora borealis dances overhead, reflecting in the still black fjord water. Snow-dusted pine trees and mountains frame the scene. The cabin glow is the only warm color in an otherwise cold composition. 20-second long exposure feel. Ultra-realistic 4K astrophotography.Nota in cinese: L'aurora boreale alle una di notte nei fiordi norvegesi e una calda casetta.
36. Tramonto nella savana africana
Cinematic wide shot of a family of elephants crossing a golden savanna at sunset in Kenya. The sun is a huge orange disc on the horizon, silhouetting the herd. Long grass ripples in the warm wind. Dust kicked up by the herd diffuses the backlight into warm beams. 200mm telephoto compression. National Geographic editorial style. Ultra-realistic 4K wildlife photography.Nota in cinese: Prateria al tramonto in Kenya, sagome di un branco di elefanti + compressione con teleobiettivo da 200 mm.
37. Il fiume dei ciliegi in fiore a Kyoto
Serene wide landscape of the Philosopher's Path in Kyoto at peak cherry blossom season. Pink petals float on the narrow canal, with more drifting down from the trees above. Traditional wooden bridges arch over the water. Early morning mist softens the light into diffused pink. A solo figure in a dark kimono walks along the stone path for scale. 50mm lens, f/4, gentle pastel color grade. Ultra-realistic 4K.Nota in cinese: Durante la stagione della fioritura dei ciliegi lungo il Sentiero della Filosofia a Kyoto, i petali rosa galleggiano sulla superficie del canale.
38. Luce della tempesta nelle Highlands scozzesi
Dramatic landscape of the Scottish Highlands during a clearing thunderstorm. Dark churning clouds above a lone glen, with a single shaft of golden sunlight breaking through and lighting one patch of heather-covered hillside. Rainbow arc barely visible at the edge. Ancient standing stones in the foreground. Moody cinematic color grade — steel blue shadows, warm sunlit highlight. 24mm wide, f/11. Ultra-realistic 4K landscape photography.Nota in cinese: Mentre il temporale sulle Highlands scozzesi stava per placarsi, un unico raggio di sole dorato filtrò tra le nuvole scure.
Libreria di prompt: Fantasia e stilizzazione
Non appena si cita un riferimento artistico specifico nel genere fantasy (Ufotable, Arcane, Studio Trigger, illustrazioni di Magic: The Gathering), le indicazioni diventano molto più precise. Un generico "fantasy art" produrrà solo immagini fantasy generiche.

39. Ufotable: Anime Senki
Epic anime-inspired fantasy warrior princess with flowing silver-white hair that reaches her waist, wearing ornate golden battle armor that hugs her figure with intricate engravings. She holds a glowing magical sword aloft, emitting bright blue energy. Cherry blossom petals and magical sparkles swirl in a violent storm around her. Her expression is fierce and determined. Dynamic action pose mid-battle leap. Ultra-detailed anime with CGI-quality lighting — Ufotable production quality. Rich colors, dramatic volumetric lighting. 4K quality.Nota in cinese: Un anime di livello Ufotable con una guerriera, una spada magica blu e una tempesta di fiori di ciliegio.
40. Maga elfa oscura
Dark fantasy dark elf sorceress with long flowing midnight-purple hair, pointed ears, and luminous violet eyes. She wears an elegant off-shoulder dark robe with intricate silver embroidery that reveals her collarbones and shoulders. Purple arcane energy spirals from her outstretched hands, illuminating her face from below. A vast star field and nebula visible in the background through a shattered stone archway. Semi-realistic fantasy illustration style with cinematic lighting. Ultra-detailed 4K.Nota in cinese: Una maga elfa oscura, con energia arcana viola che le turbina dalle mani.
41. Gli spiriti della foresta di Ghibli
Studio Ghibli style painterly scene. A small forest spirit that looks like a glowing white fox with three tails walks through a mossy enchanted forest at dusk. Fireflies dance around it. Soft painterly brushstrokes, warm honey-gold light filtering through massive ancient trees. Hayao Miyazaki watercolor aesthetic. Ultra-detailed animation cel quality.Nota in cinese: Una volpe bianca a tre code in stile Studio Ghibli passeggia in un bosco ricoperto di muschio al crepuscolo.
42. Arcane: La battaglia delle due città
Arcane Netflix animated series style illustration. A young woman with blue-tipped braided hair and steampunk goggles leans against a graffitied alley wall in the undercity of Piltover. Neon magical rune-signs glow behind her. Textured painterly brushstrokes visible, 2D illustration with 3D depth, saturated purple and teal color story. Fortiche animation studio aesthetic. Ultra-detailed 4K.Nota in cinese: Ragazza nei vicoli della città vecchia nello stile Arcane Fortiche.
43. Il Drago di Magic: The Gathering
Fantasy illustration in the style of a Magic The Gathering card. A colossal red dragon emerges from molten lava in an underground cavern, wings half-spread, mouth roaring with fire breath forming. A tiny knight in silver armor stands at the cavern's edge for scale, raising a shield. Dramatic low-angle hero composition. Rich oil-painting texture, Greg Rutkowski influence. Ultra-detailed 4K fantasy art.Nota in cinese: Il Drago di Lava Rosso e il Cavaliere Minuscolo in stile illustrativo di Magic: The Gathering.
44. Cyber Knight
Cyberpunk fantasy fusion. A female samurai with a chrome katana stands on the rain-slicked rooftop of a neo-Tokyo megacorp tower at night. She wears a fusion of traditional kimono and carbon-fiber combat armor. Holographic cherry blossoms drift around her. Neon reflections on the wet rooftop, flying ad-drones in the background. Illustrated in the style of Katsuhiro Otomo meets modern 3D concept art. Ultra-detailed 4K.Nota in cinese: Una samurai sui tetti di Cyber Tokyo + fiori di ciliegio olografici.
45. La sirena sott'acqua
Ethereal underwater fantasy. A graceful mermaid with iridescent teal and violet scales swims through a coral reef illuminated by shafts of sunlight piercing the water surface above. Her long turquoise hair flows weightlessly. Bubbles trail from her fingertips. School of small silver fish swim past. Dreamlike painterly quality, Lisa Frank meets National Geographic. Ultra-detailed 4K fantasy art.Nota in cinese: Una sirena arcobaleno tra le barriere coralline, con i raggi di luce che filtrano dalla superficie dell'acqua.
46. Capitano di un dirigibile steampunk
Illustrated steampunk fantasy portrait. A young female airship captain in a brass-buttoned red military coat, goggles pushed up on her forehead, stands at the wheel of a wooden airship. Visible brass gears and copper pipes. Behind her, clouds and other distant airships. Warm golden hour lighting. Illustration style inspired by Nausicaa and Howl's Moving Castle. Ultra-detailed 4K.Nota in cinese: Una capitana di dirigibile in stile Hayao Miyazaki e un ingranaggio in ottone.
Iterazioni multistile: lo stesso soggetto, mondi diversi
Un flusso di lavoro sottovalutato in GPT Image 2: fissare il soggetto e modificare solo gli slot dello stile. Potrai vedere chiaramente cosa fa ogni stile allo stesso volto, allo stesso abbigliamento e alla stessa posa: la prossima volta non dovrai più scegliere lo stile a caso.

Prompt di base — Il soggetto rimane identico in tutte e quattro le generazioni:
A beautiful young woman with shoulder-length brown hair stands in a sunlit garden, wearing a simple white sundress, one hand lightly touching a rose bush. Soft golden afternoon light. Three-quarter body framing, slightly tilted head, warm smile.Nota in cinese: Una ragazza in abito semplice che accarezza una rosa nel Giardino del Sole, nella luce dorata del pomeriggio.
Quindi basta cambiare lo slot dello stile ed eseguire una volta per ciascuno:
47. Fotografia realistica
[Base] — Hyperreal fashion photography aesthetic. 85mm lens at f/1.8, soft natural light, editorial sharpness. Ultra-realistic 4K.48. Anime giapponesi
[Base] — Japanese anime style with cel shading, bold line art, vibrant saturated colors, large expressive eyes. Kyoto Animation production quality. Ultra-detailed.49. Pittura a olio classica
[Base] — Classical oil painting style with visible thick brushstrokes, warm Renaissance lighting, chiaroscuro shadow, Vermeer-like color palette. Museum-quality.50. Cyberpunk
[Base] — Neon-drenched cyberpunk futurism. Holographic overlays, circuit-pattern light tattoos on skin, magenta and cyan rim lighting. Ghost in the Shell art direction. Ultra-detailed.Abbiamo eseguito questa sequenza su un account di prova interno: la prima immagine ha richiesto circa 18 secondi, mentre il cambio di stile per le immagini successive ha richiesto più o meno lo stesso tempo. In meno di due minuti e con 48 crediti abbiamo ottenuto una moodboard completa. Se inserita nella proposta per il cliente, ciò equivale a comprimere la ricerca di materiale, che normalmente richiederebbe mezza giornata, nel tempo necessario per bere una tazza di caffè.
Casi tipici di malfunzionamento e soluzioni
Sezione "Onestà": GPT Image 2 è molto utile, ma non è una bacchetta magica. Di seguito sono riportate le categorie di errori più frequenti che abbiamo riscontrato, insieme ai modelli di correzione corrispondenti. Utilizzate questa sezione come lista di controllo per la risoluzione dei problemi: la prossima volta che un'immagine non viene generata correttamente, controllate i punti in ordine e la maggior parte dei problemi si risolverà già dopo la prima modifica.
Errore 1: Risultato banale
Before:
A beautiful woman in a city.After:
A 28-year-old woman with auburn hair pulled into a low ponytail, wearing a camel trench coat, crossing a Manhattan crosswalk at 6pm on a rainy Thursday. Yellow taxis blur past in motion-blurred streaks. 50mm lens, f/2, cinematic grain. Ultra-realistic 4K.La prima prompt non ha fornito al modello alcun punto di riferimento. La soluzione è sempre quella di utilizzare nomi propri e luoghi specifici.
Errore 2: numero di dita errato
GPT Image 2 offre già una resa delle mani nettamente superiore rispetto alla prima generazione di modelli diffusivi, ma i primi piani delle mani possono ancora dare risultati deludenti. Due metodi affidabili per ovviare a questo problema:
- Non mettere le mani al centro dell'inquadratura, eliminale direttamente: "framing is shoulders up only" (inquadrare solo dalla vita in su).
- Fai in modo che le mani reggano qualcosa: "hands gently holding a ceramic coffee cup" (mani che reggono delicatamente una tazza da caffè in ceramica). La presenza di un oggetto determina la postura e stabilizza la posizione delle dita.
Errore 3: caratteri illeggibili nell'immagine
Il modello non è un programma di impaginazione. Se volete inserire nel disegno un logo, un cartello o del testo leggibile su un manifesto, fate in modo che sia molto breve (ad esempio: "un cartello recita OPEN") oppure aggiungete direttamente una nota con la dicitura: "nessun testo, nessuna lettera, nessuna parola in nessuna parte dell'immagine", per poi impaginarli separatamente in Figma/Photoshop.
Errore 4: direzione della luce ignorata
Before:
A portrait of a woman with dramatic lighting.After:
A portrait of a woman lit by a single hard spotlight from 45 degrees camera-left, with deep black shadow filling the right side of her face. Rembrandt lighting with a small triangle of light on the shadowed cheek."Illuminazione drammatica" non dice nulla. Solo specificare la direzione, l'intensità e l'estensione delle ombre costituisce un vero e proprio suggerimento.
Errore 5: il soggetto appare in una scena sbagliata
Se il modello continua a collocare i personaggi in uno studio fotografico generico anziché in una biblioteca, sposta la scena all'inizio della descrizione e rendila più specifica:
In a candle-lit 17th-century English library with floor-to-ceiling oak shelves, leather-bound books, and a stone fireplace, a woman in…Posizionare lo sfondo davanti al soggetto equivale a definire l'intera composizione prima ancora di introdurre il personaggio.
Errore 6: Sovraccarico di parole chiave
Superati i 1.200 termini circa, l'influenza dei singoli aggettivi inizia a diluirsi. Se la tua lista di prompt è un elenco di 40 etichette stilistiche, il modello calcolerà una "media". Manterrà un punto di riferimento stilistico principale (ad esempio "film noir") e considererà tutte le altre come secondarie.
Raggiungere i 20.000 caratteri: prompt strutturati di lunga durata
Un vantaggio spesso sottovalutato di GPT Image 2 è il limite massimo di 20.000 caratteri per i prompt. La maggior parte dei prodotti concorrenti si ferma a circa 1.000–2.000 caratteri. Anche se non è necessario per i ritratti, i prompt lunghi e strutturati sono estremamente utili per scene complesse con più personaggi, brief per immagini concettuali o serie di immagini che richiedono una forte coerenza di marca.
Modelli che utilizziamo comunemente nei brief di produzione:
# SCENA
[Scena: luogo, ora, condizioni meteorologiche, periodo storico, 2–3 frasi]
# PERSONAGGI
- Personaggio A: [Aspetto fisico, abbigliamento, posizione attuale, espressione]
- Personaggio B: [Idem]
- Comparse: [Breve descrizione]
# COMPOSIZIONE
[Composizione: grandangolo/medio campo/primo piano; angolazione della ripresa; inquadratura; profondità di campo; posizione di ciascun personaggio nell'inquadratura — regola dei terzi/sezione aurea/centro]
# ILLUMINAZIONE
[Sorgente luminosa, direzione, intensità, temperatura di colore, comportamento delle ombre]
# COLORE⟦NERO⟧[Descrivi la tavolozza utilizzando 3–4 termini relativi al colore. Tonalità: calda/fredda/contrastante]
# STYLE
[Un riferimento allo stile principale. Ad esempio: "Lo stile fotografico di Roger Deakins in *Blade Runner 2049*"]
# TECNICO
[Modifiche alla risoluzione, grana della pellicola, formato, etichette relative alla qualità dell'immagine. Si prega di essere concisi]
# ESCLUSIONI
[Cose da evitare: "Niente testo, niente loghi, niente filigrane, niente arti in più"]Esempio — Prompt strutturato completo (circa 500 parole) per un'immagine principale dell'annuncio:
# SCENE
A restored 1930s Art Deco ballroom on a rainy Tuesday evening in Paris, set during a private jazz performance. Tall arched windows on the left show wet boulevards and soft yellow streetlamp glow. Interior is lit warm and amber.
# CHARACTERS
- Lead: A striking 32-year-old woman with dark auburn hair in a low chignon, wearing a deep emerald-green silk bias-cut gown with a low back. She stands near a grand piano, one hand resting on its polished black lid, gazing thoughtfully toward the windows. Faint melancholy in her expression.
- Pianist: A middle-aged man in a black tuxedo, seated at the piano mid-performance, profile view, fingers on keys. He is a secondary figure — should not pull focus from the lead.
- Background: Three or four well-dressed patrons at candlelit round tables in soft bokeh, unidentifiable faces.
# COMPOSITION
Medium-wide shot. Lead character is on the right third of the frame, piano extending diagonally across the center toward the left. Rule of thirds. 50mm lens, f/2.2, shallow depth of field — lead and piano sharp, background patrons and windows softly blurred. Eye-level camera height.
# LIGHTING
Warm tungsten chandelier overhead providing ambient glow on the room. Key light on the lead is a single practical wall sconce camera-right at 45 degrees, modeling her face in gentle Rembrandt pattern. Rim from the windows behind her (cool blue rainy light) separates her hair and shoulder edge from the warm interior. Overall contrast: high but soft.
# COLOR
Deep emerald green (dress) and warm amber (interior) as hero colors, with cool blue window light as counter-accent. Warm gold dominant, with selective teal shadow detail. Film-look color grade reminiscent of early Wong Kar-wai.
# STYLE
Cinematic still in the visual language of In the Mood for Love meets a modern luxury cognac commercial. Anamorphic lens quality (slight horizontal flare on the candles). Painterly softness, 35mm film grain.
# TECHNICAL
Ultra-realistic 4K, 16:9 aspect, cinematic frame.
# EXCLUSIONS
No text, no signage, no logos, no watermarks, no visible phones or modern electronics, no extra limbs, no warped fingers on the pianist.La struttura a sezioni offre due vantaggi: in primo luogo, ti permette di non tralasciare nessuna voce; in secondo luogo, fornisce al modello un punto di accesso strutturato, anziché un testo di 500 parole scritto tutto d'un fiato. È sufficiente modificare le due sezioni CHARACTERS e SCENE per generare in blocco diverse riprese dello stesso spot pubblicitario.
Un consiglio pratico: quando un'immagine è corretta all'80%, ma un elemento non va bene (ad esempio, la protagonista indossa un colore sbagliato), non riscrivere l'intera descrizione. Copia quella che ha funzionato, modifica solo la parte corrispondente e riprova. I nostri registri interni di iterazione mostrano che con le descrizioni strutturate si ottiene in media un fotogramma di livello "immagine principale" in 2,8 tentativi, mentre con le descrizioni in forma libera spesso ne occorrono più di 6. Considerando un costo di 12 crediti per immagine, ciò comporta una differenza di 2 $ e 5 $ per ogni immagine principale.
Vuoi affidare il flusso di lavoro relativo ai prompt strutturati a un collega? Fagli prima dare un'occhiata alla guida introduttiva, poi torna a leggere questo articolo.
Domande frequenti
Qual è l'elemento più importante nelle istruzioni per GPT Image 2?
Luce e obiettivo: l'ordine è proprio questo. Se il soggetto e la scena sono un po' sfocati, si può ancora rimediare, ma se la direzione della luce e la scelta dell'obiettivo sono vaghe, il risultato sembrerà sempre un'immagine d'archivio. Se hai tempo per perfezionare solo due aspetti, concentrati su questi. Specifica chiaramente "da quale direzione proviene la luce, quanto è intensa e su quale lato cadono le ombre", poi indica "quali sono le lunghezze focali, l'apertura del diaframma e la distanza di messa a fuoco": in questo modo, le basi di un'immagine saranno solide.
Quanto deve essere lunga una prompt per GPT Image 2?
Per i ritratti e le scene semplici, la lunghezza ideale è di 80–150 parole. Per le immagini grandangolari dal sapore cinematografico, con riferimenti a epoche e stili specifici, 150–250 parole. Per scene con più personaggi o brief pubblicitari, utilizzare modelli strutturati da 400–800 parole. Il limite massimo di 20.000 caratteri è riservato a casi eccezionali: nell'uso quotidiano raramente si superano le 500 parole.
È possibile inserire il nome di un artista reale nel prompt?
Puoi fare riferimento a uno stile o a un'epoca — come "film noir", "giallo degli anni '70" o "stile pittorico dello Studio Ghibli" — e il modello riconoscerà questi linguaggi visivi. Tuttavia, l'uso diretto dei nomi di artisti viventi come etichette stilistiche è eticamente discutibile e viene sempre più spesso filtrato dai modelli. È preferibile descrivere lo stile, il mezzo espressivo e l'epoca, piuttosto che citare nomi specifici.
Perché i risultati non sono mai gli stessi quando si utilizza la stessa parola chiave?
I modelli di diffusione sono intrinsecamente casuali: partono da un'immagine rumorosa e la trasformano in un'immagine pulita. Se si esegue due volte lo stesso prompt, si otterranno inevitabilmente risultati simili ma non identici. Questa è una caratteristica intrinseca, non un bug, ed è anche la fonte della "diversità". Per riprodurre i risultati, la maggior parte dei sistemi di generazione supporta il parametro seed. Per il contesto tecnico, si veda il blog di OpenAI sulla generazione di immagini .
La lunghezza delle parole chiave influisce sul prezzo?
Non influisce. GPT Image 2 utilizza un sistema di tariffazione forfettario: 12 crediti per immagine, indipendentemente dal fatto che si scrivano 20 o 2.000 parole. L'unico fattore che incide sul costo è il numero di immagini generate.
Quante volte bisogna provare un'idea prima di abbandonarla?
Regola empirica: prova lo stesso prompt per 3 volte per valutare la variazione naturale; se non funziona, modifica solo una posizione, senza ricominciare da capo. Il più delle volte basta correggere l'illuminazione o l'angolazione. Se dopo 8 tentativi non si vedono progressi, il problema è nella struttura: torna alla formula degli otto slot e controlla quanti ne hai effettivamente riempiti. Abbiamo anche un'altra abitudine interna: annotare in un foglio di calcolo ogni prompt generato e il seme corrispondente; in questo modo, durante l'analisi è facile capire quale parola ha funzionato davvero.
Le immagini generate da GPT Image 2 possono essere utilizzate a fini commerciali?
Certo. In base alle condizioni standard del prodotto, le immagini da te generate sono di tua proprietà e possono essere utilizzate a fini commerciali. Per i termini specifici della licenza, fai riferimento al piè di pagina del sito; in caso di contesti ad alto rischio (pubblicità di marchi, copertine di pubblicazioni, ecc.), ti consigliamo di consultare un legale. Inoltre, non considerare le persone reali o i marchi citati nelle parole chiave come una sorta di "scudo" contro le responsabilità: si tratta di questioni relative al diritto all'immagine e al diritto dei marchi, che non rientrano nelle condizioni d'uso del prodotto AI.
Qual è la differenza tra i prompt "text-to-image" e "image-to-image"?
text-to-image parte dal rumore, e il prompt è l'unica guida. image-to-image parte dall'immagine di riferimento che hai caricato, e il prompt serve solo a modificarla. I prompt per image-to-image dovrebbero essere più brevi e concentrarsi su "cosa modificare" ("trasformala in uno stile pittorico, mantenendo invariate la posa e l'abbigliamento del soggetto"), piuttosto che descrivere nuovamente l'intera scena: l'immagine di riferimento fornisce già la maggior parte degli elementi.
Siete pronti a iniziare?
Ora hai a disposizione oltre 50 prompt, una serie di formule a otto slot, una lista di correzioni per i casi di fallimento e un modello strutturato per prompt lunghi. Il passo successivo è aprire lo strumento e provare a generare un'immagine. Scegline uno a caso, incollalo e verifica quanto l'output si discosti dall'immagine che hai in mente; poi correggi solo lo slot che non ha funzionato e riprova. Nel giro di due o tre tentativi, sarai in grado di produrre in modo costante immagini "pronte per la consegna".
Aggiungi questo articolo ai segnalibri del browser oppure appendi la formula degli otto elementi sul bordo del tuo secondo schermo. Il vero miglioramento non sta nel memorizzare questi termini chiave, ma nel trasformare la formula in memoria muscolare: in questo modo, ogni volta che vedrai un'immagine di riferimento, ne individuerai spontaneamente il soggetto, la luce, l'inquadratura e lo stile.
Inizia a usare GPT Image 2 gratuitamente →
Continua a leggere:
- Cos'è GPT Image 2? Presentazione completa e prima esperienza
- Tutorial su GPT Image 2: guida passo passo
- GPT Image 2 vs Sora: confronto onesto
- GPT Image 2 vs Kling: quale scegliere?
Hai domande su una determinata parola chiave? Lasciaci un messaggio sul sito: leggeremo ogni singolo commento e le domande più frequenti verranno spesso inserite nella prossima versione della guida. Per approfondire il contesto teorico, ti consigliamo di leggere anche la voce di Wikipedia sui modelli di generazione di immagini da testo; ci vorranno circa 10 minuti. Se vuoi migliorare ulteriormente, il passo successivo è consultare il tutorial della stessa serie, per passare da "generare una bella immagine" a "produrre in modo stabile una serie di immagini con uno stile uniforme".

