TL;DR
En god GPT Image 2-prompt er ikke bare en setning, men en rekke valg: motiv, scene, stil, vinkel, belysning og stemning. Denne veiledningen gir deg over 50 promptmaler du kan kopiere direkte, som dekker fem hovedkategorier: filmisk stil, portrett, action, natur og fantasy. Den inneholder også en sjekkliste for å rette opp mislykkede resultater og en effektiv arbeidsflyt for iterasjon. Alle eksemplene i artikkelen er laget med den samme KIE-modellen gpt-image-2-text-to-image, med 12 kreditter per bilde og en maksimal lengde på 20 000 tegn for prompter. Prøv GPT Image 2 gratis →
Hvordan en god prompt er bygget opp
De fleste begynner med å skrive «hva jeg vil ha». Men de som virkelig lager gode bilder, skriver «hva kameraet ser». Det er hele hemmeligheten.
Etter å ha kjørt flere tusen tester på KIE-grensesnittet gpt-image-2-text-to-image, har vi utviklet en formel med åtte plasser som dekker nesten alle scenarier. Hvis man fyller ut seks av de åtte plassene, ligger resultatet allerede over gjennomsnittet, og fyller man alle, oppnår man et resultat på nivå med kommersielle filmer.
Formel:
[Motiv] + [Handling/positur] + [Scene] + [Stil/referanse] + [Vinkel/komposisjon] + [Lys] + [Stemning/fargetone] + [Bildekvalitet]
Hver eneste plassering er med på å fastslå et spørsmål som modellen ellers måtte «gjette» seg frem til:
- Hovedmotiv – Hvem eller hva som er i bildet. «Den rødhårede bibliotekar» er ti ganger bedre enn «kvinnen».
- Handling/holdning – Hva personen gjør akkurat nå. Verbet bestemmer komposisjonen.
- Scene – Omgivelsene. Spesifiser land, tidsalder, klokkeslett.
- Stil/referanse – «film noir», «Ufotable-kvalitetsanimasjon», «Wes Andersons symmetriske komposisjon», «Fenty Beauty-reklamestil». Bruk kjent visuelt språk, ikke en haug med meningsløse adjektiver.
- Bildevinkel/komposisjon – « ekstrem nærbilde", "vidvinkel fra lav vinkel", "85 mm portrettlinse, f/1.4", "anamorft bredskjermobjektiv". Dette er nøkkelen til å forvandle et øyeblikksbilde til et filmbilde.
- Lys——"gulltimens kantlys", "enkelt Rembrandt-lys", "neonreflekser på våt bakke". Lyset utgjør 60 % av inntrykket av et bilde.
- Stemning/fargetoner——"Kontrast mellom kaldt blått og varmt oransje", "Varm ravfarge som fordyper skyggene", "Desaturert, melankolsk tone".
- Bildekvalitet——"Hyperrealistisk 4K", "filmkorn", "motefilm". Hold det kort, det tunge arbeidet er allerede gjort.
Grunnleggende vs. optimalisering – to runder med sammenligning av samme emne

Det opprinnelige søkeordet som dette bildet ovenfor tilsvarer, er:
A woman standing in a room.La oss nå omskrive «det samme konseptet» ved hjelp av formelen med åtte plasser:
A breathtaking young woman with flowing auburn hair stands in a luxurious Art Deco penthouse at golden hour. She wears a champagne-colored satin slip dress that catches the warm light. Floor-to-ceiling windows behind her show a panoramic city sunset. Dramatic side lighting creates deep shadows and golden highlights on her face and bare arms. The composition follows the rule of thirds. Cinematic depth of field with gorgeous city bokeh. Fashion editorial quality. Ultra-realistic 4K.Kommentar på kinesisk: I en penthouse-leilighet i art deco-stil står en kvinne med langt hår foran et gulv-til-tak-vindu, mens sidelyset i det gyldne øyeblikket fremhever konturene av ansiktet og armene hennes.

Merk: Den optimaliserte versjonen innebærer ikke at man har lagt til flere adjektiver, men at modellen har færre detaljer å gjette seg til. GPT Image 2 er i bunn og grunn et diffusjonsmodell basert på en transformer (se Wikipedia-forklaring om diffusjonsmodeller). For hver detalj du ikke har skrevet, vil modellen fylle ut med sin «priori-gjennomsnitt». Hvis du ikke nevner «gyldent øyeblikk», vil den som standard gi deg et lys som passer til en overskyet tirsdag ettermiddag klokken to.
Til slutt en liten kuriositet: GPT Image 2 har en øvre grense på 20 000 tegn for promptene – omtrent 3 000 engelske ord. I vanlige situasjoner vil man langt fra trenge å bruke så mange, men for komplekse scener med flere personer eller detaljerte konseptskisser betyr denne grensen at du kan gå svært detaljert til verks når du bestemmer komposisjonen. I kapittel 11 vil vi vise hvordan man bruker lange prompter.
Søkeordbibliotek: Filmaktige scener
Scener med filmisk preg er den kategorien som er lettest å få til, fordi filmhistorien har bygget opp et visuelt vokabular gjennom hundre år. Bare nevn sjanger, epoke og kameravinkel, så kan modellen gi deg et bilde som ser bra ut.

1. Nye, mørke bakgater i Hongkong
Film noir cinematic shot. A dangerously beautiful femme fatale in a curve-hugging red silk dress with a thigh-high slit, walking through a rain-soaked Hong Kong back alley at night. Neon signs in Chinese characters reflect red and blue on the wet cobblestones. She carries a black umbrella over one shoulder, her red-painted lips the only warm color against the cold teal lighting. Smoke wisps from a nearby vent. Anamorphic lens, shallow depth of field, cinematic grain. Ultra-realistic 4K noir film frame.Kommentar på kinesisk: En regnfull natt i en bakgate i Hongkong går en kvinne i rødt med paraply gjennom den neonlysende brosteinsgaten.
2. Jazzbaren Rembrandt
Moody jazz bar interior. A mysterious woman in a sheer black lace dress sits on a velvet barstool, one leg crossed showing stiletto heels. Cigarette smoke curls around her silhouette. Warm amber spotlight from above illuminates her face and exposed collarbones while the rest fades into deep shadow. A saxophone player is a blurred silhouette in the background. Film noir meets modern luxury aesthetic. Dramatic Rembrandt lighting, 35mm film look. Ultra-realistic 4K.Kommentar på kinesisk: Kvinnen i svart blonder i jazzbaren; en enkelt lyskilde kombinert med røyk skaper et dramatisk lys i Rembrandt-stil.
3. Blade Runner-taket
Cyberpunk cinematic wide shot. A lone detective in a wet black trench coat stands on a neon-drenched Tokyo rooftop at 3am. Giant holographic advertisements of a geisha float across the skyline behind him, casting shifting pink and cyan light on his face. Light rain catches the glow. Flying cars streak past as horizontal light trails. Shot on anamorphic lens, 2.39:1 aspect, shallow depth of field. Blade Runner 2049 color grade — teal shadows, orange highlights. Ultra-realistic 4K cinematic frame.Kinesisk kommentar: På et tak i cyberpunk-Tokyo omslutter en blå- og lyserosa fargesammensetning, projisert fra en holografisk geisha-reklame, detektiven.
4. Wes Andersons symmetriske lobby
Wes Anderson style cinematic composition. A 1960s hotel concierge in a burgundy uniform stands dead-center in a pastel-pink Art Deco lobby, flanked by perfectly symmetrical potted palms and brass sconces. Flat front-on framing, everything on center axis. Soft fluorescent overhead lighting. Pastel pink and mint green color palette. 35mm film look. Ultra-detailed 4K.Kommentar på kinesisk: En rosa hotelllobby i art deco-stil, med symmetrisk komposisjon, og resepsjonisten står midt i bildet.
5. Konfrontasjon i kjøkkenet i en koreansk krimfilm
Cinematic still from a modern Korean crime thriller. Two men face each other across a small Seoul apartment kitchen at 2am, both holding knives but frozen in a tense moment. Single fluorescent tube overhead casts hard green-tinted light and harsh shadows. Steam rises from an abandoned pot on the stove. Tight composition, 40mm lens, handheld feel. Bong Joon-ho style. Ultra-realistic 4K.Kommentar på kinesisk: To personer står overfor hverandre i et kjøkken i Seoul klokken to om natten, med et skarpt, grønnaktig lys fra lysrør og håndholdt kamera.

6. Eposet fra Villeneuve-ørkenen
Epic cinematic wide shot in Denis Villeneuve style. A lone hooded figure in flowing desert robes walks across a vast orange sand dune at sunset. The sun is enormous on the horizon, casting elongated shadows. Scale is extreme — the figure is tiny, the landscape overwhelming. Dust kicks up in the wind. Warm amber palette with deep violet shadows. Shot on 65mm, ultra-wide aspect. Ultra-realistic 4K cinematic quality.Kommentar på kinesisk: Et vidvinkelbilde i Villeneuve-stil, der menneskene fremstår som små og landskapet overveldende.
7. Café Nouvelle Vague
Black and white French New Wave cinematic still. A young woman in a striped Breton shirt and dark bob haircut smokes at a Paris cafe table in 1962. She looks off-camera with soft intensity. Natural window light, high contrast, slightly overexposed highlights. Film grain visible. Godard aesthetic. 35mm monochrome, 50mm lens. Ultra-detailed.Kommentar på kinesisk: En kvinne med kort hår i en kafé i Paris i 1962, svart-hvitt i stil med den franske nybølgen.
8. Den italienske giallo-skrekkfilmens historie
Cinematic horror frame in the style of a 1970s Italian giallo. A woman in a white nightgown stands at the end of a long Victorian hallway lit only by flickering red lamplight. Her back is turned. Shadow stretches toward the camera. Wallpaper is blood-red damask. Shallow depth of field, 28mm lens slightly distorted. Grainy film look. Deep red and black color story. Ultra-detailed 4K.Kommentar på kinesisk: Italiensk giallo-stil fra 1970-tallet, ryggen til en kvinne i hvitt ved enden av en blodrød korridor.
9. Neonlys i Miami
1980s Miami Vice cinematic shot. A woman in a white linen blazer drives a red convertible at night through downtown Miami. Palm trees and neon motel signs blur past. She looks at the camera with sunglasses reflecting the pink and turquoise glow of the city. Lens flare, soft film grain. Teal and magenta color grade. Ultra-realistic 4K.Kommentar på kinesisk: Nattbildet av Miami på 80-tallet: en rød kabriolet og solbriller som reflekterer neonlysene.
10. Ghibli-filmer i live-action
Cinematic still styled as a live-action Studio Ghibli adaptation. A young woman in a simple blue linen dress stands in a vast green hillside field, wind blowing her hair and skirt. Fluffy white clouds race overhead. Soft golden hour light. Warm, painterly color grading with gentle film grain. Wide lens, low-angle composition making her heroic against the sky. Ultra-detailed 4K.Kommentar på kinesisk: Et landskapsbilde i Ghibli-stil med virkelige skuespillere, hvor en lav vinkel fra bakken fremhever horisonten.
Søkeordbibliotek: Portretter og sminke
Suksessen til et portrett avhenger av tre ting: objektiv, lysretning og hudtekstur. Hvis du skriver ned «85 mm f/1,4», «ringlys» eller «softbox foran til venstre for kameraet», kan du hoppe rett over tre runder med unødvendige forsøk.

11. Fenty Beauty-nivå makro
Extreme close-up beauty portrait. A stunning model with wet dewy skin and tousled damp hair, bare shoulders glistening. Water droplets on her face and neck catch the light of a ring light. Flawless skin texture in macro detail — every pore, every water droplet razor sharp. Smoky eye makeup with subtle gold shimmer. Lips slightly parted, intense gaze at camera. Dark background. Fenty Beauty campaign aesthetic. 85mm macro lens, f/1.4, ultra-shallow depth of field. Ultra-realistic 4K.Kinesisk kommentar: Nærbilde av sminke på fuktig hud, fremhevet av ringlys, der hver eneste vanndråpe fremstår skarpt.
12. Portrett på barokkbenk
Luxury editorial portrait. A gorgeous model wearing an elegant black velvet off-shoulder gown reclines on a dark velvet chaise longue in a dimly lit Baroque-style room. One arm draped elegantly above her head. Rich warm Rembrandt lighting from a single window highlights the fabric draping against her glowing skin. Oil painting-like quality with deep shadows and warm highlights. High-end fashion editorial photography. 85mm lens, creamy bokeh. Ultra-realistic 4K.Kommentar på kinesisk: Kvinnen i svart kjole på fløyelsbenken; Rembrandts bruk av lys fra ett vindu skaper en malerisk effekt.
13. Ryddig passfoto til forretningsbruk
Professional corporate headshot. A confident woman in her early 30s wearing a tailored navy blazer over a crisp white shirt. Neutral gray seamless studio background. Three-point lighting — soft key from camera left, subtle fill from right, rim light from behind. Genuine warm smile, direct eye contact. 85mm lens, f/2.8. Skin tone natural and healthy. LinkedIn executive headshot quality. Ultra-realistic 4K.Kommentar på kinesisk: Grå bakgrunn + standard trepunktsbelysning, profilbilde av en toppleder på LinkedIn.
14. Portrettfotografering på gaten i Tokyo
Environmental street portrait. A 20-something Tokyo local with bleached blonde hair and oversized vintage streetwear stands in Shibuya on a weekday afternoon. Shallow depth of field with crowd of pedestrians soft-blurred behind her. Natural overcast daylight. She looks slightly off-camera, lost in thought. Shot on Fujifilm X100 aesthetic, 35mm lens, f/2. Ultra-realistic 4K.Kommentar på kinesisk: En ettermiddag på en ukedag i Shibuya, en jente med bleket hår mot en uskarp bakgrunn av folkemengden.
15. Vogue-nivå forsider
High-end fashion portrait in the style of a Vogue Italia cover. A striking model with razor-sharp cheekbones wears an oversized metallic silver couture gown with architectural shoulders. She stares directly into camera with a cold, commanding expression. Hair pulled back tight. Studio lighting is a single hard light from 45 degrees creating sculptural shadows. Gray backdrop. 85mm portrait lens, f/5.6 for crisp detail. Ultra-detailed 4K.Kommentar på kinesisk: Vogue Italia-forside med tekstur, sølvfarget tredimensjonal kjole + skulpturelt portrett med skarpt lys.
16. Portrett i kjøkkenet med naturlig lys
Soft natural light portrait. A woman with wavy chestnut hair sits by a large north-facing window in a quiet morning kitchen. She holds a ceramic mug of coffee in both hands, looking out the window thoughtfully. Warm cream sweater, no makeup, freckles visible. Shot in Rembrandt light with window as the only source. 50mm lens, f/1.8, shallow depth of field. Soft, honest, lived-in feel. Ultra-realistic 4K.Kommentar på kinesisk: En kvinne uten sminke ved kjøkkenvinduet i morgenlyset, kun opplyst av naturlig lys fra det ene vinduet.
17. Enfarget scenebelysning
Dramatic black and white portrait. A man with a short salt-and-pepper beard and intense dark eyes stares into the lens. Only half his face is lit — hard side light from camera right, pure black shadow on the other side. Textured gray background fades to black. Shot on medium format film aesthetic, 80mm lens. Film grain. Peter Lindbergh style monochrome. Ultra-detailed.Kommentar på kinesisk: Et svart-hvitt portrett i Peter Lindberghs stil, med skarpt lys på den ene halvdelen av ansiktet og helt mørkt på den andre.
18. En stor reportasje om rosa sminke
Dreamy pastel beauty portrait. A model with soft pink lips, dewy skin, and flushed cheeks against a blush pink seamless backdrop. She wears a sheer white off-shoulder top. Soft diffused lighting from a large softbox creates flattering even illumination. Hair in loose tousled waves. 85mm lens, f/2. Cotton candy color palette — pink, peach, cream. Ultra-realistic 4K beauty editorial.Kommentar på kinesisk: Rosa bakgrunn + stor softbox, sminkebilder i pastellfarger.
19. Romantikk i solnedgangen
Sun-drenched golden hour portrait. A woman in a flowing cream linen dress stands in a wheat field at 7pm on a summer evening. The sun is low behind her, creating a halo of golden backlight through her hair and the sheer fabric. Lens flare across the frame. Her eyes are closed, face tilted up to the warmth. 135mm telephoto lens, f/2, compressed background. Warm honey color grade. Ultra-realistic 4K.Kommentar på kinesisk: En kornåker i skumringen en sommerdag, motlys + 135 mm teleobjektiv som komprimerer rommet.
20. Biblioteket ved Den mørke akademien
Dark academia editorial portrait. A young woman with auburn hair in a loose braid wears a wool cardigan over a white collared shirt in an old university library. She holds an open leather-bound book, reading by the light of a green banker's lamp. Towering bookshelves around her fade into shadow. Warm tungsten light, deep navy and olive color palette. 50mm lens, f/2.8. Ultra-realistic 4K.Kommentar på kinesisk: Gammelt bibliotek + grønne bankierlamper, «dark academia»-stemning.
Ordliste: Handlinger og bevegelser
Aksjonsscener krever to ting: uttrykk som fanger øyeblikket («frozen mid-air», «high-speed capture») og konturlys, som brukes til å skille motivet fra den urolige bakgrunnen.

21. Nike treningsstillbilde
Dynamic action freeze-frame. An athletic woman in a fitted sports bra and high-waisted compression shorts executes a powerful spinning roundhouse kick. Water splashes frozen in mid-air around her legs and feet in a dramatic spray pattern. Her toned abs and defined muscles visible. Dramatic single-source rim lighting from behind creates a glowing silhouette edge. Dark studio background. Nike Training campaign energy. High-speed photography feel — ultra-sharp subject, motion blur on water droplets. Ultra-realistic 4K.Kinesisk kommentar: Nike-reklame med høyhastighetsfotografering, der vannsprutene er frosset i luften.
22. Innblikk i «Surferen»
Epic wide-angle shot of a female surfer riding inside a massive crystal-clear barrel wave at golden hour. Her silhouette and athletic body visible through the translucent turquoise water of the wave tube. Golden sunlight creates an explosion of light and water mist behind her. Dramatic backlit composition. The wave is enormous and perfectly formed. GoPro-style immersive perspective. Ultra-realistic 4K cinematic quality.Kinesisk kommentar: En kvinnelig surfer i en gigantisk bølge i «Golden Moment», en silhuett mot lyset.
23. Parkour-takhopp
High-speed action shot of a parkour athlete mid-leap between two Brooklyn rooftops at sunset. Frozen at the apex of the jump, arms and legs extended, silhouetted against a burning orange sky. The gap below him is dizzying — city streets far below. Motion blur on the trailing edge of his hoodie. Shot from a drone at his height, 35mm lens. Ultra-realistic 4K cinematic action.Kinesisk kommentar: Parkour på takene i Brooklyn i solnedgangen, med et bilde av det høyeste hoppet.
24. Rampelyset på MMA-ringen
Dramatic fight night action. A female MMA fighter mid-spinning back elbow, sweat flying from her hair in a visible arc of droplets. Single harsh overhead ring spotlight isolates her from pure black background — classic boxing photography look. Her opponent is a blurred silhouette out of focus. 70-200mm lens at 200mm, f/2.8, 1/2000 shutter frozen motion. High contrast, desaturated. Ultra-detailed 4K.Kommentar på kinesisk: Enkelt taklys over MMA-ringen, hvor svetteperlene som spruter opp er tydelig synlige.
25. Støv fra terrengsykler
Low-angle action shot of a motocross rider airborne over a dirt jump, red desert dust exploding behind the rear tire. Late afternoon sun casts long shadows. The bike is tilted aggressively mid-trick. Camera is just above ground level looking up, making the jump look monumental. Anamorphic lens flare from the sun. Orange and teal color grade. Ultra-realistic 4K action.Kommentar på kinesisk: Terrengsykkelen skyter opp i luften, og bakhjulet virvler opp rødt støv.
26. Et hopp i ballettsalen
Contemporary ballet dancer mid-grand jete frozen in the air, arms extended, body perfectly horizontal. She wears a simple nude leotard. Plain gray cyclorama studio background. Strong side-light from camera left creates a sculptural chiaroscuro on her musculature. Powder disturbed from the floor traces her leap in a soft cloud. 1/4000 shutter speed feel. Ultra-detailed 4K.Kommentar på kinesisk: Ved høyeste punkt i ballettens grand jeté er kroppen parallell med gulvet.
27. Dunk i basketball
Low-angle hero shot of a male basketball player mid-slam dunk, one hand gripping the rim, body extended diagonally across the frame. Arena lights streak as lens flares. Crowd is a soft blurred wall of phone flashes behind him. Frozen sweat and net motion. Shot on 24mm wide from directly below the hoop. NBA official photography energy. Ultra-realistic 4K.Kommentar på kinesisk: Et 24 mm vidvinkelbilde tatt rett under kurven, i det øyeblikket en dunk utføres.
28. En galopperende hest som surfer
A rider on a powerful black horse gallops through knee-deep shallow ocean water at sunrise. Water explodes from each hoofstrike, frozen in a dramatic spray. The rider is leaned low, hair streaming behind. Warm golden backlight from the rising sun. Mist rising off the water. Shot at 1/4000 shutter, 200mm telephoto compression. Ultra-realistic 4K equine photography.Kommentar på kinesisk: I det grunne havet ved soloppgang, en svart hest i full fart mens vannet spruter, tatt med 200 mm teleobjektiv som gir en komprimert effekt.
Søkeordbibliotek: Natur og landskap
Nøkkelordene for landskapsbilder er tidspunkt, vær og vertikal skala. Modellen har en svært sterk forhåndsantagelse om «vanlig, vakker natur», og du må bruke konkrete ord for å få den til å avvike fra dette gjennomsnittet.

29. Et eventyrland av tåke ved fossen
Ethereal fantasy nature scene. A graceful young woman in a flowing sheer gossamer dress stands at the edge of a towering waterfall cliff. Dense tropical mist swirls around her legs and the translucent fabric. She extends one arm toward the cascade, water droplets catching golden light. Aerial perspective slightly from above showing the dramatic cliff drop. Lush green ferns frame the composition. Golden hour light filtering through the mist. Ultra-realistic 4K cinematic quality.Kommentar på kinesisk: En kvinne i hvitt slør ved en foss på en klippe, sett fra luften + tåke.
30. Luftfoto av flytende strukturer på Maldivene
Overhead drone shot of a beautiful woman in a minimal white bikini floating on her back in crystal-clear turquoise shallow water over white sand in the Maldives. Her long dark hair fans out in the water like a halo. The water is so clear her full body is visible through the translucent surface. Tiny fish swim nearby. Travel photography editorial style. Ultra-realistic 4K aerial quality.Kommentar på kinesisk: Et luftfoto tatt rett over Maldivene, med en kvinne som flyter i det krystallklare vannet.
31. Islands svarte sandstrand
Dramatic wide landscape of Iceland's Reynisfjara black sand beach at dawn. Massive basalt sea stacks rise from the churning North Atlantic. Low fog drifts across the black sand. A single figure in a red rain jacket walks along the shoreline for scale. Moody desaturated color grade — almost monochrome with just the red jacket as accent. 24mm wide lens, f/11 for deep focus. Ultra-detailed 4K.Kommentar på kinesisk: Den svarte sandstranden på Island + den røde regnjakken som fargeankere.
32. Lyset i Redwood Forest Church
Vertical composition looking up through towering California redwood trees. Shafts of golden morning sunlight cut through the fog between the trunks like cathedral light rays. Ferns carpet the forest floor. A tiny hiker in the distance gives scale. Ultra-wide 14mm lens distorting the trunks into a radial pattern toward the sky. Warm green and gold palette. Ultra-realistic 4K nature photography.Kommentar på kinesisk: 14 mm vidvinkel, oppadrettet bilde av en redwoodskog, lysstråler fra en kirke i tåken.
33. Speilvannet i Patagonia
Perfect mirror reflection of the jagged Torres del Paine peaks in a glass-still Patagonian alpine lake at blue hour. Pink and purple alpenglow on the snow-capped summits. A single orange tent on the near shore as human scale. Complete symmetry — upper and lower half of frame are near-mirror images. 35mm lens, f/11. Ultra-realistic 4K landscape.Kinesisk kommentar: Det perfekte speilblanke vannet i det blå øyeblikket, symmetrisk opp og ned.
34. Sandstormer i Sahara
Vast Sahara desert at the start of a sandstorm. Rolling orange dunes extend to the horizon, with a towering wall of sand approaching from the left. A lone nomadic figure on camelback is silhouetted against the dust cloud. Sun struggles through the haze as a dim orange disc. Cinematic wide-angle, heavy atmospheric haze. Monochromatic warm orange palette. Ultra-detailed 4K.Kinesisk kommentar: I utkanten av en sandstorm i Sahara står silhuetten av en kamelrytter i kontrast til sandveggen.
35. Nordlys-hytta
Wide landscape of a tiny warm-lit wooden cabin in a Norwegian fjord valley at 1am. A spectacular green and purple aurora borealis dances overhead, reflecting in the still black fjord water. Snow-dusted pine trees and mountains frame the scene. The cabin glow is the only warm color in an otherwise cold composition. 20-second long exposure feel. Ultra-realistic 4K astrophotography.Kinesisk kommentar: Nordlys klokken ett om natten i en norsk fjord og en koselig hytte.
36. Solnedgang på den afrikanske savannen
Cinematic wide shot of a family of elephants crossing a golden savanna at sunset in Kenya. The sun is a huge orange disc on the horizon, silhouetting the herd. Long grass ripples in the warm wind. Dust kicked up by the herd diffuses the backlight into warm beams. 200mm telephoto compression. National Geographic editorial style. Ultra-realistic 4K wildlife photography.Kommentar på kinesisk: Solnedgang på savannen i Kenya, silhuetter av elefantflokken + komprimering med 200 mm teleobjektiv.
37. Sakura-elven i Kyoto
Serene wide landscape of the Philosopher's Path in Kyoto at peak cherry blossom season. Pink petals float on the narrow canal, with more drifting down from the trees above. Traditional wooden bridges arch over the water. Early morning mist softens the light into diffused pink. A solo figure in a dark kimono walks along the stone path for scale. 50mm lens, f/4, gentle pastel color grade. Ultra-realistic 4K.Kommentar på kinesisk: I blomstringssesongen på Filosofens vei i Kyoto flyter rosa blomsterblader på overflaten av kanalen.
38. Stormlys i det skotske høylandet
Dramatic landscape of the Scottish Highlands during a clearing thunderstorm. Dark churning clouds above a lone glen, with a single shaft of golden sunlight breaking through and lighting one patch of heather-covered hillside. Rainbow arc barely visible at the edge. Ancient standing stones in the foreground. Moody cinematic color grade — steel blue shadows, warm sunlit highlight. 24mm wide, f/11. Ultra-realistic 4K landscape photography.Kinesisk kommentar: Da tordenværet over det skotske høylandet var i ferd med å gi seg, trengte et eneste gyldent solstråle seg gjennom de mørke skyene.
Stikkordbibliotek: Fantasi og stiliserte motiver
Så snart du nevner en konkret kunstnerisk referanse innen fantasy-sjangeren (Ufotable, Arcane, Studio Trigger, illustrasjoner fra Magic: The Gathering), blir søkeordene mye mer presise. Et generelt søkeord som «fantasy art» vil bare gi deg generelle fantasy-bilder.

39. Ufotable: Anime-krigerprinsessen
Epic anime-inspired fantasy warrior princess with flowing silver-white hair that reaches her waist, wearing ornate golden battle armor that hugs her figure with intricate engravings. She holds a glowing magical sword aloft, emitting bright blue energy. Cherry blossom petals and magical sparkles swirl in a violent storm around her. Her expression is fierce and determined. Dynamic action pose mid-battle leap. Ultra-detailed anime with CGI-quality lighting — Ufotable production quality. Rich colors, dramatic volumetric lighting. 4K quality.Kinesisk kommentar: En anime-krigerprinsesse i Ufotable-stil, med et blått magisk sverd og en storm av kirsebærblomster.
40. Mørkealv-magi
Dark fantasy dark elf sorceress with long flowing midnight-purple hair, pointed ears, and luminous violet eyes. She wears an elegant off-shoulder dark robe with intricate silver embroidery that reveals her collarbones and shoulders. Purple arcane energy spirals from her outstretched hands, illuminating her face from below. A vast star field and nebula visible in the background through a shattered stone archway. Semi-realistic fantasy illustration style with cinematic lighting. Ultra-detailed 4K.Kinesisk kommentar: En mørk alv-magi, med lilla arkan energi som virvler ut fra hendene hennes.
41. Ghibli-skogalven
Studio Ghibli style painterly scene. A small forest spirit that looks like a glowing white fox with three tails walks through a mossy enchanted forest at dusk. Fireflies dance around it. Soft painterly brushstrokes, warm honey-gold light filtering through massive ancient trees. Hayao Miyazaki watercolor aesthetic. Ultra-detailed animation cel quality.Kommentar på kinesisk: En hvit trehalet rev i Ghibli-stil vandrer gjennom en mosekledd skog i skumringen.
42. Arcane: The Battle of the Twin Cities
Arcane Netflix animated series style illustration. A young woman with blue-tipped braided hair and steampunk goggles leans against a graffitied alley wall in the undercity of Piltover. Neon magical rune-signs glow behind her. Textured painterly brushstrokes visible, 2D illustration with 3D depth, saturated purple and teal color story. Fortiche animation studio aesthetic. Ultra-detailed 4K.Kinesisk kommentar: Jente i smugene i nedre bydel i Arcane Fortiche-stil.
43. Magic: The Gathering-dragen
Fantasy illustration in the style of a Magic The Gathering card. A colossal red dragon emerges from molten lava in an underground cavern, wings half-spread, mouth roaring with fire breath forming. A tiny knight in silver armor stands at the cavern's edge for scale, raising a shield. Dramatic low-angle hero composition. Rich oil-painting texture, Greg Rutkowski influence. Ultra-detailed 4K fantasy art.Kommentar på kinesisk: En lava-rød drage og en liten ridder i Magic: The Gathering-illustrasjonsstil.
44. Cyber Knight
Cyberpunk fantasy fusion. A female samurai with a chrome katana stands on the rain-slicked rooftop of a neo-Tokyo megacorp tower at night. She wears a fusion of traditional kimono and carbon-fiber combat armor. Holographic cherry blossoms drift around her. Neon reflections on the wet rooftop, flying ad-drones in the background. Illustrated in the style of Katsuhiro Otomo meets modern 3D concept art. Ultra-detailed 4K.Kinesisk kommentar: En kvinnelig samurai på taket i Cyber-Tokyo + holografiske kirsebærblomster.
45. Havets havfrue
Ethereal underwater fantasy. A graceful mermaid with iridescent teal and violet scales swims through a coral reef illuminated by shafts of sunlight piercing the water surface above. Her long turquoise hair flows weightlessly. Bubbles trail from her fingertips. School of small silver fish swim past. Dreamlike painterly quality, Lisa Frank meets National Geographic. Ultra-detailed 4K fantasy art.Kinesisk kommentar: En regnbuefarget havfrue i korallrev, med lysstråler som trenger ned gjennom vannoverflaten.
46. Kaptein på et steampunk-luftskip
Illustrated steampunk fantasy portrait. A young female airship captain in a brass-buttoned red military coat, goggles pushed up on her forehead, stands at the wheel of a wooden airship. Visible brass gears and copper pipes. Behind her, clouds and other distant airships. Warm golden hour lighting. Illustration style inspired by Nausicaa and Howl's Moving Castle. Ultra-detailed 4K.Kommentar på kinesisk: En kvinnelig luftskipskaptein i Hayao Miyazaki-stil og messinghjul.
Iterasjoner i flere stiler: Samme motiv, forskjellige verdener
En undervurdert arbeidsflyt i GPT Image 2: Lås motivet, og endre bare stilparametrene. Du vil tydelig se hva hver stil gjør med det samme ansiktet, de samme klærne og den samme holdningen – neste gang du velger stil, trenger du ikke lenger å gjette.

Grunnleggende prompt – hovedteksten forblir helt identisk i alle fire genereringene:
A beautiful young woman with shoulder-length brown hair stands in a sunlit garden, wearing a simple white sundress, one hand lightly touching a rose bush. Soft golden afternoon light. Three-quarter body framing, slightly tilted head, warm smile.Kommentar på kinesisk: En kvinne i en enkel kjole som berører en rose i Solens hage, i det gyldne ettermiddagslyset.
Deretter bytter du bare stilspor, og kjører hvert spor én gang:
47. Realistisk fotografering
[Base] — Hyperreal fashion photography aesthetic. 85mm lens at f/1.8, soft natural light, editorial sharpness. Ultra-realistic 4K.48. Japansk anime
[Base] — Japanese anime style with cel shading, bold line art, vibrant saturated colors, large expressive eyes. Kyoto Animation production quality. Ultra-detailed.49. Klassisk oljemaleri
[Base] — Classical oil painting style with visible thick brushstrokes, warm Renaissance lighting, chiaroscuro shadow, Vermeer-like color palette. Museum-quality.50. Cyberpunk
[Base] — Neon-drenched cyberpunk futurism. Holographic overlays, circuit-pattern light tattoos on skin, magenta and cyan rim lighting. Ghost in the Shell art direction. Ultra-detailed.Vi kjørte denne sekvensen på vår interne testkonto. Det første bildet tok omtrent 18 sekunder, og stilskiftene for de påfølgende bildene tok omtrent like lang tid. Totalt tok det under to minutter og 48 kreditter å få et komplett stil-moodboard. Når vi legger dette i et kundeforslag, tilsvarer det å komprimere en halv dags søk etter materiale til tiden det tar å drikke en kopp kaffe.
Vanlige feiltilfeller og løsninger
Ærlighetens kapittel: GPT Image 2 er veldig nyttig, men det er ikke magi. Nedenfor finner du de vanligste feilene vi har registrert, samt maler for hvordan du kan løse dem. Bruk dette kapittelet som en feilsøkingsliste – når bildet ikke blir som forventet neste gang, kan du sjekke punktene i rekkefølge; de fleste problemene løses etter den første justeringen.
Feil 1: Kjedelig uttrykk
Before:
A beautiful woman in a city.After:
A 28-year-old woman with auburn hair pulled into a low ponytail, wearing a camel trench coat, crossing a Manhattan crosswalk at 6pm on a rainy Thursday. Yellow taxis blur past in motion-blurred streaks. 50mm lens, f/2, cinematic grain. Ultra-realistic 4K.Det første nøkkelordet ga ikke modellen noe å gå på. Løsningen er alltid konkrete substantiver og konkrete steder.
Feil 2: Feil antall fingre
GPT Image 2 er allerede langt bedre enn den første generasjonen av diffusjonsmodeller når det gjelder gjengivelse av hender, men nærbilder av hender kan fortsatt gi uheldige resultater. Det finnes to pålitelige måter å unngå dette på:
- Ikke la hendene være hovedmotivet, kutt dem rett ut: «framing is shoulders up only» (fotografer kun fra skuldrene og oppover).
- La hendene holde noe: «hands gently holding a ceramic coffee cup». Når en gjenstand bestemmer holdningen, blir antall fingre naturlig.
Feil 3: Teksten i bildet vises som tegnkode
Modellen er ikke et layoutprogram. Hvis du vil ha lesbar tekst i bildet, for eksempel logoer, skilt eller plakater, må den enten være svært kort («a sign reads OPEN»), eller så må du legge til en setning i beskrivelsen: «ingen tekst, ingen bokstaver, ingen ord noe sted i bildet», og deretter lage layouten separat i Figma/Photoshop.
Feil 4: Lysretningen blir oversett
Before:
A portrait of a woman with dramatic lighting.After:
A portrait of a woman lit by a single hard spotlight from 45 degrees camera-left, with deep black shadow filling the right side of her face. Rembrandt lighting with a small triangle of light on the shadowed cheek.«Dramatisk belysning» sier ingenting. Det er først når man angir retning, lysstyrke og skyggenes utbredelse at man får et reelt hint.
Feil 5: Hovedpersonen befinner seg i feil scene
Hvis modellen stadig plasserer personen i et vanlig fotostudio i stedet for et bibliotek – flytt scenen helt frem i beskrivelsen og gjør den mer konkret:
In a candle-lit 17th-century English library with floor-to-ceiling oak shelves, leather-bound books, and a stone fireplace, a woman in…Å plassere scenen foran motivet er det samme som å fastlegge hele komposisjonen før man introduserer personen.
Feil 6: Overbelastning av nøkkelord
Når antallet ord overstiger rundt 1 200, begynner virkningen av hvert enkelt adjektiv å bli utvannet. Hvis beskrivelsen din består av en lang liste med 40 stilkoder, vil modellen «ta gjennomsnittet». Den beholder én hovedstil som referansepunkt (for eksempel «film noir»), mens de andre behandles som underordnede.
Bruk opp 20 000 tegn: Strukturert lang prompt
En undervurdert fordel ved GPT Image 2 er en maksimal lengde på 20 000 tegn for promptene. De fleste konkurrerende produktene har en begrensning på rundt 1 000–2 000 tegn. Dette er ikke nødvendig for portrettbilder, men for komplekse scener med flere personer, briefs for konseptskisser eller bildeserier med sterk merkevarekonsistens er det svært verdifullt å kunne bruke lange, strukturerte prompt.
En mal vi ofte bruker i produksjonsbriefene:
# SCENE
[Scene: sted, tidspunkt, vær, historisk periode, 2–3 setninger]
# KARAKTERER
- Karakter A: [Utseende, klær, nåværende holdning, ansiktsuttrykk]
- Karakter B: [Det samme]
- Statister i bakgrunnen: [Kort beskrivelse]
# KOMPOSISJON
[Komposisjon: vidvinkel/mellombilde/nærbilde; kameravinkel; optisk brennvidde; dybdeskarphet; hver figurs plassering i bildet — tredeling/gyldne snitt/senter]
# BELYSNING
[Lyskilde, retning, hardhet, fargetemperatur, skyggelegging]
# COLOR
[Beskriv fargepaletten med 3–4 fargetermer. Fargevalg — varm/kald/kontrastfarger]
# STYLE
[En referanse til en hovedstil. For eksempel «Roger Deakins’ fotograferingsstil i *Blade Runner 2049*»]
# TEKNISK
[Oppløsningsbeskrivelse, filmkorn, bildeformat, bildekvalitetsmerke. Hold det kortfattet]
# UNNTAK
[Ting som må unngås: «Ingen tekst, ingen logoer, ingen vannmerker, ingen ekstra lemmer»]Eksempel – fullstendig strukturert beskrivelse (ca. 500 ord) for et hovedbilde i en annonse:
# SCENE
A restored 1930s Art Deco ballroom on a rainy Tuesday evening in Paris, set during a private jazz performance. Tall arched windows on the left show wet boulevards and soft yellow streetlamp glow. Interior is lit warm and amber.
# CHARACTERS
- Lead: A striking 32-year-old woman with dark auburn hair in a low chignon, wearing a deep emerald-green silk bias-cut gown with a low back. She stands near a grand piano, one hand resting on its polished black lid, gazing thoughtfully toward the windows. Faint melancholy in her expression.
- Pianist: A middle-aged man in a black tuxedo, seated at the piano mid-performance, profile view, fingers on keys. He is a secondary figure — should not pull focus from the lead.
- Background: Three or four well-dressed patrons at candlelit round tables in soft bokeh, unidentifiable faces.
# COMPOSITION
Medium-wide shot. Lead character is on the right third of the frame, piano extending diagonally across the center toward the left. Rule of thirds. 50mm lens, f/2.2, shallow depth of field — lead and piano sharp, background patrons and windows softly blurred. Eye-level camera height.
# LIGHTING
Warm tungsten chandelier overhead providing ambient glow on the room. Key light on the lead is a single practical wall sconce camera-right at 45 degrees, modeling her face in gentle Rembrandt pattern. Rim from the windows behind her (cool blue rainy light) separates her hair and shoulder edge from the warm interior. Overall contrast: high but soft.
# COLOR
Deep emerald green (dress) and warm amber (interior) as hero colors, with cool blue window light as counter-accent. Warm gold dominant, with selective teal shadow detail. Film-look color grade reminiscent of early Wong Kar-wai.
# STYLE
Cinematic still in the visual language of In the Mood for Love meets a modern luxury cognac commercial. Anamorphic lens quality (slight horizontal flare on the candles). Painterly softness, 35mm film grain.
# TECHNICAL
Ultra-realistic 4K, 16:9 aspect, cinematic frame.
# EXCLUSIONS
No text, no signage, no logos, no watermarks, no visible phones or modern electronics, no extra limbs, no warped fingers on the pianist.En oppdeling i seksjoner har to fordeler: For det første sikrer det at du selv ikke glemmer å fylle ut noen av feltene, og for det andre gir det modellen et strukturert utgangspunkt for analyse, i stedet for en sammenhengende tekst på 500 ord. Ved å endre bare de to seksjonene CHARACTERS og SCENE kan man i hele serien generere forskjellige klipp av den samme reklamen i ett omgang.
Et praktisk tips: Når et bilde er 80 % riktig, men ett element ikke stemmer (for eksempel at hovedpersonen har feil farge på klærne), må du ikke skrive om hele beskrivelsen. Kopier den vellykkede beskrivelsen, endre bare det aktuelle elementet, og kjør den på nytt. Våre interne logger viser at strukturerte beskrivelser i gjennomsnitt gir et bilde på hovedbildenivå etter 2,8 forsøk, mens frie beskrivelser ofte krever mer enn 6 forsøk. Med en pris på 12 kreditter per bilde utgjør dette en forskjell på 2 og 5 dollar per hovedbilde.
Vil du overlate arbeidsflyten for strukturerte nøkkelord til en kollega? La dem først lese introduksjonsveiledningen, og kom tilbake til denne artikkelen etterpå.
Vanlige spørsmål
Hva er det viktigste i GPT Image 2-promptene?
Lys og objektiv – det er denne rekkefølgen som gjelder. Selv om motivet og scenen kan reddes hvis de er litt uskarpe, vil bildet alltid se ut som et arkivbilde hvis lysretningen og valg av objektiv er uklare. Hvis du bare har tid til å finjustere to elementer, bør du fokusere på disse to. Angi tydelig «hvilken retning lyset kommer fra, hvor skarpt det er og på hvilken side skyggene faller», og angi deretter «hvilket objektiv (i millimeter), hvilken blenderåpning og hvor nær eller langt unna». Da har du lagt et solid grunnlag for bildet.
Hvor lang bør en GPT Image 2-prompt være?
For portretter og enkle scener er 80–150 ord det optimale. For filmaktige vidvinkelbilder med referanser til tidsepoker og stilarter, 150–250 ord. For scener med flere personer eller reklameoppdrag, bruk strukturerte maler på 400–800 ord. Grensen på 20 000 tegn er forbeholdt ekstreme tilfeller – i daglig bruk vil man sjelden komme over 500 ord.
Kan man skrive navnet på en ekte kunstner i prompten?
Du kan henvise til en stil eller epoke – «film noir», «1970-tallets giallo», «Studio Ghiblis maleriske stil» – og modellen vil gjenkjenne disse visuelle språkene. Men å bruke navnene på levende kunstnere direkte som stilmerker er etisk tvilsomt, og blir i stadig større grad filtrert bort av modellene. Det er bedre å beskrive stil, medium og epoke, i stedet for å nevne enkeltpersoner ved navn.
Hvorfor gir det samme søkeordet forskjellige resultater hver gang?
Diffusjonsmodeller er i sin natur tilfeldige – de starter med et støyfylt bilde og fjerner støyen for å generere et nytt bilde. Hvis man kjører den samme prompten to ganger, vil man uunngåelig få resultater som er like, men likevel forskjellige. Dette er en egenskap, ikke en feil, og det er også kilden til «mangfold». For å gjenskape resultatene støtter de fleste genereringssystemer en seed-parameter. For teknisk bakgrunnsinformasjon kan du se OpenAI sin blogg om bildegenerering.
Har lengden på søkeordet innvirkning på prisen?
Det har ingen betydning. GPT Image 2 bruker en flat prisstruktur: 12 kreditter per bilde, uansett om du skriver 20 ord eller 2 000 ord. Det eneste som påvirker kostnaden, er antall bilder du genererer.
Hvor mange ganger bør man prøve et konsept før man gir opp?
Tommelfingerregel: Prøv det samme nøkkelordet tre ganger for å se på naturlig variasjon. Hvis det fortsatt ikke stemmer, endrer du bare én parameter – ikke start helt på nytt. Det meste av tiden er det lyset eller kameravinkelen som må justeres. Hvis du har prøvd 8 ganger uten fremgang, er det noe galt med strukturen – gå tilbake til åtte-posisjonsformelen og sjekk hvor mange du faktisk har fylt ut. Vi har også en intern vane: å notere hvert genererte nøkkelord og tilhørende seed i en tabell, slik at det er lett å se hvilke ord som virkelig fungerer når vi gjennomgår resultatet.
Kan bilder generert av GPT Image 2 brukes til kommersielle formål?
Ja, det går bra. I henhold til produktets standardvilkår eier du bildene du genererer, og de kan brukes til kommersielle formål. De konkrete lisensvilkårene finner du i bunnteksten på nettstedet. Ved bruk i situasjoner med høy risiko (for eksempel merkevareannonser eller omslag til publikasjoner) anbefaler vi at du rådfører deg med en advokat. Videre bør du ikke anse de virkelige personene eller varemerkene som nevnes i promptene som en «fripass» – dette er spørsmål om portrettrettigheter og varemerkerettigheter, som ikke omfattes av vilkårene for AI-produkter.
Hva er forskjellen mellom promptene for «text-to-image» og «image-to-image»?
text-to-image starter med støy, og prompten er den eneste veiledningen. image-to-image starter med referansebildet du har lastet opp, og prompten brukes bare til å endre det. Prompten for image-to-image bør være kortere og fokusere på «hva som skal endres» («endre til oljemaleri-stil, men behold motivets positur og klær»), i stedet for å beskrive hele scenen på nytt – referansebildet gir allerede de fleste detaljene.
Er du klar til å sette i gang?
Du har nå over 50 prompt-eksempler, en formel med åtte parametere, en sjekkliste for å rette opp feil, samt en strukturert mal for lange prompt-er. Neste trinn er å åpne verktøyet og faktisk kjøre en. Velg en tilfeldig, lim den inn, og se hvor mye resultatet avviker fra det du har i tankene – og rett deretter bare den parameteren som har gått galt, før du kjører den igjen. Innen to eller tre runder vil du kunne produsere bilder som er «klare til levering» på en stabil måte.
Legg denne artikkelen til i nettleserens bokmerker, eller heng formelen for de åtte komponentene ved siden av din andre skjerm. Den virkelige forbedringen ligger ikke i å huske disse stikkordene, men i å gjøre formelen til en del av muskelminnet – slik at du naturlig vil bryte ned ethvert referansebilde i hovedmotiv, belysning, vinkel og stil når du ser det.
Les videre:
- Hva er GPT Image 2? Fullstendig introduksjon og første innføring
- Veiledning i bruk av GPT Image 2: trinnvis innføring
- GPT Image 2 vs Sora: ærlig sammenligning
- GPT Image 2 vs Kling: hvilken skal du velge?
Har du spørsmål om et bestemt nøkkelord? Legg igjen en melding til oss på siden – vi leser alle innleggene, og de mest stilte spørsmålene vil ofte bli tatt med i neste utgave av veiledningen. Du kan lese om den teoretiske bakgrunnen sammen med Wikipedia-artikkelen om tekst-til-bilde-modeller; det tar omtrent 10 minutter. Hvis du ønsker å forbedre deg ytterligere, kan du gå videre til brukerveiledningen i samme serie, og oppgradere arbeidsflyten fra «å generere et godt bilde» til «å produsere en serie bilder med enhetlig stil på en stabil måte».

