GPT Image 2 prompt-útmutató: Több mint 50 gyakorlati sablon (2026)

Apr 22, 2026

TL;DR

Egy jól használható GPT Image 2 prompt nem csupán egy mondat, hanem egy sor döntés: a főszereplő, a helyszín, a stílus, a kameraállás, a megvilágítás és a hangulat. Ez az útmutató több mint 50 közvetlenül másolható prompt-sablont kínál, amelyek öt fő kategóriát fednek le: filmszerű, portré, akció, természet és fantasy. Emellett tartalmaz egy listát a sikertelen eredmények kijavításához, valamint egy hatékony iterációs munkafolyamatot is. A cikkben szereplő összes példakép ugyanazt a KIE gpt-image-2-text-to-image modellt használja, mindegyik 12 kreditbe kerül, a prompt maximális hossza 20 000 karakter. Próbáld ki ingyen a GPT Image 2-t →


Egy jó prompt felépítése

A legtöbb ember rögtön azzal kezdi, hogy leírja, „mit akarok”. Azok viszont, akik igazán jó képeket készítenek, azt írják le, „mit lát a lencse”. Ez az egész titka.

Miután több ezer tesztet futtattunk a KIE gpt-image-2-text-to-image interfészen, kidolgoztunk egy nyolc mezős képletet, amely szinte minden esetet lefed. Ha a nyolc mezőből hatot töltünk ki, az már az átlag felett van, ha pedig mindet kitöltjük, akkor elérhetjük a professzionális filmek színvonalát.

Képlet:

[Alany] + [Mozgás/Póz] + [Helyszín] + [Stílus/Referencia] + [Képkivágás/Kompozíció] + [Fény] + [Hangulat/Tónus] + [Képminőség-javítás]

Minden egyes hely egy olyan kérdést rögzít a modell számára, amelyet egyébként „meg kellene találnia”:

  • Főszereplő – Ki vagy mi látható a képen. A „vörös hajú könyvtáros” tízszer jobb, mint a „nő”.
  • Mozgás/testtartás – Mit csinál éppen. Az ige határozza meg a kompozíciót.
  • Helyszín – A környező világ. Adja meg az országot, a korszakot, az időpontot.
  • Stílus/referencia – „film noir”, „Ufotable-szintű animáció”, „Wes Anderson szimmetrikus kompozíciója”, „Fenty Beauty reklámstílus”. Hívjon segítségül ismert vizuális nyelvet, ne pedig értelmetlen melléknevek halmazát.
  • Felvétel/kompozíció – „ „szélsőséges közeli”, „alacsony szögű széles látószög”, „85 mm-es portréobjektív, f/1.4”, „anamorphikus szélesvásznú objektív”. Ez a kulcs ahhoz, hogy a pillanatfelvételekből filmkockák legyenek.
  • Fény——„aranyóra szélfény”, „egyszeri Rembrandt-fény”, „nedves talajon tükröződő neonfény”. A fény határozza meg a kép 60%-át.
  • Hangulat/színvilág——„hideg kék és meleg narancs ütközése”, „meleg borostyán árnyékok elmélyítése”, „telítettségét vesztett melankolikus hangulat”.
  • Képminőség-módosítás——„Szuperreális 4K”, „Filmgörbék”, „Divatos magazinfotó”. Legyen rövid, az előző részben már elvégeztük a nehezebb munkát.

Alapok vs. optimalizálás – két kör összehasonlítása ugyanazon témában

A GPT Image 2 alapvető promptjával generált eredmény: a kompozíció unalmas, a megvilágítás egyenletes
Alapvető leírás: „Egy nő áll egy szobában.” A fő motívum elmosódott, a megvilágítás unalmas, nincs kompozíció – a modellnek egyáltalán nincs miből kiindulnia.

A fenti képhez tartozó eredeti leírás:

A woman standing in a room.

Most írjuk át a „azonos fogalom” fogalmát a nyolc helyes képlet segítségével:

A breathtaking young woman with flowing auburn hair stands in a luxurious Art Deco penthouse at golden hour. She wears a champagne-colored satin slip dress that catches the warm light. Floor-to-ceiling windows behind her show a panoramic city sunset. Dramatic side lighting creates deep shadows and golden highlights on her face and bare arms. The composition follows the rule of thirds. Cinematic depth of field with gorgeous city bokeh. Fashion editorial quality. Ultra-realistic 4K.

Kínai magyarázat: Egy art deco stílusú penthouse-lakásban egy hosszú hajú nő áll a padlótól a mennyezetig érő ablak előtt; a naplemente oldalról érkező fénye kiemeli arcának és karjainak kontúrjait.

A teljes nyolc-slot képlet segítségével optimalizált GPT Image 2 prompt képalkotási eredménye
A nyolc helyre szóló képlet optimalizálása után kapott kulcsszavak. Ugyanaz a fő koncepció, de minden homályos pontot pontosan meghatároztak.

Megjegyzés: Az optimalizált változat nem egyszerűen több melléknévvel van tele, hanem kevesebb rész marad a modellre, hogy kitalálja. A GPT Image 2 alapját egy transzformátor által vezérelt diffúziós modell képezi (lásd a diffúziós modellekről szóló Wikipedia-cikk), és minden olyan részletet, amit nem írtál le, a modell a „priori átlagértékével” pótol. Ha nem említed az „aranyórát”, akkor alapértelmezésként egy felhős kedd délutáni 2 órai fényt ad neked.

Végül még egy érdekesség: a GPT Image 2 promptjainak maximális hossza 20 000 karakter – ez körülbelül 3000 angol szónak felel meg. Általános esetekben ennyire nincs szükség, de összetett, több szereplőt tartalmazó jelenetek vagy részletes koncepciórajzok esetében ez a korlát azt jelenti, hogy a kompozíciót nagyon aprólékosan megtervezheted. A 11. fejezetben bemutatjuk, hogyan lehet használni a hosszú promptokat.


Kulcsszótár: filmbe illő jelenetek

A filmhatású jelenetek a legkönnyebben megalkotható kategória, mivel a filmtörténet már száz évnyi vizuális kifejezésmóddal rendelkezik. Ha megnevezed a műfajt, a korszakot és a felvételt, a modell máris elkészít neked egy szép képkockát.

Film noir stílusú GPT Image 2 prompt alapján készült kép: Vörös ruhás nő egy hongkongi sikátorban eső után
A hongkongi sikátorok új fekete film stílusban. A kék és a piros színek kontrasztja, valamint a szélesvásznú felvételek adják a hangulat nagy részét.

1. Hongkong új fekete sikátorai

Film noir cinematic shot. A dangerously beautiful femme fatale in a curve-hugging red silk dress with a thigh-high slit, walking through a rain-soaked Hong Kong back alley at night. Neon signs in Chinese characters reflect red and blue on the wet cobblestones. She carries a black umbrella over one shoulder, her red-painted lips the only warm color against the cold teal lighting. Smoke wisps from a nearby vent. Anamorphic lens, shallow depth of field, cinematic grain. Ultra-realistic 4K noir film frame.

Kínai magyarázat: Esős éjszaka Hongkong egyik hátsó sikátorában egy piros ruhás nő esernyővel a kezében halad át a neonfényben csillogó kőburkolatú úton.

2. Rembrandt Jazzbár

Moody jazz bar interior. A mysterious woman in a sheer black lace dress sits on a velvet barstool, one leg crossed showing stiletto heels. Cigarette smoke curls around her silhouette. Warm amber spotlight from above illuminates her face and exposed collarbones while the rest fades into deep shadow. A saxophone player is a blurred silhouette in the background. Film noir meets modern luxury aesthetic. Dramatic Rembrandt lighting, 35mm film look. Ultra-realistic 4K.

Kínai megjegyzés: A jazzbárban ülő fekete csipkés nő; az egyetlen felülről érkező fény és a füst együttesen Rembrandt-i drámai hatást kelt.

3. A Szárnyas gyilkos tető

Cyberpunk cinematic wide shot. A lone detective in a wet black trench coat stands on a neon-drenched Tokyo rooftop at 3am. Giant holographic advertisements of a geisha float across the skyline behind him, casting shifting pink and cyan light on his face. Light rain catches the glow. Flying cars streak past as horizontal light trails. Shot on anamorphic lens, 2.39:1 aspect, shallow depth of field. Blade Runner 2049 color grade — teal shadows, orange highlights. Ultra-realistic 4K cinematic frame.

Kínai megjegyzés: A cyberpunk Tokió tetőin a nyomozót kékre és rózsaszínre festett holografikus gejszka-reklámok veszik körül.

4. Wes Anderson szimmetrikus előcsarnoka

Wes Anderson style cinematic composition. A 1960s hotel concierge in a burgundy uniform stands dead-center in a pastel-pink Art Deco lobby, flanked by perfectly symmetrical potted palms and brass sconces. Flat front-on framing, everything on center axis. Soft fluorescent overhead lighting. Pastel pink and mint green color palette. 35mm film look. Ultra-detailed 4K.

Kínai megjegyzés: Rózsaszín Art Deco stílusú szálloda előcsarnoka, szimmetrikus kompozíció, a portás a kép közepén áll.

5. Koreai krimi: Konfrontáció a konyhában

Cinematic still from a modern Korean crime thriller. Two men face each other across a small Seoul apartment kitchen at 2am, both holding knives but frozen in a tense moment. Single fluorescent tube overhead casts hard green-tinted light and harsh shadows. Steam rises from an abandoned pot on the stove. Tight composition, 40mm lens, handheld feel. Bong Joon-ho style. Ultra-realistic 4K.

Kínai megjegyzés: Hajnali kettőkor két ember áll egymással szemben egy szöuli konyhában; zöldes árnyalatú, éles fényű neonlámpa + kézi kamerával felvett felvétel.

A jazzbárban, Rembrandt fényében álló nő – kép a „GPT Image 2” prompt alapján
Egyetlen reflektor és térhatású füst: ez szinte mindenre alkalmas, filmszerű hatást keltő trükk.

6. A Villeneuve-i sivatagi eposz

Epic cinematic wide shot in Denis Villeneuve style. A lone hooded figure in flowing desert robes walks across a vast orange sand dune at sunset. The sun is enormous on the horizon, casting elongated shadows. Scale is extreme — the figure is tiny, the landscape overwhelming. Dust kicks up in the wind. Warm amber palette with deep violet shadows. Shot on 65mm, ultra-wide aspect. Ultra-realistic 4K cinematic quality.

Kínai megjegyzés: Villeneuve-féle sivatagi széles látószög: az emberek aprónak tűnnek, a táj pedig lenyűgöző.

7. A francia újhullám kávézó

Black and white French New Wave cinematic still. A young woman in a striped Breton shirt and dark bob haircut smokes at a Paris cafe table in 1962. She looks off-camera with soft intensity. Natural window light, high contrast, slightly overexposed highlights. Film grain visible. Godard aesthetic. 35mm monochrome, 50mm lens. Ultra-detailed.

Kínai megjegyzés: Rövid hajú nő egy párizsi kávézóban, 1962-ben; fekete-fehér, az új hullám stílusában.

8. Olasz giallo horrorfolyosó

Cinematic horror frame in the style of a 1970s Italian giallo. A woman in a white nightgown stands at the end of a long Victorian hallway lit only by flickering red lamplight. Her back is turned. Shadow stretches toward the camera. Wallpaper is blood-red damask. Shallow depth of field, 28mm lens slightly distorted. Grainy film look. Deep red and black color story. Ultra-detailed 4K.

Kínai megjegyzés: 1970-es évekbeli olasz giallo stílus, egy fehér ruhás nő háta a vérvörös folyosó végén.

9. Miami: Neonfényes éjszaka

1980s Miami Vice cinematic shot. A woman in a white linen blazer drives a red convertible at night through downtown Miami. Palm trees and neon motel signs blur past. She looks at the camera with sunglasses reflecting the pink and turquoise glow of the city. Lens flare, soft film grain. Teal and magenta color grade. Ultra-realistic 4K.

Kínai megjegyzés: Miami éjszakai látképe a 80-as években: piros kabrió + napszemüveg, amelyben visszatükröződnek a neonfények.

10. A Ghibli-filmek élőszereplős adaptációi

Cinematic still styled as a live-action Studio Ghibli adaptation. A young woman in a simple blue linen dress stands in a vast green hillside field, wind blowing her hair and skirt. Fluffy white clouds race overhead. Soft golden hour light. Warm, painterly color grading with gentle film grain. Wide lens, low-angle composition making her heroic against the sky. Ultra-detailed 4K.

Kínai megjegyzés: A Ghibli-stílusú, élőszereplős dombvidéki jelenet, amely alulról felfelé irányuló felvételével kiemeli a láthatárot.


Kulcsszótár: Portrék és smink

A portréfotózás sikere vagy kudarca három tényezőtől függ: az objektívtől, a fény irányától és a bőr textúrájától. Ha pontosan megadod, hogy „85 mm f/1,4”, „gyűrűs lámpa” vagy „a kamera bal oldalán elhelyezett softbox”, azzal három felesleges próbálkozási kört is megspórolhatsz magadnak.

Közelkép a kör alakú lámpa fényében – GPT Image 2 prompt: portréminta
Kozmetikai reklámokhoz hasonló makróportré. Az „85 mm-es makró, f/1,4” felirat az, ami valóban ilyen textúrát kölcsönöz a bőrnek.

11. Fenty Beauty-minőségű makrófotózás

Extreme close-up beauty portrait. A stunning model with wet dewy skin and tousled damp hair, bare shoulders glistening. Water droplets on her face and neck catch the light of a ring light. Flawless skin texture in macro detail — every pore, every water droplet razor sharp. Smoky eye makeup with subtle gold shimmer. Lips slightly parted, intense gaze at camera. Dark background. Fenty Beauty campaign aesthetic. 85mm macro lens, f/1.4, ultra-shallow depth of field. Ultra-realistic 4K.

Kínai megjegyzés: Közelkép a hidratált bőrről, kör alakú lámpa segítségével, minden egyes vízcsepp élesen látható.

12. Barokk padon ülő alak

Luxury editorial portrait. A gorgeous model wearing an elegant black velvet off-shoulder gown reclines on a dark velvet chaise longue in a dimly lit Baroque-style room. One arm draped elegantly above her head. Rich warm Rembrandt lighting from a single window highlights the fabric draping against her glowing skin. Oil painting-like quality with deep shadows and warm highlights. High-end fashion editorial photography. 85mm lens, creamy bokeh. Ultra-realistic 4K.

Kínai megjegyzés: A bársonykanapén ülő fekete ruhás nő; Rembrandt az egyetlen ablakon beáramló fény segítségével festményszerű hangulatot teremt.

13. Tiszta, üzleti célú igazolványkép

Professional corporate headshot. A confident woman in her early 30s wearing a tailored navy blazer over a crisp white shirt. Neutral gray seamless studio background. Three-point lighting — soft key from camera left, subtle fill from right, rim light from behind. Genuine warm smile, direct eye contact. 85mm lens, f/2.8. Skin tone natural and healthy. LinkedIn executive headshot quality. Ultra-realistic 4K.

Kínai megjegyzés: Szürke háttér + standard hárompontos megvilágítás, LinkedIn-szintű vezetői profilkép.

14. Tokiói utcai portrék

Environmental street portrait. A 20-something Tokyo local with bleached blonde hair and oversized vintage streetwear stands in Shibuya on a weekday afternoon. Shallow depth of field with crowd of pedestrians soft-blurred behind her. Natural overcast daylight. She looks slightly off-camera, lost in thought. Shot on Fujifilm X100 aesthetic, 35mm lens, f/2. Ultra-realistic 4K.

Kínai megjegyzés: Egy délután Shibuya-ban, egy szőke hajú lány a tömeg előtt, a háttér elmosódva.

15. Vogue-szintű címlap

High-end fashion portrait in the style of a Vogue Italia cover. A striking model with razor-sharp cheekbones wears an oversized metallic silver couture gown with architectural shoulders. She stares directly into camera with a cold, commanding expression. Hair pulled back tight. Studio lighting is a single hard light from 45 degrees creating sculptural shadows. Gray backdrop. 85mm portrait lens, f/5.6 for crisp detail. Ultra-detailed 4K.

Kínai megjegyzés: A Vogue Italia címlapjának hangulata: ezüstszínű, dombornyomott estélyi ruha + egyszerű, kemény fényű, szoborszerű portré.

16. Természetes fényben készült konyhai portré

Soft natural light portrait. A woman with wavy chestnut hair sits by a large north-facing window in a quiet morning kitchen. She holds a ceramic mug of coffee in both hands, looking out the window thoughtfully. Warm cream sweater, no makeup, freckles visible. Shot in Rembrandt light with window as the only source. 50mm lens, f/1.8, shallow depth of field. Soft, honest, lived-in feel. Ultra-realistic 4K.

Kínai megjegyzés: A reggeli fényben a konyha ablaka mellett álló, smink nélküli nő, kizárólag az egyik ablakon beáramló természetes fényben.

17. Egyszínű színházi világítás

Dramatic black and white portrait. A man with a short salt-and-pepper beard and intense dark eyes stares into the lens. Only half his face is lit — hard side light from camera right, pure black shadow on the other side. Textured gray background fades to black. Shot on medium format film aesthetic, 80mm lens. Film grain. Peter Lindbergh style monochrome. Ultra-detailed.

Kínai megjegyzés: Peter Lindbergh stílusú fekete-fehér portré, az arc egyik fele éles fényben, a másik fele teljesen sötét.

18. Rózsaszín sminkfotósorozat

Dreamy pastel beauty portrait. A model with soft pink lips, dewy skin, and flushed cheeks against a blush pink seamless backdrop. She wears a sheer white off-shoulder top. Soft diffused lighting from a large softbox creates flattering even illumination. Hair in loose tousled waves. 85mm lens, f/2. Cotton candy color palette — pink, peach, cream. Ultra-realistic 4K beauty editorial.

Kínai megjegyzés: Rózsaszín háttér + nagy softbox, cukorkás színekkel készült sminkfotósorozat.

19. Romantikus aranyórák

Sun-drenched golden hour portrait. A woman in a flowing cream linen dress stands in a wheat field at 7pm on a summer evening. The sun is low behind her, creating a halo of golden backlight through her hair and the sheer fabric. Lens flare across the frame. Her eyes are closed, face tilted up to the warmth. 135mm telephoto lens, f/2, compressed background. Warm honey color grade. Ultra-realistic 4K.

Kínai megjegyzés: Nyári alkonyat a búzamezőn, háttérvilágítás + 135 mm-es teleobjektív a tér összenyomásához.

20. Az „Sötét Akadémia” könyvtára

Dark academia editorial portrait. A young woman with auburn hair in a loose braid wears a wool cardigan over a white collared shirt in an old university library. She holds an open leather-bound book, reading by the light of a green banker's lamp. Towering bookshelves around her fade into shadow. Warm tungsten light, deep navy and olive color palette. 50mm lens, f/2.8. Ultra-realistic 4K.

Kínai megjegyzés: Régi könyvtár + zöld bankárlámpa, „dark academia” hangulat.


Kulcsszótár: Mozgás és dinamika

A mozgásjelenetekhez két dologra van szükség: a pillanat megfagyását leíró kifejezésekre („a levegőben megfagyva”, „nagy sebességgel rögzítve”) és a kontúrokat kiemelő fényre, amely kiemeli a főtárgyat a zavaros háttérből.

Sportoló forgó rúgásának pillanatképe nagy sebességgel – GPT Image 2 mozgásleírási minta
A mozdulatot megfagyasztó portré. Az alakot valójában az a „hátulról érkező szélfény” rajzolja ki.

21. Nike edzés – állókép

Dynamic action freeze-frame. An athletic woman in a fitted sports bra and high-waisted compression shorts executes a powerful spinning roundhouse kick. Water splashes frozen in mid-air around her legs and feet in a dramatic spray pattern. Her toned abs and defined muscles visible. Dramatic single-source rim lighting from behind creates a glowing silhouette edge. Dark studio background. Nike Training campaign energy. High-speed photography feel — ultra-sharp subject, motion blur on water droplets. Ultra-realistic 4K.

Kínai megjegyzés: Nike-reklámhoz készült nagysebességű felvétel, amelyen a vízcseppek a levegőben megfagyva láthatók.

22. A „Surfer’s Tube” belső képe

Epic wide-angle shot of a female surfer riding inside a massive crystal-clear barrel wave at golden hour. Her silhouette and athletic body visible through the translucent turquoise water of the wave tube. Golden sunlight creates an explosion of light and water mist behind her. Dramatic backlit composition. The wave is enormous and perfectly formed. GoPro-style immersive perspective. Ultra-realistic 4K cinematic quality.

Kínai magyarázat: A „Golden Hour” című képen egy női szörfös látható a hatalmas hullámok között, háttérvilágításban, sziluettként.

23. Parkour tetőugrás

High-speed action shot of a parkour athlete mid-leap between two Brooklyn rooftops at sunset. Frozen at the apex of the jump, arms and legs extended, silhouetted against a burning orange sky. The gap below him is dizzying — city streets far below. Motion blur on the trailing edge of his hoodie. Shot from a drone at his height, 35mm lens. Ultra-realistic 4K cinematic action.

Kínai megjegyzés: Parkour a brooklyni háztetőkön a lemenő nap fényében, a ugrás legmagasabb pontján megállítva.

24. A vegyes harcművészetek ringjének reflektorfénye

Dramatic fight night action. A female MMA fighter mid-spinning back elbow, sweat flying from her hair in a visible arc of droplets. Single harsh overhead ring spotlight isolates her from pure black background — classic boxing photography look. Her opponent is a blurred silhouette out of focus. 70-200mm lens at 200mm, f/2.8, 1/2000 shutter frozen motion. High contrast, desaturated. Ultra-detailed 4K.

Kínai megjegyzés: Az MMA-ringet egyetlen felső lámpa világítja meg, és a verejtékcseppek íve jól látható.

25. A terepmotorok által okozott porfelhő

Low-angle action shot of a motocross rider airborne over a dirt jump, red desert dust exploding behind the rear tire. Late afternoon sun casts long shadows. The bike is tilted aggressively mid-trick. Camera is just above ground level looking up, making the jump look monumental. Anamorphic lens flare from the sun. Orange and teal color grade. Ultra-realistic 4K action.

Magyarázat: A terepmotor a levegőbe emelkedik, hátsó kereke vörös porfelhőt kavar.

26. A balettterem felpattant

Contemporary ballet dancer mid-grand jete frozen in the air, arms extended, body perfectly horizontal. She wears a simple nude leotard. Plain gray cyclorama studio background. Strong side-light from camera left creates a sculptural chiaroscuro on her musculature. Powder disturbed from the floor traces her leap in a soft cloud. 1/4000 shutter speed feel. Ultra-detailed 4K.

Kínai megjegyzés: A balettben a grand jeté legmagasabb pontján a test párhuzamos a talajjal.

27. Kosárlabda: zsákolás felülről

Low-angle hero shot of a male basketball player mid-slam dunk, one hand gripping the rim, body extended diagonally across the frame. Arena lights streak as lens flares. Crowd is a soft blurred wall of phone flashes behind him. Frozen sweat and net motion. Shot on 24mm wide from directly below the hoop. NBA official photography energy. Ultra-realistic 4K.

Kínai megjegyzés: A kosár közvetlenül alatti 24 mm-es széles látószögű, felfelé irányuló felvétel a zsákolás pillanatáról.

28. Száguldó lovak a hullámok között

A rider on a powerful black horse gallops through knee-deep shallow ocean water at sunrise. Water explodes from each hoofstrike, frozen in a dramatic spray. The rider is leaned low, hair streaming behind. Warm golden backlight from the rising sun. Mist rising off the water. Shot at 1/4000 shutter, 200mm telephoto compression. Ultra-realistic 4K equine photography.

Kínai megjegyzés: Napkeltekor a sekély vízben egy fekete ló vágtat, a vízcseppek szétfröccsennek; 200 mm-es teleobjektívvel készült, a távolságot összenyomva.


Kulcsszótár: Természet és táj

A tájképekkel kapcsolatos kulcsszavak a napidő, időjárás és vertikális méretek. A modell nagyon erős előfeltevéseket támaszt a „általános természeti szépségre” vonatkozóan, ezért konkrét szavakkal kell eltéríteni a modellt ettől az átlagértéktől.

Nő a szikla és a vízesés mellett a ködben – GPT Image 2 természetes prompt-példa
Egy nő a sziklafal melletti vízesés ködös környezetében. A „kissé lefelé néző” légi felvétel szöge és a „gossamer” (pókhálószerű) ilyen konkrét kifejezésnek köszönhetően a modell már nem tűnik sablonosnak.

29. A vízesés ködös varázslatos világa

Ethereal fantasy nature scene. A graceful young woman in a flowing sheer gossamer dress stands at the edge of a towering waterfall cliff. Dense tropical mist swirls around her legs and the translucent fabric. She extends one arm toward the cascade, water droplets catching golden light. Aerial perspective slightly from above showing the dramatic cliff drop. Lush green ferns frame the composition. Golden hour light filtering through the mist. Ultra-realistic 4K cinematic quality.

Kínai leírás: Fehér fátylat viselő nő a sziklafal melletti vízesésnél, légi felvétel + köd.

30. Légifelvételek a Maldív-szigetekről

Overhead drone shot of a beautiful woman in a minimal white bikini floating on her back in crystal-clear turquoise shallow water over white sand in the Maldives. Her long dark hair fans out in the water like a halo. The water is so clear her full body is visible through the translucent surface. Tiny fish swim nearby. Travel photography editorial style. Ultra-realistic 4K aerial quality.

Kínai magyarázat: A Maldív-szigetek felett készült felülnézeti felvétel, amelyen egy nő lebeg a kristálytiszta vízben.

31. Izland fekete homokos partja

Dramatic wide landscape of Iceland's Reynisfjara black sand beach at dawn. Massive basalt sea stacks rise from the churning North Atlantic. Low fog drifts across the black sand. A single figure in a red rain jacket walks along the shoreline for scale. Moody desaturated color grade — almost monochrome with just the red jacket as accent. 24mm wide lens, f/11 for deep focus. Ultra-detailed 4K.

Kínai megjegyzés: Izlandi fekete homokos strand + piros esőkabát, mint színbeli kiindulópont.

32. A vörösfenyő-erdő templomának fénye

Vertical composition looking up through towering California redwood trees. Shafts of golden morning sunlight cut through the fog between the trunks like cathedral light rays. Ferns carpet the forest floor. A tiny hiker in the distance gives scale. Ultra-wide 14mm lens distorting the trunks into a radial pattern toward the sky. Warm green and gold palette. Ultra-realistic 4K nature photography.

Kínai megjegyzés: 14 mm-es széles látószögű felülnézet a vörösfenyő-erdőre, a ködben a templomból áradó fénysugár.

33. A Patagóniai Tükör-tó

Perfect mirror reflection of the jagged Torres del Paine peaks in a glass-still Patagonian alpine lake at blue hour. Pink and purple alpenglow on the snow-capped summits. A single orange tent on the near shore as human scale. Complete symmetry — upper and lower half of frame are near-mirror images. 35mm lens, f/11. Ultra-realistic 4K landscape.

Kínai megjegyzés: A „Kék pillanat” tökéletes, tükörszerű tava, amely felülről és alulról is szimmetrikus.

34. Szaharai homokvihar

Vast Sahara desert at the start of a sandstorm. Rolling orange dunes extend to the horizon, with a towering wall of sand approaching from the left. A lone nomadic figure on camelback is silhouetted against the dust cloud. Sun struggles through the haze as a dim orange disc. Cinematic wide-angle, heavy atmospheric haze. Monochromatic warm orange palette. Ultra-detailed 4K.

Kínai magyarázat: A szaharai homokvihar szélén a tevehátas lovas sziluettje szembeszáll a porfalakkal.

35. Aurora-ház

Wide landscape of a tiny warm-lit wooden cabin in a Norwegian fjord valley at 1am. A spectacular green and purple aurora borealis dances overhead, reflecting in the still black fjord water. Snow-dusted pine trees and mountains frame the scene. The cabin glow is the only warm color in an otherwise cold composition. 20-second long exposure feel. Ultra-realistic 4K astrophotography.

Kínai megjegyzés: Az éjjel egy órakor látható sarki fény a norvég fjordok felett és egy hangulatos faház.

36. Naplemente az afrikai szavannán

Cinematic wide shot of a family of elephants crossing a golden savanna at sunset in Kenya. The sun is a huge orange disc on the horizon, silhouetting the herd. Long grass ripples in the warm wind. Dust kicked up by the herd diffuses the backlight into warm beams. 200mm telephoto compression. National Geographic editorial style. Ultra-realistic 4K wildlife photography.

Kínai megjegyzés: Kenyai szavanna naplementekor, elefántcsorda sziluettje + 200 mm-es teleobjektívvel készített kompozíció.

37. Kiotói Sakura-folyó

Serene wide landscape of the Philosopher's Path in Kyoto at peak cherry blossom season. Pink petals float on the narrow canal, with more drifting down from the trees above. Traditional wooden bridges arch over the water. Early morning mist softens the light into diffused pink. A solo figure in a dark kimono walks along the stone path for scale. 50mm lens, f/4, gentle pastel color grade. Ultra-realistic 4K.

Kínai megjegyzés: A Kiotói Filozófusok útján a cseresznyevirágzás idején rózsaszín virágszirmok lebegnek a csatorna vizén.

38. Skót-felföldi viharfény

Dramatic landscape of the Scottish Highlands during a clearing thunderstorm. Dark churning clouds above a lone glen, with a single shaft of golden sunlight breaking through and lighting one patch of heather-covered hillside. Rainbow arc barely visible at the edge. Ancient standing stones in the foreground. Moody cinematic color grade — steel blue shadows, warm sunlit highlight. 24mm wide, f/11. Ultra-realistic 4K landscape photography.

Kínai megjegyzés: Amikor a skóciai hegyvidéken a zivatar elvonult, egyetlen aranyfényű sugár tört át a sötét felhőkön.


Kulcsszótár: Fantázia és stílusos

Ha a fantasy témában konkrét művészeti referenciákat nevez meg (Ufotable, Arcane, Studio Trigger, Magic: The Gathering illusztrációk), a leírás sokkal pontosabbá válik. Az általános „fantasy art” kifejezés csak általános fantasy-rajzokat eredményez.

A fénylő varázskard fantasztikus harcosnője – GPT Image 2 anime leírásminta
Egy Ufotable-stílusú fantasy harcoslány. Ha megemlíted a stúdió nevét, az többet mond, mint húsz jelző.

39. Ufotable: Anime Senki

Epic anime-inspired fantasy warrior princess with flowing silver-white hair that reaches her waist, wearing ornate golden battle armor that hugs her figure with intricate engravings. She holds a glowing magical sword aloft, emitting bright blue energy. Cherry blossom petals and magical sparkles swirl in a violent storm around her. Her expression is fierce and determined. Dynamic action pose mid-battle leap. Ultra-detailed anime with CGI-quality lighting — Ufotable production quality. Rich colors, dramatic volumetric lighting. 4K quality.

Kínai megjegyzés: Ufotable-szintű anime harcos hercegnő, kék varázskard + cseresznyevirág-vihar.

40. Sötét elf varázslónő

Dark fantasy dark elf sorceress with long flowing midnight-purple hair, pointed ears, and luminous violet eyes. She wears an elegant off-shoulder dark robe with intricate silver embroidery that reveals her collarbones and shoulders. Purple arcane energy spirals from her outstretched hands, illuminating her face from below. A vast star field and nebula visible in the background through a shattered stone archway. Semi-realistic fantasy illustration style with cinematic lighting. Ultra-detailed 4K.

Kínai megjegyzés: Sötét elf varázslónő, kezéből lila mágikus energia kavarog ki.

41. A Ghibli-erdő tündére

Studio Ghibli style painterly scene. A small forest spirit that looks like a glowing white fox with three tails walks through a mossy enchanted forest at dusk. Fireflies dance around it. Soft painterly brushstrokes, warm honey-gold light filtering through massive ancient trees. Hayao Miyazaki watercolor aesthetic. Ultra-detailed animation cel quality.

Kínai megjegyzés: Egy háromfarkú fehér róka, Ghibli-stílusban, alkonyatkor sétál a mohás erdőben.

42. Arcane: A két város harca

Arcane Netflix animated series style illustration. A young woman with blue-tipped braided hair and steampunk goggles leans against a graffitied alley wall in the undercity of Piltover. Neon magical rune-signs glow behind her. Textured painterly brushstrokes visible, 2D illustration with 3D depth, saturated purple and teal color story. Fortiche animation studio aesthetic. Ultra-detailed 4K.

Kínai megjegyzés: Arcane Fortiche stílusú lány a város alsó részének sikátoraiban.

43. Magic: The Gathering – A sárkány

Fantasy illustration in the style of a Magic The Gathering card. A colossal red dragon emerges from molten lava in an underground cavern, wings half-spread, mouth roaring with fire breath forming. A tiny knight in silver armor stands at the cavern's edge for scale, raising a shield. Dramatic low-angle hero composition. Rich oil-painting texture, Greg Rutkowski influence. Ultra-detailed 4K fantasy art.

Kínai megjegyzés: A Magic: The Gathering illusztrációs stílusában megrajzolt Lávavörös Sárkány és a Csekély Lovag.

44. Cyber Knight

Cyberpunk fantasy fusion. A female samurai with a chrome katana stands on the rain-slicked rooftop of a neo-Tokyo megacorp tower at night. She wears a fusion of traditional kimono and carbon-fiber combat armor. Holographic cherry blossoms drift around her. Neon reflections on the wet rooftop, flying ad-drones in the background. Illustrated in the style of Katsuhiro Otomo meets modern 3D concept art. Ultra-detailed 4K.

Kínai megjegyzés: Szamurájlány a Cyber-Tokió tetőin + holografikus cseresznyevirágok.

45. A víz alatti sellő

Ethereal underwater fantasy. A graceful mermaid with iridescent teal and violet scales swims through a coral reef illuminated by shafts of sunlight piercing the water surface above. Her long turquoise hair flows weightlessly. Bubbles trail from her fingertips. School of small silver fish swim past. Dreamlike painterly quality, Lisa Frank meets National Geographic. Ultra-detailed 4K fantasy art.

Kínai magyarázat: Szivárványos sellő a korallzátonyon, miközben a fénysugarak a víz felszínéről áthatolnak.

46. Steampunk léghajó kapitánya

Illustrated steampunk fantasy portrait. A young female airship captain in a brass-buttoned red military coat, goggles pushed up on her forehead, stands at the wheel of a wooden airship. Visible brass gears and copper pipes. Behind her, clouds and other distant airships. Warm golden hour lighting. Illustration style inspired by Nausicaa and Howl's Moving Castle. Ultra-detailed 4K.

Kínai megjegyzés: Hayao Miyazaki stílusú női léghajó-kapitány és rézfogaskerekek.


Többféle stílusú iteráció: ugyanaz a téma, különböző világok

Egy alulértékelt munkafolyamat a GPT Image 2-ben: a téma rögzítése, csak a stílusparaméterek módosítása. Így pontosan láthatod, hogy az egyes stílusok hogyan hatnak ugyanarra az arcra, ugyanarra a ruhára és ugyanarra a testtartásra – így legközelebb már nem kell találgatnod a stílusválasztáskor.

Négykockás stílusok összehasonlítása: fotórealisztikus, anime, olajfestmény, cyberpunk – GPT Image 2 prompt
Ugyanazon témához tartozó négy stílus. Ez a változatok sorozata kiválóan alkalmas hangulatlap készítésére, mielőtt az ügyfélnek átadnánk a stílusválasztékot.

Alapvető kulcsszavak – a főszöveg a négy generálás során teljesen változatlan marad:

A beautiful young woman with shoulder-length brown hair stands in a sunlit garden, wearing a simple white sundress, one hand lightly touching a rose bush. Soft golden afternoon light. Three-quarter body framing, slightly tilted head, warm smile.

Kínai magyarázat: A Napfényes Kertben egy egyszerű ruhás lány megérinti a rózsát, aranyló délutáni fényben.

Ezután csak a stílushelyeket váltjuk, és mindegyiket egyszer futtatjuk:

47. Realista fotózás

[Base] — Hyperreal fashion photography aesthetic. 85mm lens at f/1.8, soft natural light, editorial sharpness. Ultra-realistic 4K.

48. Japán animáció

[Base] — Japanese anime style with cel shading, bold line art, vibrant saturated colors, large expressive eyes. Kyoto Animation production quality. Ultra-detailed.

49. Klasszikus olajfestészet

[Base] — Classical oil painting style with visible thick brushstrokes, warm Renaissance lighting, chiaroscuro shadow, Vermeer-like color palette. Museum-quality.

50. Cyberpunk

[Base] — Neon-drenched cyberpunk futurism. Holographic overlays, circuit-pattern light tattoos on skin, magenta and cyan rim lighting. Ghost in the Shell art direction. Ultra-detailed.

Belső tesztfiókunkon futtattuk le ezt a sorozatot: az első kép elkészítése körülbelül 18 másodpercet vett igénybe, a következő képek stílusváltása pedig nagyjából ugyanennyi időt. Összesen kevesebb mint két perc alatt és 48 kreditért kaptunk egy teljes stílusú hangulatlapot. Az ügyfélnek benyújtott ajánlatban ez azt jelenti, hogy az eredetileg fél napig tartó anyagkeresést egy csésze kávé elkészítéséhez szükséges időre sikerült lecsökkenteni.


Gyakori hibák és azok kijavítása

„A valóság” fejezet: A GPT Image 2 nagyon jól működik, de nem varázslat. Az alábbiakban felsoroljuk a leggyakrabban előforduló hibatípusokat és a hozzájuk tartozó javítási sablonokat. Használd ezt a fejezetet hibaelhárítási ellenőrzőlistaként – ha legközelebb problémád adódik a képkészítéssel, vedd át sorrendben a pontokat, és a legtöbb probléma már az első módosítás után megoldódik.

1. hiba: Unalmas kimenet

Before:

A beautiful woman in a city.

After:

A 28-year-old woman with auburn hair pulled into a low ponytail, wearing a camel trench coat, crossing a Manhattan crosswalk at 6pm on a rainy Thursday. Yellow taxis blur past in motion-blurred streaks. 50mm lens, f/2, cinematic grain. Ultra-realistic 4K.

Az első utasítás nem adott a modellnek semmilyen kapaszkodót. A megoldás mindig konkrét főnevek és konkrét helyszínek használata.

2. hiba: Helytelen ujjszám

A GPT Image 2 már jóval jobb eredményeket ér el a kezek ábrázolásában, mint az első generációs diffúziós modell, de a kezek közeli felvételei még mindig hibásak lehetnek. Két megbízható módszer a probléma elkerülésére:

  • Ne hagyd, hogy a kéz legyen a kép középpontjában, egyszerűen vágd ki: „framing is shoulders up only” (csak a válltól felfelé).
  • Adj valamit a kezébe: „hands gently holding a ceramic coffee cup”. Ha egy tárgy határozza meg a testtartást, az ujjak száma is stabil marad.

3. hiba: A képen szereplő szöveg karakterhibás

A modell nem egy szedési program. Ha logót, táblát vagy poszteren szereplő olvasható szöveget szeretnél elhelyezni a képen, akkor vagy nagyon rövidre kell fogni („a tábla felirata: OPEN”), vagy közvetlenül a leírásba kell beletenni egy mondatot: „a képen sehol sem lehet szöveg, betűk vagy szavak”, majd a szöveget külön kell szedni a Figma/Photoshop programban.

4. hiba: A fény irányának figyelmen kívül hagyása

Before:

A portrait of a woman with dramatic lighting.

After:

A portrait of a woman lit by a single hard spotlight from 45 degrees camera-left, with deep black shadow filling the right side of her face. Rembrandt lighting with a small triangle of light on the shadowed cheek.

A „drámai világítás” kifejezés önmagában nem mond semmit. Az irány, a fényerősség és az árnyékok hatóköre – ezek az igazi támpontok.

5. hiba: A főszereplő rossz jelenetben jelenik meg

Ha a modell újra és újra egy általános fotóstúdióba helyezi a szereplőt a könyvtár helyett – helyezd a jelenetet a leírás elejére, és fogalmazd meg konkrétabban:

In a candle-lit 17th-century English library with floor-to-ceiling oak shelves, leather-bound books, and a stone fireplace, a woman in…

Ha a hátteret a főtárgy elé helyezzük, az azt jelenti, hogy a szereplő bemutatása előtt már meghatároztuk a teljes kompozíciót.

6. hiba: Túl sok kulcsszó

1200 szó felett az egyes melléknevek hatása kezd elhalványulni. Ha a leírásod 40 stílusjelzőből álló felsorolás, a modell „átlagot vesz”. Egy fő stílusirányzatot tart meg (például a „film noir”-t), a többit pedig kiegészítőnek tekinti.


20 000 karakter kitöltése: strukturált hosszú prompt

A GPT Image 2 egyik alulértékelt előnye, hogy a prompt hossza akár 20 000 karakter is lehet. A legtöbb versenytárs terméknél ez az érték 1000–2000 karakter körül mozog. Portrék esetében erre nincs szükség, de több szereplős, összetett jelenetek, koncepciórajzokhoz készült briefek vagy a márka arculatához szorosan illeszkedő képsorozatok esetében a strukturált, hosszú promptok használata nagyon is megéri.

A gyártási briefben általában használt sablonok:

# JELENET
[Jelenet: helyszín, időpont, időjárás, történelmi korszak, 2–3 mondat]

# SZEREPLŐK
- A. szereplő: [megjelenés, ruházat, aktuális testtartás, arckifejezés]
- B. szereplő: [ugyanez]
- Statiszták: [rövid leírás]

# KOMPOZÍCIÓ
[Kompozíció: széles látószög/közeli/közelkép; felvételi szög; lencse; mélységélesség; az egyes szereplők elhelyezkedése a képen — háromrészes elrendezés/aranyarány/középre helyezés]

# LIGHTING
[Fényforrás, irány, keménység, színhőmérséklet, árnyékolás]

# COLOR
[Írja le a színpalettát 3–4 színkifejezéssel. Színvilág – meleg/hideg/kontrasztos]

# STYLE
[Egy fő stílusreferencia. Például: „Roger Deakins operatőri stílusa a Szárnyas gyilkos 2049 című filmben”]

# TECHNICAL
[Felbontás, filmkorn, képformátum, képminőségi címke. Legyen rövid!]

# KIZÁRÁSOK
[Kerülendő elemek: „Nincs szöveg, nincs logó, nincs vízjel, nincs felesleges végtag”]

Példa – Teljes, strukturált leírás (kb. 500 szó) egy hirdetési főképre:

# SCENE
A restored 1930s Art Deco ballroom on a rainy Tuesday evening in Paris, set during a private jazz performance. Tall arched windows on the left show wet boulevards and soft yellow streetlamp glow. Interior is lit warm and amber.

# CHARACTERS
- Lead: A striking 32-year-old woman with dark auburn hair in a low chignon, wearing a deep emerald-green silk bias-cut gown with a low back. She stands near a grand piano, one hand resting on its polished black lid, gazing thoughtfully toward the windows. Faint melancholy in her expression.
- Pianist: A middle-aged man in a black tuxedo, seated at the piano mid-performance, profile view, fingers on keys. He is a secondary figure — should not pull focus from the lead.
- Background: Three or four well-dressed patrons at candlelit round tables in soft bokeh, unidentifiable faces.

# COMPOSITION
Medium-wide shot. Lead character is on the right third of the frame, piano extending diagonally across the center toward the left. Rule of thirds. 50mm lens, f/2.2, shallow depth of field — lead and piano sharp, background patrons and windows softly blurred. Eye-level camera height.

# LIGHTING
Warm tungsten chandelier overhead providing ambient glow on the room. Key light on the lead is a single practical wall sconce camera-right at 45 degrees, modeling her face in gentle Rembrandt pattern. Rim from the windows behind her (cool blue rainy light) separates her hair and shoulder edge from the warm interior. Overall contrast: high but soft.

# COLOR
Deep emerald green (dress) and warm amber (interior) as hero colors, with cool blue window light as counter-accent. Warm gold dominant, with selective teal shadow detail. Film-look color grade reminiscent of early Wong Kar-wai.

# STYLE
Cinematic still in the visual language of In the Mood for Love meets a modern luxury cognac commercial. Anamorphic lens quality (slight horizontal flare on the candles). Painterly softness, 35mm film grain.

# TECHNICAL
Ultra-realistic 4K, 16:9 aspect, cinematic frame.

# EXCLUSIONS
No text, no signage, no logos, no watermarks, no visible phones or modern electronics, no extra limbs, no warped fingers on the pianist.

A szakaszos felépítésnek két előnye van: egyrészt segít neked, hogy ne hagyj ki egyetlen mezőt sem; másrészt strukturált kiindulási pontot biztosít a modell számára, ahelyett, hogy egyhuzamban 500 szavas szöveget kellene feldolgoznia. Az egész sorozat esetében csupán a CHARACTERS és a SCENE szakaszokat kell módosítani, és így egyszerre több különböző felvétel készülhet ugyanabból a reklámból.

Egy gyakorlati tipp: ha egy kép 80%-ban jól sikerült, de egy elem nem stimmel (például a főszereplő rossz színű ruhát visel), ne írja át az egész leírást. Másolja át a sikeres leírást, csak a megfelelő részt módosítsa, majd futtassa le újra. Belső iterációs naplóink szerint: strukturált leírásokkal átlagosan 2,8 próbálkozás után kapunk egy főképszintű képkockát; míg a szabad szöveges leírásoknál ez gyakran meghaladja a 6-ot. Ha egy kép 12 kreditbe kerül, ez képenként 2 és 5 dollár közötti különbséget jelent.

Szeretnéd átadni a strukturált kulcsszavakkal kapcsolatos munkafolyamatot egy kollégádnak? Először mutasd meg nekik a Bevezető útmutatót, majd térj vissza ide.


Gyakran ismételt kérdések

Mi a legfontosabb a GPT Image 2 promptjában?

Fény és objektív – ez a sorrend. A téma és a környezet még akkor is megmenthető, ha kissé homályosan van ábrázolva, de ha a fény iránya és az objektívválasztás nem egyértelmű, az eredmény mindig olyan lesz, mint egy stockfotó. Ha csak két elemre van időd a finomhangolásra, akkor ezeket dolgozd ki alaposan. Határozd meg pontosan, hogy „melyik irányból érkezik a fény, milyen erős, és melyik oldalra esik az árnyék”, majd határozd meg, hogy „hány milliméteres objektív, milyen rekeszérték, milyen közel vagy távol”. Így a kép alapja máris szilárd lesz.

Milyen hosszú legyen a GPT Image 2 promptja?

Portrék és egyszerű jelenetek esetében az ideális hossz 80–150 szó. A korszakot és stílust tükröző, filmszerű széles látószögű felvételeknél 150–250 szó. Több szereplős jelenetek vagy reklámfeladatok esetén strukturált sablon használatával 400–800 szó. A 20 000 karakteres felső határ rendkívüli esetekre van fenntartva – a mindennapi használat során ritkán haladja meg az 500 szót.

Meg lehet-e említeni a valódi művész nevét a promptban?

Hivatkozhatsz egy stílusra vagy korszakra – például „film noir”, „1970-es évekbeli giallo” vagy „Studio Ghibli festői stílusa” –, és a modell felismeri ezeket a vizuális nyelveket. Azonban az élő művészek nevét közvetlenül stíluscímkéként használni etikai szempontból kétes, és a modellek egyre gyakrabban szűrik ki ezeket. Jobb megoldás a stílus, a médium és a korszak leírása, ahelyett, hogy konkrét személyeket neveznél meg.

Miért változnak az eredmények minden alkalommal, ha ugyanazt a kulcsszót használom?

A diffúziós modell alapvetően véletlenszerű – egy zajos képből indul ki, és azt zajmentesíti. Ugyanazt a leírást kétszer futtatva szükségszerűen hasonló, de eltérő eredményeket kapunk. Ez a modell sajátossága, nem pedig hiba, és egyben a „változatos eredmények” forrása is. A eredmények reprodukálásához a legtöbb generatív rendszer támogatja a seed paramétert. A technikai háttérről bővebben az OpenAI képgenerálási blogjában olvashat.

Befolyásolja-e az ár a kulcsszó hossza?

Nincs rá hatással. A GPT Image 2 egységes árazást alkalmaz: 12 kredit képenként, függetlenül attól, hogy 20 vagy 2000 szót írsz. A költségeket kizárólag a generált képek száma befolyásolja.

Hányszor érdemes megpróbálni egy ötletet, mielőtt feladnánk?

Tapasztalati szabály: Ha ugyanazt a kiinduló szót háromszor kipróbálod, és még mindig nem jön össze, csak egy mezőt módosíts, ne kezdd elölről az egészet. A legtöbb esetben a fényviszonyokat vagy a kameraállást kell módosítani. Ha a 8. próbálkozás után sem látszik javulás, akkor a szerkezetben van a hiba – térj vissza a nyolc pozíciós képlethez, és ellenőrizd, hogy hányat töltöttél ki. Van még egy belső szokásunk: minden generált promptot és a hozzá tartozó kiindulási szót feljegyünk egy táblázatba, így a visszatekintéskor könnyen látható, melyik szó volt igazán hatékony.

A GPT Image 2 által generált képek felhasználhatók-e kereskedelmi célokra?

Természetesen. A termék általános felhasználási feltételei szerint az Ön által létrehozott képek az Ön tulajdonát képezik, és kereskedelmi célokra is felhasználhatók. A konkrét licencfeltételeket a weboldal láblécében található szöveg határozza meg; magas kockázatú esetekben (például márkás hirdetések, kiadványok borítói stb.) javasoljuk, hogy forduljon jogi tanácsadóhoz. Emellett ne tekintse a promptban említett valós személyeket vagy márkajelzéseket felelősségmentességi garanciának – ezek a személyképjog és a védjegyjog kérdései, amelyek nem tartoznak az AI-termék feltételeinek hatálya alá.

Mi a különbség a „text-to-image” és az „image-to-image” promptok között?

A „text-to-image” funkció a semmiből indul, és a leírás az egyetlen iránymutatás. Az „image-to-image” funkció az általad feltöltött referencia-képpel indul, és a leírás csupán annak módosítására szolgál. Az „image-to-image” funkcióhoz a leírásnak rövidebbnek kell lennie, és arra kell összpontosítania, hogy „mit módosítson” („olajfestmény stílusúra, a főszereplő testtartását és ruházatát meghagyva”), ahelyett, hogy az egész jelenetet újra leírná – a referencia-kép már biztosítja a legtöbb alapot.


Készen állsz a munkára?

Most már több mint 50 prompttal, egy nyolc mezőből álló képlettel, egy hibajavítási listával és egy strukturált, hosszú prompt-sablonnal rendelkezel. A következő lépés az, hogy megnyisd az eszközt, és ténylegesen futtass le egy kísérletet. Válassz ki egyet, illeszd be, és nézd meg, mennyire tér el a kimenet attól a képtől, ami a fejedben van – majd csak azt a mezőt javítsd ki, amelyik eltér a vártól, és futtasd le újra. Két-három kör alatt már stabilan tudsz majd „közvetlenül átadható” képeket előállítani.

Tedd el ezt a cikket a böngésző könyvjelzői közé, vagy ragassz egy nyolcmezős képletet a második monitorod mellé. Az igazi fejlődés nem a kulcsszavak memorizálásában rejlik, hanem abban, hogy a képletet izomemlékezetbe vésed – ezután bármely referenciaképet látva ösztönösen ki fogod szűrni belőle a főtémát, a fényviszonyokat, a beállítást és a stílust.

Kezdje el ingyenesen használni a GPT Image 2-t →

Tovább:

Kérdésed van egy adott kulcsszóval kapcsolatban? Írj nekünk az oldalon – minden üzenetet átnézünk, és a leggyakrabban feltett kérdések általában bekerülnek a következő kiadású útmutatóba. Az elméleti háttérről a Wikipedia szócikke a szövegalapú képgeneráló modellekről című cikkben olvashatsz, ami körülbelül 10 percet vesz igénybe. Ha tovább szeretnél fejlődni, a következő lépésként nézd meg a sorozat használati útmutatóját, és fejleszd a munkafolyamatot a „jó kép generálása” szintről a „stílusában egységes képek stabil előállítása” szintre.

A GPT Image 2 csapata

A GPT Image 2 csapata

Mesterséges intelligencia által generált képek és videók