Panduan Prompt GPT Image 2: Lebih dari 50 Template Praktis (2026)

Apr 22, 2026

TL;DR

Prompt GPT Image 2 yang efektif bukanlah sekadar satu kalimat, melainkan serangkaian keputusan: subjek, latar, gaya, sudut pengambilan gambar, pencahayaan, dan suasana hati. Panduan ini memberikan lebih dari 50 templat prompt yang siap disalin, mencakup lima kategori utama: gaya sinematik, potret, aksi, alam, dan fantasi, serta dilengkapi dengan daftar perbaikan untuk hasil yang kurang memuaskan dan alur kerja iterasi yang efisien. Semua gambar contoh dalam artikel ini menggunakan model KIE gpt-image-2-text-to-image yang sama, dengan biaya 12 kredit per gambar dan batas karakter prompt 20.000. Coba GPT Image 2 secara gratis →


Struktur Anatomi Sebuah Prompt yang Baik

Kebanyakan orang langsung menulis "apa yang saya inginkan" begitu mulai. Namun, orang yang benar-benar mampu menghasilkan foto bagus justru menulis "apa yang tertangkap lensa". Itulah rahasianya.

Setelah menjalankan ribuan kali pengujian pada antarmuka KIE gpt-image-2-text-to-image, kami berhasil merumuskan formula delapan slot yang hampir mencakup semua skenario. Mengisi enam dari delapan slot saja sudah menghasilkan hasil di atas rata-rata, sedangkan mengisi semuanya akan menghasilkan kualitas setara dengan film komersial.

Rumus:

[Subjek] + [Gerakan/Postur] + [Lokasi] + [Gaya/Referensi] + [Sudut Pengambilan Gambar/Komposisi] + [Pencahayaan] + [Suasana/Nuansa] + [Pengolahan Kualitas Gambar]

Setiap slot berfungsi untuk mengunci jawaban atas pertanyaan yang seharusnya "ditebak" oleh model:

  • Subjek——Siapa atau apa yang ada dalam gambar. "Pustakawan berambut merah" sepuluh kali lebih kuat daripada "wanita".
  • Gerakan/Postur——Apa yang sedang dilakukan saat ini. Kata kerja menentukan komposisi.
  • Latar——Dunia di sekitarnya. Jelaskan negara, era, dan waktu.
  • Gaya/Referensi——"film noir", "animasi berkualitas produksi Ufotable", "komposisi simetris ala Wes Anderson", "gaya iklan Fenty Beauty". Gunakan bahasa visual yang sudah dikenal, bukan sekadar menumpuk kata sifat yang tidak bermakna.
  • Sudut Pandang/Komposisi——" "close-up ekstrem", "sudut rendah dengan lensa wide-angle", "lensa potret 85mm, f/1.4", "lensa layar lebar anamorfik". Inilah kunci untuk mengubah foto menjadi bingkai film.
  • Cahaya——"cahaya tepi pada golden hour", "cahaya Rembrandt tunggal", "pantulan neon di permukaan basah". Cahaya menentukan 60% kesan sebuah foto.
  • Suasana/Tone——"Kontras biru dingin dan oranye hangat", "Bayangan gelap dengan warna amber hangat", "Tone suram dengan saturasi rendah".
  • Penyempurnaan Kualitas Gambar——"4K Ultra Realistis", "Butiran Film", "Gaya Film Mode". Tetap singkat, bagian sebelumnya sudah menjadi bagian yang paling berat.

Dasar vs. Optimalisasi — Dua Putaran Perbandingan atas Subjek yang Sama

Hasil yang dihasilkan dari prompt dasar GPT Image 2, komposisinya biasa saja dan pencahayaannya merata
Kata kunci dasar: "Seorang wanita berdiri di dalam sebuah ruangan." Objek utamanya kabur, pencahayaannya biasa saja, dan tidak ada komposisi—model sama sekali tidak bisa menemukan titik fokus.

Kata kunci asli yang sesuai dengan gambar di atas adalah:

A woman standing in a room.

Sekarang, mari kita tulis ulang "konsep yang sama" menggunakan rumus delapan slot:

A breathtaking young woman with flowing auburn hair stands in a luxurious Art Deco penthouse at golden hour. She wears a champagne-colored satin slip dress that catches the warm light. Floor-to-ceiling windows behind her show a panoramic city sunset. Dramatic side lighting creates deep shadows and golden highlights on her face and bare arms. The composition follows the rule of thirds. Cinematic depth of field with gorgeous city bokeh. Fashion editorial quality. Ultra-realistic 4K.

Keterangan dalam bahasa Mandarin: Di sebuah apartemen penthouse bergaya Art Deco, seorang wanita berambut panjang berdiri di depan jendela kaca dari lantai ke langit-langit, sementara cahaya samping pada saat golden hour menonjolkan kontur wajah dan lengannya.

Hasil gambar yang dihasilkan oleh prompt GPT Image 2 yang telah dioptimalkan menggunakan rumus delapan slot lengkap
Kata kunci yang telah dioptimalkan berdasarkan rumus delapan slot. Konsep utamanya sama, tetapi semua ketidakjelasan telah dihilangkan.

Catatan: Versi yang dioptimalkan bukanlah versi yang dipenuhi dengan lebih banyak kata sifat, melainkan bagian yang harus ditebak oleh model menjadi lebih sedikit. GPT Image 2 pada dasarnya adalah model difusi yang dipandu oleh transformer (lihat Penjelasan Wikipedia tentang model difusi); setiap detail yang tidak Anda tulis akan diisi oleh model menggunakan "rata-rata a priori"-nya. Jika Anda tidak menyebutkan "saat emas", model akan secara default memberikan cahaya pada hari Selasa sore pukul dua saat langit berawan.

Sebagai penutup, berikut satu fakta menarik: Batas maksimum prompt GPT Image 2 adalah 20.000 karakter—sekitar 3.000 kata dalam bahasa Inggris. Dalam situasi biasa, jumlah ini jauh dari cukup, tetapi untuk adegan yang melibatkan banyak karakter atau gambar konsep yang detail, batas ini memungkinkan Anda membuat keputusan komposisi yang sangat terperinci. Bagian ke-11 akan mendemonstrasikan cara menggunakan prompt yang panjang.


Perpustakaan Kata Kunci: Adegan Bernuansa Film

Adegan bergaya sinematik adalah kategori yang paling mudah diwujudkan, karena sejarah perfilman telah mengumpulkan kosakata visual selama seratus tahun. Cukup sebutkan genre, era, dan sudut pengambilan gambarnya, maka model akan menghasilkan satu bingkai gambar yang memuaskan.

Gambar yang dihasilkan dari prompt GPT Image 2 bergaya film noir: Seorang wanita berpakaian merah di gang belakang Hong Kong setelah hujan
Gang-gang di Hong Kong bergaya film noir baru. Perpaduan warna-warna cerah dan gelap serta bidikan layar lebar yang distorsi menjadi penentu utama suasana hati.

1. Gang-gang Belakang Hong Kong yang Berwarna Hitam

Film noir cinematic shot. A dangerously beautiful femme fatale in a curve-hugging red silk dress with a thigh-high slit, walking through a rain-soaked Hong Kong back alley at night. Neon signs in Chinese characters reflect red and blue on the wet cobblestones. She carries a black umbrella over one shoulder, her red-painted lips the only warm color against the cold teal lighting. Smoke wisps from a nearby vent. Anamorphic lens, shallow depth of field, cinematic grain. Ultra-realistic 4K noir film frame.

Keterangan dalam bahasa Mandarin: Di gang-gang Hong Kong pada malam hujan, seorang wanita berpakaian merah berjalan sambil memegang payung melintasi jalan berbatu yang memantulkan cahaya lampu neon.

2. Bar Jazz Rembrandt

Moody jazz bar interior. A mysterious woman in a sheer black lace dress sits on a velvet barstool, one leg crossed showing stiletto heels. Cigarette smoke curls around her silhouette. Warm amber spotlight from above illuminates her face and exposed collarbones while the rest fades into deep shadow. A saxophone player is a blurred silhouette in the background. Film noir meets modern luxury aesthetic. Dramatic Rembrandt lighting, 35mm film look. Ultra-realistic 4K.

Keterangan dalam bahasa Mandarin: Wanita berbalut renda hitam di bar jazz; pencahayaan dari satu titik cahaya ditambah asap menciptakan efek cahaya dramatis ala Rembrandt.

3. Atap Blade Runner

Cyberpunk cinematic wide shot. A lone detective in a wet black trench coat stands on a neon-drenched Tokyo rooftop at 3am. Giant holographic advertisements of a geisha float across the skyline behind him, casting shifting pink and cyan light on his face. Light rain catches the glow. Flying cars streak past as horizontal light trails. Shot on anamorphic lens, 2.39:1 aspect, shallow depth of field. Blade Runner 2049 color grade — teal shadows, orange highlights. Ultra-realistic 4K cinematic frame.

Keterangan dalam bahasa Mandarin: Di atas atap Tokyo bergaya cyberpunk, detektif itu diselimuti oleh warna biru dan merah muda dari iklan geisha holografik yang terpancar.

4. Lobi Simetris Karya Wes Anderson

Wes Anderson style cinematic composition. A 1960s hotel concierge in a burgundy uniform stands dead-center in a pastel-pink Art Deco lobby, flanked by perfectly symmetrical potted palms and brass sconces. Flat front-on framing, everything on center axis. Soft fluorescent overhead lighting. Pastel pink and mint green color palette. 35mm film look. Ultra-detailed 4K.

Keterangan dalam bahasa Mandarin: Lobi hotel bergaya Art Deco berwarna merah muda, dengan komposisi simetris, dan petugas resepsionis berdiri tepat di tengah gambar.

5. Konfrontasi di Dapur dalam Film Kriminal Gaya Korea

Cinematic still from a modern Korean crime thriller. Two men face each other across a small Seoul apartment kitchen at 2am, both holding knives but frozen in a tense moment. Single fluorescent tube overhead casts hard green-tinted light and harsh shadows. Steam rises from an abandoned pot on the stove. Tight composition, 40mm lens, handheld feel. Bong Joon-ho style. Ultra-realistic 4K.

Keterangan dalam bahasa Mandarin: Dua orang saling berhadapan di dapur Seoul pada pukul dua dini hari, dengan cahaya lampu neon yang agak kehijauan dan sudut pengambilan gambar yang terasa seperti diambil dengan kamera genggam.

Gambar yang dihasilkan berdasarkan prompt "Wanita di Bawah Cahaya Rembrandt di Bar Jazz" (GPT Image 2)
Satu lampu sorot ditambah asap yang memberikan kesan kedalaman adalah cara paling ampuh untuk menciptakan nuansa sinematik.

6. Epik Gurun Villeneuve

Epic cinematic wide shot in Denis Villeneuve style. A lone hooded figure in flowing desert robes walks across a vast orange sand dune at sunset. The sun is enormous on the horizon, casting elongated shadows. Scale is extreme — the figure is tiny, the landscape overwhelming. Dust kicks up in the wind. Warm amber palette with deep violet shadows. Shot on 65mm, ultra-wide aspect. Ultra-realistic 4K cinematic quality.

Catatan dalam bahasa Mandarin: Sudut pandang luas ala Villeneuve di gurun, dengan tokoh-tokoh yang tampak kecil dan pemandangan yang sangat mendominasi.

7. Kafe Nouvelle Vague Prancis

Black and white French New Wave cinematic still. A young woman in a striped Breton shirt and dark bob haircut smokes at a Paris cafe table in 1962. She looks off-camera with soft intensity. Natural window light, high contrast, slightly overexposed highlights. Film grain visible. Godard aesthetic. 35mm monochrome, 50mm lens. Ultra-detailed.

Keterangan dalam bahasa Mandarin: Wanita berambut pendek di sebuah kafe di Paris pada tahun 1962, foto hitam-putih bergaya Nouvelle Vague Prancis.

8. Koridor Horor Giallo Italia

Cinematic horror frame in the style of a 1970s Italian giallo. A woman in a white nightgown stands at the end of a long Victorian hallway lit only by flickering red lamplight. Her back is turned. Shadow stretches toward the camera. Wallpaper is blood-red damask. Shallow depth of field, 28mm lens slightly distorted. Grainy film look. Deep red and black color story. Ultra-detailed 4K.

Keterangan dalam bahasa Mandarin: Gaya giallo Italia tahun 1970-an, siluet seorang wanita berpakaian putih di ujung koridor berwarna merah darah.

9. Malam Neon di Miami

1980s Miami Vice cinematic shot. A woman in a white linen blazer drives a red convertible at night through downtown Miami. Palm trees and neon motel signs blur past. She looks at the camera with sunglasses reflecting the pink and turquoise glow of the city. Lens flare, soft film grain. Teal and magenta color grade. Ultra-realistic 4K.

Keterangan dalam bahasa Mandarin: Pemandangan malam Miami pada tahun 1980-an, mobil convertible merah + pantulan lampu neon di kacamata hitam.

10. Adaptasi Live-Action Studio Ghibli

Cinematic still styled as a live-action Studio Ghibli adaptation. A young woman in a simple blue linen dress stands in a vast green hillside field, wind blowing her hair and skirt. Fluffy white clouds race overhead. Soft golden hour light. Warm, painterly color grading with gentle film grain. Wide lens, low-angle composition making her heroic against the sky. Ultra-detailed 4K.

Keterangan dalam bahasa Mandarin: Adegan lereng bukit dalam gaya Studio Ghibli yang diadaptasi ke dalam film live-action, dengan sudut pengambilan gambar dari bawah yang menonjolkan cakrawala.


Perpustakaan Kata Kunci: Potret dan Rias Wajah

Keberhasilan atau kegagalan foto potret bergantung pada tiga hal: lensa, arah cahaya, dan tekstur kulit. Dengan mencantumkan "85mm f/1.4" atau "lampu cincin" atau "softbox di sebelah kiri depan kamera", Anda dapat langsung melewati tiga tahap percobaan yang sia-sia.

Close-up kulit yang lembap di bawah lampu lingkaran — Contoh potret dengan prompt GPT Image 2
Potret makro berkualitas iklan kecantikan. Kalimat "85mm makro, f/1.4" inilah yang sebenarnya menjadi kunci untuk menghasilkan tekstur kulit seperti ini.

11. Mode Makro Fenty Beauty

Extreme close-up beauty portrait. A stunning model with wet dewy skin and tousled damp hair, bare shoulders glistening. Water droplets on her face and neck catch the light of a ring light. Flawless skin texture in macro detail — every pore, every water droplet razor sharp. Smoky eye makeup with subtle gold shimmer. Lips slightly parted, intense gaze at camera. Dark background. Fenty Beauty campaign aesthetic. 85mm macro lens, f/1.4, ultra-shallow depth of field. Ultra-realistic 4K.

Keterangan dalam bahasa Mandarin: Foto close-up riasan pada kulit yang lembap, dengan pencahayaan cincin, setiap tetesan air terlihat sangat tajam.

12. Patung Duduk Gaya Barok

Luxury editorial portrait. A gorgeous model wearing an elegant black velvet off-shoulder gown reclines on a dark velvet chaise longue in a dimly lit Baroque-style room. One arm draped elegantly above her head. Rich warm Rembrandt lighting from a single window highlights the fabric draping against her glowing skin. Oil painting-like quality with deep shadows and warm highlights. High-end fashion editorial photography. 85mm lens, creamy bokeh. Ultra-realistic 4K.

Keterangan dalam bahasa Mandarin: Wanita bergaun hitam di atas sofa beludru; cahaya dari jendela tunggal dalam lukisan Rembrandt menciptakan efek tekstur lukisan minyak.

13. Foto identitas bisnis yang rapi

Professional corporate headshot. A confident woman in her early 30s wearing a tailored navy blazer over a crisp white shirt. Neutral gray seamless studio background. Three-point lighting — soft key from camera left, subtle fill from right, rim light from behind. Genuine warm smile, direct eye contact. 85mm lens, f/2.8. Skin tone natural and healthy. LinkedIn executive headshot quality. Ultra-realistic 4K.

Keterangan dalam bahasa Mandarin: Latar belakang abu-abu + pencahayaan tiga titik standar, foto profil eksekutif tingkat tinggi di LinkedIn.

14. Potret Jalanan di Tokyo

Environmental street portrait. A 20-something Tokyo local with bleached blonde hair and oversized vintage streetwear stands in Shibuya on a weekday afternoon. Shallow depth of field with crowd of pedestrians soft-blurred behind her. Natural overcast daylight. She looks slightly off-camera, lost in thought. Shot on Fujifilm X100 aesthetic, 35mm lens, f/2. Ultra-realistic 4K.

Keterangan dalam bahasa Mandarin: Suatu sore hari kerja di Shibuya, seorang gadis berambut pirang dengan latar belakang kerumunan yang kabur.

15. Sampul Majalah Vogue

High-end fashion portrait in the style of a Vogue Italia cover. A striking model with razor-sharp cheekbones wears an oversized metallic silver couture gown with architectural shoulders. She stares directly into camera with a cold, commanding expression. Hair pulled back tight. Studio lighting is a single hard light from 45 degrees creating sculptural shadows. Gray backdrop. 85mm portrait lens, f/5.6 for crisp detail. Ultra-detailed 4K.

Keterangan dalam bahasa Mandarin: Nuansa sampul Vogue Italia, gaun perak tiga dimensi + potret bergaya patung dengan pencahayaan tajam.

16. Potret di Dapur dengan Cahaya Alami

Soft natural light portrait. A woman with wavy chestnut hair sits by a large north-facing window in a quiet morning kitchen. She holds a ceramic mug of coffee in both hands, looking out the window thoughtfully. Warm cream sweater, no makeup, freckles visible. Shot in Rembrandt light with window as the only source. 50mm lens, f/1.8, shallow depth of field. Soft, honest, lived-in feel. Ultra-realistic 4K.

Keterangan dalam bahasa Mandarin: Seorang wanita tanpa riasan di dekat jendela dapur Chen Guang, hanya diterangi oleh cahaya alami dari jendela di satu sisi.

17. Pencahayaan Teater Monokrom

Dramatic black and white portrait. A man with a short salt-and-pepper beard and intense dark eyes stares into the lens. Only half his face is lit — hard side light from camera right, pure black shadow on the other side. Textured gray background fades to black. Shot on medium format film aesthetic, 80mm lens. Film grain. Peter Lindbergh style monochrome. Ultra-detailed.

Keterangan dalam bahasa Mandarin: Potret hitam-putih bergaya Peter Lindbergh, dengan setengah wajah diterangi cahaya yang tajam dan setengah lainnya gelap pekat.

18. Pemotretan Rias Wajah Berwarna Merah Muda

Dreamy pastel beauty portrait. A model with soft pink lips, dewy skin, and flushed cheeks against a blush pink seamless backdrop. She wears a sheer white off-shoulder top. Soft diffused lighting from a large softbox creates flattering even illumination. Hair in loose tousled waves. 85mm lens, f/2. Cotton candy color palette — pink, peach, cream. Ultra-realistic 4K beauty editorial.

Keterangan dalam bahasa Mandarin: Latar belakang merah muda + softbox besar, foto-foto makeup bernuansa warna-warni.

19. Momen Emas yang Romantis

Sun-drenched golden hour portrait. A woman in a flowing cream linen dress stands in a wheat field at 7pm on a summer evening. The sun is low behind her, creating a halo of golden backlight through her hair and the sheer fabric. Lens flare across the frame. Her eyes are closed, face tilted up to the warmth. 135mm telephoto lens, f/2, compressed background. Warm honey color grade. Ultra-realistic 4K.

Keterangan dalam bahasa Mandarin: Ladang gandum saat senja musim panas, dengan pencahayaan dari belakang + lensa telefoto 135mm yang memampatkan ruang.

20. Perpustakaan Aliran Kegelapan

Dark academia editorial portrait. A young woman with auburn hair in a loose braid wears a wool cardigan over a white collared shirt in an old university library. She holds an open leather-bound book, reading by the light of a green banker's lamp. Towering bookshelves around her fade into shadow. Warm tungsten light, deep navy and olive color palette. 50mm lens, f/2.8. Ultra-realistic 4K.

Keterangan dalam bahasa Mandarin: Perpustakaan tua + lampu bankir berwarna hijau, suasana dark academia.


Kumpulan Kata Kunci: Gerakan dan Dinamika

Adegan aksi membutuhkan dua hal: istilah yang menggambarkan momen yang membeku ("frozen mid-air", "high-speed capture") serta cahaya tepi, yang digunakan untuk memisahkan subjek dari latar belakang yang ramai.

Momen saat tendangan melingkar atlet dibekukan dalam kecepatan tinggi — Contoh kata kunci gerakan untuk GPT Image 2
Potret gerakan yang membeku. Yang benar-benar membentuk konturnya adalah sinar "dari tepi belakang" itu.

21. Nike: Adegan Latihan yang Dibekukan

Dynamic action freeze-frame. An athletic woman in a fitted sports bra and high-waisted compression shorts executes a powerful spinning roundhouse kick. Water splashes frozen in mid-air around her legs and feet in a dramatic spray pattern. Her toned abs and defined muscles visible. Dramatic single-source rim lighting from behind creates a glowing silhouette edge. Dark studio background. Nike Training campaign energy. High-speed photography feel — ultra-sharp subject, motion blur on water droplets. Ultra-realistic 4K.

Keterangan dalam bahasa Mandarin: Pengambilan gambar berkecepatan tinggi ala iklan Nike, percikan air membeku di udara.

22. Pemandangan di Dalam Tabung Ombak

Epic wide-angle shot of a female surfer riding inside a massive crystal-clear barrel wave at golden hour. Her silhouette and athletic body visible through the translucent turquoise water of the wave tube. Golden sunlight creates an explosion of light and water mist behind her. Dramatic backlit composition. The wave is enormous and perfectly formed. GoPro-style immersive perspective. Ultra-realistic 4K cinematic quality.

Keterangan dalam bahasa Mandarin: Seorang peselancar wanita di dalam tabung ombak pada saat emas, siluet dengan latar belakang cahaya.

23. Lompatan Parkour di Atap

High-speed action shot of a parkour athlete mid-leap between two Brooklyn rooftops at sunset. Frozen at the apex of the jump, arms and legs extended, silhouetted against a burning orange sky. The gap below him is dizzying — city streets far below. Motion blur on the trailing edge of his hoodie. Shot from a drone at his height, 35mm lens. Ultra-realistic 4K cinematic action.

Keterangan dalam bahasa Mandarin: Parkour di atas atap Brooklyn saat matahari terbenam, momen lompatan tertinggi yang dibekukan.

24. Sorotan Ring MMA

Dramatic fight night action. A female MMA fighter mid-spinning back elbow, sweat flying from her hair in a visible arc of droplets. Single harsh overhead ring spotlight isolates her from pure black background — classic boxing photography look. Her opponent is a blurred silhouette out of focus. 70-200mm lens at 200mm, f/2.8, 1/2000 shutter frozen motion. High contrast, desaturated. Ultra-detailed 4K.

Keterangan dalam bahasa Mandarin: Lampu sorot tunggal di atas ring MMA, dengan garis lengkung tetesan keringat yang terlihat jelas.

25. Debu yang ditimbulkan oleh motor trail

Low-angle action shot of a motocross rider airborne over a dirt jump, red desert dust exploding behind the rear tire. Late afternoon sun casts long shadows. The bike is tilted aggressively mid-trick. Camera is just above ground level looking up, making the jump look monumental. Anamorphic lens flare from the sun. Orange and teal color grade. Ultra-realistic 4K action.

Keterangan dalam bahasa Mandarin: Motor trail melesat ke udara, roda belakangnya mengangkat debu merah.

26. Melompat di Ruang Balet

Contemporary ballet dancer mid-grand jete frozen in the air, arms extended, body perfectly horizontal. She wears a simple nude leotard. Plain gray cyclorama studio background. Strong side-light from camera left creates a sculptural chiaroscuro on her musculature. Powder disturbed from the floor traces her leap in a soft cloud. 1/4000 shutter speed feel. Ultra-detailed 4K.

Catatan dalam bahasa Mandarin: Pada titik tertinggi gerakan grand jeté dalam balet, tubuh sejajar dengan lantai.

27. Slam Dunk

Low-angle hero shot of a male basketball player mid-slam dunk, one hand gripping the rim, body extended diagonally across the frame. Arena lights streak as lens flares. Crowd is a soft blurred wall of phone flashes behind him. Frozen sweat and net motion. Shot on 24mm wide from directly below the hoop. NBA official photography energy. Ultra-realistic 4K.

Keterangan dalam bahasa Mandarin: Foto sudut lebar 24 mm yang diambil dari bawah ring saat melakukan slam dunk.

28. Kuda Jantan Berlari di Atas Ombak

A rider on a powerful black horse gallops through knee-deep shallow ocean water at sunrise. Water explodes from each hoofstrike, frozen in a dramatic spray. The rider is leaned low, hair streaming behind. Warm golden backlight from the rising sun. Mist rising off the water. Shot at 1/4000 shutter, 200mm telephoto compression. Ultra-realistic 4K equine photography.

Keterangan dalam bahasa Mandarin: Perairan dangkal saat matahari terbit, kuda hitam berlari kencang hingga memercikkan air, diambil dengan lensa telefoto 200mm yang memperkecil jarak.


Kumpulan Kata Kunci: Alam dan Pemandangan

Kata kunci untuk kategori pemandangan alam adalah waktu, cuaca, dan skala vertikal. Model ini memiliki asumsi awal yang sangat kuat terhadap "keindahan alam pada umumnya", sehingga Anda harus menggunakan kata-kata yang spesifik untuk menggesernya dari nilai rata-rata tersebut.

Seorang wanita di tepi air terjun tebing yang diselimuti kabut — Contoh prompt alami GPT Image 2
Seorang wanita di tengah kabut di tepi air terjun tebing. Sudut pandang pemotretan udara yang "sedikit menunduk" + penggunaan kata konkret seperti "gossamer" membuat model tersebut tidak lagi terlihat biasa-biasa saja.

29. Surga Kabut Air Terjun

Ethereal fantasy nature scene. A graceful young woman in a flowing sheer gossamer dress stands at the edge of a towering waterfall cliff. Dense tropical mist swirls around her legs and the translucent fabric. She extends one arm toward the cascade, water droplets catching golden light. Aerial perspective slightly from above showing the dramatic cliff drop. Lush green ferns frame the composition. Golden hour light filtering through the mist. Ultra-realistic 4K cinematic quality.

Keterangan dalam bahasa Mandarin: Seorang wanita bergaun putih di tepi air terjun tebing, diambil dari sudut pandang udara + kabut.

30. Pemandangan udara Maldives yang mengapung

Overhead drone shot of a beautiful woman in a minimal white bikini floating on her back in crystal-clear turquoise shallow water over white sand in the Maldives. Her long dark hair fans out in the water like a halo. The water is so clear her full body is visible through the translucent surface. Tiny fish swim nearby. Travel photography editorial style. Ultra-realistic 4K aerial quality.

Keterangan dalam bahasa Mandarin: Foto diambil dari atas tepat di atas Maladewa, memperlihatkan seorang wanita yang mengapung di air laut yang jernih.

31. Pantai Pasir Hitam Islandia

Dramatic wide landscape of Iceland's Reynisfjara black sand beach at dawn. Massive basalt sea stacks rise from the churning North Atlantic. Low fog drifts across the black sand. A single figure in a red rain jacket walks along the shoreline for scale. Moody desaturated color grade — almost monochrome with just the red jacket as accent. 24mm wide lens, f/11 for deep focus. Ultra-detailed 4K.

Catatan dalam bahasa Mandarin: Pantai Pasir Hitam Islandia + jas hujan merah sebagai titik acuan warna.

32. Cahaya Gereja Hutan Redwood

Vertical composition looking up through towering California redwood trees. Shafts of golden morning sunlight cut through the fog between the trunks like cathedral light rays. Ferns carpet the forest floor. A tiny hiker in the distance gives scale. Ultra-wide 14mm lens distorting the trunks into a radial pattern toward the sky. Warm green and gold palette. Ultra-realistic 4K nature photography.

Keterangan dalam bahasa Mandarin: Foto sudut lebar 14 mm yang diambil dari bawah ke atas, menampilkan hutan pohon sequoia dan sinar cahaya yang menembus kabut di sekitar gereja.

33. Danau Cermin Patagonia

Perfect mirror reflection of the jagged Torres del Paine peaks in a glass-still Patagonian alpine lake at blue hour. Pink and purple alpenglow on the snow-capped summits. A single orange tent on the near shore as human scale. Complete symmetry — upper and lower half of frame are near-mirror images. 35mm lens, f/11. Ultra-realistic 4K landscape.

Keterangan dalam bahasa Mandarin: Danau cermin yang sempurna pada saat langit biru, simetris atas-bawah.

34. Badai Pasir Sahara

Vast Sahara desert at the start of a sandstorm. Rolling orange dunes extend to the horizon, with a towering wall of sand approaching from the left. A lone nomadic figure on camelback is silhouetted against the dust cloud. Sun struggles through the haze as a dim orange disc. Cinematic wide-angle, heavy atmospheric haze. Monochromatic warm orange palette. Ultra-detailed 4K.

Keterangan dalam bahasa Mandarin: Di tepi badai pasir Sahara, siluet pengendara unta berhadapan dengan dinding debu.

35. Pondok Aurora

Wide landscape of a tiny warm-lit wooden cabin in a Norwegian fjord valley at 1am. A spectacular green and purple aurora borealis dances overhead, reflecting in the still black fjord water. Snow-dusted pine trees and mountains frame the scene. The cabin glow is the only warm color in an otherwise cold composition. 20-second long exposure feel. Ultra-realistic 4K astrophotography.

Keterangan dalam bahasa Mandarin: Cahaya aurora di fjord Norwegia pada pukul satu dini hari dan pondok yang hangat.

36. Matahari Terbenam di Sabana Afrika

Cinematic wide shot of a family of elephants crossing a golden savanna at sunset in Kenya. The sun is a huge orange disc on the horizon, silhouetting the herd. Long grass ripples in the warm wind. Dust kicked up by the herd diffuses the backlight into warm beams. 200mm telephoto compression. National Geographic editorial style. Ultra-realistic 4K wildlife photography.

Keterangan dalam bahasa Mandarin: Padang rumput Kenya saat matahari terbenam, siluet kawanan gajah + kompresi lensa tele 200mm.

37. Sungai Sakura di Kyoto

Serene wide landscape of the Philosopher's Path in Kyoto at peak cherry blossom season. Pink petals float on the narrow canal, with more drifting down from the trees above. Traditional wooden bridges arch over the water. Early morning mist softens the light into diffused pink. A solo figure in a dark kimono walks along the stone path for scale. 50mm lens, f/4, gentle pastel color grade. Ultra-realistic 4K.

Keterangan dalam bahasa Mandarin: Pada musim mekar bunga sakura di Jalan Filsafat Kyoto, kelopak bunga berwarna merah muda mengapung di permukaan kanal.

38. Cahaya Badai Dataran Tinggi Skotlandia

Dramatic landscape of the Scottish Highlands during a clearing thunderstorm. Dark churning clouds above a lone glen, with a single shaft of golden sunlight breaking through and lighting one patch of heather-covered hillside. Rainbow arc barely visible at the edge. Ancient standing stones in the foreground. Moody cinematic color grade — steel blue shadows, warm sunlit highlight. 24mm wide, f/11. Ultra-realistic 4K landscape photography.

Catatan dalam bahasa Mandarin: Saat badai petir di Dataran Tinggi Skotlandia mulai mereda, seberkas sinar matahari keemasan menembus awan gelap.


Perpustakaan Kata Kunci: Fantasi dan Gaya

Begitu Anda menyebutkan referensi seni tertentu dalam genre fantasi (seperti Ufotable, Arcane, Studio Trigger, atau ilustrasi Magic: The Gathering), petunjuk yang Anda berikan akan menjadi jauh lebih spesifik. Istilah umum seperti "fantasy art" hanya akan menghasilkan gambar fantasi yang juga umum.

Pahlawan Perang Fantasi Pedang Ajaib yang Bercahaya — Contoh Prompt Anime GPT Image 2
Pahlawan fantasi bergaya Ufotable. Menyebutkan nama studio tersebut jauh lebih bermakna daripada menggunakan dua puluh kata sifat sekalipun.

39. Ufotable: Anime Senki

Epic anime-inspired fantasy warrior princess with flowing silver-white hair that reaches her waist, wearing ornate golden battle armor that hugs her figure with intricate engravings. She holds a glowing magical sword aloft, emitting bright blue energy. Cherry blossom petals and magical sparkles swirl in a violent storm around her. Her expression is fierce and determined. Dynamic action pose mid-battle leap. Ultra-detailed anime with CGI-quality lighting — Ufotable production quality. Rich colors, dramatic volumetric lighting. 4K quality.

Keterangan dalam bahasa Mandarin: Anime kelas Ufotable, Pedang Ajaib Biru + Badai Sakura.

40. Penyihir Perempuan Elf Kegelapan

Dark fantasy dark elf sorceress with long flowing midnight-purple hair, pointed ears, and luminous violet eyes. She wears an elegant off-shoulder dark robe with intricate silver embroidery that reveals her collarbones and shoulders. Purple arcane energy spirals from her outstretched hands, illuminating her face from below. A vast star field and nebula visible in the background through a shattered stone archway. Semi-realistic fantasy illustration style with cinematic lighting. Ultra-detailed 4K.

Keterangan dalam bahasa Mandarin: Penyihir perempuan Elf Kegelapan, energi sihir ungu berputar-putar keluar dari tangannya.

41. Peri Hutan Ghibli

Studio Ghibli style painterly scene. A small forest spirit that looks like a glowing white fox with three tails walks through a mossy enchanted forest at dusk. Fireflies dance around it. Soft painterly brushstrokes, warm honey-gold light filtering through massive ancient trees. Hayao Miyazaki watercolor aesthetic. Ultra-detailed animation cel quality.

Keterangan dalam bahasa Mandarin: Seekor rubah putih berekor tiga bergaya Studio Ghibli sedang berjalan-jalan di hutan lumut saat senja.

42. Arcane: Pertempuran Dua Kota

Arcane Netflix animated series style illustration. A young woman with blue-tipped braided hair and steampunk goggles leans against a graffitied alley wall in the undercity of Piltover. Neon magical rune-signs glow behind her. Textured painterly brushstrokes visible, 2D illustration with 3D depth, saturated purple and teal color story. Fortiche animation studio aesthetic. Ultra-detailed 4K.

Keterangan dalam bahasa Mandarin: Gadis di gang-gang kota bawah dalam gaya Arcane Fortiche.

43. Naga Magic: The Gathering

Fantasy illustration in the style of a Magic The Gathering card. A colossal red dragon emerges from molten lava in an underground cavern, wings half-spread, mouth roaring with fire breath forming. A tiny knight in silver armor stands at the cavern's edge for scale, raising a shield. Dramatic low-angle hero composition. Rich oil-painting texture, Greg Rutkowski influence. Ultra-detailed 4K fantasy art.

Keterangan dalam bahasa Mandarin: Naga Merah Lava dan Ksatria Kecil bergaya ilustrasi Magic: The Gathering.

44. Cyber Knight

Cyberpunk fantasy fusion. A female samurai with a chrome katana stands on the rain-slicked rooftop of a neo-Tokyo megacorp tower at night. She wears a fusion of traditional kimono and carbon-fiber combat armor. Holographic cherry blossoms drift around her. Neon reflections on the wet rooftop, flying ad-drones in the background. Illustrated in the style of Katsuhiro Otomo meets modern 3D concept art. Ultra-detailed 4K.

Keterangan dalam bahasa Mandarin: Samurai wanita di atas atap Cyber Tokyo + bunga sakura hologram.

45. Putri Duyung di Bawah Air

Ethereal underwater fantasy. A graceful mermaid with iridescent teal and violet scales swims through a coral reef illuminated by shafts of sunlight piercing the water surface above. Her long turquoise hair flows weightlessly. Bubbles trail from her fingertips. School of small silver fish swim past. Dreamlike painterly quality, Lisa Frank meets National Geographic. Ultra-detailed 4K fantasy art.

Keterangan dalam bahasa Mandarin: Putri duyung pelangi di terumbu karang, sinar cahaya menembus permukaan air.

46. Kapten Kapal Udara Steampunk

Illustrated steampunk fantasy portrait. A young female airship captain in a brass-buttoned red military coat, goggles pushed up on her forehead, stands at the wheel of a wooden airship. Visible brass gears and copper pipes. Behind her, clouds and other distant airships. Warm golden hour lighting. Illustration style inspired by Nausicaa and Howl's Moving Castle. Ultra-detailed 4K.

Keterangan dalam bahasa Mandarin: Kapten kapal udara wanita bergaya Hayao Miyazaki dan roda gigi kuningan.


Iterasi Multi-Gaya: Subjek yang Sama, Dunia yang Berbeda

Alur kerja yang sering diabaikan di GPT Image 2: mengunci subjek dan hanya mengubah parameter gaya. Anda akan melihat dengan jelas apa yang dilakukan setiap gaya terhadap wajah, pakaian, dan pose yang sama—sehingga Anda tidak perlu lagi menebak-nebak saat memilih gaya berikutnya.

Perbandingan Gaya Empat Kotak: Realistis, Anime, Lukisan Minyak, Cyberpunk — Prompt GPT Image 2
Empat gaya dari subjek yang sama. Iterasi ini sangat cocok untuk membuat moodboard sebelum menyerahkan pilihan gaya kepada klien.

Kata kunci dasar — Subjek tetap sama persis dalam keempat hasil pembangkitan:

A beautiful young woman with shoulder-length brown hair stands in a sunlit garden, wearing a simple white sundress, one hand lightly touching a rose bush. Soft golden afternoon light. Three-quarter body framing, slightly tilted head, warm smile.

Keterangan dalam bahasa Mandarin: Seorang gadis bergaun pendek yang menyentuh mawar di Taman Sinar Matahari, dalam cahaya sore yang keemasan.

Kemudian cukup ganti slot gaya, jalankan masing-masing sekali:

47. Fotografi Realistis

[Base] — Hyperreal fashion photography aesthetic. 85mm lens at f/1.8, soft natural light, editorial sharpness. Ultra-realistic 4K.

48. Anime Jepang

[Base] — Japanese anime style with cel shading, bold line art, vibrant saturated colors, large expressive eyes. Kyoto Animation production quality. Ultra-detailed.

49. Lukisan Minyak Klasik

[Base] — Classical oil painting style with visible thick brushstrokes, warm Renaissance lighting, chiaroscuro shadow, Vermeer-like color palette. Museum-quality.

50. Cyberpunk

[Base] — Neon-drenched cyberpunk futurism. Holographic overlays, circuit-pattern light tattoos on skin, magenta and cyan rim lighting. Ghost in the Shell art direction. Ultra-detailed.

Kami menjalankan rangkaian ini di akun uji coba internal; gambar pertama memakan waktu sekitar 18 detik, sedangkan pergantian gaya pada gambar-gambar berikutnya memakan waktu yang hampir sama. Secara keseluruhan, dalam waktu kurang dari dua menit dan dengan 48 kredit, kami mendapatkan satu set moodboard gaya yang lengkap. Jika dimasukkan ke dalam proposal klien, ini setara dengan memadatkan proses pencarian materi yang semula memakan waktu setengah hari menjadi sesingkat waktu minum secangkir kopi.


Contoh Kegagalan Umum dan Cara Mengatasinya

Bagian Jujur: GPT Image 2 memang sangat berguna, tetapi ini bukanlah sihir. Berikut adalah beberapa jenis kegagalan yang paling sering kami temui, beserta templat perbaikan yang sesuai. Gunakan bagian ini sebagai daftar periksa untuk pemecahan masalah—periksa secara berurutan saat hasil gambar Anda tidak sesuai harapan; sebagian besar masalah dapat diselesaikan setelah revisi pertama.

Kegagalan 1: Hasil yang biasa-biasa saja

Before:

A beautiful woman in a city.

After:

A 28-year-old woman with auburn hair pulled into a low ponytail, wearing a camel trench coat, crossing a Manhattan crosswalk at 6pm on a rainy Thursday. Yellow taxis blur past in motion-blurred streaks. 50mm lens, f/2, cinematic grain. Ultra-realistic 4K.

Kata kunci pertama tidak memberikan petunjuk apa pun kepada model. Solusinya selalu adalah kata benda yang spesifik dan lokasi yang spesifik.

Kesalahan 2: Jumlah jari salah

GPT Image 2 sudah jauh lebih baik daripada model difusi generasi pertama dalam hal penggambaran tangan, tetapi close-up tangan masih bisa menghasilkan hasil yang buruk. Ada dua cara yang dapat diandalkan untuk menghindarinya:

  • Jangan jadikan tangan sebagai fokus utama, potong saja: "framing is shoulders up only" (hanya ambil bagian dari bahu ke atas).
  • Berikan benda yang dipegang di tangan: "tangan yang dengan lembut memegang cangkir kopi keramik". Dengan adanya benda yang membatasi pose, posisi jari-jari pun menjadi lebih stabil.

Kesalahan 3: Teks pada gambar muncul sebagai karakter acak

Model bukanlah perangkat lunak tata letak. Jika ingin memasukkan logo, papan nama, atau teks yang dapat dibaca pada poster ke dalam gambar—pastikan teksnya sangat singkat (misalnya, "a sign reads OPEN"), atau tambahkan kalimat berikut langsung dalam petunjuk: "tidak ada teks, huruf, atau kata-kata di mana pun dalam gambar", lalu atur tata letaknya secara terpisah di Figma/Photoshop.

Kesalahan 4: Arah cahaya diabaikan

Before:

A portrait of a woman with dramatic lighting.

After:

A portrait of a woman lit by a single hard spotlight from 45 degrees camera-left, with deep black shadow filling the right side of her face. Rembrandt lighting with a small triangle of light on the shadowed cheek.

"Pencahayaan dramatis" tidak memberikan petunjuk apa pun. Petunjuk yang sesungguhnya adalah penjelasan mengenai arah, tingkat kecerahan, dan jangkauan bayangan.

Kesalahan 5: Subjek muncul di latar yang salah

Jika model terus-menerus menempatkan karakter di studio foto umum alih-alih perpustakaan—pindahkan adegan tersebut ke bagian awal prompt, dan tulislah dengan lebih spesifik:

In a candle-lit 17th-century English library with floor-to-ceiling oak shelves, leather-bound books, and a stone fireplace, a woman in…

Menempatkan latar di depan subjek sama saja dengan menentukan komposisi keseluruhan sebelum memperkenalkan tokohnya.

Kesalahan 6: Kelebihan kata kunci

Jika jumlah kata melebihi sekitar 1.200, pengaruh setiap kata sifat mulai berkurang. Jika kata kunci Anda berupa daftar panjang berisi 40 label gaya, model akan "mengambil rata-rata". Pertahankan satu gaya utama sebagai acuan (misalnya "film noir"), dan anggap yang lain sebagai pelengkap.


Menggunakan 20.000 karakter: Prompt panjang yang terstruktur

Salah satu keunggulan GPT Image 2 yang sering terabaikan adalah batas panjang prompt hingga 20.000 karakter. Sebagian besar produk pesaing hanya mampu menangani sekitar 1.000–2.000 karakter. Meskipun hal ini tidak diperlukan untuk potret wajah, prompt panjang yang terstruktur sangat berguna untuk adegan kompleks dengan banyak karakter, brief gambar konsep, atau rangkaian gambar yang menekankan konsistensi merek.

Template yang sering kami gunakan dalam brief produksi:

# ADEGAN
[Adegan: Lokasi, waktu, cuaca, periode sejarah, 2–3 kalimat]

# KARAKTER
- Karakter A: [Penampilan, pakaian, pose saat ini, ekspresi wajah]
- Karakter B: [Demikian pula]
- Pemain figuran latar belakang: [Deskripsi singkat]

# KOMPOSISI
[Komposisi: Sudut lebar/Tengah/Close-up; Sudut pengambilan gambar; Lensa; Kedalaman bidang; Posisi setiap karakter dalam bingkai — Aturan sepertiga/Rasio emas/Pusat]

# PENCAHAYAAN
[Sumber cahaya, arah, intensitas, suhu warna, perilaku bayangan]

# WARNA
[Jelaskan palet warna menggunakan 3–4 istilah warna. Arah palet warna — hangat/dingin/palet terpisah]

# STYLE
[Referensi gaya utama. Misalnya, "Gaya sinematografi Roger Deakins dalam film *Blade Runner 2049*"]

# TEKNIS
[Modifikasi resolusi, butiran film, format gambar, label kualitas gambar. Jaga agar tetap singkat]

# KECUALIAN
[Hal-hal yang harus dihindari: "Tanpa teks, tanpa logo, tanpa tanda air, tanpa anggota tubuh tambahan"]

Contoh — Prompt terstruktur lengkap (sekitar 500 kata) untuk satu gambar utama iklan:

# SCENE
A restored 1930s Art Deco ballroom on a rainy Tuesday evening in Paris, set during a private jazz performance. Tall arched windows on the left show wet boulevards and soft yellow streetlamp glow. Interior is lit warm and amber.

# CHARACTERS
- Lead: A striking 32-year-old woman with dark auburn hair in a low chignon, wearing a deep emerald-green silk bias-cut gown with a low back. She stands near a grand piano, one hand resting on its polished black lid, gazing thoughtfully toward the windows. Faint melancholy in her expression.
- Pianist: A middle-aged man in a black tuxedo, seated at the piano mid-performance, profile view, fingers on keys. He is a secondary figure — should not pull focus from the lead.
- Background: Three or four well-dressed patrons at candlelit round tables in soft bokeh, unidentifiable faces.

# COMPOSITION
Medium-wide shot. Lead character is on the right third of the frame, piano extending diagonally across the center toward the left. Rule of thirds. 50mm lens, f/2.2, shallow depth of field — lead and piano sharp, background patrons and windows softly blurred. Eye-level camera height.

# LIGHTING
Warm tungsten chandelier overhead providing ambient glow on the room. Key light on the lead is a single practical wall sconce camera-right at 45 degrees, modeling her face in gentle Rembrandt pattern. Rim from the windows behind her (cool blue rainy light) separates her hair and shoulder edge from the warm interior. Overall contrast: high but soft.

# COLOR
Deep emerald green (dress) and warm amber (interior) as hero colors, with cool blue window light as counter-accent. Warm gold dominant, with selective teal shadow detail. Film-look color grade reminiscent of early Wong Kar-wai.

# STYLE
Cinematic still in the visual language of In the Mood for Love meets a modern luxury cognac commercial. Anamorphic lens quality (slight horizontal flare on the candles). Painterly softness, 35mm film grain.

# TECHNICAL
Ultra-realistic 4K, 16:9 aspect, cinematic frame.

# EXCLUSIONS
No text, no signage, no logos, no watermarks, no visible phones or modern electronics, no extra limbs, no warped fingers on the pianist.

Struktur berjenjang ini memiliki dua manfaat: pertama, memastikan Anda sendiri tidak melewatkan pengisian kolom mana pun; kedua, memberikan titik masuk analisis yang terstruktur pada model, bukan sekadar teks prosa sepanjang 500 kata. Untuk seluruh seri ini, cukup dengan mengubah dua bagian, yaitu CHARACTERS dan SCENE, Anda dapat menghasilkan berbagai adegan dari iklan yang sama secara massal.

Saran praktis: Ketika sebuah gambar sudah 80% benar, tetapi ada satu elemen yang salah (misalnya warna pakaian tokoh utama yang salah), jangan menulis ulang seluruh prompt. Salin prompt yang berhasil, ubah hanya bagian yang bersangkutan, lalu jalankan kembali. Catatan iterasi internal kami menunjukkan: prompt terstruktur rata-rata membutuhkan 2,8 kali percobaan untuk menghasilkan satu frame berkualitas gambar utama; sedangkan prompt prosa bebas seringkali membutuhkan lebih dari 6 kali percobaan. Dengan perhitungan 12 kredit per gambar, ini berarti selisih biaya antara $2 dan $5 per gambar utama.

Ingin menyerahkan alur kerja kata kunci terstruktur kepada rekan kerja? Minta mereka membaca Panduan Memulai terlebih dahulu, lalu kembali ke artikel ini.


Pertanyaan yang Sering Diajukan

Apa yang paling penting dalam prompt GPT Image 2?

Cahaya dan lensa—urutan yang tepat adalah seperti ini. Subjek dan latar belakang yang digambarkan agak kabur masih bisa diperbaiki, tetapi jika arah cahaya dan pemilihan lensa tidak jelas, hasilnya akan selalu terlihat seperti foto stok. Jika Anda hanya punya waktu untuk menyempurnakan dua aspek ini, fokuslah pada keduanya. Jelaskan dengan jelas "dari arah mana cahaya datang, seberapa keras intensitasnya, dan di sisi mana bayangan jatuh", lalu jelaskan juga "lensa berukuran berapa milimeter, bukaan diafragma berapa, serta jarak fokusnya", dan dasar dari sebuah foto pun sudah kokoh.

Seberapa panjang prompt GPT Image 2 sebaiknya ditulis?

Untuk potret dan pemandangan sederhana, 80–150 kata adalah rentang ideal. Untuk foto sudut lebar bergaya sinematik dengan nuansa era dan gaya tertentu, 150–250 kata. Untuk pemandangan dengan banyak orang atau brief iklan, gunakan templat terstruktur dengan 400–800 kata. Batas maksimum 20.000 karakter disediakan untuk kasus-kasus ekstrem—dalam penggunaan sehari-hari, jumlah kata jarang melebihi 500 kata.

Apakah boleh mencantumkan nama seniman asli dalam prompt?

Anda dapat merujuk pada suatu gaya atau era—seperti "film noir", "giallo tahun 1970-an", atau "gaya lukisan Studio Ghibli"—dan model tersebut akan mengenali bahasa visual tersebut. Namun, menggunakan nama seniman yang masih hidup secara langsung sebagai label gaya merupakan hal yang etisnya abu-abu, dan semakin sering disaring oleh model. Praktik yang lebih baik adalah mendeskripsikan gaya, media, dan era, bukan menyebut nama individu.

Mengapa hasil yang muncul setiap kali berbeda meskipun menggunakan prompt yang sama?

Model difusi pada dasarnya bersifat acak—model ini memulai dari gambar berisik dan menghilangkannya hingga menghasilkan gambar yang jelas. Jika prompt yang sama dijalankan dua kali, hasilnya pasti akan mirip namun berbeda. Ini adalah fitur, bukan bug, dan juga merupakan sumber "keragaman". Untuk mereproduksi hasil tersebut, sebagian besar sistem generatif mendukung parameter seed. Untuk latar belakang teknis, silakan merujuk ke blog OpenAI tentang generasi gambar.

Apakah panjang kata kunci memengaruhi harga?

Tidak ada pengaruhnya. GPT Image 2 menggunakan sistem harga tetap: 12 kredit per gambar, baik Anda menulis 20 kata maupun 2.000 kata. Satu-satunya faktor yang memengaruhi biaya adalah jumlah gambar yang dihasilkan.

Berapa kali sebaiknya kita mencoba suatu konsep sebelum menyerah?

Aturan praktis: Jalankan prompt yang sama sebanyak 3 kali untuk melihat variasi alami hasilnya. Jika masih belum tepat, ubah hanya satu slot, jangan mulai dari awal lagi. Sebagian besar waktu, yang perlu diperbaiki hanyalah pencahayaan atau sudut pengambilan gambar. Jika setelah 8 kali percobaan belum ada kemajuan, berarti ada masalah pada struktur—kembali ke rumus delapan slot untuk memeriksa berapa banyak yang sudah Anda isi. Kami juga memiliki kebiasaan internal: mencatat setiap prompt yang dihasilkan dan benih yang sesuai dalam sebuah tabel, sehingga saat mengevaluasi kembali, mudah terlihat kata mana yang benar-benar efektif.

Apakah gambar yang dihasilkan oleh GPT Image 2 dapat digunakan untuk tujuan komersial?

Tentu saja. Sesuai dengan ketentuan standar produk, gambar yang Anda buat merupakan milik Anda dan dapat digunakan untuk tujuan komersial. Ketentuan lisensi yang berlaku dapat dilihat di bagian kaki halaman situs. Untuk penggunaan dalam konteks berisiko tinggi (seperti iklan merek atau sampul publikasi), disarankan untuk berkonsultasi dengan pengacara. Selain itu, jangan menganggap nama orang atau merek dagang yang disebutkan dalam prompt sebagai jaminan kebebasan dari tuntutan hukum—hal tersebut berkaitan dengan hak atas citra dan hak merek dagang, yang tidak diatur dalam ketentuan produk AI.

Apa perbedaan antara prompt text-to-image dan image-to-image?

text-to-image dimulai dari gambar acak, dan prompt adalah satu-satunya panduan. image-to-image dimulai dari gambar referensi yang Anda unggah, dan prompt hanya berfungsi untuk memodifikasinya. Prompt untuk image-to-image sebaiknya lebih singkat, dengan fokus pada "apa yang akan diubah" ("ubah menjadi gaya lukisan minyak, pertahankan pose dan pakaian subjek"), bukan mendeskripsikan kembali seluruh adegan—gambar referensi sudah menyediakan sebagian besar elemennya.


Sudah siap untuk mulai bekerja?

Saat ini Anda memiliki lebih dari 50 prompt, satu set rumus delapan slot, daftar perbaikan kasus kegagalan, serta templat prompt panjang yang terstruktur. Langkah selanjutnya adalah membuka alat tersebut dan benar-benar mencobanya. Pilih salah satu prompt secara acak, tempelkan, lalu lihat seberapa jauh hasilnya berbeda dari gambaran yang ada di benak Anda—kemudian perbaiki hanya slot yang melenceng, lalu jalankan lagi. Dalam dua atau tiga putaran, Anda akan dapat menghasilkan gambar yang "siap diserahkan" secara konsisten.

Simpan artikel ini di bookmark browser Anda, atau tempelkan rumus delapan elemen ini di tepi monitor kedua Anda. Peningkatan yang sesungguhnya bukanlah sekadar menghafal kata kunci ini, melainkan menjadikan rumus tersebut sebagai memori otot—sehingga nantinya, setiap kali Anda melihat gambar referensi, Anda akan secara alami menganalisis elemen-elemen seperti subjek, pencahayaan, sudut pengambilan gambar, dan gaya.

Mulailah menggunakan GPT Image 2 secara gratis →

Baca selengkapnya:

Punya pertanyaan tentang salah satu kata kunci? Tinggalkan pesan untuk kami di situs ini—kami akan membaca setiap pesan, dan pertanyaan yang paling sering diajukan biasanya akan dimasukkan ke dalam panduan edisi berikutnya. Untuk latar belakang teoritisnya, Anda bisa membacanya bersamaan dengan artikel Wikipedia tentang model generasi gambar dari teks, yang memakan waktu sekitar 10 menit. Ingin meningkatkan kemampuan lebih lanjut? Langkah berikutnya adalah membaca panduan penggunaan dari seri yang sama, untuk meningkatkan alur kerja dari "membuat satu gambar yang bagus" menjadi "menghasilkan serangkaian gambar dengan gaya yang konsisten secara stabil".

Tim GPT Image 2

Tim GPT Image 2

Pembuatan Gambar & Video Berbasis AI