คู่มือคำแนะนำ GPT Image 2: แม่แบบที่ใช้ได้จริงกว่า 50 แบบ (2026)

Apr 22, 2026

TL;DR

คำแนะนำ GPT Image 2 ที่ดีไม่ใช่แค่ประโยคเดียว แต่เป็นการตัดสินใจหลายอย่าง: หัวข้อ, ฉาก, สไตล์, มุมกล้อง, แสง และอารมณ์ คู่มือนี้มอบให้คุณมากกว่า 50 แบบคำแนะนำพร้อมคัดลอก ครอบคลุม 5 หมวดหมู่หลัก—ภาพยนตร์, ภาพบุคคล, การกระทำ, ธรรมชาติ และแฟนตาซี—พร้อมรายการตรวจสอบเพื่อแก้ไขผลลัพธ์ที่ไม่สำเร็จ และกระบวนการทำงานแบบวนซ้ำที่มีประสิทธิภาพ ภาพตัวอย่างทั้งหมดในบทความนี้ถูกสร้างขึ้นโดยใช้โมเดล KIE gpt-image-2-text-to-image เดียวกัน โดยมีค่าใช้จ่าย 12 เครดิตต่อภาพ พร้อมขีดจำกัดข้อความ 20,000 ตัวอักษรต่อคำสั่ง ทดลองใช้ GPT Image 2 ฟรี →


โครงสร้างของคำสั่งที่ดี

คนส่วนใหญ่เริ่มต้นด้วยการเขียนลงว่า 'สิ่งที่ฉันต้องการ' แต่ผู้ที่สร้างภาพที่ยอดเยี่ยมจริงๆ จะเขียนว่า 'สิ่งที่เลนส์มองเห็น' นั่นคือความลับทั้งหมด

หลังจากทำการทดสอบหลายพันครั้งบน KIE gpt-image-2-text-to-image API เราได้พัฒนา สูตรแปดช่อง ที่ครอบคลุมเกือบทุกสถานการณ์ การกรอกเพียงหกช่องจากแปดช่องก็ให้ผลลัพธ์ที่สูงกว่าค่าเฉลี่ยแล้ว ในขณะที่การกรอกครบทั้งแปดช่องจะให้ผลลัพธ์ที่เทียบเท่ากับภาพระดับเชิงพาณิชย์

สูตร:

[หัวข้อ] + [การกระทำ/ท่าทาง] + [ฉาก] + [สไตล์/อ้างอิง] + [การถ่ายภาพ/การจัดวาง] + [แสง] + [อารมณ์/โทน] + [การปรับปรุงภาพ]

แต่ละช่องช่วยกำจัดปัญหาที่โมเดลจะต้อง 'เดา' อย่างมีประสิทธิภาพ:

  • หัวข้อ—ใครหรืออะไรอยู่ในกรอบ 'บรรณารักษ์ผมแดง' ดีกว่า 'ผู้หญิง' ถึงสิบเท่า
  • การกระทำ/ท่าทาง—สิ่งที่กำลังเกิดขึ้นในขณะนี้ กริยาเป็นตัวกำหนดองค์ประกอบ
  • ฉาก—โลกโดยรอบ ระบุประเทศ ยุคสมัย และช่วงเวลาของวัน
  • สไตล์/อ้างอิง — "ฟิล์มนัวร์", "แอนิเมชันคุณภาพระดับ Ufotable", "องค์ประกอบสมมาตรแบบเวส แอนเดอร์สัน", "สไตล์โฆษณา Fenty Beauty" อ้างอิงภาษาภาพที่มีอยู่แล้วแทนที่จะใช้คำคุณศัพท์ที่ไร้ความหมาย
  • ช็อต/องค์ประกอบ — " "ภาพระยะใกล้สุดขีด", "ภาพมุมต่ำกว้าง", "เลนส์พอร์ตเทรต 85 มม., f/1.4", "ภาพกว้างแบบอนามอร์ฟิก" นี่คือกุญแจสำคัญในการเปลี่ยนภาพถ่ายธรรมดาให้กลายเป็นเฟรมภาพยนตร์
  • การจัดแสง——"แสงขอบชั่วโมงทอง", "แสงเรมบรันต์เดี่ยว", "แสงสะท้อนนีออนบนพื้นเปียก" แสงสว่างคิดเป็นประมาณ 60% ของความรู้สึกของภาพ
  • อารมณ์/โทน——"การปะทะกันของสีน้ำเงินเย็นและสีส้มอบอุ่น", "สีอำพันอุ่นที่ลึกขึ้นในเงามืด", "โทนเศร้าหมองที่ลดความอิ่มตัว".
  • การปรับปรุงภาพ——"ความสมจริงระดับ 4K", "เกรนฟิล์ม", "แฟชั่นสเปรด". ให้กระชับ; งานหนักได้ทำไปแล้ว.

พื้นฐานเทียบกับที่ได้รับการปรับปรุง: การเปรียบเทียบสองรอบของบุคคลเดียวกัน

ผลลัพธ์ที่สร้างขึ้นโดยใช้คำสั่งพื้นฐานของ GPT-Image 2; องค์ประกอบค่อนข้างเรียบง่ายและแสงสว่างสม่ำเสมอ
ข้อความเริ่มต้น: "ผู้หญิงคนหนึ่งยืนอยู่ในห้อง" วัตถุไม่ชัดเจน แสงสว่างเรียบ ไม่มีองค์ประกอบ—โมเดลไม่สามารถหาจุดอ้างอิงได้เลย

ข้อความเริ่มต้นสำหรับภาพด้านบนคือ:

A woman standing in a room.

ตอนนี้ มาเขียน 'แนวคิดเดียวกัน' ใหม่โดยใช้สูตรแปดช่อง:

A breathtaking young woman with flowing auburn hair stands in a luxurious Art Deco penthouse at golden hour. She wears a champagne-colored satin slip dress that catches the warm light. Floor-to-ceiling windows behind her show a panoramic city sunset. Dramatic side lighting creates deep shadows and golden highlights on her face and bare arms. The composition follows the rule of thirds. Cinematic depth of field with gorgeous city bokeh. Fashion editorial quality. Ultra-realistic 4K.

คำบรรยายภาษาจีน: ในเพนต์เฮาส์สไตล์อาร์ตเดโค หญิงสาวผมยาวยืนอยู่หน้าหน้าต่างสูงจากพื้นจรดเพดาน ใบหน้าและแขนของเธอเป็นเงาตัดกับแสงยามโพล้เพล้สีทอง

ผลลัพธ์การสร้างภาพโดยใช้คำสั่ง GPT-Image 2 ที่ปรับแต่งด้วยสูตรแปดช่องเต็ม
คำแนะนำที่ได้รับการปรับให้เหมาะสมโดยใช้สูตร 8 ช่อง แนวคิดหลักยังคงเหมือนเดิม แต่ความคลุมเครือทั้งหมดได้ถูกกำจัดออกไปแล้ว

หมายเหตุ: เวอร์ชันที่ได้รับการปรับให้เหมาะสมไม่ได้เป็นเพียงการเพิ่มคำคุณศัพท์เข้าไปเท่านั้น แต่ มันทำให้โมเดลมีสิ่งที่ต้องคาดเดาน้อยลง GPT Image 2 ได้รับการสนับสนุนโดยโมเดลดิสฟิวชันที่นำโดยทรานส์ฟอร์เมอร์ (ดูคำอธิบายของ Wikipedia เกี่ยวกับโมเดลดิสฟิวชัน](https://en.wikipedia.org/wiki/Diffusion_model)) สำหรับทุกรายละเอียดที่คุณไม่ได้เขียน โมเดลจะเติมช่องว่างโดยใช้ 'ค่าเฉลี่ยก่อนหน้า' ของมัน หากคุณไม่ได้ระบุ "golden hour" ระบบจะตั้งค่าเริ่มต้นเป็นแสงของบ่ายวันอังคารที่มีเมฆครึ้ม เวลา 14.00 น.

สุดท้ายนี้ มีข้อเท็จจริงที่ไม่ค่อยมีใครรู้: ความยาวของคำสั่งสูงสุดสำหรับ GPT Image 2 คือ 20,000 ตัวอักษร—ประมาณ 3,000 คำภาษาอังกฤษ คุณแทบจะไม่จำเป็นต้องใช้ขีดจำกัดนี้ในสถานการณ์ทั่วไป แต่สำหรับฉากที่ซับซ้อนซึ่งมีผู้คนหลายคนหรือแผนภาพแนวคิดที่ละเอียด ข้อจำกัดนี้หมายความว่าคุณสามารถตัดสินใจเกี่ยวกับองค์ประกอบของคุณได้อย่างแม่นยำมาก ส่วนที่ 11 จะแสดงวิธีการใช้คำสั่งยาว


ไลบรารีคำสั่ง: ฉากภาพยนตร์

ฉากภาพยนตร์เป็นหมวดหมู่ที่ง่ายที่สุดในการทำให้ถูกต้อง เนื่องจากประวัติศาสตร์ภาพยนตร์หนึ่งศตวรรษได้สร้างคลังคำศัพท์ทางภาพที่อุดมสมบูรณ์ไว้แล้ว เพียงแค่ระบุประเภท ยุคสมัย และมุมกล้อง โมเดลก็จะสร้างเฟรมที่ดีให้คุณได้

ภาพสไตล์ฟิล์มนัวร์ที่สร้างขึ้นโดยใช้คำสั่ง GPT-2: ผู้หญิงในชุดสีแดงในตรอกฮ่องกงหลังฝนตก
ตรอกหลังในฮ่องกงในสไตล์ของภาพยนตร์คลื่นลูกใหม่ของจีน การผสมผสานของสีสันสดใสและภาพกว้างเต็มจอถ่ายทอดบรรยากาศได้อย่างชัดเจน

1. ถนนหลังบ้านฮ่องกงใหม่สีดำ

Film noir cinematic shot. A dangerously beautiful femme fatale in a curve-hugging red silk dress with a thigh-high slit, walking through a rain-soaked Hong Kong back alley at night. Neon signs in Chinese characters reflect red and blue on the wet cobblestones. She carries a black umbrella over one shoulder, her red-painted lips the only warm color against the cold teal lighting. Smoke wisps from a nearby vent. Anamorphic lens, shallow depth of field, cinematic grain. Ultra-realistic 4K noir film frame.

คำบรรยายภาษาจีน: ในคืนที่ฝนตกในตรอกหลังของฮ่องกง หญิงสาวในชุดสีแดงเดินผ่านถนนที่ปูด้วยหินกรวดซึ่งส่องแสงจากไฟนีออน พร้อมถือร่มไว้ในมือ

2. เรมบรันด์ แจ๊ส บาร์

Moody jazz bar interior. A mysterious woman in a sheer black lace dress sits on a velvet barstool, one leg crossed showing stiletto heels. Cigarette smoke curls around her silhouette. Warm amber spotlight from above illuminates her face and exposed collarbones while the rest fades into deep shadow. A saxophone player is a blurred silhouette in the background. Film noir meets modern luxury aesthetic. Dramatic Rembrandt lighting, 35mm film look. Ultra-realistic 4K.

คำบรรยายภาษาจีน: ผู้หญิงในชุดลูกไม้สีดำในบาร์แจ๊ส; แสงสปอตไลท์เดี่ยวรวมกับควันสร้างเอฟเฟกต์ดราม่าแบบเรมบรันด์

3. หลังคา Blade Runner

Cyberpunk cinematic wide shot. A lone detective in a wet black trench coat stands on a neon-drenched Tokyo rooftop at 3am. Giant holographic advertisements of a geisha float across the skyline behind him, casting shifting pink and cyan light on his face. Light rain catches the glow. Flying cars streak past as horizontal light trails. Shot on anamorphic lens, 2.39:1 aspect, shallow depth of field. Blade Runner 2049 color grade — teal shadows, orange highlights. Ultra-realistic 4K cinematic frame.

คำอธิบายประกอบภาษาจีน: บนดาดฟ้าในโตเกียวไซเบอร์พังค์ นักสืบถูกห่อหุ้มด้วยแสงสีฟ้าและชมพูที่ฉายจากโฆษณาโฮโลแกรมของเกอิชา

4. ล็อบบี้สมมาตรของเวส แอนเดอร์สัน

Wes Anderson style cinematic composition. A 1960s hotel concierge in a burgundy uniform stands dead-center in a pastel-pink Art Deco lobby, flanked by perfectly symmetrical potted palms and brass sconces. Flat front-on framing, everything on center axis. Soft fluorescent overhead lighting. Pastel pink and mint green color palette. 35mm film look. Ultra-detailed 4K.

คำบรรยายภาษาจีน: ล็อบบี้โรงแรมสไตล์อาร์ตเดโคสีชมพู มีองค์ประกอบสมมาตร; พนักงานต้อนรับยืนอยู่ตรงกลางของกรอบภาพ

5. ภาพยนตร์อาชญากรรมเกาหลีที่มีฉากเผชิญหน้าในห้องครัว

Cinematic still from a modern Korean crime thriller. Two men face each other across a small Seoul apartment kitchen at 2am, both holding knives but frozen in a tense moment. Single fluorescent tube overhead casts hard green-tinted light and harsh shadows. Steam rises from an abandoned pot on the stove. Tight composition, 40mm lens, handheld feel. Bong Joon-ho style. Ultra-realistic 4K.

คำอธิบายภาษาจีน: การเผชิญหน้าระหว่างสองคนในครัวที่กรุงโซลตอนตีสอง ภายใต้แสงไฟฟลูออเรสเซนต์สีเขียวจัดและกล้องมือถือ

ผู้หญิงอาบแสงเรมบรันต์ในบาร์แจ๊ส – ภาพที่สร้างขึ้นโดยใช้คำสั่ง GPT Image 2
การใช้ไฟสปอตไลท์เพียงดวงเดียวร่วมกับควันแบบวอลลูเมตริกเป็นทางลัดที่แทบจะไร้ที่ติในการสร้างลุคแบบภาพยนตร์

6. มหาภารตะแห่งทะเลทรายวิลเนิฟ

Epic cinematic wide shot in Denis Villeneuve style. A lone hooded figure in flowing desert robes walks across a vast orange sand dune at sunset. The sun is enormous on the horizon, casting elongated shadows. Scale is extreme — the figure is tiny, the landscape overwhelming. Dust kicks up in the wind. Warm amber palette with deep violet shadows. Shot on 65mm, ultra-wide aspect. Ultra-realistic 4K cinematic quality.

บทวิจารณ์: ภาพมุมกว้างของทะเลทรายในสไตล์วิลเนิฟ ที่มีตัวละครปรากฏตัวเล็กจิ๋วเมื่อเทียบกับทิวทัศน์ที่กว้างใหญ่ไพศาล

7. คาเฟ่คลื่นลูกใหม่ฝรั่งเศส

Black and white French New Wave cinematic still. A young woman in a striped Breton shirt and dark bob haircut smokes at a Paris cafe table in 1962. She looks off-camera with soft intensity. Natural window light, high contrast, slightly overexposed highlights. Film grain visible. Godard aesthetic. 35mm monochrome, 50mm lens. Ultra-detailed.

คำบรรยายภาษาจีน: ผู้หญิงผมสั้นในคาเฟ่ที่ปารีส ปี 1962; ขาวดำ ในสไตล์ของภาพยนตร์ฝรั่งเศสยุคใหม่

8. ทางเดินสยองขวัญสไตล์ Giallo อิตาลี

Cinematic horror frame in the style of a 1970s Italian giallo. A woman in a white nightgown stands at the end of a long Victorian hallway lit only by flickering red lamplight. Her back is turned. Shadow stretches toward the camera. Wallpaper is blood-red damask. Shallow depth of field, 28mm lens slightly distorted. Grainy film look. Deep red and black color story. Ultra-detailed 4K.

คำบรรยายภาษาจีน: สไตล์จิallo อิตาลียุค 1970; เงาของหญิงสาวในชุดขาวที่ปลายทางเดินสีแดงเลือด

9. ค่ำคืนนีออนในไมอามี

1980s Miami Vice cinematic shot. A woman in a white linen blazer drives a red convertible at night through downtown Miami. Palm trees and neon motel signs blur past. She looks at the camera with sunglasses reflecting the pink and turquoise glow of the city. Lens flare, soft film grain. Teal and magenta color grade. Ultra-realistic 4K.

คำบรรยาย: ภาพยามค่ำคืนของไมอามีในช่วงทศวรรษ 1980: รถเปิดประทุนสีแดงสะท้อนแสงไฟนีออนผ่านแว่นกันแดด

10. การดัดแปลงเป็นภาพยนตร์คนแสดงของสตูดิโอจิบลิ

Cinematic still styled as a live-action Studio Ghibli adaptation. A young woman in a simple blue linen dress stands in a vast green hillside field, wind blowing her hair and skirt. Fluffy white clouds race overhead. Soft golden hour light. Warm, painterly color grading with gentle film grain. Wide lens, low-angle composition making her heroic against the sky. Ultra-detailed 4K.

บทวิจารณ์: ภาพถ่ายแบบไลฟ์แอ็กชันของเนินเขาในสไตล์สตูดิโอจิบลิ โดยใช้มุมกล้องต่ำเพื่อเน้นเส้นขอบฟ้า


ไลบรารีคำสั่ง: ภาพเหมือนและความงาม

ความสำเร็จหรือความล้มเหลวของภาพถ่ายบุคคลขึ้นอยู่กับเพียงสามสิ่ง: เลนส์, ทิศทางของแสง, และพื้นผิวของผิวหนัง การบันทึกเพียงว่า '85mm f/1.4', 'ไฟวงแหวน' หรือ 'ซอฟต์บ็อกซ์ไว้ด้านหน้าซ้ายของกล้อง' ก็สามารถช่วยให้คุณข้ามการทดลองที่ไร้ผลไปได้ถึงสามรอบ

ภาพระยะใกล้ของผิวชุ่มชื้นใต้แสงไฟวงแหวน – GPT Image 2 คำสั่ง: ตัวอย่างภาพบุคคล
ภาพถ่ายมาโครคุณภาพระดับโฆษณาความงาม วลี '85mm มาโคร, f/1.4' คือเหตุผลที่แท้จริงที่ทำให้ผิวมีพื้นผิวเช่นนี้

11. โคลสอัพสไตล์ Fenty Beauty

Extreme close-up beauty portrait. A stunning model with wet dewy skin and tousled damp hair, bare shoulders glistening. Water droplets on her face and neck catch the light of a ring light. Flawless skin texture in macro detail — every pore, every water droplet razor sharp. Smoky eye makeup with subtle gold shimmer. Lips slightly parted, intense gaze at camera. Dark background. Fenty Beauty campaign aesthetic. 85mm macro lens, f/1.4, ultra-shallow depth of field. Ultra-realistic 4K.

คำบรรยาย: ภาพระยะใกล้ของเมคอัพบนผิวที่ดูชุ่มชื้น สว่างไสวด้วยแสงไฟวงแหวน ทุกหยดน้ำถูกถ่ายทอดอย่างคมชัดทุกรายละเอียด

12. ภาพเหมือนบนม้านั่งสไตล์บาโรก

Luxury editorial portrait. A gorgeous model wearing an elegant black velvet off-shoulder gown reclines on a dark velvet chaise longue in a dimly lit Baroque-style room. One arm draped elegantly above her head. Rich warm Rembrandt lighting from a single window highlights the fabric draping against her glowing skin. Oil painting-like quality with deep shadows and warm highlights. High-end fashion editorial photography. 85mm lens, creamy bokeh. Ultra-realistic 4K.

คำอธิบายประกอบภาษาจีน: ผู้หญิงในชุดสีดำบนโซฟากำมะหยี่; แสงไฟจากหน้าต่างเดียวของเรมบรันด์สร้างพื้นผิวที่เหมือนภาพวาด

13. รูปถ่ายบัตรประจำตัวมืออาชีพ

Professional corporate headshot. A confident woman in her early 30s wearing a tailored navy blazer over a crisp white shirt. Neutral gray seamless studio background. Three-point lighting — soft key from camera left, subtle fill from right, rim light from behind. Genuine warm smile, direct eye contact. 85mm lens, f/2.8. Skin tone natural and healthy. LinkedIn executive headshot quality. Ultra-realistic 4K.

คำอธิบายภาษาจีน: พื้นหลังสีเทา + แสงสามจุดมาตรฐาน; รูปโปรไฟล์ LinkedIn สำหรับผู้บริหารระดับสูง

14. ภาพถ่ายบุคคลบนถนนโตเกียว

Environmental street portrait. A 20-something Tokyo local with bleached blonde hair and oversized vintage streetwear stands in Shibuya on a weekday afternoon. Shallow depth of field with crowd of pedestrians soft-blurred behind her. Natural overcast daylight. She looks slightly off-camera, lost in thought. Shot on Fujifilm X100 aesthetic, 35mm lens, f/2. Ultra-realistic 4K.

คำบรรยายภาษาจีน: เด็กผู้หญิงผมบลอนด์ฟอกสีตัดกับฉากหลังที่พร่ามัวของฝูงชนในยามบ่ายวันธรรมดาที่ชิบูย่า

15. ปกสไตล์โว้ก

High-end fashion portrait in the style of a Vogue Italia cover. A striking model with razor-sharp cheekbones wears an oversized metallic silver couture gown with architectural shoulders. She stares directly into camera with a cold, commanding expression. Hair pulled back tight. Studio lighting is a single hard light from 45 degrees creating sculptural shadows. Gray backdrop. 85mm portrait lens, f/5.6 for crisp detail. Ultra-detailed 4K.

คำบรรยายภาษาจีน: ปกที่มีพื้นผิวเหมือน Vogue Italia: ชุดราตรีสีเงินสามมิติจับคู่กับภาพพอร์ตเทรตที่ดูประติมากรรม แสงไฟที่ส่องมาจากแหล่งเดียวอย่างรุนแรง

16. ภาพถ่ายครัวในแสงธรรมชาติ

Soft natural light portrait. A woman with wavy chestnut hair sits by a large north-facing window in a quiet morning kitchen. She holds a ceramic mug of coffee in both hands, looking out the window thoughtfully. Warm cream sweater, no makeup, freckles visible. Shot in Rembrandt light with window as the only source. 50mm lens, f/1.8, shallow depth of field. Soft, honest, lived-in feel. Ultra-realistic 4K.

คำบรรยายภาษาจีน: ผู้หญิงคนหนึ่งไม่แต่งหน้าอยู่ข้างหน้าต่างครัวในแสงสว่างของเช้าตรู่ ถูกส่องสว่างเพียงแสงธรรมชาติจากหน้าต่างบานเดียว

17. แสงไฟเวทีแบบโมโนโครม

Dramatic black and white portrait. A man with a short salt-and-pepper beard and intense dark eyes stares into the lens. Only half his face is lit — hard side light from camera right, pure black shadow on the other side. Textured gray background fades to black. Shot on medium format film aesthetic, 80mm lens. Film grain. Peter Lindbergh style monochrome. Ultra-detailed.

บทวิจารณ์: ภาพถ่ายบุคคลขาวดำในสไตล์ของปีเตอร์ ลินด์เบิร์ก โดยครึ่งหนึ่งของใบหน้าถูกส่องสว่างด้วยแสงจ้า และอีกครึ่งหนึ่งอยู่ในความมืดสนิท

18. การถ่ายภาพความงามสีชมพู

Dreamy pastel beauty portrait. A model with soft pink lips, dewy skin, and flushed cheeks against a blush pink seamless backdrop. She wears a sheer white off-shoulder top. Soft diffused lighting from a large softbox creates flattering even illumination. Hair in loose tousled waves. 85mm lens, f/2. Cotton candy color palette — pink, peach, cream. Ultra-realistic 4K beauty editorial.

คำบรรยายภาษาจีน: พื้นหลังสีชมพู + ซอฟต์บ็อกซ์ขนาดใหญ่; การถ่ายภาพความงามในโทนสีลูกกวาด

19. ช่วงเวลาทองแห่งความโรแมนติก

Sun-drenched golden hour portrait. A woman in a flowing cream linen dress stands in a wheat field at 7pm on a summer evening. The sun is low behind her, creating a halo of golden backlight through her hair and the sheer fabric. Lens flare across the frame. Her eyes are closed, face tilted up to the warmth. 135mm telephoto lens, f/2, compressed background. Warm honey color grade. Ultra-realistic 4K.

คำบรรยาย: ทุ่งข้าวสาลีในยามพลบค่ำช่วงฤดูร้อน; แสงย้อน + เลนส์เทเลโฟโต้ 135 มม. ทำให้พื้นที่ดูแคบลง

20. ห้องสมุดแห่งสถาบันมืด

Dark academia editorial portrait. A young woman with auburn hair in a loose braid wears a wool cardigan over a white collared shirt in an old university library. She holds an open leather-bound book, reading by the light of a green banker's lamp. Towering bookshelves around her fade into shadow. Warm tungsten light, deep navy and olive color palette. 50mm lens, f/2.8. Ultra-realistic 4K.

คำบรรยายภาษาจีน: ห้องสมุดเก่า + โคมไฟสีเขียวสไตล์นักบัญชี, บรรยากาศแบบวิชาการเข้มข้น.


ไลบรารีคำสั่ง: การกระทำและการเคลื่อนไหว

ฉากแอ็กชันต้องการสองสิ่ง: วลีที่จับภาพช่วงเวลาที่หยุดนิ่ง (เช่น 'หยุดกลางอากาศ' หรือ 'จับภาพความเร็วสูง') และ แสงที่เน้นเส้นขอบ ซึ่งใช้เพื่อแยกวัตถุออกจากฉากหลังที่วุ่นวาย

ช่วงเวลาที่หยุดนิ่งของนักกีฬาที่กำลังเตะหมุนตัวด้วยความเร็วสูง — ตัวอย่างคำสั่งสำหรับ GPT Image 2
ภาพเคลื่อนไหวที่ถูกแช่แข็งไว้ชั่วขณะ เป็นลำแสง 'แสงย้อน' ที่แท้จริงซึ่งสลักเส้นสายและรูปทรงให้ปรากฏ

21. ไนกี้ เทรนนิ่ง ฟรีซ เฟรม

Dynamic action freeze-frame. An athletic woman in a fitted sports bra and high-waisted compression shorts executes a powerful spinning roundhouse kick. Water splashes frozen in mid-air around her legs and feet in a dramatic spray pattern. Her toned abs and defined muscles visible. Dramatic single-source rim lighting from behind creates a glowing silhouette edge. Dark studio background. Nike Training campaign energy. High-speed photography feel — ultra-sharp subject, motion blur on water droplets. Ultra-realistic 4K.

คำบรรยายภาษาจีน: การถ่ายภาพความเร็วสูงสไตล์ไนกี้ พร้อมหยดน้ำที่ถูกแช่แข็งกลางอากาศ

22. ภาพภายในของสระคลื่นเซิร์ฟ

Epic wide-angle shot of a female surfer riding inside a massive crystal-clear barrel wave at golden hour. Her silhouette and athletic body visible through the translucent turquoise water of the wave tube. Golden sunlight creates an explosion of light and water mist behind her. Dramatic backlit composition. The wave is enormous and perfectly formed. GoPro-style immersive perspective. Ultra-realistic 4K cinematic quality.

คำบรรยายภาษาจีน: นักโต้คลื่นหญิงกำลังขี่คลื่นยักษ์ในช่วงเวลาทอง โดยมีเงาตัดกับแสงสว่าง

23. กระโดดข้ามหลังคาแบบพาร์กัวร์

High-speed action shot of a parkour athlete mid-leap between two Brooklyn rooftops at sunset. Frozen at the apex of the jump, arms and legs extended, silhouetted against a burning orange sky. The gap below him is dizzying — city streets far below. Motion blur on the trailing edge of his hoodie. Shot from a drone at his height, 35mm lens. Ultra-realistic 4K cinematic action.

คำบรรยายภาษาจีน: พาร์กัวร์บนหลังคาบรู๊คลินยามพระอาทิตย์ตก แช่แข็งอยู่ที่จุดสูงสุดของการกระโดด

24. สปอตไลท์สังเวียนศิลปะการต่อสู้แบบผสมผสาน

Dramatic fight night action. A female MMA fighter mid-spinning back elbow, sweat flying from her hair in a visible arc of droplets. Single harsh overhead ring spotlight isolates her from pure black background — classic boxing photography look. Her opponent is a blurred silhouette out of focus. 70-200mm lens at 200mm, f/2.8, 1/2000 shutter frozen motion. High contrast, desaturated. Ultra-detailed 4K.

คำบรรยายภาษาจีน: แสงไฟสปอตไลท์เพียงดวงเดียวส่องสว่างเวที MMA เผยให้เห็นเส้นโค้งของเม็ดเหงื่อที่ลอยอยู่ในอากาศอย่างชัดเจน

25. ฝุ่นจากรถจักรยานยนต์วิบาก

Low-angle action shot of a motocross rider airborne over a dirt jump, red desert dust exploding behind the rear tire. Late afternoon sun casts long shadows. The bike is tilted aggressively mid-trick. Camera is just above ground level looking up, making the jump look monumental. Anamorphic lens flare from the sun. Orange and teal color grade. Ultra-realistic 4K action.

การแปล: รถจักรยานยนต์วิบากทะยานขึ้นสู่ท้องฟ้า ล้อหลังเตะขึ้นเป็นฝุ่นแดงกระจาย

26. กระโดดในสตูดิโอบัลเล่ต์

Contemporary ballet dancer mid-grand jete frozen in the air, arms extended, body perfectly horizontal. She wears a simple nude leotard. Plain gray cyclorama studio background. Strong side-light from camera left creates a sculptural chiaroscuro on her musculature. Powder disturbed from the floor traces her leap in a soft cloud. 1/4000 shutter speed feel. Ultra-detailed 4K.

หมายเหตุ: ที่จุดสูงสุดของการกระโดดแกรนด์เจเต้ในบัลเลต์ ร่างกายจะอยู่ในแนวขนานกับพื้น

27. การดังค์บาสเกตบอล

Low-angle hero shot of a male basketball player mid-slam dunk, one hand gripping the rim, body extended diagonally across the frame. Arena lights streak as lens flares. Crowd is a soft blurred wall of phone flashes behind him. Frozen sweat and net motion. Shot on 24mm wide from directly below the hoop. NBA official photography energy. Ultra-realistic 4K.

คำบรรยายภาพ: ภาพมุมกว้าง 24 มม. ถ่ายจากด้านล่างตะกร้าโดยตรง บันทึกช่วงเวลาของการดังค์

28. ม้าควบที่ขี่คลื่น

A rider on a powerful black horse gallops through knee-deep shallow ocean water at sunrise. Water explodes from each hoofstrike, frozen in a dramatic spray. The rider is leaned low, hair streaming behind. Warm golden backlight from the rising sun. Mist rising off the water. Shot at 1/4000 shutter, 200mm telephoto compression. Ultra-realistic 4K equine photography.

คำบรรยายภาษาจีน: น้ำตื้นในยามรุ่งอรุณ; ม้าสีดำควบเร็ว ส่งน้ำกระเซ็นขึ้นไปในอากาศ; ถ่ายภาพด้วยเลนส์เทเลโฟโต้ 200 มม. เพื่อมุมมองที่ดูอัดแน่น


ไลบรารีของคำสั่ง: ธรรมชาติและทิวทัศน์

องค์ประกอบสำคัญสำหรับภาพภูมิทัศน์คือ เวลาของวัน, สภาพอากาศ และมาตราส่วนแนวตั้ง โมเดลนี้มีอคติล่วงหน้าอย่างมากต่อ 'ธรรมชาติทั่วไปที่สวยงาม' ดังนั้นคุณต้องใช้คำเฉพาะเพื่อชี้นำให้มันออกห่างจากค่าเริ่มต้นนั้น

หญิงสาวท่ามกลางหมอกริมหน้าผา น้ำตก — ตัวอย่างคำสั่งธรรมชาติ GPT Image 2
หญิงสาวท่ามกลางหมอกใกล้หน้าผาที่มีน้ำตก สายตาจากมุมสูงที่มองลงมาเล็กน้อย ผสมผสานกับคำเฉพาะว่า 'ผ้าบาง' ทำให้มั่นใจได้ว่านางแบบจะไม่ดูเป็นภาพที่คาดเดาได้ทั่วไป

29. ดินแดนมหัศจรรย์หมอกจางริมน้ำตก

Ethereal fantasy nature scene. A graceful young woman in a flowing sheer gossamer dress stands at the edge of a towering waterfall cliff. Dense tropical mist swirls around her legs and the translucent fabric. She extends one arm toward the cascade, water droplets catching golden light. Aerial perspective slightly from above showing the dramatic cliff drop. Lush green ferns frame the composition. Golden hour light filtering through the mist. Ultra-realistic 4K cinematic quality.

คำบรรยายภาษาจีน: ผู้หญิงในชุดกระโปรงสีขาวอยู่ข้างน้ำตกริมหน้าผา, มุมมองจากด้านบน + หมอก.

30. ภาพมุมสูงของมัลดีฟส์

Overhead drone shot of a beautiful woman in a minimal white bikini floating on her back in crystal-clear turquoise shallow water over white sand in the Maldives. Her long dark hair fans out in the water like a halo. The water is so clear her full body is visible through the translucent surface. Tiny fish swim nearby. Travel photography editorial style. Ultra-realistic 4K aerial quality.

คำบรรยาย: ภาพมุมสูงเหนือมัลดีฟส์โดยตรง แสดงให้เห็นผู้หญิงกำลังลอยตัวอยู่ในน้ำใสราวกับคริสตัล

31. ชายหาดทรายดำแห่งไอซ์แลนด์

Dramatic wide landscape of Iceland's Reynisfjara black sand beach at dawn. Massive basalt sea stacks rise from the churning North Atlantic. Low fog drifts across the black sand. A single figure in a red rain jacket walks along the shoreline for scale. Moody desaturated color grade — almost monochrome with just the red jacket as accent. 24mm wide lens, f/11 for deep focus. Ultra-detailed 4K.

หมายเหตุภาษาจีน: ชายหาดทรายดำและเสื้อกันฝนสีแดงของไอซ์แลนด์เป็นจุดยึดสีที่โดดเด่น

32. แสงสว่างที่โบสถ์เรดวูดโกรฟ

Vertical composition looking up through towering California redwood trees. Shafts of golden morning sunlight cut through the fog between the trunks like cathedral light rays. Ferns carpet the forest floor. A tiny hiker in the distance gives scale. Ultra-wide 14mm lens distorting the trunks into a radial pattern toward the sky. Warm green and gold palette. Ultra-realistic 4K nature photography.

คำบรรยายภาพ: ภาพมุมกว้าง 14 มม. ของป่าเรดวูด โดยมีลำแสงส่องผ่านหมอกไปยังโบสถ์

33. ทะเลสาบกระจกแห่งปาตาโกเนีย

Perfect mirror reflection of the jagged Torres del Paine peaks in a glass-still Patagonian alpine lake at blue hour. Pink and purple alpenglow on the snow-capped summits. A single orange tent on the near shore as human scale. Complete symmetry — upper and lower half of frame are near-mirror images. 35mm lens, f/11. Ultra-realistic 4K landscape.

คำอธิบายภาษาจีน: ทะเลสาบที่สะท้อนภาพเหมือนกระจกอย่างสมบูรณ์แบบในช่วงเวลาบลูอาวร์ มีความสมมาตรจากบนลงล่าง

34. พายุทรายทะเลทรายซาฮาร่า

Vast Sahara desert at the start of a sandstorm. Rolling orange dunes extend to the horizon, with a towering wall of sand approaching from the left. A lone nomadic figure on camelback is silhouetted against the dust cloud. Sun struggles through the haze as a dim orange disc. Cinematic wide-angle, heavy atmospheric haze. Monochromatic warm orange palette. Ultra-detailed 4K.

คำบรรยายภาษาจีน: บนขอบของพายุทรายทะเลทรายซาฮารา เงาร่างของผู้นั่งบนหลังอูฐยืนอยู่ตรงกำแพงของฝุ่น

35. ออโรร่า คาบิน

Wide landscape of a tiny warm-lit wooden cabin in a Norwegian fjord valley at 1am. A spectacular green and purple aurora borealis dances overhead, reflecting in the still black fjord water. Snow-dusted pine trees and mountains frame the scene. The cabin glow is the only warm color in an otherwise cold composition. 20-second long exposure feel. Ultra-realistic 4K astrophotography.

คำบรรยายภาษาจีน: แสงเหนือเวลา 1 นาฬิกาในฟยอร์ดนอร์เวย์ และกระท่อมแสนอบอุ่น

36. พระอาทิตย์ตกดินบนทุ่งหญ้าสะวันนาแอฟริกา

Cinematic wide shot of a family of elephants crossing a golden savanna at sunset in Kenya. The sun is a huge orange disc on the horizon, silhouetting the herd. Long grass ripples in the warm wind. Dust kicked up by the herd diffuses the backlight into warm beams. 200mm telephoto compression. National Geographic editorial style. Ultra-realistic 4K wildlife photography.

คำบรรยาย: ทุ่งหญ้าในเคนยาตอนพระอาทิตย์ตกดิน เงาของช้าง + การบีบอัดด้วยเลนส์เทเลโฟโต้ 200 มม.

37. แม่น้ำซากุระแห่งเกียวโต

Serene wide landscape of the Philosopher's Path in Kyoto at peak cherry blossom season. Pink petals float on the narrow canal, with more drifting down from the trees above. Traditional wooden bridges arch over the water. Early morning mist softens the light into diffused pink. A solo figure in a dark kimono walks along the stone path for scale. 50mm lens, f/4, gentle pastel color grade. Ultra-realistic 4K.

คำบรรยายภาษาจีน: ในช่วงฤดูซากุระบานบนเส้นทางนักปราชญ์แห่งเกียวโต กลีบดอกสีชมพูลอยอยู่บนผิวน้ำของคลอง

38. แสงแห่งพายุในที่สูงของสกอตแลนด์

Dramatic landscape of the Scottish Highlands during a clearing thunderstorm. Dark churning clouds above a lone glen, with a single shaft of golden sunlight breaking through and lighting one patch of heather-covered hillside. Rainbow arc barely visible at the edge. Ancient standing stones in the foreground. Moody cinematic color grade — steel blue shadows, warm sunlit highlight. 24mm wide, f/11. Ultra-realistic 4K landscape photography.

คำอธิบายภาษาจีน: ขณะที่พายุฝนฟ้าคะนองในเขตสูงของสกอตแลนด์กำลังจะสิ้นสุดลง แสงอาทิตย์สีทองเส้นเดียวได้ทะลุผ่านเมฆดำมืดออกมา


ไลบรารีคำสั่ง: แฟนตาซีและสไตล์

เมื่อคุณระบุแหล่งอ้างอิงทางศิลปะเฉพาะภายในแนวแฟนตาซี (เช่น Ufotable, Arcane, Studio Trigger หรือภาพประกอบจาก Magic: The Gathering) คำขอของคุณจะมีความแม่นยำมากขึ้น คำขอที่คลุมเครืออย่าง 'ศิลปะแฟนตาซี' จะให้ผลลัพธ์ที่คลุมเครือเท่านั้น

เจ้าหญิงนักรบผู้มหัศจรรย์แห่งดาบเวทมนตร์เรืองแสง — GPT Image 2 ตัวอย่างคำสั่งสร้างภาพอนิเมะ
เจ้าหญิงนักรบแฟนตาซีในสไตล์ Ufotable แค่เอ่ยชื่อสตูดิโอ ก็บอกได้มากกว่าคำคุณศัพท์นับสิบคำ

39. เซนกิของ Ufotable

Epic anime-inspired fantasy warrior princess with flowing silver-white hair that reaches her waist, wearing ornate golden battle armor that hugs her figure with intricate engravings. She holds a glowing magical sword aloft, emitting bright blue energy. Cherry blossom petals and magical sparkles swirl in a violent storm around her. Her expression is fierce and determined. Dynamic action pose mid-battle leap. Ultra-detailed anime with CGI-quality lighting — Ufotable production quality. Rich colors, dramatic volumetric lighting. 4K quality.

คำอธิบายภาษาจีน: อนิเมะ 'เจ้าหญิงแห่งสงคราม' ระดับ Ufotable ที่มาพร้อมกับดาบเวทมนตร์สีน้ำเงินและพายุซากุระ

40. นักเวทย์หญิงเอลฟ์ดำ

Dark fantasy dark elf sorceress with long flowing midnight-purple hair, pointed ears, and luminous violet eyes. She wears an elegant off-shoulder dark robe with intricate silver embroidery that reveals her collarbones and shoulders. Purple arcane energy spirals from her outstretched hands, illuminating her face from below. A vast star field and nebula visible in the background through a shattered stone archway. Semi-realistic fantasy illustration style with cinematic lighting. Ultra-detailed 4K.

คำบรรยายภาษาจีน: นักเวทย์หญิงเอลฟ์ดำ กำลังปล่อยพลังเวทย์มนตร์สีม่วงหมุนวนออกจากมือของเธอ

41. วิญญาณแห่งป่าของสตูดิโอจิบลิ

Studio Ghibli style painterly scene. A small forest spirit that looks like a glowing white fox with three tails walks through a mossy enchanted forest at dusk. Fireflies dance around it. Soft painterly brushstrokes, warm honey-gold light filtering through massive ancient trees. Hayao Miyazaki watercolor aesthetic. Ultra-detailed animation cel quality.

คำบรรยายภาษาจีน: สุนัขจิ้งจอกขาวหางสามหางในสไตล์สตูดิโอจิบลิ เดินเล่นผ่านป่าที่ปกคลุมไปด้วยมอสในยามพลบค่ำ

42. เวทมนตร์: การต่อสู้ของเมืองคู่แฝด

Arcane Netflix animated series style illustration. A young woman with blue-tipped braided hair and steampunk goggles leans against a graffitied alley wall in the undercity of Piltover. Neon magical rune-signs glow behind her. Textured painterly brushstrokes visible, 2D illustration with 3D depth, saturated purple and teal color story. Fortiche animation studio aesthetic. Ultra-detailed 4K.

คำบรรยายภาษาจีน: เด็กหญิงในตรอกซอยของเมืองชั้นล่าง ในสไตล์อาร์เคน ฟอร์ติช

43. เมจิก: เดอะ เกเธอร์ริ่ง ดราก้อน

Fantasy illustration in the style of a Magic The Gathering card. A colossal red dragon emerges from molten lava in an underground cavern, wings half-spread, mouth roaring with fire breath forming. A tiny knight in silver armor stands at the cavern's edge for scale, raising a shield. Dramatic low-angle hero composition. Rich oil-painting texture, Greg Rutkowski influence. Ultra-detailed 4K fantasy art.

คำบรรยายภาษาจีน: มังกรแดงลาวาและอัศวินตัวจิ๋วในสไตล์ศิลปะของ Magic: The Gathering

44. อัศวินไซเบอร์

Cyberpunk fantasy fusion. A female samurai with a chrome katana stands on the rain-slicked rooftop of a neo-Tokyo megacorp tower at night. She wears a fusion of traditional kimono and carbon-fiber combat armor. Holographic cherry blossoms drift around her. Neon reflections on the wet rooftop, flying ad-drones in the background. Illustrated in the style of Katsuhiro Otomo meets modern 3D concept art. Ultra-detailed 4K.

คำบรรยายภาษาจีน: ซามูไรหญิงบนหลังคาของไซเบอร์โตเกียว + ดอกซากุระโฮโลแกรม

45. นางเงือกใต้ทะเล

Ethereal underwater fantasy. A graceful mermaid with iridescent teal and violet scales swims through a coral reef illuminated by shafts of sunlight piercing the water surface above. Her long turquoise hair flows weightlessly. Bubbles trail from her fingertips. School of small silver fish swim past. Dreamlike painterly quality, Lisa Frank meets National Geographic. Ultra-detailed 4K fantasy art.

คำบรรยายภาษาจีน: นางเงือกสายรุ้งท่ามกลางแนวปะการัง โดยมีลำแสงส่องผ่านผิวน้ำ

46. กัปตันของเรือเหาะสตีมพังค์

Illustrated steampunk fantasy portrait. A young female airship captain in a brass-buttoned red military coat, goggles pushed up on her forehead, stands at the wheel of a wooden airship. Visible brass gears and copper pipes. Behind her, clouds and other distant airships. Warm golden hour lighting. Illustration style inspired by Nausicaa and Howl's Moving Castle. Ultra-detailed 4K.

คำบรรยายภาษาจีน: กัปตันเรือเหาะหญิงในสไตล์ของฮายาโอะ มิยาซากิ และเฟืองทองเหลือง


การวนซ้ำหลายรูปแบบ: หนึ่งหัวข้อ หลากหลายโลก

ขั้นตอนการทำงานที่ถูกมองข้ามใน GPT Image 2: ล็อกวัตถุหลักและปรับเฉพาะแถบสไลด์สไตล์เท่านั้น คุณจะเห็นได้อย่างชัดเจนว่าแต่ละสไตล์ส่งผลต่อใบหน้า ชุด และท่าทางเดียวกันอย่างไร—ครั้งต่อไปที่คุณเลือกสไตล์ คุณจะไม่จำเป็นต้องเดาอีกต่อไป

การเปรียบเทียบสไตล์สี่แบบ: สไตล์สมจริง, สไตล์อนิเมะ, สไตล์ภาพวาดสีน้ำมัน, สไตล์ไซเบอร์พังค์ — คำสั่ง GPT Image 2
สี่สไตล์สำหรับหัวข้อเดียวกัน วิธีการนี้เหมาะอย่างยิ่งสำหรับการสร้างบอร์ดอารมณ์ก่อนนำเสนอตัวเลือกสไตล์ให้กับลูกค้า

ข้อความเริ่มต้น — หัวข้อจะคงเดิมอย่างสมบูรณ์ในทุกสี่รุ่น:

A beautiful young woman with shoulder-length brown hair stands in a sunlit garden, wearing a simple white sundress, one hand lightly touching a rose bush. Soft golden afternoon light. Three-quarter body framing, slightly tilted head, warm smile.

คำอธิบายภาษาจีน: หญิงสาวในชุดเรียบง่ายกำลังสัมผัสดอกกุหลาบในสวนแสงแดด ท่ามกลางแสงสีทองยามบ่าย

จากนั้นเพียงแค่สลับช่องสไตล์ แล้วใช้งานแต่ละช่องหนึ่งครั้ง

47. การถ่ายภาพแบบสมจริง

[Base] — Hyperreal fashion photography aesthetic. 85mm lens at f/1.8, soft natural light, editorial sharpness. Ultra-realistic 4K.

48. การ์ตูนญี่ปุ่น

[Base] — Japanese anime style with cel shading, bold line art, vibrant saturated colors, large expressive eyes. Kyoto Animation production quality. Ultra-detailed.

49. จิตรกรรมสีน้ำมันแบบคลาสสิก

[Base] — Classical oil painting style with visible thick brushstrokes, warm Renaissance lighting, chiaroscuro shadow, Vermeer-like color palette. Museum-quality.

50. ไซเบอร์พังค์

[Base] — Neon-drenched cyberpunk futurism. Holographic overlays, circuit-pattern light tattoos on skin, magenta and cyan rim lighting. Ghost in the Shell art direction. Ultra-detailed.

เราได้รันลำดับนี้บนบัญชีทดสอบภายในของเรา; ภาพแรกใช้เวลาประมาณ 18 วินาที และการเปลี่ยนสไตล์ในครั้งต่อๆ ไปใช้เวลาประมาณเท่ากัน โดยรวมแล้ว ใช้เวลาน้อยกว่าสองนาทีและ 48 เครดิตในการสร้างบอร์ดอารมณ์ที่สมบูรณ์ เมื่อรวมอยู่ในข้อเสนอสำหรับลูกค้า สิ่งนี้สามารถย่อเวลาการค้นหาภาพซึ่งปกติจะใช้เวลาครึ่งวันให้เหลือเพียงเวลาในการดื่มกาแฟหนึ่งถ้วย


สถานการณ์ความล้มเหลวที่พบบ่อยและวิธีแก้ไข

มุมความซื่อสัตย์: GPT Image 2 ทำงานได้อย่างยอดเยี่ยม แต่ไม่ได้เป็นเวทมนตร์ ด้านล่างนี้คือประเภทของความล้มเหลวที่พบบ่อยที่สุดที่เราได้บันทึกไว้ พร้อมวิธีแก้ไขที่เกี่ยวข้อง โปรดใช้ส่วนนี้เป็นรายการตรวจสอบการแก้ไขปัญหา—ครั้งต่อไปที่การสร้างภาพของคุณไม่ถูกต้อง ให้ทำตามขั้นตอนทีละขั้น ปัญหาส่วนใหญ่สามารถแก้ไขได้หลังจากปรับครั้งแรก

ข้อผิดพลาดที่ 1: ผลลัพธ์ที่จืดชืด

Before:

A beautiful woman in a city.

After:

A 28-year-old woman with auburn hair pulled into a low ponytail, wearing a camel trench coat, crossing a Manhattan crosswalk at 6pm on a rainy Thursday. Yellow taxis blur past in motion-blurred streaks. 50mm lens, f/2, cinematic grain. Ultra-realistic 4K.

ข้อความแรกไม่ได้ให้ข้อมูลใด ๆ กับโมเดลเลย วิธีแก้ไขคือควรใช้ คำนามเฉพาะเจาะจงและสถานที่เฉพาะเจาะจง เสมอ

ข้อผิดพลาด 2: จำนวนนิ้วไม่ถูกต้อง

GPT Image 2 ทำงานได้ดีกว่าแบบจำลองการกระจายรุ่นแรกอย่างมากเมื่อพูดถึงการเรนเดอร์มือ แต่ภาพระยะใกล้ของมืออาจยังผิดพลาดได้ มีสองวิธีที่น่าเชื่อถือในการหลีกเลี่ยงปัญหานี้:

  • อย่าให้มือเป็นจุดสนใจหลัก ให้ตัดมือออก: "กรอบภาพให้เหลือแค่ช่วงไหล่ขึ้นไปเท่านั้น"
  • ให้มือถือสิ่งของบางอย่าง: "มือจับถ้วยกาแฟเซรามิกอย่างเบามือ" การมีวัตถุให้ถือจะช่วยให้ท่าทางดูมั่นคงขึ้นและช่วยให้ปลายนิ้วอยู่ในตำแหน่งที่เหมาะสม

ปัญหาที่ 3: ข้อความในภาพเป็นอักขระที่อ่านไม่ออก

ซอฟต์แวร์การสร้างแบบจำลองไม่ใช่ซอฟต์แวร์จัดวาง หากคุณต้องการใส่โลโก้ ป้าย หรือข้อความที่อ่านได้บนโปสเตอร์ในภาพของคุณ ให้ใช้ข้อความที่สั้นที่สุดเท่าที่จะเป็นไปได้ (เช่น 'ป้ายเขียนว่า เปิด') หรือเพียงแค่เพิ่มหมายเหตุต่อไปนี้ในคำแนะนำ: 'ห้ามมีข้อความ ตัวอักษร หรือคำใดๆ ในภาพ' จากนั้นจัดรูปแบบแยกต่างหากใน Figma หรือ Photoshop

ข้อผิดพลาดที่ 4: การละเลยทิศทางของแสง

Before:

A portrait of a woman with dramatic lighting.

After:

A portrait of a woman lit by a single hard spotlight from 45 degrees camera-left, with deep black shadow filling the right side of her face. Rembrandt lighting with a small triangle of light on the shadowed cheek.

"แสงไฟแบบดราม่า" ไม่ได้บอกอะไรเราเลย การระบุเพียงทิศทาง ความเข้ม และขอบเขตของเงาเท่านั้นที่ให้เบาะแสที่แท้จริง

ข้อผิดพลาดที่ 5: ตัวละครปรากฏในฉากที่ไม่ถูกต้อง

หากโมเดลยังคงวางตัวละครในสตูดิโอทั่วไปแทนที่จะเป็นห้องสมุด—ย้ายฉากไปยังจุดเริ่มต้นของคำสั่ง และทำให้เฉพาะเจาะจงมากขึ้น:

In a candle-lit 17th-century English library with floor-to-ceiling oak shelves, leather-bound books, and a stone fireplace, a woman in…

การวางฉากไว้หน้าตัวแบบนั้นเทียบเท่ากับการกำหนดองค์ประกอบทั้งหมดก่อนที่จะแนะนำตัวละคร

ข้อผิดพลาดที่ 6: การให้คำแนะนำมากเกินไป

เมื่อคุณเขียนเกินประมาณ 1,200 คำ ผลกระทบของคำคุณศัพท์แต่ละคำจะเริ่มลดลง หากคำแนะนำของคุณเป็นเพียงรายการของแท็กสไตล์ 40 รายการ โมเดลจะ 'เฉลี่ย' ทั้งหมด ให้คงจุดยึดสไตล์หลักไว้หนึ่งจุด (เช่น 'ฟิล์มนัวร์') และใช้ส่วนที่เหลือเป็นรอง


ใช้ได้สูงสุด 20,000 ตัวอักษร: คำสั่งยาวที่มีโครงสร้าง

หนึ่งในข้อได้เปรียบที่มักถูกมองข้ามของ GPT Image 2 คือ ขีดจำกัดของข้อความคำสั่งสูงสุดถึง 20,000 ตัวอักษร ในขณะที่คู่แข่งส่วนใหญ่จำกัดไว้ที่ประมาณ 1,000–2,000 ตัวอักษร แม้ว่าจะไม่จำเป็นสำหรับภาพบุคคลเดี่ยว แต่ข้อความคำสั่งที่มีโครงสร้างและยาวขึ้นจะเหมาะสมอย่างยิ่งสำหรับฉากที่ซับซ้อนซึ่งมีบุคคลหลายคน รายละเอียดงานศิลปะแนวความคิด หรือภาพชุดที่ต้องการความสอดคล้องของแบรนด์อย่างเข้มงวด

แม่แบบที่เราใช้บ่อยในเอกสารสรุปงานผลิต:

# ฉาก
[ฉาก: สถานที่, เวลา, สภาพอากาศ, ยุคประวัติศาสตร์; 2–3 ประโยค]

# ตัวละคร
- ตัวละคร A: [ลักษณะภายนอก, เครื่องแต่งกาย, ท่าทางปัจจุบัน, สีหน้า]
- ตัวละคร B: [เช่นเดียวกับข้างต้น]
- ตัวประกอบฉาก: [คำอธิบายสั้นๆ]

# องค์ประกอบ
[องค์ประกอบ: ภาพมุมกว้าง/ภาพระยะกลาง/ภาพระยะใกล้; มุมกล้อง; การถ่ายภาพ; ความลึกของภาพ; การวางตำแหน่งของแต่ละตัวละครภายในกรอบ — กฎสามส่วน/อัตราส่วนทองคำ/ตรงกลาง]

# แสง
[แหล่งกำเนิดแสง, ทิศทาง, ความเข้ม, อุณหภูมิสี, พฤติกรรมของเงา]

# COLOUR
[อธิบายชุดสีโดยใช้คำศัพท์เกี่ยวกับสี 3–4 คำ. แผนผังสี — สีอบอุ่น/เย็น/แยกสี]

# STYLE
[แหล่งอ้างอิงสไตล์หลัก. ตัวอย่าง: "การถ่ายภาพยนตร์ของโรเจอร์ ดีกินส์ใน *Blade Runner 2049*"]

# เทคนิค
[การตั้งค่าความละเอียด, เกรนฟิล์ม, อัตราส่วนภาพ, ป้ายคุณภาพภาพ. ให้กระชับ]

# ข้อยกเว้น
[สิ่งที่ต้องหลีกเลี่ยง: "ห้ามมีข้อความ, ห้ามมีโลโก้, ห้ามมีลายน้ำ, ห้ามมีแขนขาเพิ่มเติม"]

ตัวอย่าง – คำแนะนำที่มีโครงสร้างสมบูรณ์ (ประมาณ 500 คำ) สำหรับภาพหลักหนึ่งภาพ:

# SCENE
A restored 1930s Art Deco ballroom on a rainy Tuesday evening in Paris, set during a private jazz performance. Tall arched windows on the left show wet boulevards and soft yellow streetlamp glow. Interior is lit warm and amber.

# CHARACTERS
- Lead: A striking 32-year-old woman with dark auburn hair in a low chignon, wearing a deep emerald-green silk bias-cut gown with a low back. She stands near a grand piano, one hand resting on its polished black lid, gazing thoughtfully toward the windows. Faint melancholy in her expression.
- Pianist: A middle-aged man in a black tuxedo, seated at the piano mid-performance, profile view, fingers on keys. He is a secondary figure — should not pull focus from the lead.
- Background: Three or four well-dressed patrons at candlelit round tables in soft bokeh, unidentifiable faces.

# COMPOSITION
Medium-wide shot. Lead character is on the right third of the frame, piano extending diagonally across the center toward the left. Rule of thirds. 50mm lens, f/2.2, shallow depth of field — lead and piano sharp, background patrons and windows softly blurred. Eye-level camera height.

# LIGHTING
Warm tungsten chandelier overhead providing ambient glow on the room. Key light on the lead is a single practical wall sconce camera-right at 45 degrees, modeling her face in gentle Rembrandt pattern. Rim from the windows behind her (cool blue rainy light) separates her hair and shoulder edge from the warm interior. Overall contrast: high but soft.

# COLOR
Deep emerald green (dress) and warm amber (interior) as hero colors, with cool blue window light as counter-accent. Warm gold dominant, with selective teal shadow detail. Film-look color grade reminiscent of early Wong Kar-wai.

# STYLE
Cinematic still in the visual language of In the Mood for Love meets a modern luxury cognac commercial. Anamorphic lens quality (slight horizontal flare on the candles). Painterly softness, 35mm film grain.

# TECHNICAL
Ultra-realistic 4K, 16:9 aspect, cinematic frame.

# EXCLUSIONS
No text, no signage, no logos, no watermarks, no visible phones or modern electronics, no extra limbs, no warped fingers on the pianist.

โครงสร้างแบบแบ่งส่วนมีประโยชน์หลักสองประการ: ประการแรก มันช่วยให้ คุณ ไม่พลาดช่องใด ๆ; ประการที่สอง มันให้จุดเริ่มต้นที่มีโครงสร้างสำหรับการวิเคราะห์โมเดล แทนที่จะเป็นเรียงความ 500 คำในคราวเดียว เพียงแค่ปรับเปลี่ยนส่วน 'ตัวละคร' และ 'ฉาก' ตลอดทั้งซีรีส์ คุณสามารถสร้างช็อตที่แตกต่างกันสำหรับโฆษณาเดียวกันได้เป็นจำนวนมาก

เคล็ดลับที่ใช้งานได้จริง: เมื่อภาพถูกต้อง 80% แต่มีองค์ประกอบหนึ่งที่ไม่ถูกต้อง (เช่น นางเอกสวมสีผิด) อย่าเขียนข้อความใหม่ทั้งหมด ให้คัดลอกข้อความที่ประสบความสำเร็จ ปรับเปลี่ยนเฉพาะส่วนที่เกี่ยวข้อง แล้วรันอีกครั้ง บันทึกการวนซ้ำภายในของเราแสดงให้เห็นว่าคำแนะนำที่มีโครงสร้างจะให้เฟรมคุณภาพหลักของภาพโดยเฉลี่ยหลังจาก 2.8 ครั้ง ในขณะที่คำแนะนำแบบอิสระมักต้องใช้มากกว่า 6 ครั้ง ด้วยราคา 12 เครดิตต่อภาพ ความแตกต่างนี้เท่ากับ $2 เทียบกับ $5 ต่อภาพหลัก

ต้องการส่งต่อขั้นตอนการทำงานแบบโครงสร้างให้กับเพื่อนร่วมงานหรือไม่? ก่อนอื่นให้พวกเขาอ่าน คู่มือเริ่มต้น แล้วกลับมาที่บทความนี้


คำถามที่พบบ่อย

อะไรคือแง่มุมที่สำคัญที่สุดของคำสั่ง GPT-Image 2?

การจัดแสงและการเลือกเลนส์—นั่นคือลำดับความสำคัญ คุณสามารถกู้ภาพได้หากวัตถุหรือฉากเบลอเล็กน้อย แต่หากทิศทางของแสงหรือการเลือกเลนส์ไม่ชัดเจน ผลลัพธ์จะดูเหมือนภาพสต็อกเสมอ หากคุณมีเวลาปรับแต่งเพียงสองด้าน ให้เน้นที่สองด้านนี้ กำหนดทิศทางของแสง ความเข้ม และตำแหน่งที่เงาตกอย่างชัดเจน จากนั้นระบุความยาวโฟกัส ขนาดรูรับแสง และระยะห่างจากวัตถุ เมื่อคุณทำเสร็จแล้ว รากฐานของภาพของคุณจะมั่นคง

คำสั่งสำหรับ GPT-Image 2 ควรมีความยาวเท่าไร?

สำหรับภาพถ่ายบุคคลและฉากง่ายๆ 80–150 คำคือจุดที่เหมาะสมที่สุด สำหรับภาพมุมกว้างแบบภาพยนตร์ที่มีการอ้างอิงถึงยุคสมัยและสไตล์ 150–250 คำ สำหรับฉากที่มีตัวละครหลายตัวหรือบทสรุปโฆษณา ให้ใช้แม่แบบที่มีโครงสร้าง 400–800 คำ ข้อจำกัด 20,000 ตัวอักษรนั้นสงวนไว้สำหรับกรณีพิเศษเท่านั้น—ในการใช้งานทั่วไป คุณจะไม่เกิน 500 คำบ่อยนัก

ฉันสามารถใส่ชื่อของศิลปินจริงในคำสั่งได้หรือไม่?

คุณสามารถอ้างอิงถึง สไตล์หรือยุคสมัย—เช่น 'ฟิล์มนัวร์', 'จิallo ปี 1970' หรือ 'ภาพวาดแบบสตูดิโอจิบลิ'—และโมเดลจะรับรู้ภาษาภาพเหล่านี้ได้ อย่างไรก็ตาม การใช้ชื่อของศิลปินที่ยังมีชีวิตอยู่โดยตรงเป็นแท็กสไตล์นั้นอาจมีความขัดแย้งทางจริยธรรมและถูกกรองออกโดยโมเดลมากขึ้น การอธิบายสไตล์, สื่อ และยุคสมัยจะดีกว่าการระบุชื่อบุคคลเฉพาะ

ทำไมผลลัพธ์จึงแตกต่างกันในแต่ละครั้งสำหรับคำสั่งเดียวกัน?

แบบจำลองการแพร่กระจายมีความสุ่มโดยธรรมชาติ—เริ่มต้นด้วยภาพที่มีสัญญาณรบกวนและลดสัญญาณรบกวนเพื่อสร้างภาพสุดท้าย การรันคำสั่งเดียวกันสองครั้งจะให้ผลลัพธ์ที่คล้ายกันแต่แตกต่างกัน นี่คือคุณสมบัติ ไม่ใช่ข้อบกพร่อง และเป็นแหล่งที่มาของ 'ความหลากหลาย' เพื่อสร้างผลลัพธ์ซ้ำ ระบบสร้างส่วนใหญ่รองรับพารามิเตอร์เมล็ดพันธุ์ สำหรับข้อมูลพื้นฐานทางเทคนิค โปรดอ้างอิงที่ บล็อกการสร้างภาพของ OpenAI.

ความยาวของคำแนะนำมีผลต่อราคาหรือไม่?

ไม่มีความแตกต่าง. GPT Image 2 ใช้โครงสร้างราคาแบบอัตราคงที่: 12 เครดิตต่อภาพ ไม่ว่าคุณจะเขียน 20 คำ หรือ 2,000 คำ. ปัจจัยเดียวที่ส่งผลต่อค่าใช้จ่ายคือจำนวนภาพที่ถูกสร้างขึ้น.

คุณควรลองทำไอเดียสักกี่ครั้งก่อนที่จะยอมแพ้?

กฎทั่วไป: ทำการป้อนคำสั่งเดิมสามครั้งเพื่อรองรับความแปรผันตามธรรมชาติ; หากยังไม่ถูกต้อง เปลี่ยนเพียงช่องเดียว—อย่าเริ่มใหม่ทั้งหมด ส่วนใหญ่แล้ว การปรับแต่งที่จำเป็นมักเป็นเรื่องของแสงหรือมุมกล้อง หากคุณทำซ้ำไปแล้วแปดครั้งแต่ไม่มีความคืบหน้า แสดงว่ามีปัญหาเกี่ยวกับโครงสร้าง—ให้ย้อนกลับไปที่สูตรแปดช่องและตรวจสอบว่าคุณกรอกครบทุกช่องจริงหรือไม่ นอกจากนี้ เรายังมีแนวปฏิบัติภายในในการบันทึกข้อความที่สร้างขึ้นแต่ละรายการและเมล็ดพันธุ์ที่ใช้ในสเปรดชีต ซึ่งช่วยให้เห็นได้ง่ายระหว่างการทบทวนว่าคำใดมีประสิทธิภาพจริง

สามารถใช้ภาพที่สร้างโดย GPT Image 2 เพื่อวัตถุประสงค์ทางการค้าได้หรือไม่?

แน่นอน ตามเงื่อนไขมาตรฐานของผลิตภัณฑ์ ภาพที่คุณสร้างขึ้นยังคงเป็นกรรมสิทธิ์ของคุณและสามารถใช้เพื่อวัตถุประสงค์ทางการค้าได้ โปรดดูที่ส่วนท้ายของเว็บไซต์สำหรับเงื่อนไขการอนุญาตใช้สิทธิ์เฉพาะ สำหรับสถานการณ์ที่มีความเสี่ยงสูง (เช่น การโฆษณาแบรนด์หรือปกสิ่งพิมพ์) เราแนะนำให้ปรึกษาทนายความ นอกจากนี้ อย่าใช้บุคคลจริงหรือโลโก้แบรนด์ที่กล่าวถึงในคำสั่งเป็น 'บัตรออกจากคุกฟรี'—สิ่งเหล่านี้อยู่ภายใต้ขอบเขตของสิทธิ์ในภาพบุคคลและสิทธิ์ในเครื่องหมายการค้า ซึ่งไม่ครอบคลุมโดยเงื่อนไขของผลิตภัณฑ์ AI

อะไรคือความแตกต่างระหว่างคำแนะนำสำหรับข้อความสู่ภาพและภาพสู่ภาพ?

การสร้างภาพจากข้อความเริ่มต้นจากศูนย์ โดยใช้ข้อความคำสั่งเป็นแนวทางเดียว การสร้างภาพจากภาพเริ่มต้นจากภาพอ้างอิงที่คุณอัปโหลด โดยข้อความคำสั่งจะปรับแต่งภาพนั้นเท่านั้น ข้อความคำสั่งสำหรับการสร้างภาพจากภาพควรสั้นและเน้นที่ 'สิ่งที่ต้องเปลี่ยน' ('เปลี่ยนเป็นสไตล์ภาพวาดสีน้ำมัน ในขณะที่รักษาท่าทางและเสื้อผ้าของวัตถุหลักไว้') แทนที่จะอธิบายฉากทั้งหมดใหม่—ภาพอ้างอิงได้ให้บริบทส่วนใหญ่แล้ว


พร้อมที่จะเริ่มต้นหรือยัง?

ตอนนี้คุณมีมากกว่า 50 คำสั่ง, ชุดของสูตรแปดช่อง, รายการตรวจสอบสำหรับการแก้ไขตัวอย่างที่ล้มเหลว, และเทมเพลตคำสั่งรูปแบบยาวที่มีโครงสร้าง ขั้นตอนต่อไปคือการเปิดเครื่องมือและรันคำสั่งจริง เลือกคำสั่งใดก็ได้หนึ่งคำสั่ง, วางลงไป, และดูว่าผลลัพธ์ห่างจากภาพในใจของคุณแค่ไหน—จากนั้นปรับแต่งเฉพาะช่องที่ผิดพลาด, และรันอีกครั้ง ภายในสองหรือสามรอบ, คุณจะสามารถสร้างภาพที่ 'พร้อมสำหรับการส่งมอบ' ได้อย่างสม่ำเสมอ

บันทึกบทความนี้ไว้ในบุ๊กมาร์กของเบราว์เซอร์ของคุณ หรือแปะ 'สูตรแปดช่อง' ไว้ข้างจอมอนิเตอร์ที่สองของคุณ การพัฒนาที่แท้จริงไม่ได้มาจากการท่องจำคำสำคัญเหล่านี้เพียงอย่างเดียว แต่มาจากการ ซึมซับสูตรนี้เข้าไปในความจำแบบอัตโนมัติ—หลังจากนั้นคุณจะสามารถแยกแยะภาพอ้างอิงใดๆ ออกเป็นองค์ประกอบหลัก ได้แก่ วัตถุ แสง การจัดกรอบ และสไตล์ได้อย่างเป็นธรรมชาติ

เริ่มใช้ GPT Image 2 ฟรี →

อ่านต่อ:

คุณมีคำถามเกี่ยวกับคำแนะนำเฉพาะหรือไม่? ฝากข้อความไว้บนเว็บไซต์ได้เลย—เราอ่านทุกข้อความ และคำถามที่พบบ่อยมักจะถูกนำไปตอบในฉบับถัดไปของคู่มือนี้ สำหรับข้อมูลพื้นฐานทางทฤษฎี คุณอาจต้องการอ่าน บทความของ Wikipedia เกี่ยวกับโมเดลสร้างภาพจากข้อความ; ใช้เวลาประมาณ 10 นาที หากคุณต้องการยกระดับทักษะของคุณไปอีกขั้น คุณสามารถไปยัง บทเรียน ในชุดนี้ เพื่อยกระดับการทำงานของคุณจาก 'การสร้างภาพที่ดีเพียงภาพเดียว' ไปสู่ 'การสร้างชุดภาพที่มีสไตล์เป็นหนึ่งเดียวกันอย่างสม่ำเสมอ'

ทีม GPT Image 2

ทีม GPT Image 2

การสร้างภาพและวิดีโอด้วยปัญญาประดิษฐ์