دليل تلميحات GPT Image 2: أكثر من 50 نموذجًا عمليًا (2026)

Apr 22, 2026

TL;DR

إن التوجيه الفعال لـ GPT Image 2 ليس مجرد جملة واحدة، بل هو مجموعة من القرارات: الموضوع، والمشهد، والأسلوب، واللقطة، والإضاءة، والمزاج. يقدم لك هذا الدليل أكثر من 50 نموذجًا للتوجيهات يمكن نسخها مباشرةً، وتغطي خمس فئات رئيسية هي: الطابع السينمائي، والصور الشخصية، والحركة، والطبيعة، والخيال، بالإضافة إلى قائمة لإصلاح المشاهد الفاشلة وسير عمل فعال للتحسين المتكرر. جميع الصور النموذجية الواردة في المقالة تستخدم نفس نموذج KIE gpt-image-2-text-to-image، بتكلفة 12 نقطة لكل صورة، وحد أقصى لعدد أحرف التلميح يبلغ 20,000 حرف. جرب GPT Image 2 مجانًا →


تشريح العبارة التوجيهية الجيدة

يبدأ معظم الناس مباشرة بكتابة "ما أريده". أما من يلتقطون صورًا رائعة حقًا، فيكتبون "ما تراه العدسة". هذا هو السر كله.

بعد إجراء آلاف الاختبارات على واجهة KIE gpt-image-2-text-to-image، توصلنا إلى صيغة من ثمانية خانات تغطي جميع السيناريوهات تقريبًا. ويكفي ملء ستة من هذه الخانات لتتجاوز النتائج المتوسط، أما ملء جميع الخانات فيؤدي إلى نتائج بمستوى الأفلام التجارية.

الصيغة:

[الموضوع] + [الحركة/الوضعية] + [المشهد] + [الأسلوب/المصدر المرجعي] + [اللقطة/التكوين] + [الإضاءة] + [المزاج/اللون] + [تحسين جودة الصورة]

كل خانة تُحدد إجابة سؤال كان النموذج سيضطر إلى "تخمينه" في الأصل:

  • الموضوع——من أو ماذا يظهر في الصورة. عبارة "أمينة المكتبة ذات الشعر الأحمر" أقوى بعشر مرات من "امرأة".
  • الحركة/الوضعية——ما الذي تفعله في هذه اللحظة. الفعل هو الذي يحدد التكوين.
  • المشهد——العالم المحيط. حدد البلد والعصر والوقت.
  • الأسلوب/المرجع——"فيلم نوار"، "رسوم متحركة من إنتاج Ufotable"، "تركيب متماثل على طريقة ويس أندرسون"، "أسلوب إعلانات Fenty Beauty". استخدم لغة بصرية معروفة، بدلاً من تراكم الصفات التي لا معنى لها.
  • اللقطة/التركيب——" "لقطة قريبة جدًا"، "زاوية منخفضة وعريضة"، "عدسة بورتريه 85 مم، f/1.4"، "عدسة شاشة عريضة مشوهة". هذا هو المفتاح لتحويل اللقطة الفوتوغرافية إلى إطار سينمائي.
  • الإضاءة——"ضوء حافة الساعة الذهبية"، "ضوء رامبرانت أحادي"، "انعكاس نيون على الأرض الرطبة". تشكل الإضاءة 60% من الإحساس الذي تخلقه الصورة.
  • المزاج/الدرجات اللونية——"تصادم الأزرق البارد والبرتقالي الدافئ"، "الظلال العميقة باللون الكهرماني الدافئ"، "نغمة حزينة منخفضة التشبع".
  • تحسين جودة الصورة——"4K فائق الواقعية"، "حبيبات الفيلم"، "أفلام الموضة". اجعلها موجزة، فقد تم إنجاز الجزء الأصعب بالفعل.

الأساسيات مقابل التحسين — جولتان من المقارنة حول موضوع واحد

نتائج تم إنشاؤها باستخدام تلميحات GPT Image 2 الأساسية، حيث تتسم التكوينات بالبساطة والإضاءة المتساوية
الكلمات المفتاحية الأساسية: "امرأة تقف في غرفة." الصورة غير واضحة، والإضاءة باهتة، ولا يوجد أي تركيب — لا يوجد أي عنصر يمكن للعارضة الاستفادة منه.

الكلمة المفتاحية الأصلية المرتبطة بالصورة أعلاه هي:

A woman standing in a room.

الآن، لنعيد كتابة "نفس المفهوم" باستخدام صيغة الثماني خانات:

A breathtaking young woman with flowing auburn hair stands in a luxurious Art Deco penthouse at golden hour. She wears a champagne-colored satin slip dress that catches the warm light. Floor-to-ceiling windows behind her show a panoramic city sunset. Dramatic side lighting creates deep shadows and golden highlights on her face and bare arms. The composition follows the rule of thirds. Cinematic depth of field with gorgeous city bokeh. Fashion editorial quality. Ultra-realistic 4K.

تعليق باللغة الصينية: في شقة بالطابق العلوي مصممة على طراز آرت ديكو، تقف امرأة ذات شعر طويل أمام نافذة ممتدة من الأرض إلى السقف، حيث يبرز الضوء الجانبي في ساعة الذروة ملامح وجهها وذراعيها.

نتائج الصور الناتجة عن استخدام تلميحات GPT Image 2 المُحسَّنة باستخدام صيغة الثماني خانات الكاملة
كلمات التوجيه بعد تحسين صيغة الثماني خانات. نفس المفهوم الأساسي، لكن تم تحديد جميع النقاط الغامضة بدقة.

ملاحظة: النسخة المُحسَّنة لا تعني إضافة المزيد من الصفات، بل تقليل الجزء الذي يُترك للنموذج لتخمينه. يعتمد GPT Image 2 في الأساس على نموذج انتشاري يُقوده محول (انظر شرح ويكيبيديا لنموذج الانتشار)، حيث يقوم النموذج باستكمال كل تفصيل لم تكتبه باستخدام "متوسطه المسبق". إذا لم تذكر "لحظة ذهبية"، فسيقدم لك النموذج افتراضيًا ضوءًا غائمًا في الساعة الثانية بعد الظهر من يوم الثلاثاء.

وأخيرًا، إليكم معلومة غير معروفة: الحد الأقصى لعدد أحرف التوجيه في GPT Image 2 هو 20,000 حرف — أي ما يعادل حوالي 3,000 كلمة باللغة الإنجليزية. لن تحتاجوا إلى هذا العدد في الحالات العادية، ولكن بالنسبة للمشاهد المعقدة التي تضم عدة شخصيات أو الرسوم التوضيحية التفصيلية، فإن هذا الحد الأقصى يعني أنه يمكنكم اتخاذ قرارات دقيقة للغاية بشأن التكوين. سيتم شرح كيفية استخدام التوجيهات الطويلة في الفصل الحادي عشر.


مكتبة الكلمات المفتاحية: مشاهد ذات طابع سينمائي

تعد المشاهد ذات الطابع السينمائي من أسهل الفئات التي يمكن تصويرها، لأن تاريخ السينما قد تراكمت فيه مفردات بصرية على مدى قرن من الزمان. ما عليك سوى تحديد النوع والفترة الزمنية واللقطة، وستقدم لك النماذج صورة جيدة.

صورة تم إنشاؤها باستخدام GPT Image 2 بنمط "فيلم نوار": امرأة ترتدي ثوبًا أحمر في زقاق بمدينة هونغ كونغ بعد هطول المطر
أزقة هونغ كونغ بأسلوب السينما السوداء الجديدة. قصة ألوان تتصادم بين الأخضر والأحمر + لقطات بشاشة عريضة مشوهة تتحمل الجزء الأكبر من الأجواء العاطفية.

1. الأزقة الخلفية الجديدة في هونغ كونغ

Film noir cinematic shot. A dangerously beautiful femme fatale in a curve-hugging red silk dress with a thigh-high slit, walking through a rain-soaked Hong Kong back alley at night. Neon signs in Chinese characters reflect red and blue on the wet cobblestones. She carries a black umbrella over one shoulder, her red-painted lips the only warm color against the cold teal lighting. Smoke wisps from a nearby vent. Anamorphic lens, shallow depth of field, cinematic grain. Ultra-realistic 4K noir film frame.

تعليق باللغة الصينية: في ليلة ممطرة في أحد الأزقة الخلفية بهونغ كونغ، تعبر امرأة ترتدي ثوبًا أحمر الطريق المرصوفة بالحجارة التي تعكس أضواء النيون وهي تحمل مظلة.

2. بار الجاز «Rembrandt Light»

Moody jazz bar interior. A mysterious woman in a sheer black lace dress sits on a velvet barstool, one leg crossed showing stiletto heels. Cigarette smoke curls around her silhouette. Warm amber spotlight from above illuminates her face and exposed collarbones while the rest fades into deep shadow. A saxophone player is a blurred silhouette in the background. Film noir meets modern luxury aesthetic. Dramatic Rembrandt lighting, 35mm film look. Ultra-realistic 4K.

تعليق باللغة الصينية: امرأة ترتدي ملابس من الدانتيل الأسود في حانة جاز، حيث يخلق الضوء الموجه من أعلى مع الدخان إضاءة درامية على غرار رامبرانت.

3. سقف فيلم «القتلة ذوو الأجنحة الفضية»

Cyberpunk cinematic wide shot. A lone detective in a wet black trench coat stands on a neon-drenched Tokyo rooftop at 3am. Giant holographic advertisements of a geisha float across the skyline behind him, casting shifting pink and cyan light on his face. Light rain catches the glow. Flying cars streak past as horizontal light trails. Shot on anamorphic lens, 2.39:1 aspect, shallow depth of field. Blade Runner 2049 color grade — teal shadows, orange highlights. Ultra-realistic 4K cinematic frame.

تعليق باللغة الصينية: على أسطح طوكيو ذات الطابع السيبربانك، يحيط بالمحقق لونان أزرق وفاتح من إعلانات الغيكي الهولوغرافية.

4. ردهة ويس أندرسون المتناسقة

Wes Anderson style cinematic composition. A 1960s hotel concierge in a burgundy uniform stands dead-center in a pastel-pink Art Deco lobby, flanked by perfectly symmetrical potted palms and brass sconces. Flat front-on framing, everything on center axis. Soft fluorescent overhead lighting. Pastel pink and mint green color palette. 35mm film look. Ultra-detailed 4K.

تعليق باللغة الصينية: ردهة فندق على طراز آرت ديكو باللون الوردي، بتكوين متماثل أمامي، ويقف موظف الاستقبال في منتصف الصورة.

5. المواجهة في المطبخ في فيلم الجريمة الكوري

Cinematic still from a modern Korean crime thriller. Two men face each other across a small Seoul apartment kitchen at 2am, both holding knives but frozen in a tense moment. Single fluorescent tube overhead casts hard green-tinted light and harsh shadows. Steam rises from an abandoned pot on the stove. Tight composition, 40mm lens, handheld feel. Bong Joon-ho style. Ultra-realistic 4K.

تعليق باللغة الصينية: مواجهة بين شخصين في مطبخ بسيول في الساعة الثانية صباحًا، في ضوء مصابيح الفلورسنت القاسي ذي اللون الأخضر المائل + تصوير يدوي.

صورة لفتاة تحت ضوء رامبرانت في حانة جاز، تم إنشاؤها باستخدام موجه GPT Image 2
إن استخدام مصباح كشاف واحد مع دخان يضفي إحساسًا بالحجم هو طريقة سريعة شبه شاملة لإضفاء طابع سينمائي.

6. ملحمة صحراء فيرنونوف

Epic cinematic wide shot in Denis Villeneuve style. A lone hooded figure in flowing desert robes walks across a vast orange sand dune at sunset. The sun is enormous on the horizon, casting elongated shadows. Scale is extreme — the figure is tiny, the landscape overwhelming. Dust kicks up in the wind. Warm amber palette with deep violet shadows. Shot on 65mm, ultra-wide aspect. Ultra-realistic 4K cinematic quality.

تعليق باللغة الصينية: زاوية تصوير واسعة على غرار فيرنوف، حيث تبدو الشخصيات صغيرة جدًا والمناظر الطبيعية مهيبة.

7. مقهى "الموجة الفرنسية"

Black and white French New Wave cinematic still. A young woman in a striped Breton shirt and dark bob haircut smokes at a Paris cafe table in 1962. She looks off-camera with soft intensity. Natural window light, high contrast, slightly overexposed highlights. Film grain visible. Godard aesthetic. 35mm monochrome, 50mm lens. Ultra-detailed.

تعليق باللغة الصينية: امرأة ذات شعر قصير في مقهى بباريس عام 1962، صورة بالأبيض والأسود على طراز الموجة الجديدة الفرنسية.

8. ممر الرعب الإيطالي "جيالو"

Cinematic horror frame in the style of a 1970s Italian giallo. A woman in a white nightgown stands at the end of a long Victorian hallway lit only by flickering red lamplight. Her back is turned. Shadow stretches toward the camera. Wallpaper is blood-red damask. Shallow depth of field, 28mm lens slightly distorted. Grainy film look. Deep red and black color story. Ultra-detailed 4K.

تعليق باللغة الصينية: أسلوب «جيالو» الإيطالي في سبعينيات القرن الماضي، صورة ظهري لامرأة ترتدي ثوبًا أبيض في نهاية ممر أحمر قاني.

9. ليلة الأضواء الساطعة في ميامي

1980s Miami Vice cinematic shot. A woman in a white linen blazer drives a red convertible at night through downtown Miami. Palm trees and neon motel signs blur past. She looks at the camera with sunglasses reflecting the pink and turquoise glow of the city. Lens flare, soft film grain. Teal and magenta color grade. Ultra-realistic 4K.

تعليق باللغة الصينية: مشهد ليلي في ميامي في الثمانينيات، سيارة مكشوفة حمراء + انعكاس أضواء النيون على النظارات الشمسية.

10. تحويل أفلام استوديو جيبلي إلى أفلام روائية

Cinematic still styled as a live-action Studio Ghibli adaptation. A young woman in a simple blue linen dress stands in a vast green hillside field, wind blowing her hair and skirt. Fluffy white clouds race overhead. Soft golden hour light. Warm, painterly color grading with gentle film grain. Wide lens, low-angle composition making her heroic against the sky. Ultra-detailed 4K.

تعليق باللغة الصينية: مشهد منحدر مصور بأسلوب استوديو جيبلي، حيث تبرز خط الأفق بفضل التصوير بزاوية منخفضة.


مكتبة الكلمات المفتاحية: صور الأشخاص والمكياج

يعتمد نجاح أو فشل صورة البورتريه على ثلاثة عوامل فقط: العدسة، واتجاه الضوء، وملمس البشرة. إن تحديد "85 مم f/1.4" أو "مصباح حلقي" أو "صندوق إضاءة ناعمة أمام يسار الكاميرا" سيساعدك على تخطي ثلاث جولات من التجارب غير المجدية مباشرةً.

لقطة مقربة لبشرة رطبة تحت ضوء دائري — نماذج صور شخصية لموجهات GPT Image 2
صورة بورتريه مقربة بجودة إعلانات مستحضرات التجميل. إن عبارة "85 مم ماكرو، f/1.4" هي السبب الحقيقي وراء ظهور هذه النعومة في البشرة.

11. تصوير ماكرو بمستوى Fenty Beauty

Extreme close-up beauty portrait. A stunning model with wet dewy skin and tousled damp hair, bare shoulders glistening. Water droplets on her face and neck catch the light of a ring light. Flawless skin texture in macro detail — every pore, every water droplet razor sharp. Smoky eye makeup with subtle gold shimmer. Lips slightly parted, intense gaze at camera. Dark background. Fenty Beauty campaign aesthetic. 85mm macro lens, f/1.4, ultra-shallow depth of field. Ultra-realistic 4K.

تعليق باللغة الصينية: لقطة مقربة لمكياج البشرة الرطبة، مع إضاءة دائرية، تظهر كل قطرة ماء بوضوح شديد.

12. تمثال على مقعد باروكي

Luxury editorial portrait. A gorgeous model wearing an elegant black velvet off-shoulder gown reclines on a dark velvet chaise longue in a dimly lit Baroque-style room. One arm draped elegantly above her head. Rich warm Rembrandt lighting from a single window highlights the fabric draping against her glowing skin. Oil painting-like quality with deep shadows and warm highlights. High-end fashion editorial photography. 85mm lens, creamy bokeh. Ultra-realistic 4K.

تعليق باللغة الصينية: امرأة ترتدي فستانًا أسود على أريكة مخملية، حيث يضفي ضوء النافذة الوحيدة الذي استخدمه رامبرانت مظهرًا زيتيًا على اللوحة.

13. صورة شخصية رسمية نظيفة

Professional corporate headshot. A confident woman in her early 30s wearing a tailored navy blazer over a crisp white shirt. Neutral gray seamless studio background. Three-point lighting — soft key from camera left, subtle fill from right, rim light from behind. Genuine warm smile, direct eye contact. 85mm lens, f/2.8. Skin tone natural and healthy. LinkedIn executive headshot quality. Ultra-realistic 4K.

تعليق باللغة الصينية: خلفية رمادية + إضاءة ثلاثية النقاط قياسية، صورة شخصية لمسؤول تنفيذي رفيع المستوى على LinkedIn.

14. صور شوارع طوكيو

Environmental street portrait. A 20-something Tokyo local with bleached blonde hair and oversized vintage streetwear stands in Shibuya on a weekday afternoon. Shallow depth of field with crowd of pedestrians soft-blurred behind her. Natural overcast daylight. She looks slightly off-camera, lost in thought. Shot on Fujifilm X100 aesthetic, 35mm lens, f/2. Ultra-realistic 4K.

تعليق باللغة الصينية: بعد ظهر يوم عمل في شيبويا، فتاة ذات شعر مصبوغ باللون الذهبي مع خلفية ضبابية من الحشود.

15. غلاف على مستوى مجلة فوغ

High-end fashion portrait in the style of a Vogue Italia cover. A striking model with razor-sharp cheekbones wears an oversized metallic silver couture gown with architectural shoulders. She stares directly into camera with a cold, commanding expression. Hair pulled back tight. Studio lighting is a single hard light from 45 degrees creating sculptural shadows. Gray backdrop. 85mm portrait lens, f/5.6 for crisp detail. Ultra-detailed 4K.

تعليق باللغة الصينية: مظهر غلاف مجلة Vogue Italia، فستان فضي ثلاثي الأبعاد + صورة شخصية منحوتة بإضاءة قوية أحادية.

16. صور شخصية في المطبخ بالضوء الطبيعي

Soft natural light portrait. A woman with wavy chestnut hair sits by a large north-facing window in a quiet morning kitchen. She holds a ceramic mug of coffee in both hands, looking out the window thoughtfully. Warm cream sweater, no makeup, freckles visible. Shot in Rembrandt light with window as the only source. 50mm lens, f/1.8, shallow depth of field. Soft, honest, lived-in feel. Ultra-realistic 4K.

تعليق باللغة الصينية: امرأة بدون مكياج بجوار نافذة مطبخ «تشينغو»، معتمدةً فقط على الضوء الطبيعي القادم من النافذة الواحدة.

17. إضاءة مسرحية أحادية اللون

Dramatic black and white portrait. A man with a short salt-and-pepper beard and intense dark eyes stares into the lens. Only half his face is lit — hard side light from camera right, pure black shadow on the other side. Textured gray background fades to black. Shot on medium format film aesthetic, 80mm lens. Film grain. Peter Lindbergh style monochrome. Ultra-detailed.

تعليق باللغة الصينية: صورة شخصية بالأبيض والأسود على طريقة بيتر ليندبرغ، نصف الوجه مضاء بإضاءة قوية، والنصف الآخر مظلم تمامًا.

18. جلسة تصوير لمستحضرات التجميل باللون الوردي

Dreamy pastel beauty portrait. A model with soft pink lips, dewy skin, and flushed cheeks against a blush pink seamless backdrop. She wears a sheer white off-shoulder top. Soft diffused lighting from a large softbox creates flattering even illumination. Hair in loose tousled waves. 85mm lens, f/2. Cotton candy color palette — pink, peach, cream. Ultra-realistic 4K beauty editorial.

تعليق باللغة الصينية: خلفية وردية + صندوق إضاءة كبير، صور تجميلية بألوان حلوى.

19. لحظات رومانسية في وقت الذروة

Sun-drenched golden hour portrait. A woman in a flowing cream linen dress stands in a wheat field at 7pm on a summer evening. The sun is low behind her, creating a halo of golden backlight through her hair and the sheer fabric. Lens flare across the frame. Her eyes are closed, face tilted up to the warmth. 135mm telephoto lens, f/2, compressed background. Warm honey color grade. Ultra-realistic 4K.

تعليق باللغة الصينية: حقل قمح في غسق يوم صيفي، تصوير عكسي للضوء + عدسة مقربة 135 مم لتقليص المساحة.

20. مكتبة مدرسة الظلام

Dark academia editorial portrait. A young woman with auburn hair in a loose braid wears a wool cardigan over a white collared shirt in an old university library. She holds an open leather-bound book, reading by the light of a green banker's lamp. Towering bookshelves around her fade into shadow. Warm tungsten light, deep navy and olive color palette. 50mm lens, f/2.8. Ultra-realistic 4K.

تعليق بالصينية: مكتبة قديمة + مصباح مصرفي أخضر، أجواء "دارك أكاديميا".


قائمة الكلمات المفتاحية: الحركات والحيوية

تتطلب مشاهد الحركة شيئين: عبارات تصف اللحظة المتجمدة (مثل "متجمد في الهواء" و"التقاط عالي السرعة") والإضاءة الحافة، التي تُستخدم لفصل العنصر الرئيسي عن الخلفية المزدحمة.

لحظة تجميد حركة الركلة الدوارة للرياضي بسرعة عالية — نموذج لمصطلحات الحركة في GPT Image 2
صورة لحركة متجمدة. ما يحدد المعالم حقًا هو ذلك «الضوء الجانبي القادم من الخلف».

21. لقطة ثابتة من تدريب نايكي

Dynamic action freeze-frame. An athletic woman in a fitted sports bra and high-waisted compression shorts executes a powerful spinning roundhouse kick. Water splashes frozen in mid-air around her legs and feet in a dramatic spray pattern. Her toned abs and defined muscles visible. Dramatic single-source rim lighting from behind creates a glowing silhouette edge. Dark studio background. Nike Training campaign energy. High-speed photography feel — ultra-sharp subject, motion blur on water droplets. Ultra-realistic 4K.

تعليق باللغة الصينية: تصوير عالي السرعة على مستوى إعلانات Nike، حيث تبدو قطرات الماء وكأنها تجمدت في الهواء.

22. مشهد داخلي لـ "Surfer's Tube"

Epic wide-angle shot of a female surfer riding inside a massive crystal-clear barrel wave at golden hour. Her silhouette and athletic body visible through the translucent turquoise water of the wave tube. Golden sunlight creates an explosion of light and water mist behind her. Dramatic backlit composition. The wave is enormous and perfectly formed. GoPro-style immersive perspective. Ultra-realistic 4K cinematic quality.

تعليق باللغة الصينية: راكبة أمواج داخل أنبوب موجة "اللحظة الذهبية"، صورة ظلية في ضوء خلفي.

23. القفز على أسطح المباني في رياضة الباركور

High-speed action shot of a parkour athlete mid-leap between two Brooklyn rooftops at sunset. Frozen at the apex of the jump, arms and legs extended, silhouetted against a burning orange sky. The gap below him is dizzying — city streets far below. Motion blur on the trailing edge of his hoodie. Shot from a drone at his height, 35mm lens. Ultra-realistic 4K cinematic action.

تعليق باللغة الصينية: رياضة "باركور" على أسطح بروكلين عند غروب الشمس، صورة مجمّدة في أعلى نقطة القفز.

24. أضواء كاشفة على حلبة القتال المختلط

Dramatic fight night action. A female MMA fighter mid-spinning back elbow, sweat flying from her hair in a visible arc of droplets. Single harsh overhead ring spotlight isolates her from pure black background — classic boxing photography look. Her opponent is a blurred silhouette out of focus. 70-200mm lens at 200mm, f/2.8, 1/2000 shutter frozen motion. High contrast, desaturated. Ultra-detailed 4K.

تعليق باللغة الصينية: إضاءة علوية واحدة على حلبة MMA، حيث تظهر بوضوح القوسات التي تشكلها قطرات العرق المتطايرة.

25. الغبار المتطاير من الدراجات النارية

Low-angle action shot of a motocross rider airborne over a dirt jump, red desert dust exploding behind the rear tire. Late afternoon sun casts long shadows. The bike is tilted aggressively mid-trick. Camera is just above ground level looking up, making the jump look monumental. Anamorphic lens flare from the sun. Orange and teal color grade. Ultra-realistic 4K action.

تعليق باللغة الصينية: انطلقت الدراجة النارية عبر الطرق الوعرة، ورفعت العجلة الخلفية سحابة من الغبار الأحمر.

26. قفزة في قاعة الباليه

Contemporary ballet dancer mid-grand jete frozen in the air, arms extended, body perfectly horizontal. She wears a simple nude leotard. Plain gray cyclorama studio background. Strong side-light from camera left creates a sculptural chiaroscuro on her musculature. Powder disturbed from the floor traces her leap in a soft cloud. 1/4000 shutter speed feel. Ultra-detailed 4K.

تعليق باللغة الصينية: أعلى نقطة في حركة «غراند جيت» في الباليه، حيث يكون الجسم موازيًا للأرض.

27. تسديدة كرة السلة باليد المرفوعة

Low-angle hero shot of a male basketball player mid-slam dunk, one hand gripping the rim, body extended diagonally across the frame. Arena lights streak as lens flares. Crowd is a soft blurred wall of phone flashes behind him. Frozen sweat and net motion. Shot on 24mm wide from directly below the hoop. NBA official photography energy. Ultra-realistic 4K.

تعليق باللغة الصينية: لقطة بزاوية واسعة 24 ملم التقطت لحظة تسديد كرة السلة بالسلة من أسفل مباشرة.

28. حصان جامح يركض على الأمواج

A rider on a powerful black horse gallops through knee-deep shallow ocean water at sunrise. Water explodes from each hoofstrike, frozen in a dramatic spray. The rider is leaned low, hair streaming behind. Warm golden backlight from the rising sun. Mist rising off the water. Shot at 1/4000 shutter, 200mm telephoto compression. Ultra-realistic 4K equine photography.

تعليق باللغة الصينية: مياه ضحلة عند شروق الشمس، حصان أسود يركض محدثاً رشاشات من الماء، مع ضغط البعد البؤري البالغ 200 مم.


مكتبة الكلمات المفتاحية: الطبيعة والمناظر الطبيعية

الكلمات المفتاحية المتعلقة بالمناظر الطبيعية هي الوقت، والطقس، والمقياس الرأسي. يتمتع النموذج بـ"توقع مسبق" قوي جدًا لـ"الجمال الطبيعي العام"، لذا يجب عليك استخدام كلمات محددة لإبعاده عن هذا المتوسط.

امرأة وسط الضباب بجانب شلال على حافة منحدر — نموذج لمصطلحات التوجيه الطبيعية لـ GPT Image 2
امرأة وسط الضباب على حافة شلال على جرف. إن زاوية التصوير الجوي "المنظر من أعلى قليلاً" + استخدام مصطلح محدد مثل "rقيق" يجعلان النموذج يخرج عن المألوف.

29. جنة ضباب الشلالات

Ethereal fantasy nature scene. A graceful young woman in a flowing sheer gossamer dress stands at the edge of a towering waterfall cliff. Dense tropical mist swirls around her legs and the translucent fabric. She extends one arm toward the cascade, water droplets catching golden light. Aerial perspective slightly from above showing the dramatic cliff drop. Lush green ferns frame the composition. Golden hour light filtering through the mist. Ultra-realistic 4K cinematic quality.

تعليق باللغة الصينية: فتاة ترتدي فستانًا أبيض بجانب شلال على حافة منحدر، من منظور تصوير جوي مع ضباب.

30. لقطات جوية للجزر المالدية

Overhead drone shot of a beautiful woman in a minimal white bikini floating on her back in crystal-clear turquoise shallow water over white sand in the Maldives. Her long dark hair fans out in the water like a halo. The water is so clear her full body is visible through the translucent surface. Tiny fish swim nearby. Travel photography editorial style. Ultra-realistic 4K aerial quality.

تعليق باللغة الصينية: صورة ملتقطة من أعلى مباشرة فوق جزر المالديف، تظهر فيها امرأة تطفو في مياه البحر الصافية.

31. ساحل الرمال السوداء في أيسلندا

Dramatic wide landscape of Iceland's Reynisfjara black sand beach at dawn. Massive basalt sea stacks rise from the churning North Atlantic. Low fog drifts across the black sand. A single figure in a red rain jacket walks along the shoreline for scale. Moody desaturated color grade — almost monochrome with just the red jacket as accent. 24mm wide lens, f/11 for deep focus. Ultra-detailed 4K.

تعليق باللغة الصينية: الشاطئ الأسود في أيسلندا + المعطف المطري الأحمر كنقطة مرجعية لونية.

32. ضوء كنيسة غابة السكويا

Vertical composition looking up through towering California redwood trees. Shafts of golden morning sunlight cut through the fog between the trunks like cathedral light rays. Ferns carpet the forest floor. A tiny hiker in the distance gives scale. Ultra-wide 14mm lens distorting the trunks into a radial pattern toward the sky. Warm green and gold palette. Ultra-realistic 4K nature photography.

تعليق باللغة الصينية: صورة مأخوذة بزاوية عريضة 14 ملم لغابة من أشجار السكويا، مع أشعة ضوء تتسلل عبر الضباب إلى الكنيسة.

33. بحيرة ميرور في باتاغونيا

Perfect mirror reflection of the jagged Torres del Paine peaks in a glass-still Patagonian alpine lake at blue hour. Pink and purple alpenglow on the snow-capped summits. A single orange tent on the near shore as human scale. Complete symmetry — upper and lower half of frame are near-mirror images. 35mm lens, f/11. Ultra-realistic 4K landscape.

تعليق باللغة الصينية: بحيرة عاكسة مثالية في «لحظة زرقاء»، متناظرة من أعلى إلى أسفل.

34. العواصف الترابية في الصحراء

Vast Sahara desert at the start of a sandstorm. Rolling orange dunes extend to the horizon, with a towering wall of sand approaching from the left. A lone nomadic figure on camelback is silhouetted against the dust cloud. Sun struggles through the haze as a dim orange disc. Cinematic wide-angle, heavy atmospheric haze. Monochromatic warm orange palette. Ultra-detailed 4K.

تعليق باللغة الصينية: على حافة عاصفة ترابية في الصحراء الكبرى، تظهر صورة ظلية لراكب جمل وهو يواجه جدارًا من الغبار.

35. كوخ الشفق القطبي

Wide landscape of a tiny warm-lit wooden cabin in a Norwegian fjord valley at 1am. A spectacular green and purple aurora borealis dances overhead, reflecting in the still black fjord water. Snow-dusted pine trees and mountains frame the scene. The cabin glow is the only warm color in an otherwise cold composition. 20-second long exposure feel. Ultra-realistic 4K astrophotography.

تعليق باللغة الصينية: الشفق القطبي في الساعة الواحدة صباحًا في مضايق النرويج، إلى جانب كوخ دافئ.

36. غروب الشمس في السهول الأفريقية

Cinematic wide shot of a family of elephants crossing a golden savanna at sunset in Kenya. The sun is a huge orange disc on the horizon, silhouetting the herd. Long grass ripples in the warm wind. Dust kicked up by the herd diffuses the backlight into warm beams. 200mm telephoto compression. National Geographic editorial style. Ultra-realistic 4K wildlife photography.

تعليق باللغة الصينية: سهول كينيا عند غروب الشمس، صور ظلية لقطيع من الأفيال + ضغط بفضل عدسة مقربة 200 مم.

37. نهر ساكورا في كيوتو

Serene wide landscape of the Philosopher's Path in Kyoto at peak cherry blossom season. Pink petals float on the narrow canal, with more drifting down from the trees above. Traditional wooden bridges arch over the water. Early morning mist softens the light into diffused pink. A solo figure in a dark kimono walks along the stone path for scale. 50mm lens, f/4, gentle pastel color grade. Ultra-realistic 4K.

تعليق باللغة الصينية: في موسم ازدهار أزهار الكرز على «طريق الفلاسفة» في كيوتو، تطفو البتلات الوردية على سطح القناة.

38. ضوء العاصفة في مرتفعات اسكتلندا

Dramatic landscape of the Scottish Highlands during a clearing thunderstorm. Dark churning clouds above a lone glen, with a single shaft of golden sunlight breaking through and lighting one patch of heather-covered hillside. Rainbow arc barely visible at the edge. Ancient standing stones in the foreground. Moody cinematic color grade — steel blue shadows, warm sunlit highlight. 24mm wide, f/11. Ultra-realistic 4K landscape photography.

تعليق باللغة الصينية: عندما كانت العاصفة الرعدية في مرتفعات اسكتلندا على وشك أن تهدأ، انبثق شعاع واحد من ضوء الشمس الذهبي من بين السحب الداكنة.


مكتبة الكلمات المفتاحية: الخيال والأسلوب الفني

بمجرد أن تحدد مرجعًا فنيًا معينًا في مجال الفن الخيالي (مثل Ufotable أو Arcane أو Studio Trigger أو رسومات Magic: The Gathering)، ستصبح الكلمات المفتاحية أكثر دقة. أما مصطلح "فن الخيال" العام، فلن يعطيك سوى رسومات خيالية عامة.

أميرة الحرب الخيالية ذات السيف السحري المضيء — نماذج لتوجيهات الرسوم المتحركة لـ GPT Image 2
"محاربة خيالية" على طراز Ufotable. ذكر اسم الاستوديو هذا أكثر فائدة من استخدام عشرين صفة.

39. Ufotable: أنمي "حرب الأميرات"

Epic anime-inspired fantasy warrior princess with flowing silver-white hair that reaches her waist, wearing ornate golden battle armor that hugs her figure with intricate engravings. She holds a glowing magical sword aloft, emitting bright blue energy. Cherry blossom petals and magical sparkles swirl in a violent storm around her. Her expression is fierce and determined. Dynamic action pose mid-battle leap. Ultra-detailed anime with CGI-quality lighting — Ufotable production quality. Rich colors, dramatic volumetric lighting. 4K quality.

تعليق بالصينية: أنمي من إنتاج Ufotable من سلسلة «حرب الأميرات»، السيف السحري الأزرق + عاصفة أزهار الكرز.

40. ساحرة الجنيات المظلمة

Dark fantasy dark elf sorceress with long flowing midnight-purple hair, pointed ears, and luminous violet eyes. She wears an elegant off-shoulder dark robe with intricate silver embroidery that reveals her collarbones and shoulders. Purple arcane energy spirals from her outstretched hands, illuminating her face from below. A vast star field and nebula visible in the background through a shattered stone archway. Semi-realistic fantasy illustration style with cinematic lighting. Ultra-detailed 4K.

تعليق باللغة الصينية: ساحرة من الجن المظلم، تتدفق طاقة سحرية أرجوانية من يديها.

41. جني غابة جيبلي

Studio Ghibli style painterly scene. A small forest spirit that looks like a glowing white fox with three tails walks through a mossy enchanted forest at dusk. Fireflies dance around it. Soft painterly brushstrokes, warm honey-gold light filtering through massive ancient trees. Hayao Miyazaki watercolor aesthetic. Ultra-detailed animation cel quality.

تعليق باللغة الصينية: ثعلب أبيض ثلاثي الذيل على طراز استوديو جيبلي يتجول في غابة الطحالب عند الغسق.

42. أركان: رياح حرب المدينتين

Arcane Netflix animated series style illustration. A young woman with blue-tipped braided hair and steampunk goggles leans against a graffitied alley wall in the undercity of Piltover. Neon magical rune-signs glow behind her. Textured painterly brushstrokes visible, 2D illustration with 3D depth, saturated purple and teal color story. Fortiche animation studio aesthetic. Ultra-detailed 4K.

تعليق باللغة الصينية: فتاة في أزقة المدينة السفلية بأسلوب Arcane Fortiche.

43. تنين ماجيك

Fantasy illustration in the style of a Magic The Gathering card. A colossal red dragon emerges from molten lava in an underground cavern, wings half-spread, mouth roaring with fire breath forming. A tiny knight in silver armor stands at the cavern's edge for scale, raising a shield. Dramatic low-angle hero composition. Rich oil-painting texture, Greg Rutkowski influence. Ultra-detailed 4K fantasy art.

تعليق باللغة الصينية: التنين الأحمر البركاني والفارس الصغير بأسلوب رسوم «ماجيك: ذا أسسولت».

44. سايبورغ

Cyberpunk fantasy fusion. A female samurai with a chrome katana stands on the rain-slicked rooftop of a neo-Tokyo megacorp tower at night. She wears a fusion of traditional kimono and carbon-fiber combat armor. Holographic cherry blossoms drift around her. Neon reflections on the wet rooftop, flying ad-drones in the background. Illustrated in the style of Katsuhiro Otomo meets modern 3D concept art. Ultra-detailed 4K.

تعليق باللغة الصينية: ساموراي على أسطح طوكيو السيبرانية + أزهار الكرز الهولوغرافية.

45. حورية البحر

Ethereal underwater fantasy. A graceful mermaid with iridescent teal and violet scales swims through a coral reef illuminated by shafts of sunlight piercing the water surface above. Her long turquoise hair flows weightlessly. Bubbles trail from her fingertips. School of small silver fish swim past. Dreamlike painterly quality, Lisa Frank meets National Geographic. Ultra-detailed 4K fantasy art.

تعليق باللغة الصينية: حورية البحر القزحية في الشعاب المرجانية، وأشعة الضوء تتسلل من سطح الماء.

46. قبطان منطاد على طراز "ستيمبانك"

Illustrated steampunk fantasy portrait. A young female airship captain in a brass-buttoned red military coat, goggles pushed up on her forehead, stands at the wheel of a wooden airship. Visible brass gears and copper pipes. Behind her, clouds and other distant airships. Warm golden hour lighting. Illustration style inspired by Nausicaa and Howl's Moving Castle. Ultra-detailed 4K.

تعليق باللغة الصينية: قائدة منطاد أنثوية على طراز هياو ميازاكي وتروس نحاسية.


تكرار متعدد الأساليب: نفس الموضوع، عوالم مختلفة

أحد أساليب العمل التي لا تحظى بالتقدير الكافي في GPT Image 2: تحديد العنصر الرئيسي والتركيز على تغيير نمط الأسلوب فقط. ستتمكن من رؤية تأثير كل نمط بوضوح على نفس الوجه ونفس الملابس ونفس الوضعية — ولن تضطر بعد ذلك إلى التخمين عند اختيار النمط.

مقارنة بين أنماط الصور الرباعية: الواقعية، الأنيمي، الرسم الزيتي، السايبربانك —— كلمات توجيهية لـ GPT Image 2
أربعة أنماط مختلفة لنفس الموضوع. هذه النسخ المتكررة مناسبة جدًا لإنشاء لوحة أفكار قبل تقديم خيارات الأنماط للعميل.

الكلمات الموجّهة الأساسية — يظل الموضوع متطابقًا تمامًا في المراحل الأربع من عملية التوليد:

A beautiful young woman with shoulder-length brown hair stands in a sunlit garden, wearing a simple white sundress, one hand lightly touching a rose bush. Soft golden afternoon light. Three-quarter body framing, slightly tilted head, warm smile.

التعليق بالصينية: فتاة ترتدي تنورة قصيرة تلمس وردة في حديقة مشمسة، في ضوء بعد الظهر الذهبي.

ثم قم بتبديل مواقع الأنماط فقط، مع تشغيل كل منها مرة واحدة:

47. التصوير الواقعي

[Base] — Hyperreal fashion photography aesthetic. 85mm lens at f/1.8, soft natural light, editorial sharpness. Ultra-realistic 4K.

48. الأنمي الياباني

[Base] — Japanese anime style with cel shading, bold line art, vibrant saturated colors, large expressive eyes. Kyoto Animation production quality. Ultra-detailed.

49. اللوحات الزيتية الكلاسيكية

[Base] — Classical oil painting style with visible thick brushstrokes, warm Renaissance lighting, chiaroscuro shadow, Vermeer-like color palette. Museum-quality.

50. السايبربانك

[Base] — Neon-drenched cyberpunk futurism. Holographic overlays, circuit-pattern light tattoos on skin, magenta and cyan rim lighting. Ghost in the Shell art direction. Ultra-detailed.

قمنا بتشغيل هذه السلسلة على حساب الاختبار الداخلي، واستغرقت الصورة الأولى حوالي 18 ثانية، بينما استغرق تغيير الأنماط في الصور التالية وقتًا مشابهًا. وبذلك، حصلنا على لوحة أفكار كاملة في أقل من دقيقتين و48 نقطة، ويمكن إدراجها في عرض العميل، وهو ما يعادل تقليص وقت البحث عن المواد الذي كان يستغرق نصف يوم إلى وقت شرب فنجان قهوة.


حالات الفشل الشائعة وحلولها

"نصائح مفيدة": GPT Image 2 أداة رائعة، لكنها ليست سحرية. فيما يلي أكثر أنواع الأخطاء شيوعًا التي سجلناها، بالإضافة إلى نماذج التصحيح المقابلة لها. استخدم هذا القسم كقائمة للتحقق من الأخطاء — عندما تفشل الصورة في المرة القادمة، تحقق من هذه النقاط بالترتيب، وستتمكن من حل معظم المشكلات بعد التعديل الأول.

الفشل 1: مخرجات عادية ومملة

Before:

A beautiful woman in a city.

After:

A 28-year-old woman with auburn hair pulled into a low ponytail, wearing a camel trench coat, crossing a Manhattan crosswalk at 6pm on a rainy Thursday. Yellow taxis blur past in motion-blurred streaks. 50mm lens, f/2, cinematic grain. Ultra-realistic 4K.

لم تقدم الكلمة التوجيهية الأولى أي نقطة ارتكاز للنموذج. الحل دائمًا هو الأسماء المحددة والأماكن المحددة.

الخطأ 2: خطأ في عدد الأصابع

يتفوق GPT Image 2 بشكل كبير على الجيل الأول من النماذج الانتشارية في تصوير الأيدي، لكن اللقطات المقربة للأيدي قد لا تزال تعاني من مشاكل. وهناك طريقتان موثوقتان لتجنب ذلك:

  • لا تجعل اليد هي العنصر الرئيسي، بل قم بقصها مباشرةً: "framing is shoulders up only" (التصوير من الكتفين فما فوق فقط).
  • اجعل اليد تمسك بشيء: "hands gently holding a ceramic coffee cup" (اليدان تمسكان برفق بفنجان قهوة خزفي). فوجود شيء ما يحدد الوضعية يساعد على تثبيت عدد الأصابع.

المشكلة 3: ظهور أحرف مشوشة في النص الموجود في الصورة

البرنامج ليس برنامجًا للتنسيق. إذا كنت تريد وضع شعار أو لافتة أو نص قابل للقراءة على الملصق في الصورة، فإما أن يكون النص قصيرًا جدًّا (مثل "لافتة مكتوب عليها OPEN")، أو أن تضيف جملة مباشرةً في التعليمات تقول: "لا يوجد نص أو حروف أو كلمات في أي مكان بالصورة"، ثم تقوم بتنسيقها بشكل منفصل في Figma/Photoshop.

الخطأ 4: تجاهل اتجاه الضوء

Before:

A portrait of a woman with dramatic lighting.

After:

A portrait of a woman lit by a single hard spotlight from 45 degrees camera-left, with deep black shadow filling the right side of her face. Rembrandt lighting with a small triangle of light on the shadowed cheek.

"الإضاءة الدرامية" لا تعني شيئًا. ما يمثل تلميحًا حقيقيًّا هو تحديد الاتجاه ودرجة الصلابة ونطاق تغطية الظلال.

الخطأ 5: ظهور الشخصية في المشهد الخطأ

إذا كان النموذج يضع الشخصية مرارًا وتكرارًا في استوديو تصوير عام بدلاً من المكتبة — انقل المشهد إلى مقدمة الكلمة المفتاحية، واكتبها بشكل أكثر تحديدًا:

In a candle-lit 17th-century English library with floor-to-ceiling oak shelves, leather-bound books, and a stone fireplace, a woman in…

وضع المشهد أمام العنصر الرئيسي يعني تحديد التكوين بأكمله قبل إدخال الشخصية.

الخطأ 6: الإفراط في استخدام الكلمات المفتاحية

عندما يتجاوز عدد الكلمات حوالي 1200 كلمة، تبدأ تأثير كل صفة على حدة في التلاشي. إذا كانت كلمات التوجيه الخاصة بك عبارة عن قائمة مملة تضم 40 علامة أسلوبية، فسيقوم النموذج بـ"حساب المتوسط". احتفظ بمرساة أسلوبية رئيسية (مثل "فيلم نوار")، واعتبر الباقي عناصر ثانوية.


استكمال 20,000 حرف: تلميحات طويلة منظمة

من المزايا التي لا تحظى بالتقدير الكافي في GPT Image 2 الحد الأقصى لعدد أحرف التوجيه الذي يصل إلى 20,000 حرف. فمعظم المنتجات المنافسة لا تتجاوز 1,000 إلى 2,000 حرف. قد لا تكون هذه الميزة ضرورية في صور الأشخاص، ولكنها مفيدة للغاية في المشاهد المعقدة التي تضم عدة شخصيات، أو موجزات الرسوم التصورية، أو سلسلة الصور التي تتطلب اتساقًا عاليًا مع العلامة التجارية، حيث يُعد استخدام التوجيهات الطويلة والمنظمة أمرًا يستحق العناء.

النماذج التي نستخدمها عادةً في موجز الإنتاج:

# المشهد
[المشهد: المكان، الوقت، الطقس، الفترة التاريخية، 2–3 جمل]

# الشخصيات
- الشخصية أ: [المظهر، الملابس، الوضعية الحالية، تعابير الوجه]
- الشخصية ب: [كما سبق]
- الممثلون الثانويون في الخلفية: [وصف موجز]

# التكوين
[التكوين: زاوية واسعة/لقطة متوسطة/لقطة مقربة؛ زاوية التصوير؛ العدسة؛ عمق المجال؛ موقع كل شخصية في الإطار — قاعدة الثلثين/نسبة الذهبية/المركز]

# الإضاءة
[مصدر الضوء، الاتجاه، الصلابة، درجة حرارة اللون، سلوك الظلال]

# COLOR
[وصف لوحة الألوان باستخدام 3–4 مصطلحات لونية. اتجاه الألوان — دافئة/باردة/ألوان منفصلة]

# STYLE
[مرجع لأسلوب رئيسي. مثل "أسلوب التصوير الفوتوغرافي لروجر ديكينز في فيلم «بلاد القتلة 2049»"]

# TECHNICAL
[تعديل الدقة، حبيبات الفيلم، حجم الصورة، علامات جودة الصورة. اجعل النص موجزًا]

# الاستثناءات
[الأشياء التي يجب تجنبها: "لا نصوص، لا شعارات، لا علامات مائية، لا أطراف إضافية"]

مثال — نص توجيهي كامل ومهيكل (حوالي 500 كلمة) لصورة إعلانية رئيسية واحدة:

# SCENE
A restored 1930s Art Deco ballroom on a rainy Tuesday evening in Paris, set during a private jazz performance. Tall arched windows on the left show wet boulevards and soft yellow streetlamp glow. Interior is lit warm and amber.

# CHARACTERS
- Lead: A striking 32-year-old woman with dark auburn hair in a low chignon, wearing a deep emerald-green silk bias-cut gown with a low back. She stands near a grand piano, one hand resting on its polished black lid, gazing thoughtfully toward the windows. Faint melancholy in her expression.
- Pianist: A middle-aged man in a black tuxedo, seated at the piano mid-performance, profile view, fingers on keys. He is a secondary figure — should not pull focus from the lead.
- Background: Three or four well-dressed patrons at candlelit round tables in soft bokeh, unidentifiable faces.

# COMPOSITION
Medium-wide shot. Lead character is on the right third of the frame, piano extending diagonally across the center toward the left. Rule of thirds. 50mm lens, f/2.2, shallow depth of field — lead and piano sharp, background patrons and windows softly blurred. Eye-level camera height.

# LIGHTING
Warm tungsten chandelier overhead providing ambient glow on the room. Key light on the lead is a single practical wall sconce camera-right at 45 degrees, modeling her face in gentle Rembrandt pattern. Rim from the windows behind her (cool blue rainy light) separates her hair and shoulder edge from the warm interior. Overall contrast: high but soft.

# COLOR
Deep emerald green (dress) and warm amber (interior) as hero colors, with cool blue window light as counter-accent. Warm gold dominant, with selective teal shadow detail. Film-look color grade reminiscent of early Wong Kar-wai.

# STYLE
Cinematic still in the visual language of In the Mood for Love meets a modern luxury cognac commercial. Anamorphic lens quality (slight horizontal flare on the candles). Painterly softness, 35mm film grain.

# TECHNICAL
Ultra-realistic 4K, 16:9 aspect, cinematic frame.

# EXCLUSIONS
No text, no signage, no logos, no watermarks, no visible phones or modern electronics, no extra limbs, no warped fingers on the pianist.

تتميز البنية المقسمة إلى فقرات بميزتين: الأولى هي أنها تمنع أنت من إغفال ملء أي خانة؛ والثانية هي أنها توفر للنموذج مدخلاً منظمًا للتحليل، بدلاً من نص نثري يضم 500 كلمة دفعة واحدة. يكفي تعديل فقرتي «CHARACTERS» و«SCENE» في السلسلة بأكملها لإنتاج لقطات مختلفة لنفس الإعلان دفعة واحدة.

نصيحة عملية: عندما يكون 80% من الصورة صحيحًا، لكن عنصرًا ما غير صحيح (مثل ارتداء البطلة لونًا خاطئًا)، لا تقم بإعادة كتابة النص التوجيهي بالكامل. انسخ النص الناجح، وقم بتعديل الجزء المعني فقط، ثم أعد التشغيل مرة أخرى. تُظهر سجلات التكرار الداخلية لدينا أن النصوص الموجهة المنظمة تحتاج في المتوسط إلى 2.8 محاولة للحصول على إطار بمستوى الصورة الرئيسية؛ بينما النصوص الموجهة الحرة غالبًا ما تتجاوز 6 محاولات. وبحساب 12 نقطة لكل صورة، فإن هذا يمثل فرقًا بين 2 دولار و5 دولارات لكل صورة رئيسية.

هل تريد أن تسلم مهمة سير عمل الكلمات المفتاحية المنظمة إلى زملائك؟ اجعلهم يقرؤون أولاً دليل البدء، ثم عد إلى هذه المقالة.


الأسئلة الشائعة

ما هو أهم شيء في تلميحات GPT Image 2؟

الإضاءة والعدسة — هذا هو الترتيب الصحيح. يمكن إنقاذ الصورة إذا كان الهدف والمشهد غير واضحين تمامًا، لكن إذا كان اتجاه الضوء واختيار العدسة غير واضحين، فستبدو الصورة دائمًا كصورة جاهزة من مكتبة الصور. إذا كان لديك الوقت الكافي لتعديل عنصرين فقط، فقم بتعديل هذين العنصرين. حدد بوضوح "من أي اتجاه يأتي الضوء، ومدى قوة الإضاءة، وأين تقع الظلال"، ثم حدد بوضوح "مقاس العدسة بالملليمتر، وفتحة العدسة، والمسافة بين الكاميرا والهدف"، وبذلك تكون الأساسيات للصورة قد تم تأسيسها.

ما هو الطول المثالي لعبارة التوجيه في GPT Image 2؟

بالنسبة لصور الأشخاص والمشاهد البسيطة، فإن النطاق الأمثل يتراوح بين 80 و150 كلمة. أما بالنسبة للصور ذات الطابع السينمائي الملتقطة بزاوية واسعة والتي تحمل إشارات إلى حقبة زمنية أو أسلوب معين، فيتراوح النطاق بين 150 و250 كلمة. أما بالنسبة للمشاهد التي تضم عدة أشخاص أو موجزات الإعلانات، فيُستخدم نموذج منظم يتراوح بين 400 و800 كلمة. وقد تم تحديد الحد الأقصى البالغ 20,000 حرف للحالات الاستثنائية فقط — فنادرًا ما يتجاوز الاستخدام اليومي 500 كلمة.

هل يمكن ذكر أسماء فنانين حقيقيين في الكلمات الموجّهة؟

يمكنك الإشارة إلى أسلوب أو حقبة معينة — مثل "فيلم نوار" أو "جيالو السبعينيات" أو "أسلوب استوديو جيبلي التشكيلي" — حيث سيتعرف النموذج على هذه اللغات البصرية. لكن استخدام أسماء الفنانين الأحياء مباشرةً كعلامات أسلوبية يعد أمرًا غير أخلاقي، كما أنه يتم تصفية هذه العلامات بشكل متزايد من قبل النموذج. والأفضل هو وصف الأسلوب والوسيلة والفترة الزمنية، بدلاً من ذكر أسماء الأفراد.

لماذا تختلف نتائج نفس الكلمة المفتاحية في كل مرة؟

نموذج الانتشار هو في جوهره عشوائي — فهو يبدأ من صورة مشوشة ويقوم بإزالة التشويش منها ليُنتج صورة. عند تشغيل نفس التلميح مرتين، ستحصل حتماً على نتائج متقاربة ولكنها مختلفة. هذه سمة من سمات النموذج وليست خطأً، وهي أيضاً مصدر "التنوع". لإعادة إنتاج هذه النتائج، تدعم معظم أنظمة التوليد معلمة البذرة (seed). يمكن الرجوع إلى مدونة OpenAI حول توليد الصور للاطلاع على الخلفية التقنية.

هل يؤثر طول الكلمات المفتاحية على السعر؟

لا يؤثر ذلك. يستخدم GPT Image 2 نظام تسعير ثابت: 12 نقطة لكل صورة، سواء كتبت 20 كلمة أو 2000 كلمة. ما يؤثر على التكلفة هو عدد الصور التي يتم إنشاؤها فقط.

كم مرة يجب تجربة فكرة ما قبل التخلي عنها؟

قاعدة عامة: جرب نفس الكلمة المفتاحية 3 مرات لتلاحظ التباين الطبيعي، وإذا لم تكن النتيجة صحيحة، قم بتعديل خانة واحدة فقط، ولا تبدأ من الصفر. في معظم الأحيان، ما تحتاج إلى تعديله هو الإضاءة أو زاوية التصوير. إذا وصلت إلى المحاولة الثامنة ولم تحرز أي تقدم، فهذا يعني أن هناك مشكلة في البنية — ارجع إلى صيغة الثمانية مواقع وتحقق من عدد المواقع التي ملأتها بالفعل. لدينا عادة داخلية أخرى: تسجيل كل كلمة تلميح تم إنشاؤها والبذرة المقابلة لها في جدول، مما يسهل عند المراجعة معرفة أي كلمة كانت فعالة حقًا.

هل يمكن استخدام الصور التي تم إنشاؤها بواسطة GPT Image 2 في الأغراض التجارية؟

نعم. وفقًا للشروط القياسية للمنتج، فإن الصور التي تقوم بإنشائها هي ملكك ويمكنك استخدامها لأغراض تجارية. وتُعتبر شروط الترخيص الموضحة في تذييل الموقع هي المرجع النهائي؛ وفيما يتعلق بالحالات عالية المخاطر (مثل الإعلانات التجارية وأغلفة المنشورات وغيرها)، يُنصح باستشارة محامٍ. علاوة على ذلك، لا تعتبر الأشخاص الحقيقيين أو العلامات التجارية المذكورة في الكلمات الموجّهة بمثابة «بطاقة إعفاء» من المسؤولية — فهذه مسائل تتعلق بحقوق الصورة وحقوق العلامات التجارية، ولا تخضع لشروط منتجات الذكاء الاصطناعي.

ما الفرق بين كلمات التوجيه في "text-to-image" و"image-to-image"؟

تبدأ عملية "text-to-image" من صورة عشوائية، حيث تكون الكلمات الموجهة هي الدليل الوحيد. أما عملية "image-to-image" فتبدأ من الصورة المرجعية التي قمت بتحميلها، حيث تعمل الكلمات الموجهة فقط على تعديلها. يجب أن تكون الكلمات الموجهة في عملية "image-to-image" أقصر، وتركز على "ما الذي يجب تغييره" ("تغيير الأسلوب إلى أسلوب لوحة زيتية، مع الحفاظ على وضعية الشخصية وملابسها")، بدلاً من إعادة وصف المشهد بأكمله — فالصورة المرجعية توفر بالفعل معظم العناصر الأساسية.


هل أنت مستعد لبدء العمل؟

لديك الآن أكثر من 50 كلمة دلالية، ومجموعة من الصيغ ذات الثمانية خانات، وقائمة لإصلاح الحالات الفاشلة، بالإضافة إلى نموذج منظم للكلمات الدلالية الطويلة. الخطوة التالية هي تشغيل الأداة وتجربة واحدة فعليًا. اختر أي واحدة منها والصقها، وانظر إلى أي مدى يختلف الناتج عن الصورة التي تتخيلها في ذهنك — ثم قم بتعديل الخانة التي انحرفت عن المسار فقط، وأعد التشغيل مرة أخرى. في غضون جولتين أو ثلاث، ستتمكن من إنتاج صور "جاهزة للتسليم" بشكل ثابت.

أضف هذه المقالة إلى قائمة الإشارات المرجعية في متصفحك، أو ألصق صيغة "الثمانية عناصر" بجانب شاشتك الثانية. لا يكمن التحسن الحقيقي في حفظ هذه الكلمات المفتاحية، بل في تحويل الصيغة إلى ذاكرة عضلية — وعندها ستتمكن تلقائيًا من تحليل أي صورة مرجعية إلى عناصرها الأساسية، مثل الموضوع والضوء والزاوية والأسلوب.

ابدأ باستخدام GPT Image 2 مجانًا →

تابع القراءة:

هل لديك استفسار بشأن مصطلح معين؟ اترك لنا رسالة عبر الموقع — فنحن نقرأ كل رسالة، وغالبًا ما تظهر المصطلحات الأكثر تكرارًا في الإصدار التالي من الدليل. يمكنك قراءة الخلفية النظرية جنبًا إلى جنب مع مقالة ويكيبيديا حول نماذج إنشاء الصور من النص، والتي تستغرق قراءتها حوالي 10 دقائق. إذا كنت ترغب في تحسين مهاراتك، يمكنك في الخطوة التالية الاطلاع على دليل الاستخدام من نفس السلسلة، لترقية سير العمل من "إنشاء صورة جيدة" إلى "إنتاج مجموعة من الصور ذات أسلوب موحد بشكل مستمر".

فريق GPT Image 2

فريق GPT Image 2

إنشاء الصور والفيديوهات باستخدام الذكاء الاصطناعي

دليل تلميحات GPT Image 2: أكثر من 50 نموذجًا عمليًا (2026) | مدونة GPT IMAGE 2 — دروس ونصائح حول إنشاء مقاطع الفيديو باستخدام الذكاء الاصطناعي وأحدث المستجدات