Návod k použití GPT Image 2: Kompletní průvodce od registrace po generování obrázků (2026)

Stručné shrnutí

GPT Image 2 je nástroj pro generování obrázků pomocí umělé inteligence, který běží přímo v prohlížeči. Nabízí pouze dva režimy – text-to-image (z textu na obrázek) a image-to-image (z obrázku na obrázek) – a účtuje jednotnou cenu 12 bodů za obrázek. Neobsahuje žádné doplňkové možnosti, jako je rozlišení, poměr stran nebo úroveň kvality. Tento článek vás provede celým procesem od registrace, prvního vygenerování obrázku, nahrání referenční fotografie pro úpravy až po osvědčené postupy pro zadávání promptů, které vám umožní vytvářet skutečně použitelné obrázky. Vyzkoušejte GPT Image 2 zdarma →

Než začnete: Co si musíte připravit

K používání GPT Image 2 nepotřebujete výkonnou grafickou kartu, Photoshop ani žádné zkušenosti s umělou inteligencí. Veškeré výpočty probíhají na serveru, prohlížeč slouží pouze k zadávání příkazů a zobrazování výsledků. To, co si skutečně musíte připravit, je velmi jednoduché:

Moderní prohlížeč. Lze použít aktuální verze prohlížečů Chrome, Edge, Safari, Firefox nebo Arc. Zapnutí hardwarové akcelerace zajistí plynulejší náhled, není však nezbytné.
E-mailový účet. Podporuje registraci pomocí e-mailu a hesla i přihlášení jedním kliknutím přes Google. Lze použít firemní e-mail i Gmail, domény jednorázových e-mailů budou odmítnuty.
Malý zůstatek bodů. Ať už jde o generování obrázků z textu nebo z obrázků, bez ohledu na délku zadání a výstupní poměr, cena je jednotná: 12 bodů za obrázek. Nové účty mají k dispozici bezplatné zkušební body, které postačí na prvních několik obrázků v tomto tutoriálu.
Jeden referenční obrázek (volitelné). Pokud plánujete použít generování obrázků z obrázků, připravte si jeden až dva zdrojové obrázky ve formátu JPG / PNG / WebP, přičemž velikost jednoho obrázku by neměla přesáhnout 10 MB. Nejstabilnější výsledky se dosahují u čtvercových nebo vertikálních kompozic.
**Stačí jen hrubá představa. ** Začátečníci se často snaží hned na poprvé napsat „dokonalý prompt“, což je naopak vede k rozporuplným pocitům. Skutečně účinná metoda spočívá v tom, že nejprve vytvoříte obrázek pomocí jednoduchého promptu, podíváte se, co vám model poskytne, a teprve poté se rozhodnete, jak to upravit.

Do dubna 2026 není pro používání GPT Image 2 nutné stahovat žádný klient, žádat o API klíč ani čekat ve frontě. Stačí otevřít domovskou stránku, přihlásit se a začít generovat – to jsou všechny tři kroky.

Obálka návodu k použití GPT Image 2: Autor pracuje s generátorem obrázků pomocí AI u svého notebooku — Stůl, jedna karta v prohlížeči, krátký popis – to je celé pracovní prostředí GPT Image 2.

Tento článek je určen pro ty, kteří chtějí tento nástroj využívat naplno. Ovládání nástroje se naučíte za dvě minuty, ale to, co vyžaduje skutečné úsilí, jsou rozhodnutí typu „co napsat, na co se zaměřit a kdy provést úpravy“ – právě o tom pojednávají následující kapitoly. Pokud spěcháte, můžete nejprve přejít k metodě č. 1 a až narazíte na první neuspokojivý výsledek, vrátit se zpět k kapitolám věnovaným tipům pro zadávání dotazů a častým chybám.

Metoda 1: Text na obrázek – vytvoření prvního obrázku od nuly

Vytváření obrázků na základě textu je funkce, kterou si většina uživatelů při návštěvě GPT Image 2 chce vyzkoušet jako první: stačí napsat popis, kliknout na tlačítko „Generovat“ a model vám vrátí hotový obrázek. Níže najdete podrobný návod.

Krok 1: Spusťte generátor a přihlaste se

Otevřete Domovská stránka GPT Image 2. Panel generátoru se na počítači nachází na úvodní obrazovce a na mobilních zařízeních v prvním úplném bloku. Pokud nejste přihlášeni, zobrazí se odkaz „Generovat po přihlášení“. Přihlaste se pomocí e-mailu nebo účtu Google, což zabere méně než minutu.

Po přihlášení se v pravém horním rohu zobrazí zůstatek bodů. Ujistěte se, že máte alespoň 12 bodů – nový účet má k dispozici zkušební limit, takže první příklad v tomto článku můžete provést i bez propojení platební karty.

Krok 2: Přejděte na záložku „Text to Image“

V horní části generátoru jsou dvě záložky: Text to Image a Image to Image. Nejprve vyzkoušejte výchozí funkci převodu textu na obrázek. Pole pro zadávání textu se nachází přímo pod záložkami.

Není třeba ručně vybírat model – v pozadí se využívá funkce gpt-image-2-text-to-image od KIE, bez roletových nabídek pro formáty, poměry stran a rozlišení: jeden model, jedna cena.

Krok 3: Nejprve napište záměrně krátký popisek

Častou chybou začátečníků je, že do prvního promptu nacpou všechna adjektiva, která znají. To nedělejte. Nejprve zkuste krátký a konkrétní popis a podívejte se, jak si model poradí ve „výchozím stavu“. Následující text je prompt, který jsem použil při přípravě tohoto článku při prvním testování:

A golden retriever puppy sitting in a sunlit field of wildflowers, shallow depth of field,
warm afternoon light.

(Popis: Štěně zlatého retrívra sedí v trsu polních květin na slunci, s malou hloubkou ostrosti a v teplém odpoledním světle.)

Vložte text do vstupního pole a klikněte na Generate. Většina promptů vrátí výsledek za 20 až 40 sekund, v době špičky to může trvat o něco déle.

Krok 4: Upřímné zhodnocení výsledků

Když jsem poprvé spustil výše uvedený příkaz, výsledek byl v zásadě přesný: teplé tóny, ostré oči, přirozeně rozostřené pozadí – ale tlapky psa byly mírně rozmazané, což je typická slabina současných obrazových modelů. To je zcela normální; tento krok neslouží k hodnocení, ale k tomu, abyste si vytvořili představu o „výchozím výstupu“.

Na prvním obrázku je třeba si všimnout alespoň tří věcí:

Je hlavní motiv správný? Zobrazuje model přesně to, co jste chtěli? Nebo se od toho odchyluje (například je zlatý retrívr namalován jako labrador)?
**Směr světla. ** Odpovídá skutečné osvětlení vašemu popisu? „Teplé odpolední světlo“ by mělo být měkké a směrové boční světlo, nikoli světlo shora.
Kompozice. Odpovídá záběr motivu představě, kterou máte v hlavě? Nebo je motiv nešikovně umístěn uprostřed?

Pokud je některý z těchto tří aspektů v nepořádku, máte jasný důvod k úpravě klíčových slov – místo toho, abyste je slepě generovali znovu.

Krok 5: Napište vylepšený popisek

Níže je pokročilejší verze stejné scény. Hlavní motiv i přístup k osvětlení zůstaly stejné, ale byla použita struktura, která lépe vyhovuje GPT Image 2:

A 3-month-old golden retriever puppy with fluffy fur and floppy ears, sitting upright in a
meadow of wild daisies and lavender. Warm late-afternoon sunlight streams from the left,
casting long gentle shadows and creating a soft golden rim light on the fur. Shallow depth
of field, background softly blurred with bokeh. Shot on an 85mm lens, eye level with the
puppy. Photorealistic, high detail, natural colors.

(Čínský popis: Tříměsíční štěně zlatého retrívra s nadýchanou srstí a měkkými ušima sedí na louce poseté sedmikráskami a levandulí. Teplé odpolední slunce svítí zleva, vrhá jemný dlouhý stín a na srsti vytváří zlatý konturový lesk. Malá hloubka ostrosti, pozadí je rozostřené s efektem bokeh. Objektiv 85 mm, pohled z úrovně štěněte. Realistický styl, vysoká úroveň detailů, přirozené barvy.)

Oproti prvnímu vydání došlo ke čtyřem změnám:

Konkrétnější detaily subjektu („tříměsíční“, „nadýchaná srst“, „měkké uši“), aby si model mohl lépe představit danou postavu.
Jasný směr světla („zleva“, „konturové světlo dopadající na srst“), namísto pouhého popisu „teplé“.
Jazyk objektivu („objektiv 85 mm“, „pohled z úrovně štěněte“) poskytuje modelovi konkrétní kompoziční šablonu.
Adjektiva popisující kvalitu umístěte na konec („realistické, vysoce detailní, přirozené barvy“) – jsou krátká a nevytlačují hlavní obsah.

Klikněte znovu na „Generate“. Druhý obrázek by měl být blíže tomu, co máte na mysli. Pokud to stále není ono, nepřepisujte celý odstavec – měňte vždy jen jednu proměnnou, generujte a porovnávejte, abyste zjistili, který výraz má vliv.

Užitečný mentální model: Rozdělte zadání na čtyři „sloty“ – subjekt, akce, prostředí a styl. Vždy upravujte pouze ten slot, který je problémový. Pokud je nesprávný druh objektu, upravte slot subjektu; pokud je nesprávné osvětlení, upravte slot prostředí; pokud je výsledek kreslený, ale vy chcete fotografii, upravte slot stylu.

Krok 6: Uložení, stažení nebo pokračování v iteracích

Jakmile budete s obrázkem spokojeni, pod náhledem se zobrazí tlačítko pro stažení. Každý vygenerovaný obrázek se automaticky uloží do historie vašeho účtu, kde si můžete prohlédnout starší verze, zkopírovat předchozí zadání a pokračovat v úpravách. Pokud budete chtít později v nástroji pro generování obrázků tuto postavu dále upravovat, stačí ji z historie vybrat jako výchozí obrázek.

Filmově působivý obrázek vygenerovaný pomocí modelu GPT Image 2: Žena v bílé hedvábné dlouhé sukni na pláži v zlaté hodince — Výstup textového podnětu pro generování obrázku s konkrétním popisem osvětlení. Pokud uvedete „zlatou hodinu“ a „hedvábí v protisvětle“, model získá jasné vizuální vodítko, na jehož základě může tvořit.

Právě jste prošli celým pracovním cyklem generování obrázků z textu, který se skládá z kroků „otevření – napsání textu – vyhodnocení – doladění – regenerování“. Ve zbytku tohoto článku se dozvíte, jak tento cyklus urychlit a ušetřit při tom body.

Pokud GPT Image 2 používáte dlouhodobě, doporučujeme si vést textový soubor s „účinnými pokyny“. Nejde o šablony, ale o váš vlastní deník – pokaždé, když budete s výsledným obrázkem spokojeni, vložte do něj jako poznámku celý text pokynu. Za půl roku bude tento soubor lépe odpovídat vašemu vkusu než jakékoli obecné šablony z internetu.

Metoda č. 2: Vytváření obrázků z obrázků – úpravy stávajících fotografií nebo změna jejich stylu

Model typu „image-to-image“ (zkráceně i2i) vychází z jednoho zdrojového obrázku, přičemž model zachová části, které chcete zachovat, a zbytek přetvoří podle zadaného popisu. Tento model se hodí pro požadavky typu „stejná osoba v jiném oblečení“, „stejný produkt na jiném pozadí“ nebo „stejná kompozice v jiném stylu“.

Krok 1: Přejděte na kartu „Image to Image“

Vraťte se do generátoru domovské stránky a klikněte na Image to Image. Nad vstupním polem se objeví oblast pro nahrávání souborů; pole pro zadávání textu zůstává zachováno a stále podporuje maximálně 20 000 znaků, nyní však spolupracuje s nahraným obrázkem.

V pozadí se využívá funkce gpt-image-2-image-to-image, cena je stejná jako u generování obrázků z textu – 12 bodů za obrázek. Neexistuje samostatný posuvník pro nastavení „intenzity“; míra změny závisí výhradně na formulaci vašeho zadání.

Pokud jste již používali jiné nástroje pro InPainting (retušování pomocí masky), nezapomeňte změnit přístup: GPT Image 2 nevyžaduje kreslení masky, ale nejprve si přečte celý zdrojový obrázek i celý textový popis a teprve poté rozhodne, co změnit. U 80 % reálných požadavků (změna pozadí, výměna oblečení, změna denní doby na noční) je úpravy pouze textového popisu dokonce jednodušší.

Krok 2: Nahrajte zdrojový obrázek

Přetáhněte soubor JPG, PNG nebo WebP do oblasti pro nahrávání nebo klikněte na tlačítko „Vybrat soubor“. Pro první pokus doporučujeme vybrat fotografii s čistým osvětlením a jednoduchou kompozicí. Fotografie s pohybovým rozmazáním, slabým osvětlením nebo rušivým pozadím poskytují modelu větší prostor pro „volnou interpretaci“, což naopak znesnadňuje porovnání výsledků.

Tento obrázek je typickým příkladem toho, co „nováček při svém prvním pokusu s nástrojem AI obvykle nahraje“ – obyčejná selfie pořízená v interiéru.

Obyčejná selfie pořízená v interiéru jako příklad zdrojového obrázku pro generování obrázků pomocí GPT Image 2 — Původní snímek: Mírně přeexponovaná každodenní selfie pořízená v interiéru. Nejedná se o profesionálně upravenou fotografii, ale právě o ten typ snímku, který se k úpravám v aplikaci „Tubeshot“ hodí nejlépe.

Krok 3: Nejprve se rozhodněte – jde o „drobnou opravu“ nebo o „proměnu“?

Než začnete psát popis, nejprve si ujasněte, jak rozsáhlé změny chcete provést. Generování obrázků a přepsání obrázků představují dva zcela odlišné záměry, a proto se i způsob psaní popisu liší:

Drobná úprava (Edit): Zachovat většinu, změnit pouze jeden prvek. „Změnit barvu oblečení na tmavě modrou.“ „Odstranit šálek s kávou.“ „Změnit pozadí na knihovnu.“ "
Transformace (Transform): Zachovat identitu, přepsat celou scénu. „Stejná osoba, nyní v čínském oděvu, stojící na terase paláce pod měsícem.“ „Stejný produkt, nyní s mramorovou deskou a studiovým osvětlením.“

Čím podrobněji popisuješ nový scénář v pokynu, tím více model změní; pokud zmíníš pouze jednu vlastnost, ostatní části se obvykle zachovají. To je páka, kterou můžeš použít k ovládání „rozsahu změn“, aniž bys musel používat posuvníky.

Příklad: change the shirt to navy blue (změnit košili na tmavě modrou) je úzká úprava, při které se nezmění obličej, účes, póza, pozadí ani osvětlení. Změňte to na „She is now wearing a tailored navy suit, standing in a glass-walled corporate office at golden hour“ (Teď má na sobě na míru šitý tmavě modrý kostým a stojí v kanceláři s prosklenými stěnami v době zlaté hodinky) a jedná se o proměnu – kostým, prostředí i osvětlení se zcela mění, zachovává se pouze obličej a postava. Je to stále jedna věta, ale rozsah změn závisí na tom, kolik nových scén popíšete.

Krok 4: Napište pokyn, který modelu sdělí, „co má zachovat“

Níže uvádím klíčová slova, která jsem použil při „proměně“ výše uvedené zdrojové fotografie:

Same woman — identical facial features and hair. Transform the scene: she now wears an
elaborate crimson-and-gold hanfu with intricate embroidery and a jeweled phoenix hairpin.
She stands on a moonlit palace terrace, red lanterns glowing softly in the background,
cherry blossom petals drifting in the air. Warm lantern light from the right, cool
moonlight fill from the left. Cinematic shallow depth of field, elegant composition, 4K
photorealistic.

(Význam v čínštině: Stejná žena – obličej i účes zůstaly beze změny. Přepracování scény: Nyní má na sobě nádherné červeno-zlaté čínské šaty s bohatou výšivkou a ve vlasech má zlatou sponu ve tvaru fénixe. Stojí na palácové terase ve svitu měsíce, v pozadí jsou červené lucerny s měkkým světlem a padají okvětní lístky sakury. Vpravo teplé světlo luceren, vlevo studené měsíční světlo. Filmová malá hloubka ostrosti, elegantní kompozice, 4K realismus.)

Na dvou místech je to výslovně uvedeno:

„Stejná žena – identické rysy obličeje a vlasy.“ Tato věta prakticky zajišťuje zachování identity. Pokud by zde nebyla uvedena, model by se náhodně posouval.
Úplný popis nové scény. Je třeba jasně popsat oblečení, místo, rekvizity i směr světla. Model právě rekonstruuje celé prostředí, a proto potřebuje celý soubor pokynů, nikoli pouze jeden štítek.

Krok 5: Porovnání před a po vytvoření

Klikněte na tlačítko „Generate“ a podobně. Když jsem to testoval, výsledný obrázek zachoval rozpoznatelné rysy obličeje a kontury účesu, zatímco vše ostatní bylo generováno podle zadaného popisu.

Výstup GPT Image 2: Stejná postava byla přetvořena do scény z historického palácového dramatu — Vytvoření obrázku: Identita postav zůstává stejná, oblečení, prostředí a osvětlení se však zcela přizpůsobí zadání.

Podívejte se na to v celkovém kontextu. Pokud se obličej příliš liší, přidejte do pokynů klauzuli „same person“ (například doplňte „preserve exact face shape, same eyes, same nose, same lip shape“ – zachovat přesný tvar obličeje, stejné oči, stejný nos, stejný tvar rtů); pokud se scéna nezměnila dostatečně, doplňte více detailů o prostředí. To jsou vaše nástroje, které máte k dispozici.

Krok 6: Bez opuštění stránky použijte výstup jako vstup pro další krok

Největší výhodou generování obrázků je to, že právě vytvořený výstup je sám o sobě platným výchozím obrázkem pro další úpravu. Stačí kliknout na „Použít jako nový vstup“ a zadat nový popis (například „stejná scéna, ale za úsvitu“ nebo „stejná póza, ale s vějířem v ruce“). Konečný obrázek, který vznikne postupnými drobnými úpravami, je téměř vždy čistší než ten, který vychází z jednoho příliš dlouhého popisu, jenž se snaží obsáhnout vše najednou.

„Řetězová editace“ je jednou z nejužitečnějších pracovních technik, které si z tohoto článku můžete odnést. Častá chyba začátečníků: napsat 300 slov dlouhý popis, který má obsáhnout vše, a i po osmi pokusech se stále nedaří dosáhnout správného výsledku. Profesionální postup spočívá v postupném rozdělení práce: nejprve se zaměřte na postavu a poté na základě výsledku z předchozího kroku vytvořte oblečení, prostředí a osvětlení. Každé kolo má hodnotu 12 bodů, celkem tedy 48 bodů za čtyři kola – výsledný obrázek je mnohem čistší než ten, který vznikne po deseti opakovaných pokusech najednou.

Stylová transformace v GPT Image 2: vlevo skutečná fotografie pláže, vpravo cyberpunková neonová verze — Další krok ve stylové transformaci: stejná postava, stejná póza, přenesena z reálné pláže na neonovou cyberpunkovou střešní terasu. Stačí v pokynech zadat „same pose“ a model zachová geometrii, zatímco vše ostatní se přizpůsobí nové scéně.

Tipy a triky pro klíčová slova, které skutečně zlepší výsledky vyhledávání

Nyní již ovládáte celý postup. Rozdíl mezi novými uživateli prvního dne a zkušenými uživateli, kteří dokážou pomocí GPT Image 2 vytvořit portfolio, nespočívá v nějakém tajemném příkazu, ale v tom, že vědí, které triky skutečně fungují. Následujících devět tipů přináší při praktickém použití nejvyšší návratnost investic.

Tip 1: Hlavní část umístěte na začátek, klíčová slova na konec

Na začátek popisu uveďte „kdo/co je na obrázku“ a výrazy popisující kvalitu, jako jsou photorealistic, cinematic, 4K a high detail, přesuňte na konec. Model čte popis od začátku do konce, přičemž nejvyšší váhu má předmět uvedený na začátku, zatímco předmět, který je schován za sedmi značkami kvality, bude jeho význam oslaben.

Slabší: Hyperrealistická 4K mistrovská kinematograficky detailní fotografie kočky sedící na okenním parapetu v rozlišení Ultra HD

Silný: Černobílá kočka ve smokingu sedí na dřevěném parapetu a pozoruje deštivou městskou ulici venku. Z okna proudí měkké rozptýlené světlo, hloubka ostrosti je malá. Fotorealistické, filmové.

Tip 2: Popište „směr světla“, nikoli „atmosféru světla“

„krásné osvětlení“ je téměř jako nic neříkat. Teprve „teplé světlo západu slunce zleva, dlouhé stíny padající doprava“ modelce sdělí, kam přesně má každý stín dopadat. Světelné zdroje s jasným směrem a názvem (window light, rim light, softbox from above, neon fill from behind) patří k nejúčinnějším prostředkům, jak s minimem slov výrazně zlepšit kvalitu obrazu.

Tip 3: Popište kompozici fotografickými termíny a okamžitě zvýšíte realističnost snímku

Chcete-li dosáhnout realistického vzhledu fotografií, přejměte si slovník fotografů. Kombinací ohniskových vzdáleností (35 mm, 50 mm, 85 mm, 135 mm), pojmů týkajících se hloubky ostrosti (shallow depth of field, deep focus) a úhlů záběru (eye level, low angle, overhead) získáte konkrétní šablony pro kompozici. Hodný zdroj informací je článek Camera lens na anglické Wikipedii, který přečtete za 10 minut a který vám pomůže vědomě vybírat ohniskové vzdálenosti.

Tip č. 4: Popisujte styl podle „médií“ namísto „jména umělce“

Výraz „ve stylu určitého malíře“ je nejen nejistý, ale také vyvolává spory ohledně autorství. Jistější je popsat samotné médium: olejomalba s viditelnými tahy štětcem, tužková skica s křížovým šrafováním, vintage vzhled Kodachrome filmu se zrnitostí, čistá vektorová ilustrace s plochými barvami. Takto poskytnete estetické vodítko, aniž byste se spoléhali na konkrétní osobu.

Tip č. 5: Nahraďte „negativní omezení“ „pozitivním popisem“

GPT Image 2 nemá samostatné pole pro zadávání negativních pokynů. Chcete-li se vyhnout určitým prvkům, nejlepším způsobem je jasně popsat, co chcete. Místo toho, abyste psali „žádní lidé, žádný text, žádný nepořádek“, napište raději „prázdná místnost s čistými stěnami, minimalistická kompozice, jedna rostlina v rohu“. Pozitivní popis je mnohem spolehlivější než negativní formulace.

Tip 6: Při tvorbě obrázků nejprve určete postavu a poté přepište scénu

Při „změně oblečení/scény“ je klíčová první věta pokynu, pokud chcete, aby tvář zůstala stejná. Věta typu „Stejná osoba – zachovat rysy obličeje, barvu vlasů a odstín pleti“ umístěná na začátku je účinnější než jakékoli krásné popisy scény, které následují. Pokud potřebujete, aby identita byla ještě výraznější, doplňte „stejný tvar očí, stejný nos, stejné rty“. Výslovné uvedení je účinnější než naznačování.

Tip 7: Postupné vylepšování místo přepisování celých úseků

Změňujte vždy jen jednu proměnnou. Pokud je držení těla správné, ale oblečení ne, upravte pouze část týkající se oblečení; pokud je osvětlení špatné, ale ostatní je v pořádku, upravte pouze část týkající se osvětlení. Teprve tak vytvoříte skutečně kontrolovatelnou zpětnou vazbu a budete vědět, která změna co ovlivnila. Přepisování celé části tento signál zničí a vyčerpá vaše body.

Tip 8: Napište pokyny v pořadí, které by měl model upřednostnit

Umístěte klíčové prvky na začátek: objekt → akce → prostředí → styl. Pokud napíšete „ve stylu olejomalby je zde žena v červených šatech kráčející po dlážděné ulici za soumraku“, sdělujete modelu, že „jde především o olejomalbu“ a vše ostatní je jen doplňkem. Změňte to na „Žena v červených šatech kráčí po dlážděné ulici za soumraku, ztvárněno jako olejomalba“. Model nejprve uslyší hlavní téma a až nakonec médium. Informační obsah je stejný, ale výsledný obrázek je u druhé varianty obvykle výrazně přesnější.

Tip č. 9: Používejte výrazy, které skutečně používají fotografové a režiséři

Dutch angle (holandský úhel), rack focus (změna zaostření), golden hour (zlatá hodinka), overcast daylight (denní světlo za zatažené oblohy), softbox (softbox), gobo shadow (stín gobo), hero shot (záběr hrdiny), two-shot (záběr dvou osob), negative space (negativní prostor) – tyto výrazy mají ve fotografii i ve filmu jasný význam a v trénovacích datech je k nim přiřazeno velké množství obrázků. Nejasné emotivní výrazy (vibey, dreamy, epic) jsou pro model mnohem slabším signálem. Článek Shot (filmmaking) na anglické Wikipedii je dobrým 15minutovým slovníkem pro rychlou orientaci.

Nejčastější chyby začátečníků a jak je napravit

Upřímně řečeno, všechny tyto chyby jsem už někdy udělal. Je velmi pravděpodobné, že je uděláte také, ale alespoň je budete umět rychleji rozpoznat.

Chyba č. 1: Napsat 400 znaků dlouhý popis a očekávat, že výsledek bude hned dokonalý. Obrazové modely lépe zpracovávají „úzké a iterativní“ popisy než „obrovsky dlouhé a na první pokus dokonalé“ popisy. Maximální délka 20 000 znaků není cílem. U výstupů z GPT Image 2, se kterými jsem nejspokojenější, mají popisy většinou délku mezi 40 a 120 slovy.

Chyba č. 2: Opakované generování při nezměněném zadání. Pokud dvakrát kliknete na „Generate“ u stejného zadání, výsledek je „téměř hotový“, a i při třetím pokusu je stále „téměř hotový“. Náhodnost prozkoumává pouze malou oblast; pokud je směr této oblasti špatný, nepomůže ani opakované generování – je třeba změnit zadání.

Chyba 3: Rozporuplné popisky. V jednom řádku se objevuje jak „soft dreamy watercolor“ (jemná, snová akvarelová malba), tak „ultra-sharp photorealistic 4K“ (ultraostré fotorealistické 4K), což je rozporuplné. Model si vybere jednu z těchto možností, nebo ještě hůře: obě možnosti zprostředkuje. Než začnete psát, nejprve si vše dobře promyslete.

Chyba č. 4: Příliš vysoká očekávání ohledně textu v obrázku. K dubnu 2026 je vykreslování dlouhých textových úseků, zejména textů obsahujících nelatinské znaky, ze strany modelů generujících obrázky pomocí AI stále nestabilní. Krátké texty na cedulích se někdy podaří, u textů na úrovni odstavců se to však podaří jen zřídka. Pokud je text klíčovou informací, stačí jej po vygenerování obrázku přidat jako vrstvu pomocí libovolného grafického editoru.

Chyba č. 5: Nahrání rozmazané zdrojové fotografie do generátoru obrázků. Model bere úroveň detailů zdrojového obrázku jako referenční bod. U rozmazané fotografie pořízené mobilním telefonem s nedostatečným osvětlením si výstup zachová tento rozmazaný vzhled, bez ohledu na to, jak moc v popisu zadání zdůrazníte, že má být „ostrý a jasný“. Pokud máte na výběr, vždy volte ostrý zdrojový obrázek.

Chyba č. 6: Nevystavujte ruce do popředí. Ruce jsou stále nejčastějším zdrojem nedostatků při tvorbě obrázků. Pokud kompozice vyžaduje, aby ruce vynikly, smířte se s tím, že budete muset obrázek několikrát přepracovat; pokud nejsou ústředním prvkem, nechte je mimo záběr nebo je nechte přirozeně viset.

Chyba č. 7: Zanedbání poměru stran při nahrávání obrázků pro generování. Výstup generovaného obrázku obvykle kopíruje poměr stran zdrojového obrázku. Pokud chcete vytvořit banner, ale nahrajete vertikální selfie, je to jako jít proti proudu. Před generováním obrázek ořízněte na požadovaný poměr stran.

Chyba č. 8: Považovat „první přijatelný obrázek“ za finální verzi. Zkušení uživatelé berou „to stačí“ jako výchozí bod pro další kolo. Rozdíl mezi „to stačí“ a „úrovní portfolia“ se obvykle projeví až při třetím pokusu, nikoli při prvním.

Chyba č. 9: Zapomínáte, že model si mezi dvěma generacemi nic nepamatuje. Pokud při generování obrázku z obrázku nepoužijete předchozí výstup jako zdrojový obrázek, je každé generování zcela nové. Chcete-li znovu použít starou postavu, uložte si původní prompt nebo přímo proveďte řetězovou úpravu předchozího obrázku.

Jak funguje GPT Image 2 uvnitř (stručně)

Tato část není pro používání nezbytná, ale pomůže vám vytvořit si reálnou představu. GPT Image 2 je zjednodušené uživatelské rozhraní, které přímo volá dva modely KIE: gpt-image-2-text-to-image a gpt-image-2-image-to-image. Tyto modely patří do rodiny difúzních modelů a jsou vyladěny pro sledování pokynů a vysoce věrné realistické zobrazení. Každý požadavek prochází ověřením, je účtován 12 bodů, zařazen do fronty a vrací URL obrázku.

Minimální počet ovládacích prvků na rozhraní je záměrný: samotné rozhraní KIE API tyto ovládací prvky nezobrazuje a přidání „falešných posuvníků“ na vyšší úrovni by mohlo uživatele uvést v omyl. Vše, co model dokáže, se vyjadřuje prostřednictvím promptů. Chcete-li se dozvědět více o principech fungování, podívejte se na Wikipedii Diffusion model a na stránku výzkumu společnosti OpenAI.

GPT Image 2 má také své slabiny

Kdybychom se zabývali jen klady a opomíjeli zápory, nebylo by to návod. Níže uvádíme společné slabiny modelu GPT Image 2 – a vlastně všech současných hlavních obrazových modelů:

Přesné zachování prvků značky. Logo, licencované postavy a obaly produktů nelze stabilně reprodukovat. Správný postup spočívá ve vytvoření kompozice a následném vložení skutečného loga.
**Přísná shoda s předlohou. ** Pokud je třeba, aby postava zůstala zcela konzistentní v desítkách obrázků (například v komiksové sérii), je zachování identity při generování obrázků z obrázků mnohem lepší než při generování obrázků z textu, ale stále není tak přesné jako při trénování LoRA nebo 3D vazby postav, kde je přesnost na úrovni každého snímku.
Anatomie v extrémních pozicích. Prsty, chodidla, zuby, uši a zkřížené končetiny jsou části, které se nejčastěji deformují. Čím blíže je záběr, tím jsou chyby viditelnější.
Dokonalé rozvržení. Jak již bylo zmíněno výše – stále platí.

Ještě dvě upřímné poznámky: Za prvé, difúzní modely mají ve své podstatě náhodný charakter vzorkování – na stejný prompt se výsledky pokaždé liší; rozmanitost je jejich předností, konzistence pak nevýhodou, přičemž druhou zmíněnou lze zmírnit pomocí řetězcové editace typu „obrázek generuje obrázek“. Za druhé, model odráží rozložení trénovacích dat, takže u méně známých kulturních kontextů je obtížnější dosáhnout přesného výsledku na první pokus než u populárních témat; je třeba počítat s více iteracemi.

Skutečně dobrý pracovní postup při tvorbě obrázků pomocí AI nespočívá v tom, že „jeden model zvládne všechno“, ale v tom, že „GPT Image 2 vyřeší 80 % základního obrazu a základní editor se postará o 20 % ručního doladění“.

Přehled na jedné stránce: Kompletní postup

Pokud chcete pouze verzi, kterou si můžete přečíst na první pohled vedle obrazovky:

Otevřete Domovskou stránku GPT Image 2 a přihlaste se.
Ujistěte se, že máte na účtu alespoň 12 bodů.
Vyberte štítek: Text to Image nebo Image to Image.
Vytvoření obrázku z obrázku: Nahrajte čistý zdrojový obrázek.
Nejprve napište krátký a konkrétní popis. Hlavní motiv na začátku, slova popisující kvalitu na konci.
Vygenerujte. Objektivně vyhodnoťte tři aspekty: hlavní motiv, osvětlení a kompozici.
Změňte pouze jednu proměnnou, znovu vygenerujte a porovnejte.
Opakujte kroky 6–7, dokud nebudete s výsledkem spokojeni.
Stáhněte.

To je vše. Všechny zkratky, triky a návyky zkušených uživatelů popsané v tomto článku jsou variacemi těchto devíti kroků.

Ještě jeden malý tip: nejprve si napište prompt do textového editoru a teprve poté jej vložte do generátoru. Je to praktické pro uchování historie, změnu slovosledu a opakované použití pevných úvodních frází, jako je například „Same person — preserve facial features…“. Až budete s výsledkem spokojeni, zkopírujte finální verzi zpět do protokolu promptů. Tato malá překážka vám zabrání v tom, aby se vaše nejlepší prompty ztratily při aktualizaci prohlížeče.

Často kladené otázky

Kolik bodů se za každý obrázek v GPT Image 2 uděluje?

Ať už jde o generování obrázků z textu nebo z obrázků, cena je jednotná: 12 bodů za kus. Neúčtují se žádné příplatky za „delší popis“, „větší výstup“ nebo „vyšší úroveň kvality“ – tyto možnosti totiž vůbec neexistují. Body lze zakoupit v rámci balíčků na webu a novým účtům jsou automaticky přiděleny zkušební body.

Je pro používání GPT Image 2 třeba něco nainstalovat?

To není nutné. Vše se odehrává přímo v prohlížeči. Není potřeba žádná desktopová aplikace, žádné rozšíření prohlížeče ani webové rozhraní a nemusíte si ani žádat o API klíč. Stačí vám moderní prohlížeč a e-mailový účet.

Jak dlouhý může být zadávací text?

Zadávání promptů pro generování obrázků z textu i z obrázků podporuje maximálně 20 000 znaků. V praxi jsou však nejúčinnější prompty většinou dlouhé 40 až 200 slov. Příliš dlouhé prompty mohou oslabit signál nebo dokonce vést k rozporům; krátké prompty s dobrou strukturou obvykle přinášejí lepší výsledky.

Je možné nahrát více referenčních obrázků najednou?

Režim „obrázek z obrázku“ podporuje vždy pouze jeden zdrojový obrázek. Pokud chcete zkombinovat více referencí (například „tato postava + styl tohoto oblečení“), můžete použít řetězcové generování: nejprve vytvořte meziobrázek a ten pak použijte jako zdrojový obrázek pro další kolo s novým popisem a pokračujte v úpravách. Řetězcová úprava obvykle vede k čistšímu výsledku než generování na základě jednoho složitého popisu.

Podporuje GPT Image 2 zadání konkrétního rozlišení nebo poměru stran?

Aktuální nastavení rozměrů je jednotné a samotné rozhraní KIE API neposkytuje uživateli možnost volby měřítka ani rozlišení. Výstup generovaného obrázku obvykle kopíruje tvar zdrojového obrázku – pokud tedy potřebujete konkrétní měřítko, je třeba nejprve oříznout zdrojový obrázek a teprve poté generovat nový.

Lze vygenerované obrázky použít pro komerční účely?

Práva k použití výstupů se řídí podmínkami služby uvedenými v zápatí webu; tyto podmínky jsou rozhodující. V praxi je většina uživatelů do roku 2026 využívá k tvorbě marketingových nápadů, obsahu pro sociální sítě, prototypů a osobních projektů. Než obrázek použijete v produktu, který generuje příjmy, zkontrolujte prosím podmínky platné v daném okamžiku.

Jak zajistit, aby stejná postava vypadala na všech obrázcích stejně?

Použijte metodu generování obrázků z obrázků a na začátek pokynu jasně uveďte klauzuli o zachování identity („Stejná osoba – zachovat rysy obličeje, barvu vlasů a odstín pleti“). Poté použijte každý výstup jako zdrojový obrázek pro další obrázek a pokračujte v generování s novým popisem scény. Tato metoda není tak přesná jako speciálně vycvičené model LoRA, ale je mnohem účinnější než pokaždé začínat od začátku s generováním obrázků z textu.

Jak se nejrychleji naučit používat GPT Image 2?

Prvních 12 až 20 generací proveďte s jednoduchými pokyny pro generování obrázků z textu, abyste si osvojili chování modelu v jeho „výchozím stavu“; poté přejděte k generování obrázků z obrázků a začněte s čistým výchozím obrázkem. Postupujte podle návodu na předchozí stránce a většina uživatelů si po asi hodině pečlivého cvičení bude s tímto úkolem poradit poměrně snadno.

Proč se moje výsledky vůbec nepodobají zadanému dotazu?

Existují tři běžné příčiny: Za prvé, popisné výrazy jsou nahromaděny na začátku a hlavní obsah je schován na konci – přesuňte hlavní obsah na začátek; za druhé, protichůdné klíčové výrazy (například „akvarel“ a „fotorealistický“ vedle sebe) – vyberte si jedno médium; za třetí, pouze emotivní výrazy („krásný“, „ohromující“) bez konkrétních podstatných jmen – doplňte konkrétní objekty, směr světla, filmový jazyk.

Jste připraveni začít?

Nyní máte k dispozici kompletní pracovní postup, osvědčené vzory pro zadávání pokynů, seznam věcí, kterým se vyhnout, a přehlednou referenční stránku. Zbývá už jen jedna věc: spustit generátor a pomocí prvních 100 bodů zjistit, „jaké pokyny se vám líbí“. Tento krok za vás nikdo neudělá.

Otevřete GPT Image 2 a vygenerujte svůj první obrázek →

Pokud se chcete dozvědět více:

Co je GPT Image 2? Funkce, cena a příklady použití
Průvodce prompty pro GPT Image 2: Jak napsat skutečně funkční prompty
GPT Image 2 vs Sora: Srovnání schopností generování obrázků
Vyzkoušejte nejprve vestavěný generátor obrazových promptů, který z jednoduché myšlenky automaticky vytvoří kompletní prompt.
Můžete také přejít přímo na stránku věnovanou jednotlivým režimům Text to Image nebo Image to Image.

Tento článek zveřejnil tým GPT Image 2. K dubnu 2026 se za oba modely účtuje jednotná sazba 12 bodů za jeden obrázek. V případě budoucích změn tento článek aktualizujeme a uvedeme je v seznamu změn.

Návod k použití GPT Image 2: Kompletní průvodce od registrace po generování obrázků (2026)

Obsah