Sådan bruger du GPT Image 2: prompt-vejledning, parametre og arbejdsgang

CometAPI
AnnaApr 23, 2026
Sådan bruger du GPT Image 2: prompt-vejledning, parametre og arbejdsgang

OpenAI lancerede GPT Image 2 (som også driver ChatGPT Images 2.0) den 21. april 2026 og markerede et stort spring i AI-billedgenerering. Denne native multimodale model leverer overlegen tekstrendering (nærmer sig 99 % nøjagtighed på tværs af flere skriftsystemer), fleksible opløsninger op til 2K (med 4K beta), avanceret instruktionsefterlevelse, flersproget support og "Thinking"-funktioner, der muliggør websøgning, multi-billede-konsistens og selvverificering.

CometAPI giver en OpenAI-kompatibel måde at tilgå GPT Image 2 gennem et samlet API-lag, samtidig med at prisen er meget omkostningseffektiv.

Hvad er GPT Image 2?

GPT Image 2 (model-ID: gpt-image-2) er OpenAI’s førende model til billedgenerering og -redigering. Den driver ChatGPT Images 2.0 og fungerer som en samlet "GPT for images" — håndterer komplekse visuelle opgaver med ræsonnering, redigering og præcise output.

Væsentlige fremskridt i forhold til forgængere (GPT Image 1 / 1.5 og DALL-E 3):

  • Tekstrendering: ~99 % nøjagtighed for engelsk og store forbedringer i japansk, koreansk, kinesisk, hindi, bengali m.fl. Håndterer pålideligt tæt tekst som overskrifter, brødtekst, labels og ikoner uden typiske slåfejl eller forvrængninger.
  • Opløsning og aspektforhold: Native support op til 2K (2560x1440 eller lignende, ~3,6 mio. pixels maks. anbefalet for konsistens; op til ~8,29 mio. pixels eller 3840 px længste kant med begrænsninger). Fleksible forhold fra 3:1 bred til 1:3 høj; kanter skal være multipla af 16. 4K er fortsat eksperimentel/beta.
  • Instruktionsefterlevelse og Thinking-tilstand: Modellen kan "tænke" (søge på nettet, planlægge, generere flere varianter og selv-tjekke) for sofistikerede output som konsistente karakter-sæt, storyboards eller datadrevne infografikker. Tilgængelig for betalende ChatGPT-brugere; forbedrer multi-billedgenerering (op til 8 konsistente billeder fra én prompt).
  • Redigering og troskab: Stærkere bevarelse af detaljer i billede-til-billede-redigeringer; høj troskab i inputhåndtering.
  • Vidensskæring: December 2025, hvilket muliggør referencer til nyere stilarter, brands og produkter.
  • Multimodal integration: Fungerer sømløst i chat til iterativ forfining.

Den excellerer i "brugbare" billeder — ikke kun kunstneriske, men produktionsklare til annoncer, præsentationer, UI/UX, dokumentation m.m. Tidlige benchmarks viser, at den topper ranglister med betydelige Elo-stigninger i tekst-til-billede- og redigeringsopgaver.

GPT Image 2 modelparametre og tekniske specifikationer

Udviklere tilgår GPT Image 2 primært via OpenAI API (eller kompatible gateways) med modelidentifikatoren gpt-image-2 (snapshot: gpt-image-2-2026-04-21). Hvis du kun tager én ting med fra dokumentationen, så er det denne: GPT Image 2 svarer langt bedre, når du bevidst styrer genereringsrummet.

Centrale parametre, du faktisk vil bruge

ParameterHvad den gørPraktisk vejledning
sizeAngiver billeddimensioner. GPT Image 2 accepterer mange opløsninger, så længe de opfylder modellens begrænsninger. Populære eksempler omfatter 1024x1024, 1536x1024, 1024x1536, 2048x2048, 2048x1152, 3840x2160 og 2160x3840 samt auto.Brug 1024x1024 til hurtige allround-opgaver, 1024x1536 til portrætindhold og større størrelser til endelige aktiver.
qualityStyrer gengivelseskvalitet: low, medium, high eller auto.Brug low til skitser og hurtige iterationer; skift til medium eller high til endelige leverancer og lille tekst.
backgroundStyrer baggrundshåndtering. auto understøttes, men gennemsigtige baggrunde understøttes i øjeblikket ikke for GPT Image 2.Undgå workflows med gennemsigtig baggrund for denne model; design til uigennemsigtige eller auto-baggrunde.
formatOutputformat kan være png, jpeg eller webp; API’et returnerer base64-kodede data.Brug jpeg når latens er vigtig, fordi OpenAI siger, at JPEG er hurtigere end PNG.
output_compressionKompressionskontrol for JPEG- og WebP-output, fra 0–100 %.Nyttigt når du har brug for mindre filer til weblevering.
moderationSikkerhedsindstilling med auto og low.Behold auto, medmindre du har en klar grund til at slække på filtreringen.

Oversigt over begrænsninger:

  • Det samlede pixelantal må ikke overskride grænserne for at undgå fejl.
  • Til produktion: Start med quality=low/medium til test, og opskalér derefter til high.
  • Latens: Mellemhurtig generelt; Thinking-tilstand tilføjer ræsonneringstid, men forbedrer kvalitet for komplekse prompts.
  • Alle prompts og output filtreres under politikker, og GPT Image-modeller understøtter moderation: "auto" eller moderation: "low". OpenAI beskriver auto som standardfilteret og low som mindre restriktivt.

Modellen behandler billedgenerering som en del af en samlet arkitektur, hvilket muliggør bedre rumlig ræsonnering, perspektiv og layoutkontrol sammenlignet med rene diffusionsmodeller.

Bemærkninger specifikt til redigering

Når du redigerer billeder, tager GPT Image 2 billedinput med høj troskab. Kildebilledet og masken skal matche i format og størrelse, og masken skal have en alfa­kanal. Det er vigtigt, hvis du bygger inpainting-workflows, produktretouchering eller enhver billedredigeringsfunktion, hvor brugeren vil ændre kun ét område og bevare alt andet.

GPT-Image-2 brugsråd og promptguide

GPT-Image-2 understøtter naturligt sprog; beskriv blot, hvad du vil generere, så skaber modellen det tilsvarende billede uden behov for komplekse strukturer. Modellen understøtter flere iterationer.

Værdien af komplekse strukturer ligger i at kontrollere præcision, ikke i deres nødvendighed. Komplekse strukturer er kun egnede i to scenarier: kommercielle leverancer (hvor gentagen regenerering er spild af tid og penge) og når du redigerer eksisterende billeder, hvor præcise specifikationer for, hvad der skal bevares, og hvad der skal ændres, er påkrævet.

Følgende er nogle avancerede vejledninger, der kan anvendes.

Grundlæggende promptstruktur

En stærk GPT Image 2-prompt bør læses som et mini-kunstbrief, ikke en vag idé. Organisér prompts i denne rækkefølge: scene eller baggrund først, motiv andet, vigtige detaljer tredje og begrænsninger til sidst. Til komplekse output er linjeskift eller mærkede sektioner lettere for modellen at følge end ét tæt afsnit.

En pålidelig struktur ser sådan ud:

Goal: [what the image is for]Scene: [where it happens, time, environment]Subject: [main person/object/product]Style: [photo, editorial, illustration, UI, infographic]Details: [lighting, composition, lens, color, material, typography]Constraints: [no watermark, no extra text, preserve identity, keep background unchanged]

For eksempel, hvis målet er et blog-hero-billede, skal du ikke blot sige “make it futuristic.” Angiv i stedet den præcise komposition, stemningen, den visuelle hierarki og den tomme plads, du har brug for til overskriften.

Grundprincipper

Vær konkret. Nævn materialer, teksturer, former, kamerasprog og medie. For fotorealisme anbefaler OpenAI at bruge ordet “photorealistic” direkte og tilføje virkelighedsnære teksturspor som porer, rynker, stofslid eller små ufuldkommenheder.

Sæt rækværk i prompten. Til redigeringer: sig “change only X” og “keep everything else the same.” OpenAI anbefaler specifikt at liste invarianter som identitet, geometri, layout, labels, kameravinkel og omkringliggende objekter.

Iterér i små trin. Start med en ren grundprompt, og forfin derefter med små opfølgninger som “warm the lighting”, “remove the extra tree” eller “restore the original background”. Det er en af guidens vigtigste kontroltaktikker.

Tilpas kvaliteten til opgaven. OpenAI siger, at gpt-image-2 understøtter low, medium og high outputkvalitet, hvor low er nyttig for hastighed og medium/high for maksimal troskab. Til tæt tekst, diagrammer og layout med flere skrifttyper anbefales medium eller high.

Billedredigering: ændring af eksisterende billeder

Ved redigering skal du angive, hvad der skal forblive uændret, og hvad der må ændres. OpenAI’s eksempler låser konsekvent identitet, positur, indramning, kameravinkel eller baggrund, når de skal forblive stabile, og beskriver derefter redigeringen præcist. For gpt-image-2 understøtter redigeringsworkflows også baggrundskontrol med background="transparent", opaque eller auto, og du kan give op til 16 inputbilleder i understøttede GPT-billedredigerings-workflows.

Mønster for redigeringsprompt

Preserve: face, pose, framing, background.Change only: clothing / object / lighting / season / material.Do not add: text, logos, watermarks, extra objects.

Sammensætning med flere referencebilleder

Når du bruger mere end ét referencebillede, skal du mærke dem efter indeks og beskrive interaktionen eksplicit, såsom “Image 1: product photo” og “Image 2: style reference.” Beskriv præcist, hvad der skal flyttes hvorhen, og hvilke elementer i scenen der ikke skal ændres. Det er den reneste måde at lave indsatser, udskiftninger, stiloverførsel og sammensmeltede kompositioner.

Eksempel

Image 1: person in a room.Image 2: dog reference.Place the dog from Image 2 next to the person in Image 1.Keep the room, camera angle, and lighting unchanged.Match scale, perspective, and shadow.

Teknikker til tekstrendering

For læselig tekst skal du sætte den nøjagtige kopi i citationstegn, kræve ordret gengivelse og angive placering, skrifttypestil og kontrast. Tekst-i-billede fungerer bedst, når prompten er stram og itereres i små ændringer af layoutformuleringen. Dette er nyttigt til billboards, mockups, plakater, slides og emballage.

Eksempel

Add this exact text, verbatim:"Fresh and clean"Typography: bold sans-serif, centered, high contrast, clean kerning.No extra characters, no second instance of the text.

Sådan kommer du i gang med GPT Image 2 på CometAPI:

  • Tilmeld dig på CometAPI og få din API-nøgle.
  • Brug den standard OpenAI Python SDK (eller enhver kompatibel klient) med en brugerdefineret base-URL:
from openai import OpenAI

client = OpenAI(
    api_key="YOUR_COMETAPI_KEY",
    base_url="https://api.cometapi.com/v1"
)

response = client.images.generate(
    model="gpt-image-2",  # or specific snapshot
    prompt="Your detailed prompt here",
    size="1792x1024",     # flexible resolution
    quality="high",
    n=1                   # number of images
)

print(response.data[0].url)  # or b64_json for direct data

Til chat-integreret generering (med Thinking-lignende adfærd) skal du bruge chat completions-endpointet og referere til billegenerering i beskeder.

Fordele på CometAPI:

  • Omkostningsbesparelser: Konkurrencedygtige priser (f.eks. omtale af optimeret billedgenereringsprissætning som Nano Banana 2 på lavere niveauer; GPT Image 2 rutes effektivt). Undgå at skulle håndtere flere nøgler.
  • Høj samtidighed og lav latens: Infrastruktur i enterprise-klassen.
  • Forenet økosystem: Kombinér med tekstmodeller (GPT-5-serien, Claude osv.), video eller andre billedgeneratorer i én pipeline.
  • Pålidelighed: Cache for gentagne input reducerer omkostninger; fallback-routing om nødvendigt.
  • Skalérbarhed: Ideel til produktionsapps, der genererer marketingvisuelt indhold, produktmockups eller automatiseret indhold i volumen.

Anbefaling: For brugsscenarier med høj volumen (f.eks. e-handelsproduktbilleder eller batches til sociale medier), test kvalitetsniveauer på CometAPI først. Overvåg forbruget via deres dashboard og udnyt caching til promptvariationer. Mange udviklere rapporterer mere gnidningsfrie workflows og betydelige besparelser sammenlignet med direkte OpenAI-fakturering, især når man blander modeller.

Hvis du bygger en AI-drevet app eller automatiserer visuelt indhold på CometAPI, så start med gpt-image-2 til præcisionsopgaver og eksperimentér med alternativer til kunstneriske stilarter.

GPT Image 2 anvendelsestilfælde med prompteksempler

GPT Image 2 skinner i praktiske scenarier. Her er detaljerede use cases med klar-til-brug-prompter (optimeret til CometAPI eller OpenAI API).

Praktiske anvendelser og use cases

GPT Image 2 excellerer i:

  • Marketing & design: Professionelle plakater, sociale assets, produktmockups og brandede infografikker med perfekt tekst.
  • Forretning & uddannelse: Slides, diagrammer, datavisualiseringer og træningsmaterialer.
  • Produktudvikling: UI/UX-mockups, app-screenshots og iterative prototyper.
  • Indholdsskabelse: Manga, storyboards, konsistente karakterark og multimedieaktiver.
  • Redigerings-workflows: Forfining af fotos eller generering af variationer med bevarelse af identitet og detaljer.

Tidlige brugere rapporterer, at den føles “produktionsklar” og reducerer efterbehandlingstiden markant.

1. Marketing- og sociale medie-assets

Use case: Iøjnefaldende annoncer med nøjagtig branding og calls-to-action.

Eksempel-prompt:

Scene: Clean white studio background with subtle gradient. Subject: Modern wireless earbuds in matte black and silver, floating dynamically. Details: High-end product photography, reflective surfaces, precise shadows. Text: Headline "Experience Crystal Clear Sound" in bold sans-serif, subhead "$129 - Limited Offer" in smaller font. Style: Photorealistic, commercial product shot, 16:9 aspect ratio. Constraints: No people, exact text only, high resolution for web use.

2. UI/UX-mockups og app-screenshots

Use case: Hurtig prototyping til mobil-/webgrænseflader.

Eksempel-prompt:

Create a high-fidelity iOS app screenshot for a fitness tracking app. Screen: Dark mode dashboard showing steps: 12,458, heart rate 72 bpm, calories 487. UI Elements: Bottom navigation bar with icons labeled "Home", "Stats", "Profile". Text: All labels in SF Pro font, exact numbers as specified. Style: Realistic smartphone frame, subtle bevel, clean modern design. Resolution: 1170x2532 (iPhone-like).

3. Infografikker og datavisualiseringer

Use case: Professionelle rapporter eller præsentationer med nøjagtige statistikker.

Eksempel-prompt (med Thinking til dataverifikation):

Thinking: Plan a clean infographic on AI adoption rates 2025-2026. Generate an infographic: Title "AI Growth Statistics 2026". Sections with icons and bars: "Enterprises using AI: 78%", source labels. Color palette: Blues and greens, modern flat design with subtle gradients. Exact text and numbers only. High readability at 2K resolution.

4. Manga/tegneseriesider eller storyboards

Use case: Konsistente karakterer på tværs af paneler.

Eksempel-prompt:

Generate a 4-panel manga page in black-and-white ink style. Consistent character: Young female detective with short black hair, trench coat. Panel 1: Close-up surprised expression, speech bubble "The clue was right here!". Panel 2-4: [describe actions sequentially]. Maintain exact character design across all panels, Japanese manga style, speech bubbles with exact text.

5. Billedredigering/variationer:

Upload basisbillede og prompt: "Bevar kvindens positur og tøj, skift baggrunden til en futuristisk by om natten, tilføj glødende holografisk tekst 'Innovation 2026'."

Iterér i chatten: Generér, og forfin derefter med "Gør teksten kraftigere og flyt kompositionen mod venstre."

Konklusion

GPT Image 2 repræsenterer et skifte mod virkelig brugbare AI-visuals — præcise, flersprogede og med forbedret ræsonnering. Ved at mestre dets promptframework og køre det effektivt via CometAPI kan du spare omkostninger, skalere produktion og skabe billeder i professionel kvalitet hurtigere end nogensinde.

Til udviklere og teams: Integrér via CometAPI i dag for samlet, omkostningseffektiv adgang til gpt-image-2 sammen med hundredvis af andre modeller. Eksperimentér med eksemplerne ovenfor, iterér i ChatGPT, og se dine visuelle workflows blive transformeret.

Klar til at starte? Gå til CometAPI, hent din nøgle, og generér dine første high-fidelity aktiver med GPT Image 2. Del dine kreationer og prompttips i Slack — lad os bygge bedre visuals sammen.

Klar til at skære AI-udviklingsomkostninger med 20%?

Kom gratis i gang på få minutter. Gratis prøvekreditter inkluderet. Intet kreditkort påkrævet.

Læs mere