Nøglefunktioner
- Tekst→Billede-generering: konverterer prompt'er i naturligt sprog til billeder med stærk efterlevelse af instruktioner.
- Billedredigering / inpainting: accepterer referencebilleder og masker til målrettede redigeringer.
- Omkostningsoptimeret (“mini”) design: et mindre fodaftryk, som OpenAI og observatører beskriver som meget billigere pr. billede end den store model (OpenAI/DevDay-budskaber og tidlige rapporter siger ~80% billigere).
- Fleksible output-kontroller: understøtter størrelse, outputformat (JPEG/PNG/WEBP), komprimering og en kvalitetsindstilling (low/medium/high/auto i cookbook).
Tekniske detaljer (arkitektur & funktioner)
- Modelfamilie & input/output: medlem af gpt-image-1-familien; accepterer tekstprompter og billedinput (til redigeringer) og returnerer genererede billedoutput. Kvalitets-/størrelsesparametre styrer opløsningen (typisk maks. ~1536×1024 i denne familie—se dokumentationen for præcist understøttede størrelser).
- Driftsmæssige afvejninger: konstrueret som en model med mindre fodaftryk—bytter noget top-end-fidelitet for forbedret gennemstrømning og omkostninger, samtidig med at robust prompt-efterlevelse og redigeringsfunktioner bevares.
- Sikkerhed & metadata: følger OpenAI’s billedsikkerhedsværn og indlejrer C2PA-metadataindstillinger for oprindelse, når tilgængeligt.
Input & output — kanonisk brug understøtter:
- Tekstprompt (streng) til at generere et nyt billede.
- Billede + maske til at udføre målrettede redigeringer/inpainting.
- Referencebilleder til at styre stil eller komposition.
Disse er eksponeret via Images API (modelnavngpt-image-1-mini).
Begrænsninger
- Lavere top-fidelitet: sammenlignet med den store gpt-image-1-model kan mini miste nogle mikrodetaljer og den højeste grad af fotorealisme (forventet afvejning for omkostninger).
- Tekstgengivelse & meget små detaljer: som mange billedmodeller kan den have svært ved lille læsbar tekst, tætte diagrammer eller mikrofine teksturer; forvent efterbehandling eller brug af modeller med højere kapacitet til disse behov.
- Redigeringsomfang: billedredigering/inpainting-funktioner er tilgængelige, men antyder visse redigeringsbegrænsninger sammenlignet med de interaktive ChatGPT web tools—redigeringer er effektive til mange opgaver, men kan kræve iterativ forfining.
- Sikkerheds- & politikbegrænsninger: output er underlagt OpenAI-moderations-/sikkerhedsværn (eksplicit indhold, ophavsretsbegrænsninger, ikke-tilladte output). Udviklere kan styre moderationsfølsomhed via API-parametre, hvor dette tilbydes.
Anbefalede anvendelsestilfælde
- Indholdsgenerering i stor skala (marketingmaterialer, miniaturebilleder, hurtig konceptkunst) — hvor pris pr. billede er afgørende.
- Programmatisk redigering / skabelonarbejde — masse-inpainting eller generering af varianter fra et grundmateriale.
- Interaktive applikationer med budgetbegrænsninger — chatgrænseflader eller integrerede designværktøjer, hvor svartid og omkostninger vægter højere end absolut top-fidelitet.
- Prototyper & A/B-billedgenerering — generér mange kandidatbilleder hurtigt og opskalér selektivt eller kør igen på større modeller for finalister.
- Sådan får du adgang til gpt-image-1-mini API
Trin 1: Sign Up for API Key
Log ind på cometapi.com. Hvis du ikke er vores bruger endnu, skal du først registrere dig. Log ind på din CometAPI console. Hent adgangslegitimationsoplysningen API-nøgle til grænsefladen. Klik “Add Token” ved API-tokenet i det personlige center, få token-nøglen: sk-xxxxx og indsend.
Trin 2: Send forespørgsler til gpt-image-1-mini API
Vælg “\**gpt-image-1-mini \**” endepunktet for at sende API-anmodningen og angive anmodningskroppen. Anmodningsmetoden og anmodningskroppen fås fra vores websites API-dokumentation. Vores website tilbyder også Apifox test for din bekvemmelighed. Erstat <YOUR_API_KEY> med din faktiske CometAPI-nøgle fra din konto.
Indsæt dit spørgsmål eller din forespørgsel i content-feltet—det er dette, modellen vil svare på . Behandl API-svaret for at få det genererede svar.
Trin 3: Retrieve and Verify Results
Behandl API-svaret for at få det genererede svar. Efter behandling svarer API'et med opgavestatus og outputdata.