Afbeeldingen bewerken met de OpenAI GPT-Image-1 API

CometAPI
AnnaApr 28, 2025
Afbeeldingen bewerken met de OpenAI GPT-Image-1 API

De GPT-Image-1 API van OpenAI revolutioneert de manier waarop ontwikkelaars en creatieve professionals beeldbewerking benaderen. Door geavanceerde multimodale mogelijkheden te combineren met intuïtieve tekstprompts, maakt het nauwkeurige en hoogwaardige beeldmanipulatie rechtstreeks via code mogelijk. Of u nu nieuwe beelden wilt genereren, bestaande afbeeldingen wilt bewerken of variaties wilt creëren, gpt-image-1 biedt een robuuste oplossing.

Wat is gpt-image-1?

GPT-Image-1 is OpenAI's nieuwste model voor het genereren van afbeeldingen, ontworpen om afbeeldingen te creëren en te bewerken op basis van tekstuele beschrijvingen. Het kan complexe prompts begrijpen en hoogwaardige afbeeldingen produceren die nauw aansluiten bij de intentie van de gebruiker. Belangrijkste kenmerken zijn:

  • Generatie van afbeeldingen met hoge getrouwheid: Produceert gedetailleerde en nauwkeurige beelden.
  • Diverse visuele stijlen: Ondersteunt een scala aan esthetica, van fotorealistisch tot abstract.
  • Nauwkeurige beeldbewerking: Maakt gerichte wijzigingen in gegenereerde afbeeldingen mogelijk.
  • Rijke wereldkennis: Begrijpt complexe vragen met contextuele nauwkeurigheid.
  • Consistente tekstweergave: Geeft tekst in afbeeldingen op een betrouwbare manier weer.

Toepassingen in de echte wereld

Tot de sectoren die gpt-image-1 gebruiken, behoren:

  • Ontwerp en prototypen:Hulpmiddelen zoals Figma integreren gpt-image-1 om creatieve workflows te verbeteren.
  • E-Commerce:Platformen gebruiken het om productbeelden en marketingmateriaal te genereren.
  • Educatie: Maakt diagrammen en visuele hulpmiddelen voor leerplatformen.
  • Marketing: Produceert direct advertentieafbeeldingen en visuals voor sociale media.

Uw omgeving instellen

Voorwaarden

Zorg ervoor dat u over het volgende beschikt voordat u begint:

  • Een OpenAI API-sleutel.
  • Python op uw systeem geïnstalleerd.
  • Het openai Python-pakket geïnstalleerd.

U kunt de openai pakket dat pip gebruikt:

bashpip install openai

De OpenAI API-client instellen

Stel eerst de OpenAI API-client in uw Python-script in:

pythonimport openai

openai.api_key = 'your-api-key-here'

vervangen 'your-api-key-here' met uw daadwerkelijke OpenAI API-sleutel.


Afbeeldingen bewerken met GPT-Image-1

Hoe werkt beeldbewerking?

Met GPT-Image-1 kunt u afbeeldingen bewerken door een basisafbeelding, een optioneel masker om bewerkbare gebieden te specificeren en een tekstuele prompt met de gewenste uitkomst op te geven. De API verwerkt deze invoer en retourneert een aangepaste afbeelding die aan uw specificaties voldoet.

Het beeld en masker voorbereiden

Zorg ervoor dat uw invoerafbeelding en masker aan de volgende criteria voldoen:

  • Beide moeten vierkante afbeeldingen zijn.
  • Het masker moet een transparante PNG zijn, waarbij het transparante gebied het gebied aangeeft dat bewerkt moet worden.

Het Python-script schrijven

Hier is een voorbeeld van een Python-script om een ​​afbeelding te bewerken met de gpt-image-1 API:​

import requests
edit_url = "https://api.openai.com/v1/images/edits"
headers = {
"Authorization": "Bearer YOUR_API_KEY"
}
files = {
"image": open("input-image.png", "rb")
"mask":open("path_to_your_mask.png", "rb"),
}
data = {
"model": "gpt-image-1",
"prompt": "Add a bright red balloon in the sky",
"n": 1,
"size": "1024x1024"
}
response = requests.post(edit_url, headers=headers, files=files, data=data)
image_url = response.json()
print("Edited Image URL:", image_url)

Vervangen:

  • 'Bearer YOUR_API_KEY' met uw OpenAI API-sleutel.
  • "path_to_your_image.png" met het pad naar uw originele afbeelding.
  • "path_to_your_mask.png" met het pad naar uw maskerafbeelding.
  • "Describe the desired edit here" met een prompt waarin u beschrijft welke bewerking u wilt maken.

Voorbeeld: de kleur van een object veranderen

Stel je voor dat je een afbeelding van een rode bal hebt en je wilt de kleur ervan veranderen naar blauw. Je opdracht zou dan zijn:

pythonprompt="Change the red ball to a blue ball"

Zorg ervoor dat uw masker alleen het gebied met de rode bal benadrukt.


GPT-Afbeelding-1

Geavanceerde tips en overwegingen

Wat zijn enkele geavanceerde functies?

  • Stijloverdracht: Pas verschillende artistieke stijlen toe door de prompt aan te passen.
  • Object toevoegen/verwijderen: Voeg elementen toe aan de afbeelding of verwijder elementen met behulp van beschrijvende prompts.
  • Tekstweergave: Voeg tekst in afbeeldingen in met specifieke lettertypen en plaatsingen.

Afbeeldingsgrootte en beeldverhouding

De GPT-Image-1 API vereist dat afbeeldingen vierkant zijn, met ondersteunde formaten zoals 256×256, 512×512 of 1024×1024 pixels. Afbeeldingen die niet vierkant zijn, kunnen worden verkleind of bijgesneden, wat de uitvoer kan beïnvloeden.

Tokengebruik en kosten

Houd er bij het gebruik van base64-gecodeerde afbeeldingen rekening mee dat de payloadgrootte met ongeveer 33% toeneemt, wat van invloed kan zijn op het gebruik en de kosten van tokens. Om dit te beperken, kunt u overwegen uw afbeeldingen te hosten en URL's aan te bieden in plaats van base64-gegevens.

Modelbeperkingen

Hoewel gpt-image-1 krachtige beeldbewerkingsmogelijkheden biedt, kan het complexe bewerkingen met meerdere objecten of ingewikkelde details mogelijk niet zo effectief verwerken als gespecialiseerde beeldbewerkingssoftware. Het is het meest geschikt voor eenvoudige bewerkingen met duidelijke instructies.

Best practices voor optimale resultaten

Hoe kunt u de resultaten van uw beeldbewerking verbeteren?

  • Wees specifiek: Gedetailleerde prompts leveren nauwkeurigere resultaten op.
  • Gebruik afbeeldingen van hoge kwaliteit: Zorg ervoor dat de basisafbeeldingen duidelijk en goed belicht zijn.
  • Test verschillende promptsExperimenteer met verschillende beschrijvingen om het gewenste effect te bereiken.
  • Hefboommaskers: Gebruik maskers om bewerkbare gebieden nauwkeurig te beheren.

Integratie van gpt-image-1 in ontwerpworkflows

De integratie van gpt-image-1 in tools zoals Figma en Adobe Firefly stroomlijnt het ontwerpproces. Ontwerpers kunnen afbeeldingen direct binnen deze platforms genereren en bewerken met behulp van tekstprompts, wat rapid prototyping en iteratie vergemakkelijkt.

In Figma kunt u bijvoorbeeld een ontwerpelement selecteren, een opdracht invoeren zoals 'Voeg een schaduw toe aan dit object', waarna de GPT-Image-1-integratie de bewerking dienovereenkomstig toepast.


Conclusie

De GPT-Image-1 API van OpenAI vertegenwoordigt een aanzienlijke vooruitgang in AI-gestuurde beeldbewerking. Door natuurlijke taalprompts te gebruiken bij het bewerken van afbeeldingen, stelt het ontwerpers en ontwikkelaars in staat om efficiënt visuals te creëren en te bewerken. Naarmate de integratie met ontwerptools zich verder ontwikkelt, is gpt-image-1 klaar om een ​​onmisbare tool te worden in de creatieve workflow.

Beginnen

Ontwikkelaars hebben toegang tot GPT-image-1 API  brengt KomeetAPIOm te beginnen kunt u de mogelijkheden van het model in de Playground verkennen en de API-gids (modelnaam: gpt-image-1) voor gedetailleerde instructies. Houd er rekening mee dat sommige ontwikkelaars mogelijk hun organisatie moeten verifiëren voordat ze het model kunnen gebruiken.

GPT-Image-1 API-prijzen in CometAPI, 20% korting op de officiële prijs:

Uitvoertokens: $32/M tokens

Invoertokens: $8 / M tokens

Lees Meer

500+ modellen in één API

Tot 20% korting