ModèlesSupportEntrepriseBlog
500+ API de modèles IA, toutes en une seule API. Simplement avec CometAPI
API des modèles
Développeur
Démarrage rapideDocumentationTableau de bord API
Ressources
Modèles d'IABlogEntrepriseJournal des modificationsÀ propos
2025 CometAPI. Tous droits réservés.Politique de confidentialitéConditions d'utilisation
Home/Models/OpenAI/GPT 4o Image
O

GPT 4o Image

Par requête:$0.04
gpt-4o-image génère des images en sortie, avec possibilité d'utiliser des images en entrée
Nouveau
Usage commercial
Aperçu
Fonctionnalités
Tarification
API

Technical Specifications of gpt-4o-image

SpecificationDetails
Model IDgpt-4o-image
Model TypeMultimodal image generation model
Input ModalitiesText, image
Output ModalitiesImage
Primary Use CasesText-to-image generation, image-to-image generation, visual editing, creative asset production
Context SupportText prompts with optional image inputs
StreamingNot typically required for image output workflows
Tool / Function CallingNot applicable for core image generation
Response FormatGenerated image output, typically returned through API response payload or referenced asset data
Best ForApplications that need generated images from prompts, optionally guided by input images

What is gpt-4o-image?

gpt-4o-image is a multimodal image generation model exposed through CometAPI that is designed to generate images as output, with support for optional image inputs alongside text prompts. It is well suited for products that need to create visual content from natural language descriptions, transform existing images, or build image-driven creative workflows.

Because it can work from prompt-only input or combine prompt instructions with reference imagery, gpt-4o-image fits a wide range of use cases such as concept art generation, marketing creatives, product mockups, design exploration, and iterative visual editing. Through CometAPI, developers can access gpt-4o-image using a consistent API integration pattern across providers and models.

Main features of gpt-4o-image

  • Text-to-image generation: Create original images from natural language prompts for creative, design, and production workflows.
  • Image-conditioned generation: Use one or more input images to guide composition, style, subject matter, or transformations.
  • Visual iteration: Refine outputs across repeated requests by adjusting prompt details and image references.
  • Creative flexibility: Support a broad range of visual use cases, including illustrations, marketing assets, mockups, and conceptual design.
  • Multimodal prompting: Combine descriptive text with image inputs to achieve more controlled and context-aware results.
  • Developer-friendly access: Integrate gpt-4o-image through CometAPI’s unified model access layer and standardized API workflow.

How to access and integrate gpt-4o-image

Step 1: Sign Up for API Key

Sign up on CometAPI and create an API key from the dashboard. After generating your key, store it securely and use it to authenticate requests to the CometAPI endpoint.

Step 2: Send Requests to gpt-4o-image API

Use CometAPI’s OpenAI-compatible API format and set the model field to gpt-4o-image.

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer $COMETAPI_API_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "gpt-4o-image",
    "input": [
      {
        "role": "user",
        "content": [
          { "type": "input_text", "text": "Generate a clean modern product poster for a smartwatch on a soft studio background." }
        ]
      }
    ]
  }'

You can also include image inputs in the request when building image-to-image or guided generation workflows, depending on your application’s needs.

Step 3: Retrieve and Verify Results

Read the API response, extract the generated image result from the returned output structure, and verify that the image matches your prompt, formatting expectations, and application requirements before displaying it to end users or storing it in your system.

Fonctionnalités pour GPT 4o Image

Découvrez les fonctionnalités clés de GPT 4o Image, conçues pour améliorer les performances et la facilité d'utilisation. Explorez comment ces capacités peuvent bénéficier à vos projets et améliorer l'expérience utilisateur.

Tarification pour GPT 4o Image

Découvrez des tarifs compétitifs pour GPT 4o Image, conçus pour s'adapter à différents budgets et besoins d'utilisation. Nos formules flexibles garantissent que vous ne payez que ce que vous utilisez, ce qui facilite l'adaptation à mesure que vos besoins évoluent. Découvrez comment GPT 4o Image peut améliorer vos projets tout en maîtrisant les coûts.
Prix de Comet (USD / M Tokens)Prix officiel (USD / M Tokens)Remise
Par requête:$0.04
Par requête:$0.05
-20%

Exemple de code et API pour GPT 4o Image

Accédez à des exemples de code complets et aux ressources API pour GPT 4o Image afin de simplifier votre processus d'intégration. Notre documentation détaillée fournit des instructions étape par étape pour vous aider à exploiter tout le potentiel de GPT 4o Image dans vos projets.
POST
/v1/chat/completions

Plus de modèles

G

Nano Banana 2

Entrée:$0.4/M
Sortie:$2.4/M
Aperçu des capacités principales: Résolution: Jusqu'à 4K (4096×4096), comparable à Pro. Cohérence des images de référence: Jusqu'à 14 images de référence (10 objets + 4 personnages), en maintenant la cohérence du style et des personnages. Rapports d'aspect extrêmes: Nouveaux rapports 1:4, 4:1, 1:8, 8:1 ajoutés, adaptés aux images longues, aux affiches et aux bannières. Rendu de texte: Génération de texte avancée, adaptée aux infographies et aux mises en page d'affiches marketing. Amélioration de la recherche: Google Search + Image Search intégrés. Ancrage: Processus de réflexion intégré; les prompts complexes font l'objet d'un raisonnement avant la génération.
D

Doubao Seedream 5

Par requête:$0.028
Seedream 5.0 Lite est un modèle de génération d’images multimodal unifié, doté de capacités de réflexion approfondie et de recherche en ligne, offrant une amélioration globale de ses capacités de compréhension, de raisonnement et de génération.
F

FLUX 2 MAX

Par requête:$0.008
FLUX.2 [max] est un modèle d’intelligence visuelle de premier plan de Black Forest Labs (BFL), conçu pour les flux de production : marketing, photographie de produits, e-commerce, pipelines créatifs, et toute application nécessitant une identité de personnage/produit cohérente, un rendu de texte précis et des détails photoréalistes à des résolutions multi-mégapixels. Son architecture est conçue pour une forte fidélité aux prompts, la fusion multi-références (jusqu’à dix images en entrée) et une génération ancrée (capacité à intégrer un contexte web à jour lors de la production d’images).
X

Black Forest Labs/FLUX 2 MAX

Par requête:$0.056
FLUX.2 [max] est la variante phare, de la plus haute qualité, de la famille FLUX.2 de Black Forest Labs (BFL). Il est positionné comme un modèle de génération texte→image et d’édition d’images de niveau professionnel, axé sur une fidélité maximale, le respect du prompt et une cohérence des modifications couvrant les personnages, les objets, l’éclairage et la couleur. BFL et des registres partenaires décrivent FLUX.2 [max] comme la variante FLUX.2 haut de gamme, avec des fonctionnalités d’édition à références multiples et de génération ancrée.
O

GPT Image 1.5

Entrée:$6.4/M
Sortie:$25.6/M
GPT-Image-1.5 est le modèle d’image d’OpenAI au sein de la famille GPT Image. Il s’agit d’un modèle GPT nativement multimodal, conçu pour générer des images à partir de prompts textuels et pour effectuer des retouches à haute fidélité sur des images en entrée, tout en respectant fidèlement les instructions de l’utilisateur.
D

Doubao Seedream 4.5

Par requête:$0.032
Seedream 4.5 est le modèle d’images multimodal de ByteDance/Seed (texte→image + édition d’images) qui met l’accent sur une fidélité d’image de niveau production, un respect renforcé des prompts et une cohérence d’édition nettement améliorée (préservation du sujet, rendu du texte/de la typographie et réalisme des visages).