Fonctionnalités clés
- Génération texte→image : convertit des invites en langage naturel en images avec un excellent respect des instructions.
- Édition d’image / inpainting : accepte des images de référence et des masques pour effectuer des modifications ciblées.
- Conception optimisée pour les coûts (« mini ») : une empreinte plus légère que OpenAI et des observateurs décrivent comme bien moins coûteuse par image que le grand modèle (les messages OpenAI/DevDay et les premiers rapports indiquent ~80 % moins cher).
- Contrôles de sortie flexibles : prend en charge la taille, le format de sortie (JPEG/PNG/WEBP), la compression et un paramètre de qualité (low/medium/high/auto dans le cookbook).
Détails techniques (architecture et capacités)
- Famille de modèles et entrée/sortie : membre de la famille gpt-image-1 ; accepte des invites textuelles et des entrées image (pour les modifications) et renvoie des images générées en sortie. Les paramètres quality/size contrôlent la résolution (maximum typique ~1536×1024 dans cette famille — voir la documentation pour les tailles exactes prises en charge).
- Compromis opérationnels : conçu comme un modèle à empreinte réduite — il sacrifie une partie de la fidélité maximale au profit du débit et du coût, tout en conservant un bon respect des invites et des fonctions d’édition robustes.
- Sécurité et métadonnées : respecte les garde-fous de sécurité d’image d’OpenAI et intègre des options de métadonnées C2PA pour la provenance lorsque disponibles.
Entrées et sorties — l’utilisation canonique prend en charge :
- Invite textuelle (chaîne) pour générer une nouvelle image.
- Image + masque pour effectuer des modifications ciblées/inpainting.
- Images de référence pour contrôler le style ou la composition.
Ces fonctionnalités sont exposées via l’API Images (nom du modèlegpt-image-1-mini).
Limitations
- Fidélité maximale inférieure : par rapport au grand modèle gpt-image-1, mini peut perdre certains micro-détails et un photoréalisme de pointe (compromis attendu pour réduire les coûts).
- Rendu du texte et petits détails : comme de nombreux modèles d’image, il peut avoir des difficultés avec les petits textes lisibles, les graphiques denses ou les textures extrêmement fines ; prévoyez un post-traitement ou l’utilisation de modèles plus puissants pour ces besoins.
- Portée des modifications : les fonctions de modification d’image/inpainting sont disponibles, mais présentent certaines limitations d’édition par rapport aux outils web interactifs de ChatGPT — les modifications sont efficaces pour de nombreuses tâches, mais peuvent nécessiter des raffinements itératifs.
- Contraintes de sécurité et de politique : les sorties sont soumises aux garde-fous de modération/sécurité d’OpenAI (contenu explicite, restrictions sur le contenu protégé par le droit d’auteur, sorties interdites). Les développeurs peuvent contrôler la sensibilité de la modération via des paramètres API lorsque proposés.
Cas d’utilisation recommandés
- Génération de contenu à grand volume (ressources marketing, miniatures, concept art rapide) — lorsque le coût par image est le critère principal.
- Édition programmatique / templating — inpainting en masse ou génération de variantes à partir d’une ressource de base.
- Applications interactives avec contraintes budgétaires — interfaces de chat ou outils de conception intégrés où la vitesse de réponse et le coût comptent davantage que la fidélité absolue maximale.
- Prototypage et génération d’images pour A/B testing — générez rapidement de nombreuses images candidates, puis agrandissez de manière sélective ou relancez sur des modèles plus grands pour les versions finales.
- Comment accéder à l’API gpt-image-1-mini
Étape 1 : S’inscrire pour obtenir une clé API
Connectez-vous à cometapi.com. Si vous n’êtes pas encore utilisateur, veuillez d’abord vous inscrire. Connectez-vous à votre console CometAPI. Obtenez la clé API d’accès à l’interface. Cliquez sur « Add Token » dans la section API token du centre personnel, obtenez la clé de jeton : sk-xxxxx, puis validez.
Étape 2 : Envoyer des requêtes à l’API gpt-image-1-mini
Sélectionnez le point de terminaison “\**gpt-image-1-mini \**” pour envoyer la requête API et définissez le corps de la requête. La méthode de requête et le corps de requête sont disponibles dans la documentation API de notre site web. Notre site web fournit également des tests Apifox pour votre commodité. Remplacez <YOUR_API_KEY> par votre véritable clé CometAPI depuis votre compte.
Insérez votre question ou votre demande dans le champ content — c’est à cela que le modèle répondra. Traitez la réponse API pour obtenir la réponse générée.
Étape 3 : Récupérer et vérifier les résultats
Traitez la réponse API pour obtenir la réponse générée. Après traitement, l’API répond avec le statut de la tâche et les données de sortie.