Qu’est-ce que GPT Image 2 ?
GPT Image 2 est le modèle de génération d’images de pointe d’OpenAI, intégré nativement à ChatGPT sous la forme de ChatGPT Images 2.0. Contrairement aux outils autonomes antérieurs comme DALL·E 3, il combine la compréhension linguistique de la série GPT avec une synthèse visuelle avancée. Le modèle génère des images précises et exploitables, optimisées pour des tâches professionnelles plutôt que pour l’expérimentation purement artistique.
Principales capacités
- Rendu du texte quasi parfait : Atteint ~99 % de précision au niveau des caractères, produisant un texte lisible et contextuellement exact en anglais et dans des écritures non latines. Il gère les blocs longs, les menus, les affiches et les infographies sans les dégradations typographiques courantes des modèles précédents.
- Composition complexe et fidélité de mise en page : Produit des résultats structurés tels que des maquettes d’interface, des plans d’étage, des visualisations de données, des diapositives, des cartes, des pages de manga et des grilles multi-éléments (p. ex. des matrices d’icônes 10x10 ou des affiches produit).
- Prise en charge multilingue et culturelle : Génère un texte précis et des visuels culturellement pertinents dans plusieurs langues.
- Édition d’images et gestion des références : Applique des modifications aux images téléchargées tout en préservant les détails, les visages et les styles avec une grande cohérence.
- Génération par lots : Crée jusqu’à 8 images cohérentes à partir d’une seule invite, en maintenant la cohérence des personnages et des objets sur l’ensemble.
- Photoréalisme et utilisabilité : Les résultats paraissent plus naturels et prêts pour la production, avec moins d’artefacts, une meilleure iconographie et une composition professionnelle.