Qu’est-ce que GPT Image 2 ?
GPT Image 2 est le modèle de génération d’images de pointe d’OpenAI, intégré nativement à ChatGPT sous l’appellation ChatGPT Images 2.0. Contrairement aux outils autonomes antérieurs comme DALL·E 3, il combine la compréhension linguistique de la série GPT avec une synthèse visuelle avancée. Le modèle génère des images précises et exploitables, optimisées pour des tâches professionnelles plutôt que pour la simple expérimentation artistique.
Fonctionnalités clés
- Rendu de texte quasi parfait: Atteint une précision de ~99% au niveau des caractères, produisant un texte lisible et contextuellement exact en anglais comme dans les écritures non latines. Il gère les longs blocs, les menus, les affiches et les infographies sans la typographie brouillée courante dans les modèles précédents.
- Composition complexe et fidélité de mise en page: Produit des sorties structurées telles que des maquettes d’interface utilisateur, des plans d’étage, des visualisations de données, des diapositives, des cartes, des pages de manga et des grilles multi-éléments (par exemple, des matrices d’icônes 10x10 ou des affiches de produits).
- Prise en charge multilingue et culturelle: Génère un texte précis et des visuels culturellement pertinents dans plusieurs langues.
- Édition d’images et gestion des références: Applique des modifications aux images importées tout en préservant les détails, les visages et les styles avec une grande cohérence.
- Génération par lots: Crée jusqu’à 8 images cohérentes à partir d’un seul prompt, en maintenant la cohérence des personnages et des objets sur l’ensemble.
- Photoréalisme et utilisabilité: Les résultats paraissent plus naturels et prêts pour la production, avec moins d’artefacts, une meilleure iconographie et une composition professionnelle.