什么是 GPT Image 2?
GPT Image 2 是 OpenAI 的最先进图像生成模型,已作为 ChatGPT Images 2.0 原生集成到 ChatGPT 中。不同于早期的独立工具(如 DALL·E 3),它将 GPT 系列的语言理解与先进的视觉合成相结合。该模型生成精确、可用的图像,优化面向专业任务,而非纯粹的艺术性试验。
关键能力
- 接近完美的文本渲染:实现 ~99% 的字符级准确率,能够以英文和非拉丁文字渲染清晰、语境准确的文本。可处理长段文本、菜单、海报和信息图,避免了先前模型常见的文字乱码。
- 复杂构图与版式保真:可生成结构化输出,如 UI 原型图、平面图、数据可视化、幻灯片、地图、漫画页以及多元素网格(例如,10x10 图标阵列或产品海报)。
- 多语言与文化支持:在多种语言中生成准确文本与具有文化相关性的视觉内容。
- 图像编辑与参考处理:对上传的图像进行编辑,同时以高一致性保留细节、人脸和风格。
- 批量生成:一次可生成多达 8 张连贯的图像,并在整组中保持角色与物体的一致性。
- 照片级真实感与可用性:输出更自然且可用于生产,伪影更少、图标设计更佳、构图更专业。