什麼是 GPT Image 2?
GPT Image 2 是 OpenAI 的最先進影像生成模型,並以 ChatGPT Images 2.0 的形式原生整合進 ChatGPT。不同於先前如 DALL·E 3 等獨立工具,它結合了 GPT-series 的語言理解與先進的視覺合成能力。該模型生成精準、可用的影像,優化用於專業任務,而非僅作藝術性實驗。
關鍵能力
- 近乎完美的文字渲染: 在字元層級達成 ~99% 的準確度,可在英文與非拉丁文字中渲染清晰、語境準確的文字。能處理長段落、選單、海報與資訊圖表,避免先前模型常見的文字錯亂。
- 複雜構圖與版面忠實度: 可產出具結構的結果,如 UI 模型稿、平面圖、資料視覺化圖表、投影片、地圖、漫畫頁,以及多元素網格(例如 10x10 圖示陣列或產品海報)。
- 多語與文化支援: 可在多種語言中生成準確的文字與符合文化脈絡的視覺。
- 影像編輯與參考圖處理: 對已上傳影像進行編輯,同時以高度一致性保留細節、臉部與風格。
- 批次生成: 單一提示詞可生成最多 8 張彼此一致的影像,並在整組中維持角色與物件的一致性。
- 照片級寫實與可用性: 輸出更自然且可直接投入生產使用,偽影更少、圖示設計更佳、構圖更專業。