什麼是 GPT Image 2?
GPT Image 2 是 OpenAI 最先進的圖像生成模型,並以 ChatGPT Images 2.0 的形式原生整合進 ChatGPT。不同於先前如 DALL·E 3 之類的獨立工具,它結合了 GPT 系列的語言理解能力與先進的視覺合成。該模型著眼於專業任務而非純藝術試驗,能生成精確、可用且為專業用途最佳化的圖像。
關鍵能力
- 近乎完美的文字呈現:可達到 ~99% 的字元級準確率,能以英語與非拉丁文字呈現清晰、語境準確的文本。可處理長段落、選單、海報與資訊圖表,避免以往模型常見的亂碼與排版錯誤。
- 複雜構圖與版面保真:可生成結構化成果,如 UI 原型稿、平面圖、資料視覺化、投影片、地圖、漫畫頁,以及多元素網格(例如 10x10 圖示陣列或產品海報)。
- 多語與文化支援:可在多種語言中生成準確文字與具文化相關性的視覺內容。
- 圖像編輯與參考處理:可對上傳的圖像進行編修,同時在細節、人臉與風格上保持高度一致性。
- 批次生成:可由單一提示生成最多 8 張連貫的圖像,並在整組作品中維持角色與物件的一致性。
- 擬真度與可用性:輸出更自然且更貼近實際上線需求,具有更少的偽影、更好的圖示設計與更專業的構圖。