Apa Itu GPT Image 2?
GPT Image 2 adalah model generasi gambar mutakhir dari OpenAI, terintegrasi secara native ke dalam ChatGPT sebagai ChatGPT Images 2.0. Berbeda dengan alat mandiri sebelumnya seperti DALL·E 3, model ini menggabungkan pemahaman bahasa dari seri GPT dengan sintesis visual tingkat lanjut. Model ini menghasilkan gambar yang presisi dan dapat digunakan, dioptimalkan untuk tugas profesional alih-alih sekadar eksperimen artistik.
Kapabilitas utama
- Perenderan teks nyaris sempurna: Mencapai akurasi tingkat karakter ~99%, merender teks yang terbaca jelas dan akurat secara kontekstual dalam bahasa Inggris serta aksara non-Latin. Menangani blok panjang, menu, poster, dan infografik tanpa tipografi berantakan yang umum pada model sebelumnya.
- Komposisi kompleks dan kesetiaan tata letak: Menghasilkan keluaran terstruktur seperti mockup UI, denah lantai, visualisasi data, slide, peta, halaman manga, dan grid multi-elemen (mis., deretan ikon 10x10 atau poster produk).
- Dukungan multibahasa dan budaya: Menghasilkan teks yang akurat dan visual yang relevan secara budaya dalam berbagai bahasa.
- Pengeditan gambar dan penanganan referensi: Menerapkan pengeditan pada gambar yang diunggah sambil mempertahankan detail, wajah, dan gaya dengan konsistensi tinggi.
- Generasi batch: Membuat hingga 8 gambar koheren dari satu prompt, mempertahankan konsistensi karakter dan objek di seluruh set.
- Fotorealisme dan kegunaan: Keluaran tampak lebih natural dan siap produksi, dengan lebih sedikit artefak, ikonografi yang lebih baik, dan komposisi yang profesional.