Temel özellikler
- Metin→Görsel üretimi: doğal dil istemlerini, güçlü talimat takibiyle görsellere dönüştürür.
- Görsel düzenleme/inpainting: hedefe yönelik düzenlemeler yapmak için referans görseller ve maskeleri kabul eder.
- Maliyete göre optimize edilmiş (“mini”) tasarım: OpenAI ve gözlemcilerin, büyük modele kıyasla görüntü başına çok daha ucuz olduğunu belirttiği daha küçük bir ayak izi (OpenAI/DevDay mesajları ve erken raporlar yaklaşık %80 daha ucuz olduğunu söylüyor).
- Esnek çıktı denetimleri: boyut, çıktı biçimi (JPEG/PNG/WEBP), sıkıştırma ve bir kalite ayarı (cookbook'ta düşük/orta/yüksek/otomatik).
Teknik ayrıntılar (mimari ve yetenekler)
- Model ailesi ve giriş/çıkış: gpt-image-1 ailesinin bir üyesi; düzenlemeler için metin istemleri ve görsel girdileri kabul eder ve üretilen görsel çıktıları döndürür. Kalite/boyut parametreleri çözünürlüğü kontrol eder (bu ailede tipik maksimum ~1536×1024 — desteklenen kesin boyutlar için belgelere bakın).
- Operasyonel ödünler: daha küçük ayak izi olacak şekilde tasarlanmıştır — bazı üst düzey doğrulukları, iş hacmi ve maliyet iyileştirmeleri karşılığında kısmen feda ederken sağlam talimat takibini ve düzenleme özelliklerini korur.
- Güvenlik ve üstveri: OpenAI’nin görsel güvenlik korumalarını izler ve mümkün olduğunda kaynağa ilişkin C2PA üstveri seçeneklerini gömer.
Girdiler ve çıktılar — kanonik kullanım şunları destekler:
- Yeni bir görsel üretmek için Metin istemi (string).
- Hedefe yönelik düzenleme/inpainting için Görsel + maske.
- Stil veya kompozisyonu kontrol etmek için Referans görseller.
Bunlar Images API aracılığıyla sunulur (model adıgpt-image-1-mini).
Sınırlamalar
- Daha düşük tepe doğruluğu: büyük gpt-image-1 modeline kıyasla, mini mikro detay ve üst düzey fotogerçekçilikten bir miktar kaybedebilir (maliyet için beklenen bir ödün).
- Metin işleme ve çok küçük detaylar: birçok görsel model gibi, küçük, okunaklı metin, yoğun grafikler veya mikro ince dokularda zorlanabilir; bu ihtiyaçlar için sonradan işleme yapmayı veya daha yüksek kapasiteli modelleri kullanmayı bekleyin.
- Düzenleme kapsamı: görsel düzenleme/inpainting özellikleri mevcuttur ancak etkileşimli ChatGPT web araçlarına göre bazı düzenleme sınırlamaları önerilir — düzenlemeler birçok görevde etkilidir ancak yinelemeli iyileştirme gerektirebilir.
- Güvenlik ve politika kısıtları: çıktılar OpenAI’nin denetim/güvenlik korumalarına tabidir (açık içerik, telif hakları kısıtları, yasaklanmış çıktılar). Geliştiriciler, sunulduğu yerlerde API parametreleri aracılığıyla denetim duyarlılığını kontrol edebilir.
Önerilen kullanım senaryoları
- Yüksek hacimli içerik üretimi (pazarlama varlıkları, küçük görseller, hızlı konsept taslakları) — görüntü başı maliyetin birincil olduğu durumlar.
- Programatik düzenleme/şablonlama — bir temel varlıktan toplu inpainting veya varyant üretimi.
- Bütçe kısıtlı etkileşimli uygulamalar — yanıt hızının ve maliyetin, mutlak üst düzey doğruluktan daha önemli olduğu sohbet arayüzleri veya entegre tasarım araçları.
- Prototipleme ve A/B görsel üretimi — birçok aday görseli hızlıca üretin ve finalistler için seçici olarak yükseltin veya büyük modellerde yeniden çalıştırın.
- gpt-image-1-mini API'ye nasıl erişilir
Adım 1: API Anahtarına Kayıt Olun
cometapi.com adresine giriş yapın. Henüz kullanıcımız değilseniz, lütfen önce kaydolun. CometAPI console hesabınıza giriş yapın. Arayüzün erişim kimliği olan API anahtarını edinin. Kişisel merkezde API token bölümünde “Add Token”a tıklayın, token anahtarını edinin: sk-xxxxx ve gönderin.
Adım 2: gpt-image-1-mini API'ye İstek Gönderin
API isteği göndermek ve istek gövdesini ayarlamak için “\**gpt-image-1-mini \**”endpoint'ini seçin. İstek yöntemi ve istek gövdesi web sitemizdeki API dokümanından alınır. Web sitemiz ayrıca kolaylığınız için Apifox testi sağlar. Hesabınızdaki gerçek CometAPI anahtarınızla <YOUR_API_KEY> ifadesini değiştirin.
Sorunuzu veya isteğinizi content alanına ekleyin — modelin yanıtlayacağı kısım budur. Oluşturulan yanıtı almak için API yanıtını işleyin.
Adım 3: Sonuçları Alın ve Doğrulayın
Oluşturulan yanıtı almak için API yanıtını işleyin. İşleme sonrasında, API görev durumunu ve çıktı verilerini döndürür.