GPT-görüntü-1 API'si

CometAPI
AnnaJun 30, 2025
GPT-görüntü-1 API'si

OpenAI en GPT-Görüntü-1 API'si geliştiricilerin ve işletmelerin gelişmiş görüntü oluşturma yeteneklerini uygulamalarına entegre etmelerini sağlayan son teknoloji, çok modlu görüntü oluşturma modelidir. Bu API, metinsel istemlerden yüksek kaliteli görüntülerin oluşturulmasını sağlayarak çeşitli stilleri ve hassas içerik oluşturmayı destekler.

GPT-Image-1'in Temel Özellikleri

GPT-Image-1, metinsel istemlerden yüksek kaliteli görüntüler üretmek için tasarlanmıştır ve kullanıcılara çeşitli stillerde ve formatlarda görseller oluşturma olanağı sunar. Temel özellikleri şunlardır:

  • Çok Modlu Entegrasyon: GPT-Image-1, hem metinsel hem de görsel verileri sorunsuz bir şekilde işlemek ve üretmek için tasarlanmıştır. Bu çok modlu entegrasyon, kullanıcıların tutarlı ve bağlamsal olarak ilgili çıktılar üretmek için metin ve görüntüleri birleştiren istemleri girmesini sağlayarak daha dinamik etkileşimlere olanak tanır.
  • Özel İstem Uyumu: Kullanıcı tarafından tanımlanan istemleri doğru bir şekilde yorumlar ve görselleştirir, belirtilen gereksinimlerle uyumu sağlar.
  • Dünya Bilgi Birleştirme: Oluşturulan görsellere bağlamsal anlayışı ve gerçek dünya bilgisini yerleştirmek için kapsamlı eğitim verilerinden yararlanır.
  • Metin İşleme Yeteneği: Metinsel öğeleri görsellere etkili bir şekilde entegre ederek okunabilirliği ve üslup tutarlılığını korur.
  • Gelişmiş Görsel Muhakeme: Önceki sürümlerinin yetenekleri üzerine inşa edilen GPT-Image-1, gelişmiş görsel muhakeme sergiler. Karmaşık sahneleri yorumlayabilir, mekansal ilişkileri anlayabilir ve sağlanan metinsel açıklamalarla yakından uyumlu görüntüler üretebilir.
  • Yüksek Doğrulukta Görüntü Oluşturma: Model, dikkat çekici ayrıntı ve doğrulukla yüksek çözünürlüklü görüntüler üretebilir. Bu özellik, özellikle fotogerçekçi çıktılar veya karmaşık tasarım öğeleri gerektiren uygulamalar için faydalıdır.

Bu özellikler, kullanıcıların yalnızca görsel olarak çekici değil aynı zamanda bağlamsal olarak anlamlı görseller üretmesini sağlayarak, geniş yelpazedeki yaratıcı ve profesyonel ihtiyaçlara hitap ediyor.

Teknik Mimari

GPT-4o'da temel

GPT-Image-1, hem dil hem de görsel görevlerde sağlam performansıyla bilinen GPT-4o çerçevesi üzerine inşa edilmiştir. Bu temel, GPT-Image-1'e karmaşık çok modlu girdileri işlemek ve yüksek kaliteli çıktılar üretmek için sağlam bir temel sağlar.

Otoregresif Görüntü Üretimi

Difüzyon tabanlı modellerin aksine, GPT-Image-1 görüntü oluşturmada otoregresif bir yaklaşım kullanır. Bu yöntem, modelin görüntüleri ardışık olarak oluşturmasına olanak tanır ve görsel çıktılarda tutarlılık ve uyum sağlar.

Tokenizasyon ve Veri İşleme

Model, girdi verilerini etkili bir şekilde işlemek ve anlamak için gelişmiş belirteçleme tekniklerini kullanır. Bu, görüntülerdeki metni yorumlama ve oluşturma becerisini içerir ve belge analizi ve içerik oluşturma gibi uygulamalardaki kullanımını artırır.

Teknik özellikler

Giriş ve çıkış

  • Giriş: Metin istemleri ve isteğe bağlı resim girişleri.
  • Çıktı: Verilen komutlara göre oluşturulan görseller.

Çözünürlük Desteği

GPT-Image-1, 1024×1024, 1024×1536 ve 1536×1024 piksel gibi boyutlar da dahil olmak üzere yüksek çözünürlüklü görüntü oluşturmayı destekler.

Güvenlik ve Moderasyon

API, aşağıdakiler de dahil olmak üzere sağlam güvenlik önlemlerini içerir:

  • içerik Filtreleme: Geliştiriciler şunları ayarlayabilir: moderation parametresi auto (varsayılan) standart filtreleme için veya low daha az kısıtlayıcı filtreleme için.
  • C2PA Meta Verisi:Oluşturulan tüm görseller, platformların yapay zeka tarafından oluşturulan içeriği tespit etmesini sağlayan C2PA meta verilerini içerir.

Performans değerlendirme ve kıyaslama

Görüntü kalitesi değerlendirmesi

Görüntü kalitesi değerlendirmesinde GPT-Image-1, 9.1 üzerinden 10 puanlık ortalama bir puana sahiptir ve bu diğer ana akım modellerden önemli ölçüde daha iyidir. Görüntü netliği, renk üretimi ve detay performansı açısından iyi performans gösterir.

Üretim hızı ve verimliliği

256x256 çözünürlükte görüntü üretirken, GPT-Image-1'in ortalama üretim süresi 6.1 saniyedir ve bu da benzer modellerden daha iyidir. Ayrıca, daha yüksek çözünürlüklerde üretim verimliliği de mükemmeldir ve gerçek zamanlı üretim ihtiyaçlarını karşılar.

Performans Metrikleri

GPT-Image-1, farklı sınıflar ve koşullar arasında görüntü oluşturmada etkileyici doğruluk oranlarına ulaşmıştır. Örneğin, kedilerin görüntülerini oluşturmada %93, manzaralar için %91 ve gece sahneleri için %94 doğruluk oranı göstermiştir. Ayrıca, model stil aktarım görevlerinde üstün performans göstererek GAN ve PixelCNN gibi diğer modelleri geride bırakmıştır.

Nasıl aranır GPT-Image-1 CometAPI'den API

GPT-Image-1 CometAPI'de API Fiyatlandırması, resmi fiyattan %20 indirim:

  • Giriş Jetonları: 8$ / M jeton
  • Çıktı Tokenları: 32$/M token

Gerekli Adımlar

  • Giriş cometapi.com. Eğer henüz kullanıcımız değilseniz lütfen önce kayıt olun
  • Arayüzün erişim kimlik bilgisi API anahtarını edinin. Kişisel merkezdeki API belirtecinde “Token Ekle”ye tıklayın, belirteç anahtarını edinin: sk-xxxxx ve gönderin.
  • Bu sitenin URL'sini alın: https://api.cometapi.com/

Kullanım Yöntemleri

  1. "Seçin**GPT-Image-1**” API isteğini göndermek ve istek gövdesini ayarlamak için uç nokta. İstek yöntemi ve istek gövdesi web sitemizin API belgesinden elde edilir. Web sitemiz ayrıca kolaylığınız için Apifox testi de sağlar.
  2. Yer değiştirmek Hesabınızdaki gerçek CometAPI anahtarınızla.
  3. Sorunuzu veya isteğinizi içerik alanına girin; model buna cevap verecektir.
  4. . Üretilen cevabı almak için API yanıtını işleyin.

Comet API'de Model başlatma bilgileri için lütfen şuraya bakın: API kılavuzu (model adı: gpt-image-1)

Comet API'deki Model Fiyatı bilgisi için lütfen şuraya bakın: https://api.cometapi.com/pricing.

API Kullanımı

OpenAI, Görüntüler API'si aracılığıyla GPT-Image-1'e erişim sağlayarak geliştiricilerin görüntü oluşturma yeteneklerini uygulamalarına entegre etmelerine olanak tanıyor.

1.Görüntü Oluştur: Bu model çağrılar için openai v1/images/generations formatını takip eder.

Ayrıntılar için: https://apidoc.cometapi.com/images-api-13851474.

url: https://api.cometapi.com/v1/images/generations

API kullanımına dair bir örnek şu şekildedir:​

import requests
url = "https://api.cometapi.com/v1/images/generations"
headers = {
"Authorization": "Bearer YOUR_API_KEY",
"Content-Type": "application/json"
}
payload = {
"model": "gpt-image-1",
"prompt": "A billboard in a city square that reads 'Welcome to the Future'",
"n": 1,
"size": "1024x1024"
}
response = requests.post(url, headers=headers, json=payload)
image_url = response.json()
print("Generated Image with Text URL:", image_url)

Bu betik, sahne içerisinde belirtilen metni içeren bir görüntü oluşturur.

2.Görüntüyü Düzenle: Bu model çağrılar için openai v1/images/edits formatını takip eder.

Ayrıntılar için: Görüntü Düzenleme (gpt-image-1).

url: https://api.cometapi.com/v1/images/edits

Çağrı hakkında herhangi bir sorunuz varsa veya bize önerileriniz varsa lütfen sosyal medya ve e-posta adresimiz aracılığıyla bizimle iletişime geçin. destek@cometapi.com.

Ayrıca bakınız GPT-Image-1'in maliyeti ne kadar?

SHARE THIS BLOG

500+ Model Tek Bir API'de

%20'ye Varan İndirim