gen4_image Gen-4 ailesindeki Runway'in amiral gemisi çok modlu görüntü oluşturma modelidir ve şunları destekler: istemli nesil artı görsel referanslar (Referans görselleri “@mention” edebilirsiniz) görüntü ve görüntü→video kanalları için son derece kontrol edilebilir, stilistik olarak tutarlı çıktılar üretmek için.
Giriş — ne 4. Nesil Görüntü is
gen4_image Runway'in dördüncü nesil görsel üretken model ailesi, metin istemleri + görsel referanslar ve yüksek kaliteli durağan görüntüler veya medyaya hazır çerçeveler üretin kimlik ve stil açılar ve aydınlatma arasında geçiş yapar. Model, daha geniş bir 4. Nesil paketinin parçası olarak sunulur (video varyantları dahil) gen4_turbo) ve açıkça tasarlanmıştır yaratıcı üretim — örneğin, tutarlı karakter oluşturma, büyük ölçekte ürün fotoğrafçılığı, sanal deneme ve oyun varlıkları oluşturma.
anahtar özellikler
- Referans tabanlı üretim (1–3 referans). Modelin pozu, ışığı, arka planı vb. değiştirirken kimliğini, stilini veya konumunu koruyabilmesi için en fazla üç referans görsel kullanın.
- Yüksek görsel sadakat (üretime hazır çıktılar). Çıkışlar güçlü ayrıntı ve stil kontrolüyle yüksek çözünürlüğü (1080p seçenekleri mevcuttur) hedefler.
- Kimlik ve sahne tutarlılığı. Aynı karakter(ler)i veya ortamı birden fazla nesil boyunca tutarlı tutmak için tasarlanmıştır; çoklu çekimli görseller veya karakter merkezli varlıklar için kullanışlıdır.
- Çok modlu (metin + görsel) istemler. Kompozisyonu, ruh halini, giyimi, kamera açısını vb. yönlendirmek için doğal dil talimatlarını referans görsellerle birleştirin.
- Resim → resim artı metin → resim iş akışları. Referanslar kullanarak sürekliliği sağlamak için resimden resme (düzenleme/dönüştürme) ve metinden resme çalışır.
- Performans kademesi (Turbo) mevcuttur. "4. Nesil Görüntü Turbo" varyantı, referans odaklı özellikleri korurken maliyet ve hızdan (örneğin, ~2.5 kat daha hızlı) feragat ediyor.
- Kontroller ve tekrarlanabilirlik. Tipik API seçenekleri arasında en boy oranı ön ayarları, çözünürlük (720p/1080p), yeniden üretilebilirlik için tohum ve belirli girdilere işaret eden referans etiketleri bulunur.
Teknik detaylar
Giriş: Metin/Görsel
Çıkışlar: Resim
iş akışı:
- Kullanıcı malzemeleri: metin istemi + 0–3 referans görüntüsü (ve isteğe bağlı maskeler, anahtar kareler, kamera hareket talimatları).
- önişlem: referanslar normalleştirilir ve kodlanır; metin belirteçlere dönüştürülür. Kimlik/stil yerleştirmeleri çıkarılır ve yeniden kullanım için önbelleğe alınır.
- Klima: metin ve referans yerleştirmeleri çok modlu omurgada birleştirilir; isteğe bağlı kontrol sinyalleri (poz, derinlik, maske) eklenir.
- Örnekleme / gürültü giderme: kod çözücü gürültü giderme yinelemelerini (yayılma adımlarını) çalıştırarak bir görüntü (veya video için bir dizi kare) üretir.
gen4_image — somut sınırlar
Zamansal/hareketsel uç durumlar. İncelemeciler ve yaratıcılar ara sıra hareket bozuklukları, tuhaf zamansal dinamikler (oluşturulan kliplerin başlarında/sonlarında oluşan aksaklıklar) ve çok karmaşık çok oyunculu koreografilerde başarısızlıklar bildiriyor; hedef sahnelerinizle test edin.
Hesaplama, maliyetlendirme ve kuyruklama. Yüksek kaliteli görüntü→video üretimi GPU ağırlıklıdır; kullanıcılar, seri üretim için önemli olabilecek kuyruk süreleri ve render başına maliyet bildirmektedir. Bütçeyi/verim hızını buna göre planlayın.
Yaratıcı ödünleşimler ve saf sanatsal modeller. Gen-4'ün gücü tutarlılıktır; eğer son derece stilize, resimsel veya "şaşırtıcı" estetik çıktılar istiyorsanız, Midjourney veya ayarlanmış SDXL kontrol noktaları tercih edilen sanat yönlerini üretebilir.
Kanonik kullanım durumları
- Ön prodüksiyon ve storyboard: Referans fotoğraflardan stil açısından tutarlı karakter/sahne varyantlarını hızla yaratın.
- Pazarlama ve içerik üretimi: Tutarlı marka karakterlerine sahip kahraman görselleri, animasyonlu sosyal klipler ve kampanya öğelerinin hızlı üretimi. (Runway, canlı turlar ve müzik videoları gibi kurumsal örnekler listeliyor.)
- Oyun/varlık prototipleme ve sanal deneme: Küçük bir referans kümesinden birden fazla kamera açısı, kıyafet çeşidi ve çevre konsepti üretin.
Diğer modellerle karşılaştırma
- gen4_image→ en iyisi Ne zaman ihtiyacın olursa referans / kimlik tutarlılığı (tek karakter veya nesne çekimler boyunca aynı tutulur) ve istediğiniz zaman resim→video ve çoklu atışlı boru hatları.
- DALL·E 3 → en iyi Görüntüye sıkı bir şekilde sadık kalma ve sohbet tarzında ChatGPT destekli düzenleme akışı ile yerleşik güvenlik/köken çalışması için.
- SDXL (Kararlı Difüzyon ailesi) → en iyisi Açık modeller, yerel/özel ince ayarlar ve maliyet açısından esnek dağıtım istediğinizde.
- Midjourney → en iyisi Son derece stilize edilmiş, sanatsal açıdan hoş renderlar ve güçlü topluluk odaklı ön ayarlar / "stilize" kontrolleri için.
- Runway Gen-4 vs. ByteDance Seedream 4.0 / Google “Nano Banana” tipi modeller: son rakip lansmanları (örneğin, Seedream 4.0) vurgulamaktadır ultra hızlı işleme ve çoklu referans işleme Ticari içerik üreticilerine yöneliktir; Runway'in avantajı sıkı bir şekilde entegre edilmiş görüntü→video hattı ve prodüksiyon odaklı kontrollerin yanı sıra olgun bir API ve SDK ekosistemidir.
Nasıl aranır gen4_image CometAPI'den API
| Fiyat | $0.32000 |
Gerekli Adımlar
- Giriş cometapi.com. Eğer henüz kullanıcımız değilseniz lütfen önce kayıt olun
- Arayüzün erişim kimlik bilgisi API anahtarını edinin. Kişisel merkezdeki API belirtecinde “Token Ekle”ye tıklayın, belirteç anahtarını edinin: sk-xxxxx ve gönderin.
- Bu sitenin URL'sini alın: https://api.cometapi.com/
Kullanım Yöntemi
- API isteğini göndermek için "gen4_image" uç noktasını seçin ve istek gövdesini ayarlayın. İstek yöntemi ve istek gövdesi, web sitemizdeki API dokümanından alınmıştır. Web sitemizde ayrıca kolaylık olması açısından Apifox testi de sunulmaktadır.
- Yer değiştirmek Hesabınızdaki gerçek CometAPI anahtarınızla.
- Sorunuzu veya isteğinizi içerik alanına girin; model buna cevap verecektir.
- . Üretilen cevabı almak için API yanıtını işleyin.
CometAPI, sorunsuz geçiş için tamamen uyumlu bir REST API sağlar. Temel ayrıntılar API belgesi:
- Son nokta:
https://api.cometapi.com/runwayml/v1/text_to_image - Model Parametresi:
gen4_image - Kimlik doğrulama:
Bearer YOUR_CometAPI_API_KEY - İçerik türü:
application/json.
curl --location --request POST 'https://api.cometapi.com/runwayml/v1/text_to_image' \
--header 'X-Runway-Version: 2024-11-06' \
--header 'Authorization: {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{
"promptText": "cat",
"ratio": "1920:1080",
"seed": 4294967295,
"model": "gen4_image",
"referenceImages": ,
"contentModeration": {
"publicFigureThreshold": "auto"
}
}'
Ayrıca bakınız Podyum/İkinci Perde
