Flux.1 Kontext ile Çoklu Görüntü Referansı: Adım Adım Kılavuz

Flux.1 Kontext'in "çoklu görüntü referansı" özelliği, yapay zeka destekli görüntü düzenleme ve oluşturma iş akışlarının birden fazla görsel girdiyi nasıl ele aldığında bir paradigma değişikliğini temsil ediyor. İçerik oluşturucuların aynı anda birden fazla referans görüntüsü göndermesine olanak tanıyan Flux.1 Kontext, tüm girdilerde tutarlı stil, poz ve aydınlatma sağlayarak birleşik toplu düzenlemelere, tutarlı stil transferlerine ve karmaşık sahne kompozisyonlarına olanak tanıyor. Aşağıda, Flux Kontext ile çoklu görüntü referans işlemede ustalaşmak için temelleri, son gelişmeleri ve en iyi uygulamaları inceliyoruz.

Flux.1 Kontext nedir ve görüntü düzenlemeyi neden dönüştürüyor?

Flux.1 Kontext, Flux serisi akış tabanlı dönüştürücü modelleri üzerine kurulu, çok modlu görüntü oluşturma ve düzenleme alanındaki en son gelişmeyi temsil eder. Black Forest Labs tarafından geliştirilen Flux modelleri, doğrultulmuş akış dönüştürücü bloklarına dayanır ve yüksek doğrulukta metin-görüntü sentezi ve düzenleme yetenekleri sunmak için 12 milyara kadar parametreye ölçeklenebilir. Geleneksel metin-görüntü aktarım hatlarının aksine, Flux.1 Kontext bu temelleri genişleterek şunları sağlar: bağlam içi Düzenleme: Kullanıcılar yalnızca metin istemleri değil, aynı zamanda bir veya daha fazla referans görseli de sağlayabilir; bu sayede modelin görsel kavramları anlamsal olarak anlaması ve bunları yeni çıktılara uygulaması sağlanır.

Flux.1 Kontext'in önemi, birleşik mimarisinde yatmaktadır; üretken akış eşleştirme—her ikisini de idare eden yerel düzenlemeler (örneğin, bir fotoğraftaki nesnenin rengini değiştirmek) ve küresel dönüşümler (örneğin, bir sahnenin yeni görünümlerini tek bir model içinde oluşturma). Bu, ayrı düzenleme ve oluşturma modellerine olan ihtiyacı ortadan kaldırır, iş akışlarını kolaylaştırır ve yaratıcı profesyoneller için bağlam değiştirmeyi azaltır.

Flux.1 Kontext'in farklı versiyonları nelerdir?

Flux.1 Kontext, her biri farklı kullanım durumlarına ve lisanslama modellerine hitap eden üç ana varyantta gelir:

Flux.1Kontext Dev: Öncelikle yerel GPU destekli iş akışlarında deneme ve entegrasyon için tasarlanmış, ticari olmayan bir lisans altında kaynak kullanılabilir bir model.
Flux.1 Kontext Pro: Sektör düzeyinde performans, tutarlı sonuçlar ve ticari destek sunan, tescilli, API erişilebilir bir model.
Flux.1 Kontext Max: Gelişmiş tipografi işleme, maksimum verim ve iyileştirilmiş uç durum doğruluğuna sahip birinci sınıf katman.

Bu varyantlar bir arada, araştırmacıların ve kurumsal kullanıcıların, ister özelleştirilebilirliği ister üretim istikrarını önceliklendirsinler, çok modlu düzenlemeden yararlanabilmelerini sağlar.

Flux.1 Kontext’te “çoklu-görüntü referansı” nedir?

Çoklu görüntü referansı, bir yapay zeka modeline birden fazla örnek görüntü sağlama sürecini ifade eder; böylece model, stil, aydınlatma veya özne kimliği gibi ortak özellikleri çıkarsayabilir ve tüm girdilerde bu özelliklere saygılı tutarlı düzenlemeler uygulayabilir veya yeni içerikler üretebilir. Tek görüntü koşullandırmasının aksine, bu yaklaşım içerik oluşturucuların toplu çıktılarda tekdüzeliği sağlamalarına, manuel rötuşları azaltmalarına ve görsel tutarlılığı sağlamalarına olanak tanır.

Flux.1Kontext çoklu resim referansını nasıl uygular?

Flux.1 Kontext'in çoklu görüntü yeteneğinin özünde, akış eşleştirme Çerçeve. Flux.1 Kontext, her referans görüntüsünü ayrı ayrı ele almak yerine, görüntü yerleştirmelerini ve metin belirteçlerini tek bir dizi halinde birleştirir. Dönüştürücü tabanlı bir akış eşleştiricisi daha sonra bu yerleştirmeleri gizli alanda hizalamayı ve birleştirmeyi öğrenerek hem bireysel hem de birleşik görsel semantiği etkili bir şekilde yakalar.

Geleneksel çoklu referans yaklaşımları genellikle gömmeleri ortalamaya indirger veya yoğun ince ayarlara (örneğin, LoRA) dayanır. Flux.1 Kontext'in akış eşleştirme yaklaşımı:

Tutarlılığı korur birden fazla dönüş boyunca, nesne kimliklerini ve stillerini koruyarak.
Bozunmayı azaltır, yinelemeli düzenleme süreçlerinde yaygın olan bir durumdur.
Etkileşimli oranları desteklerUygulamalarda gerçek zamanlıya yakın önizlemelerin yapılmasını sağlar.

Flux.1 Kontext ile çoklu görüntü entegrasyonunu hangi iş akışları sağlar?

Flux.1 Kontext'in tasarımı, hem GUI tabanlı hem de kod odaklı kanallara kusursuz entegrasyonu garanti eder:

ComfyUI Entegrasyonu

ComfyUI'nin düğüm tabanlı arayüzünden yararlanarak kullanıcılar, birden fazla referans görüntüsünü doğrudan özel bir "Flux.1 Kontext Dev" düğümüne aktarabilirler. Bu düğüm, bir metin istemiyle birlikte bir görüntü listesi kabul ederek birleşik bir difüzyon grafiği sonucu üretir. İki temel mod mevcuttur:

Bağlantı Modu: Sıralı olarak yerleştirmeleri ekler, basit bileşik görevler için idealdir.
Çapraz Dikkat Modu: Daha derin anlamsal harmanlama için dikkat haritalarını iç içe geçirir, karmaşık stil birleştirmeleri için tercih edilir.
Görüntü başına ağırlıkları ve birleştirme belirteçlerini belirtme gibi hızlı ipuçları, renk değişimlerini ve görünür birleşimleri önlemeye yardımcı olur ().

API-First Yaklaşımı (Kopyala, CometAPI)

Geliştiriciler, Flux.1 Kontext Max veya Pro ile RESTful uç noktaları aracılığıyla etkileşim kurabilirler. API şeması genellikle şunları içerir:

   {
     "input_images": ,
     "prompt": "Describe the desired transformation",
     "options": { "blend_strength": 0.8, "seed": 42 }
   }

JavaScript, Python ve Go'daki Playground ve SDK desteği, çoklu görüntü koşullandırmayı web veya mobil uygulamalara entegre etmeyi kolaylaştırır.

CometAPI'nin Flux.Kontext API'si ile Çoklu Görüntü Referansı

Aşağıda, FLUX 1 Kontext API'sine çoklu resim referans istekleri göndermeye yönelik adım adım bir kılavuz bulunmaktadır. Kılavuz, kimlik doğrulama, istek oluşturma (iki referans resimle), sonuç işleme ve en iyi uygulamaları kapsamaktadır.

1. FLUX.1 Kontext API ile kimlik doğrulamasını nasıl yaparım?

Eğer Replicate'in barındırdığı FLUX 1 Kontext uygulamalarını kullanıyorsanız, Replicate → hesabınız → API Token'ları'na giriş yapın.

API anahtarınızı edinin: Kayıt Ol ve Giriş Yap Kuyrukluyıldız API'si, taşıyıcı tokeninizi panonuzdan alın.

Anahtarı başlığınıza ekleyin Authorization: Token YOUR_API_TOKEN veya taşıyıcı tarzı API'ler için: Authorization: Bearer YOUR_API_TOKEN

2. İki görüntü birleştirmeyi hangi uç nokta gerçekleştirir?

Replicate'teki "iki görüntüyü birleştir" modeli için (flux-kontext-apps/multi-image-kontext-pro), POST'larınızı şu adrese gönderin:

https://api.replicate.com/v1/predictions

CometAPI'nin yönetilen API'si için şöyle olacaktır:

https://api.cometapi.com/replicate/v1/models/black-forest-labs/flux-kontext-max/predictions

Not: CometAPI'de, yalnızca flux-kontext birden fazla görüntü referansını destekler. Aşağıdaki farklı modelleri çağırmak için, URL'deki modelden sonra model adını değiştirmeniz gerekir:
black-forest-labs/flux-kontext-max
black-forest-labs/flux-kontext-pro

Her iki uç nokta da şunları içeren bir JSON yükü bekliyor: prompt, input_image_1, ve input_image_2 .

3. İstek yükü nasıl görünüyor?

Aşağıda belgelendiği gibi minimum JSON şeması bulunmaktadır multi-image-kontext-pro:

Alan	Menşei	Tanım
`prompt`	dizi	İki giriş görüntüsünün nasıl birleştirileceği veya dönüştürüleceğiyle ilgili metin açıklaması
`input_image_1`	dizi	İlk resmin (JPEG/PNG/WebP/GIF) URL'si veya Base64 veri URI'si
`input_image_2`	dizi	İkinci görüntünün URL'si veya Base64 veri URI'si
`aspect_ratio`	enum	(opsiyonel) `match_input`, `1:1`, `16:9`, vb. Varsayılan olarak `match_input`

Bahşiş: Genel olarak barındırılan URL'leri veya satır içi Base64 veri URI'lerini geçirebilirsiniz; Base64 tek seferlik betikler için kullanışlıdır ancak çok büyük dosyaları yavaşlatabilir.

CometAPI artık 4'e kadar referans görüntüsünün yüklenmesini destekliyor (önceden yalnızca tek görüntü destekleniyordu)

4. cURL ile çoklu resim isteği nasıl gönderilir?

curl https://api.replicate.com/v1/predictions \
  -H "Authorization: Token $REPLICATE_API_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "version": "multi-image-kontext-pro:f3545943bdffdf06420f0d8ececf86a36ce401b9df0ad5ec0124234c0665cfed",
    "input": {
      "prompt": "Blend the lighting from image1 with the background of image2, preserving color harmony",
      "input_image_1": "https://example.com/portrait1.png",
      "input_image_2": "https://example.com/background2.jpg",
      "aspect_ratio": "match_input"
    }
  }'

Değiştirin version Replicate'ten en son model sürüm kimliğine sahip alan.
CometAPI'de, bunların takasını yapın /predict uç nokta ve kullanım "file": { ... } belgelerine göre.

5. Aynısını Python'da nasıl yapabilirim?

import requests

API_TOKEN = "YOUR_API_TOKEN"
headers = {
    "Authorization": f"Token {API_TOKEN}",
    "Content-Type": "application/json",
}

payload = {
    "version": "multi-image-kontext-pro:f3545943bdffdf06420f0d8ececf86a36ce401b9df0ad5ec0124234c0665cfed",
    "input": {
        "prompt": "Combine the style of image1 with the content of image2, matching lighting and mood",
        "input_image_1": "https://my-bucket.s3.amazonaws.com/imgA.png",
        "input_image_2": "https://my-bucket.s3.amazonaws.com/imgB.png",
        "aspect_ratio": "match_input"
    },
}

resp = requests.post("https://api.replicate.com/v1/predictions", json=payload, headers=headers)
resp.raise_for_status()
data = resp.json()
print("🖼️ Output URL:", data)

Kontrol data (“başlıyor” → “işleniyor” → “başarılı”) hazır olana kadar yoklama yapmak için.

6. Sonucu nasıl işleyip görüntüleyebilirim?

Tahmin tamamlandığında, model birleştirilmiş görüntüye bir URI döndürür:

{  
  "id": "...",  
  "status": "succeeded",  
  "output": "https://.../result.png"  
}

Bu URL'yi alın (veya doğrudan uygulamanıza/kullanıcı arayüzüne yerleştirin).

Sonuçlar nasıl en üst düzeye çıkarılır: en iyi uygulamalar?

Hangi referans görselleri seçmelisiniz?

homojenlik: En iyi düzgünlüğü elde etmek için tutarlı stil, konu ölçeği ve aydınlatmaya sahip görseller seçin.
Stil Transferi için Çeşitlilik: Yeni bir stil uygularken, istenen efektlerin tüm aralığını gösteren çeşitli örnekler ekleyin.
Yüksek Çözünürlüklü Girişler: Daha kaliteli referanslar, özellikle dokular ve yüz hatları gibi ince detaylar için daha keskin üretken çıktılar sağlar.
Resim boyut sınırları: Zaman aşımını önlemek için her girdiyi 10 MB'ın (Çoğaltma standardı) altında tutun.
Biçimleri: JPEG, PNG, GIF ve WebP en iyi sonuçları verir; egzotik formatlardan kaçının.

Hızlı mühendislik:

Açık olun: "1. resimdeki yüz hatlarını koruyun"
Ağırlıklandırmayı kullanın: "image1 önceliği yüksek, image2 önceliği düşük"
Oran sınırlamaları: Planınızın QPS limitlerini kontrol edin; toplu talepleri dikkatlice yapın.

Başlamak

CometAPI, OpenAI'nin GPT serisi, Google'ın Gemini, Anthropic'in Claude, Midjourney, Suno ve daha fazlası gibi önde gelen sağlayıcılardan 500'den fazla AI modelini tek bir geliştirici dostu arayüzde toplayan birleşik bir API platformudur. Tutarlı kimlik doğrulama, istek biçimlendirme ve yanıt işleme sunarak CometAPI, AI yeteneklerinin uygulamalarınıza entegrasyonunu önemli ölçüde basitleştirir. İster sohbet robotları, görüntü oluşturucular, müzik bestecileri veya veri odaklı analiz hatları oluşturuyor olun, CometAPI daha hızlı yineleme yapmanızı, maliyetleri kontrol etmenizi ve satıcıdan bağımsız kalmanızı sağlar; tüm bunları yaparken AI ekosistemindeki en son atılımlardan yararlanırsınız.

Geliştiriciler erişebilir FLUX.1 Bağlam (Modeli: flux-kontext-pro ; flux-kontext-max) başından sonuna kadar Kuyrukluyıldız API'si, listelenen en son model sürümleri makalenin yayınlandığı tarih itibarıyla geçerlidir. Başlamak için, modelin yeteneklerini keşfedin. Oyun Alanı ve danışın API kılavuzu Ayrıntılı talimatlar için. Erişimden önce, lütfen CometAPI'ye giriş yaptığınızdan ve API anahtarını edindiğinizden emin olun. Kuyrukluyıldız API'si Entegrasyonunuza yardımcı olmak için resmi fiyattan çok daha düşük bir fiyat teklif ediyoruz.

Sonuç

FLUX 1 Kontext ile çoklu görüntü referanslama, üretken yapay zeka iş akışlarında bir paradigma değişimini temsil eder. Metin ve birden fazla görsel girdiyi tek bir akış eşleştirme mimarisinde birleştirerek, içerik oluşturucuların daha az adımda karmaşık ve tutarlı çıktılar elde etmelerini sağlar. ComfyUI'deki Görüntü Birleştirme Düğümü'nden düşük hassasiyetli niceleme optimizasyonlarına ve CometAPI API'sine kadar son dönemdeki çığır açan gelişmeler, çoklu görüntü işlemenin erişilebilirliğini, performansını ve yaratıcı potansiyelini önemli ölçüde artırmıştır.