FLUX.2, Black Forest Labs'ın yeni duyurduğu görüntü oluşturma ve düzenleme modelleri ailesidir. Bu modeller, üretim düzeyinde doğruluk, çoklu referans düzenleme (10 referansa kadar) ve açık ağırlıklı Dev'den üretim Pro'ya ve kontrol edilebilir Flex katmanına kadar uzanan dağıtılabilir varyantlar sunar.
FLUX.2 nedir?
FLUX.2, Black Forest Labs'ın üretim düzeyinde görüntü oluşturma ve düzenleme ailesidir. Çoklu referans koşullandırma, yeniden işlenmiş gizli alan (VAE) ve gelişmiş kontrol ilkellerini (onaltılık renk yönlendirme, JSON komut istemi, poz yönlendirme) birleştirerek yaratıcı ve ticari iş akışları için tutarlı ve yüksek doğrulukta sonuçlar sunar. Tek bir model ailesinde hem metin→görüntü oluşturmayı hem de çoklu referans görüntü düzenlemeyi destekler ve BFL, barındırılan API uç noktalarının yanı sıra araştırma ve yerel çıkarım için açık ağırlık eserleri de sunar. Teklif, birden fazla dağıtım kanalında mevcuttur: araştırmacılar/geliştiriciler için açık ağırlıklar (FLUX.2 ), barındırılan üretim modelleri gibi **Flux.2 Pro**ve özelleştirilebilir barındırılan uç noktalar gibi Flux.2 Esnek.
Anahtar yetenekler
- Çoklu referans düzenleme: Kimlik ve stil tutarlılığını koruyarak tek bir çıktı için 8-10 referans görseli birleştirin. Bu, özellikle reklam, ürün maketleri veya yaratıcı varyantlar arasında karakter sürekliliği için faydalıdır.
- Yüksek çözünürlük (4MP'ye kadar): 4 megapiksele kadar çıkış verir (örneğin en boy oranına bağlı olarak 2048×2048 ve daha büyük).
- Fotogerçekçilik + ince detay: Ellerde, yüzlerde, dokularda ve mekansal akıl yürütmede önceki açık modellere kıyasla gelişmeler.
- Yapılandırılmış istemler ve JSON istemleri: FLUX.2, kullanıcı arayüzü kontrollerine (sahne, özneler[], stil, aydınlatma, kamera) doğal olarak eşlenen yapılandırılmış/JSON istemlerini destekleyerek programlı ve yeniden üretilebilir üretimi mümkün kılar.
- Tipografi ve renk doğruluğu: Markaya duyarlı iş akışları için alışılmadık derecede iyi metin oluşturma ve tam renk (hex) yönlendirmesi.
- İçerik kaynağı ve güvenliği: Pro API, üretilen görsellere kriptografik olarak imzalanmış C2PA meta verilerini uygular ve izin verilmeyen içerik kategorileri için katmanlı filtreleme gerçekleştirir.
Pro, Flex ve Dev: Hangi Modeli Seçmeli?
| Varyant | Gecikme ve maliyet | Kalite | Kontrol ve özellikler | Çoklu referans |
|---|---|---|---|---|
| FLUX.2 | Düşük gecikme süresi için optimize edilmiştir (tipik API kurulumlarında <10 saniye), içerik filtreleri ve köken için kriptografik olarak imzalanmış C2PA meta verilerini içerir. | En yüksek (4MP, en iyi doğruluk) | Tüm özellikler, üretim SLA'ları | 8'e kadar (API, 9MP sınırı) |
| FLUX.2 | daha yüksek gecikme süresi pro ancak ayarlanabilir çıkarım hiperparametrelerini (adımlar, rehberlik ölçeği, vb.) ortaya çıkarır | Yüksek | Ayarlanabilir sadakat ve çeşitlilik; ayarlanabilir çıkarım adımları, rehberlik ölçeği ve kalite/hız dengeleri için diğer örnekleme kontrolleri. | 10 kadar |
| FLUX.2 | Donanıma bağlıdır | Güçlü (açık ağırlıklar) | Tam düzenleme + çoklu referans; açık kontrol noktası | Önerilen maksimum 6 |
| AKIŞ.2 | Kenar / düşük kaynaklı | Orta (damıtılmış) | Hızlı, küçük VRAM alanı |
Hangisini ne zaman seçmelisiniz?
- Klinik dev Eğer yerel olarak çalıştırmanız gerekiyorsa, algoritmik araştırmaya ihtiyacınız varsa veya açık ağırlıkta özelleştirmeler gerektiriyorsa (ve yüksek donanım ihtiyaçlarını kabul ediyorsanız).
- Klinik için Dahili güvenlik ve köken özelliklerine sahip, öngörülebilir, düşük gecikmeli üretim görüntülerine ihtiyaç duyduğunuzda.
- Klinik esnek Üretim hiperparametreleri (ayar adımları, rehberlik ölçeği, vb.) üzerinde yineleme yapıyorsanız ve bu kontrolü açığa çıkaran yönetilen bir uç nokta istiyorsanız.
FLUX.2 nasıl çalışır?
FLUX.2 üç temel mimari unsuru bir araya getiriyor:
1. Doğrultulmuş akışlı transformatör omurgası
FLUX.2'nin özünde bir akış eşleştirme / düzeltilmiş akış Öğrenilmiş gizli uzayda çalışan transformatör mimarisi (bazı üretim hatları için difüzyona modern bir alternatif). Bu omurga, birden fazla referans arasında tutarlılığı artıran yüksek doğrulukta işleme ve uzamsal akıl yürütmeyi mümkün kılar. "Akış eşleştirme" yaklaşımı, klasik difüzyona kıyasla örnekleme hızı ve doğrulukta farklı ödünleşimler sunar.
2. Yeni değişken otomatik kodlayıcı (VAE)
Özel olarak tasarlanmış bir otomatik kodlayıcı, görüntüleri FLUX.2'nin oluşturma ve düzenleme görevleri için optimize edilmiş gizli bir gösterime sıkıştırır. BFL, yeni VAE'nin sıkıştırılabilirliği ve doğruluğu iyileştirdiğini (önceki nesillere göre daha iyi öğrenme dinamikleri ve daha yüksek kaliteli yeniden yapılandırmalar) belirtiyor. VAE, 4 MP'ye temiz ölçekleme ve gelişmiş ayrıntılara önemli bir katkıda bulunuyor.
3. Uzun bağlamlı vizyon-dil modeli (VLM)
Bir VLM (yayınlanmış notlarda Mistral sınıfı görsel dil kodlayıcılarıyla ilişkili olduğu bildirilmektedir), istemleri daha sadık hale getiren ve modeli karmaşık talimatları (poz rehberliği, bağlamsal düzenlemeler, vb.) takip etmede daha iyi hale getiren dil koşullandırmasını ve gerçek dünya bilgisini sağlar. Bir VLM'yi bir akış omurgasıyla birleştirmek, FLUX.2'nin daha büyük bağlam pencerelerinde kompozisyon ve anlambilim hakkında akıl yürütmesine olanak tanır.
Bu parçalar nasıl etkileşime giriyor (çalışma zamanı akışı)
- Girişi kodla: Referans görüntüler VAE aracılığıyla gizli belirteçlere kodlanır; metin istemleri VLM tarafından kodlanır.
- Çapraz-modal füzyon: Transformatör omurgası görüntü gizli verilerini + metin belirteçlerini alır ve mekansal ilişkileri, kimlik özelliklerini ve düzenleme talimatlarını modeller.
- Akış tabanlı üretim: düzeltilmiş akışlı örnekleme cihazları, birleştirilmiş gösterime bağlı olarak gizli görüntüler üretir veya düzenler.
- Kod çözme: VAE, isteğe bağlı olarak son renk kısıtlamalarını ve filigran/C2PA meta verilerini uygulayarak gizli verileri piksel alanına geri dönüştürür.
Bu mimarinin önemi nedir?
Bu kombinasyon üç pratik avantaj sağlar: (1) çoklu referans tutarlılığı çünkü kimlik ve stil, gizlide açıkça modellenmiştir; (2) daha iyi metin ve tipografi VLM ile görüntü gizli alanı arasındaki daha sıkı entegrasyon nedeniyle; (3) ölçeklenebilir dağıtım seçenekleri — aynı temel model ailesi, yerel kullanım için açık ağırlıklar (dev), yönetilen düşük gecikmeli bir hizmet (pro) veya geliştiriciler için ayarlanabilir bir hizmet (flex) olarak gönderilebilir.
FLUX.2 Nasıl İyi?
Kriterlerde performans gösterin
Black Forest Labs, FLUX.2 'in, insan tercihi/kazanma oranı karşılaştırmalı testlerinde ve ELO/maliyet analizlerinde birçok açık ağırlıktaki muadilinden daha iyi performans gösterdiğini gösteren karşılaştırmalı değerlendirmeler ve grafikler yayınladı. Yayınlanan tedarikçi/basın özetinden öne çıkanlar şunlardır:
- Metin→Görüntü kazanma oranı: FLUX.2 bildirildi ≈% 66.6 kazanma oranı (~%51.3 Qwen-Image, %48.1 Hunyuan Image 3.0'a karşı).
- Tek referans düzenlemesi: ≈% 59.8 kazanma oranı (~%49.3 Qwen-Image, %41.2 FLUX.1 Kontext'e karşı).
- Çoklu referans düzenleme: ≈% 63.6 kazanma oranı (Qwen-Image için ~%36.4'e karşı).
- ELO ve maliyet: FLUX.2 ailesi (Pro, Flex, Dev) daha yüksek kalitede, nispeten düşük maliyetli bir bantta kümelenmiştir (satıcının fiyatlandırma tablosunda görüntü başına ~2-6 sentle çalışırken ELO ≈1030-1050).
Çoklu Referans Üretimi
FLUX.2'nin en büyük özelliklerinden biri, birden fazla referans görüntüsü kullanarak birden fazla tutarlı çıktı üretebilme yeteneğidir.
Örneğin bir ürünü fotoğrafladığınızda, farklı açılardan, farklı ışık koşulları altında ve farklı arka planlara karşı çekilmiş birden fazla fotoğrafı yükleyebilir ve aynı görüntünün birden fazla varyasyonunu aynı anda üretebilirsiniz.
Bu özellik, e-ticaret siteleri, reklam afişleri, sosyal medya görsel setleri ve daha fazlası için ürün kataloğu fotoğraflarını toplu olarak hızlı bir şekilde oluşturmanıza olanak tanır.
Geleneksel tek görüntü oluşturmanın aksine, bu çoklu referans mekanizması tutarlılık ve bütünlüğe önem veren gerçek dünya iş akışları için idealdir.
Yüksek Çözünürlük, İş Kalitesi (4MP'ye Kadar)
FLUX.2, reklam, baskı, tabela ve poster gibi pratik uygulamalar için uygun görüntü kalitesi sağlayarak 4 megapiksele (yaklaşık 2000-3000 piksel) kadar çıktı desteği sağlar.
Metin, logo, kullanıcı arayüzü maketleri, infografikler ve daha fazlasını mükemmel bir şekilde işler; bu da onu yalnızca sanatsal yaratım için değil, aynı zamanda tasarım ve ticari kullanım için de uygun hale getirir.
Bu arada yazı tipleri ve metinlerin görüntü kalitesi de iyileştirilerek reklam afişleri ve ürün etiketleri oluşturmaya uygun hale getirildi.
Yerel GPU Yürütmesini Destekler: Düşük Maliyet, Düşük Giriş Engeli
Bugüne kadar, birçok yüksek performanslı görüntü oluşturma modeli yalnızca büyük bilgi işlem kaynaklarına sahip veri merkezlerinde kullanışlıydı. Ancak FLUX.2, daha az VRAM tüketimine sahip standart GPU'larda (NVIDIA RTX gibi) çalışacak şekilde optimize edilmiştir.
Modellere artık bulut üzerinden erişilmesi gerekmiyor; yerel olarak düzenlenebiliyor ve oluşturulabiliyorlar; bu da maliyetleri önemli ölçüde azaltıyor ve operasyonel esnekliği artırıyor.
Bu sadece şirketler için değil, aynı zamanda bireysel yaratıcılar ve küçük ekipler için de büyük bir avantajdır.
Birleşik Oluşturma ve Düzenleme İş Akışı
FLUX.2 yalnızca metinden resme dönüştürmeyi (metin → resim oluşturma) değil aynı zamanda resimden resme dönüştürmeyi (mevcut resimleri düzenleme ve biçimlendirme) de destekler.
Bu, "sıfırdan yeni bir görüntü çizme", "mevcut fotoğrafları düzenleme ve rötuşlama" ve "tek tip varyasyonlar oluşturmak için birden fazla görüntüyü yeniden kullanma" gibi görevler için tutarlı bir şekilde tek bir model kullanmanıza olanak tanır.
Örneğin, bir ürün fotoğrafının arka planını farklı bir atmosfere dönüştürmek veya sosyal medya için boyutunu değiştirmek kolaydır.
Flux.2 API'sine Nasıl Erişilir?
CometAPI'nin Flux.2 API'sini entegre ettiğini duyurmaktan mutluluk duyuyoruz. Artık Replicate Format Modelini (Resmi Replicate Fiyatlandırmasından Daha Düşük) ve FLUX.2 Uç Noktalarını Destekliyor:
- kara-orman-laboratuvarları/flux-2-pro
- kara-orman-laboratuvarları/flux-2-dev
- kara-orman-laboratuvarları/flux-2-flex
Hemen İnşa Etmeye Başlayın Tahmin Oluşturma – API Belgesi,
Önce denemek ister misin? FLUX.2 ve 'i sitemizde test edin oyun alanı CometAPI'ye kaydolup giriş yaptıktan sonra, isterseniz API ile hemen oluşturmaya başlayın: Tahmin Oluşturma – API Belgesi.
FLUX.2, yalnızca bir model düşüşü değil; üretim gerçeklerini ele alan, aile düzeyinde bir ürün stratejisidir: sadakat, düzenlenebilirlik, çoklu referans tutarlılığı ve pratik dağıtım yolları (yönetilen API'ler ve açık kontrol noktaları). Ölçekli görsel içerik üreten kuruluşlar için FLUX.2, ekiplerin teknik benimsemeyi sağlam lisanslama yönetimi ve kalite kontrolüyle birleştirmesi koşuluyla, anlamlı üretkenlik kazanımları vaat ediyor.
FLUX.2'nin Ana Kullanımları ve Amaçlanan Kullanım Örnekleri
Ürün Görselleri/E-ticaret Kataloğu Oluşturma
E-ticaret işletmeleri ve markaları, farklı ışıklandırma, arka plan ve renk modları kullanarak çok sayıda ürünün fotoğrafını birden fazla açıdan çekmeye yönelik yüksek bir taleple karşı karşıyadır.
- FLUX.2 ile aslında hiçbir içerik çekmeden, birden fazla görsel olarak tutarlı efekti hızla üretebilirsiniz.
- Bu, fotoğraf maliyetlerini, zamanı ve yönetim maliyetlerini azaltırken ürün kataloğunuzu hızla genişletmenizi sağlar.
Reklam ve Pazarlama Materyali Oluşturma
Reklam afişleri, sosyal medya paylaşım görselleri, promosyon kampanya görselleri ve halkla ilişkiler posterleri dahil olmak üzere tasarım materyallerine olan talep oldukça geniştir.
- İstenilen stil, kompozisyon ve atmosfere sahip görselleri elde etmek için yalnızca bir metin açıklaması sağlayın; bu sayede tasarımcıların ve reklam verenlerin yükü büyük ölçüde azalır.
- Ayrıca, birden fazla referans görsel kullanılarak varyasyonlar oluşturulabildiği için yaratıcı fikirlerin A/B test edilmesi ve birden fazla dil ve bölgeyle uyumlu materyaller oluşturulması için de uygundur.
Kullanıcı Arayüzü/Kullanıcı Deneyimi Tasarımı, Prototipleme
FLUX.2 ayrıca logo, yazı tipi, düzen ve arka plan düzenlemeyi de desteklediğinden yalnızca fotoğraf üretimi için değil, aynı zamanda dijital ürünlerin görsel tasarımı için de uygundur.
- Ön tasarımları, tel kafesleri, etkinlik web sitelerini, uygulama ekranı maketlerini ve daha fazlasını hızla oluşturabilirsiniz.
- Özellikle yeni kurulan şirketler ve küçük tasarım ekipleri için uygun maliyetli bir üretim çözümüdür.
Sanat/Yaratıcı Eserler ve Kişisel Kullanım
Elbette, yalnızca "sanat eseri", "ilüstrasyon" veya "grafik tasarım" için de kullanılabilir.
- Metin istemleri ve referans görselleri kullanarak farklı ruh hallerinde ve stillerde eserler yaratarak yaratıcı ufkunuzu genişletin.
- Ayrıca, mevcut fotoğraflarınızı sanatsal stillere dönüştürmek için resim düzenleme özelliklerini kullanabilir veya fantastik manzaralar veya karakter tasarımlarıyla deneyler yapabilirsiniz.
Mevcut Modellerden ve Rakiplerden Farklı—Neden FLUX.2'yi Seçmelisiniz?
Diğer Yapay Zeka Görüntü Oluşturma Modelleriyle Karşılaştırma
Yapay zeka görüntü üretimi alanında, geleneksel difüzyon modelleri ve en yeni rakip modeller gibi birçok model (açık kaynaklı ve ticari) bulunmaktadır. Peki, FLUX.2 neden bu kadar ilgi çekici? Sebepleri şunlardır:
- Entegre Oluşturma ve Düzenleme: Birçok model ya “oluşturma (metinden resme)” ya da “düzenleme (görüntüden resme)” üzerine odaklanır. FLUX.2 her iki işlevi de aynı anda destekleyerek son derece tutarlı bir iş akışı sağlar.
- Çoklu Referans Girişleri: Kolay ürün fotoğrafçılığı ve tutarlı görsel tutarlılık için birden fazla referans görseli kullanın.
- Ticari Kalite ve Yüksek Çözünürlük: Reklam, ürün fotoğrafçılığı ve baskı için 4MP'yi destekler.
- Kolay Yerel Çalıştırma: Buluttan bağımsızdır ve standart GPU'larda çalışabilir, bu da hem maliyet hem de esneklik açısından avantajlar sunar.
- Esnek Model Seçimi: Standarttan ticari ve araştırma uygulamalarına kadar her şeyi kapsayan çeşitli modeller sunarak ihtiyaçlarınıza ve bütçenize en uygun olanı seçmenize olanak tanır.
Bu, FLUX.2'yi profesyonel iş akışları, ticari kullanım, yüksek hacimli üretim ve maliyet ile hızın kritik olduğu projeler için güçlü bir seçenek haline getirir.
Son düşünceler:
FLUX.2 pragmatik bir kesişim noktasında yer alır: açık ağırlık araştırma seçenekleri kontrol ve yeniden üretilebilirliğe ihtiyaç duyan ekipler için ve yönetilen, üretim API'leri Düşük gecikme süresine, öngörülebilir çıktılara ve kökene öncelik veren ekipler için. Hem açık hem de yönetilen varyantları (dev/pro/flex) sunarak BFL, farklı iş akışlarının (deneysel, yinelemeli tasarım ve üretim) sadakat, hız, özelleştirme ve yönetişim arasında farklı dengeler gerektirdiğini kabul eder.
Geliştiriciler erişebilir Flux.2 Geliştirme API'si, Flux.2 Flex API ve Flux.2 Pro API CometAPI aracılığıyla. Başlamak için, CometAPI'nin model yeteneklerini keşfedin Oyun AlanıErişim sağlamadan önce CometAPI'ye giriş yaptığınızdan ve API anahtarını aldığınızdan emin olun. IleetAPI Entegrasyonunuza yardımcı olmak için resmi fiyattan çok daha düşük bir fiyat teklif ediyoruz.
Gitmeye hazır mısınız?→ Bugün CometAPI'ye kaydolun !
Yapay zeka hakkında daha fazla ipucu, kılavuz ve haber öğrenmek istiyorsanız bizi takip edin VK, X ve Katılın!
