FLUX.2 adalah keluarga model pembuatan dan penyuntingan gambar yang baru diumumkan dari Black Forest Labs yang menawarkan fidelitas tingkat produksi, penyuntingan multi-referensi (hingga 10 referensi), dan varian yang dapat diterapkan mulai dari Dev berbobot terbuka hingga Pro produksi dan tingkat Flex yang dapat dikontrol.
Apa itu FLUX.2?
FLUX.2 adalah keluarga pembangkitan + penyuntingan gambar kelas produksi dari Black Forest Labs yang menggabungkan pengkondisian multi-referensi, ruang laten yang telah direvisi (VAE), dan primitif kontrol lanjutan (pengarahan warna heksadesimal, prompt JSON, panduan pose) untuk memberikan hasil yang konsisten dan fidelitas tinggi bagi alur kerja kreatif dan komersial. FLUX.2 mendukung pembangkitan teks→gambar dan penyuntingan gambar multi-referensi dalam satu keluarga model, dan BFL mengirimkan titik akhir API yang dihosting serta artefak bobot terbuka untuk penelitian dan inferensi lokal. Penawaran ini tersedia di berbagai saluran distribusi: bobot terbuka untuk peneliti/pengembang (FLUX.2 ), model produksi yang dihosting seperti Fluks.2 Pro, dan titik akhir hosting yang dapat disesuaikan seperti Flux.2 Flex.
Kemampuan utama
- Pengeditan multi-referensi: Gabungkan hingga 8–10 gambar referensi untuk satu keluaran dengan tetap menjaga identitas dan konsistensi gaya. Ini sangat berguna untuk periklanan, mockup produk, atau kontinuitas karakter di berbagai varian kreatif.
- Resolusi tinggi (hingga 4MP): menghasilkan hingga 4 megapiksel (misalnya 2048×2048 dan lebih besar, tergantung pada rasio aspek).
- Fotorealisme + detail halus: peningkatan pada tangan, wajah, tekstur dan penalaran spasial dibandingkan model terbuka sebelumnya.
- Perintah terstruktur & perintah JSON: FLUX.2 mendukung perintah terstruktur/JSON yang memetakan secara alami ke kontrol UI (pemandangan, subjek[], gaya, pencahayaan, kamera), yang memungkinkan pembuatan programatik dan dapat direproduksi.
- Tipografi dan kesetiaan warna: rendering teks yang luar biasa bagus dan pengarahan warna (hex) yang tepat untuk alur kerja yang peka terhadap merek.
- Asal-usul konten & keamanan: API Pro menerapkan metadata C2PA yang ditandatangani secara kriptografi ke gambar yang diproduksi dan mengoperasikan penyaringan berlapis untuk kategori konten yang tidak diizinkan.
Pro vs Flex vs Dev: Model Mana yang Dipilih?
| Varian | Latensi & biaya | Kualitas | Kontrol & fitur | Multi-referensi |
|---|---|---|---|---|
| FLUX.2 | dioptimalkan untuk latensi rendah (<10 detik dalam pengaturan API umum), mencakup filter konten dan metadata C2PA yang ditandatangani secara kriptografi untuk mengetahui asal usulnya. | Tertinggi (4MP, fidelitas terbaik) | Fitur lengkap, SLA produksi | Hingga 8 (API, batas 9MP) |
| FLUX.2 | latensi lebih tinggi dari pro tetapi memaparkan hiperparameter inferensi yang dapat disesuaikan (langkah, skala panduan, dsb.) | High | Kesetiaan yang dapat disesuaikan vs. keberagaman; langkah inferensi yang dapat disesuaikan, skala panduan, dan kontrol pengambilan sampel lainnya untuk keseimbangan kualitas/kecepatan. | Sampai 10 |
| FLUX.2 | Tergantung pada perangkat keras | Kuat (beban terbuka) | Pengeditan penuh + multi-referensi; titik pemeriksaan terbuka | Disarankan maksimal 6 |
| FLUX.2 | Tepi / sumber daya rendah | Sedang (suling) | Jejak VRAM yang cepat dan kecil |
Kapan harus memilih yang mana
- Pilih dev jika Anda harus menjalankannya secara lokal, memerlukan penelitian algoritmik, atau memerlukan kustomisasi bobot terbuka (dan menerima kebutuhan perangkat keras yang tinggi).
- Pilih untuk ketika Anda memerlukan gambar produksi yang dapat diprediksi dan berlatensi rendah dengan fitur keselamatan dan asal usul yang terintegrasi.
- Pilih melenturkan jika Anda melakukan iterasi pada hiperparameter pembangkitan (langkah penyetelan, skala panduan, dsb.) dan menginginkan titik akhir terkelola yang memaparkan kontrol tersebut.
Bagaimana cara kerja FLUX.2?
FLUX.2 menyatukan tiga elemen arsitektur utama:
1. Tulang punggung transformator aliran-disearahkan
Pada intinya FLUX.2 menggunakan pencocokan aliran / aliran yang diperbaiki Arsitektur transformator yang beroperasi dalam ruang laten yang dipelajari (alternatif modern untuk difusi bagi beberapa jalur produksi). Tulang punggung ini memungkinkan rendering fidelitas tinggi dan penalaran spasial yang meningkatkan konsistensi di berbagai referensi. Pendekatan "pencocokan aliran" menawarkan berbagai tradeoff dalam hal kecepatan dan fidelitas pengambilan sampel dibandingkan dengan difusi klasik.
2. Autoencoder variasional (VAE) baru
Sebuah autoencoder yang dirancang khusus mengompresi gambar menjadi representasi laten yang dioptimalkan untuk tugas pembuatan dan pengeditan FLUX.2. BFL menyatakan bahwa VAE baru meningkatkan kompresibilitas dan fidelitas (dinamika pembelajaran yang lebih baik dan rekonstruksi berkualitas lebih tinggi dibandingkan generasi sebelumnya). VAE merupakan kontributor utama untuk peningkatan skala yang bersih ke 4MP dan detail yang lebih baik.
3. Model visi-bahasa konteks panjang (VLM)
VLM (dilaporkan terkait dengan enkoder bahasa visual kelas Mistral dalam catatan yang dipublikasikan) menyediakan pengkondisian bahasa dan pengetahuan dunia nyata yang membuat prompt lebih akurat dan model lebih baik dalam mengikuti instruksi kompleks (panduan pose, suntingan kontekstual, dll.). Menggabungkan VLM dengan tulang punggung alur memungkinkan FLUX.2 untuk bernalar tentang komposisi dan semantik pada jendela konteks yang lebih luas.
Bagaimana bagian-bagian ini berinteraksi (alur waktu proses)
- Enkode masukan: gambar referensi dikodekan melalui VAE menjadi token laten; perintah teks dikodekan oleh VLM.
- Fusi lintas modal: tulang punggung transformator menyerap laten gambar + token teks dan memodelkan hubungan spasial, fitur identitas, dan instruksi pengeditan.
- Pembangkitan berbasis aliran: pengambil sampel aliran-rektifikasi menghasilkan atau mengedit gambar laten yang dikondisikan pada representasi yang menyatu.
- Membaca sandi: VAE mendekode laten kembali ke ruang piksel, secara opsional menerapkan batasan warna akhir dan metadata tanda air/C2PA.
Mengapa arsitektur ini penting
Kombinasi ini menghasilkan tiga keuntungan praktis: (1) koherensi multi-referensi karena identitas dan gaya dimodelkan secara eksplisit dalam laten; (2) teks dan tipografi yang lebih baik karena integrasi yang lebih erat antara VLM dan ruang laten gambar; (3) opsi penerapan yang dapat diskalakan —keluarga model dasar yang sama dapat dikirimkan sebagai bobot terbuka untuk penggunaan lokal (dev), sebagai layanan latensi rendah yang terkelola (pro), atau sebagai layanan yang dapat disesuaikan untuk pengembang (flex).
Bagaimana FLUX.2 Bagus?
Tampil dalam tolok ukur
Black Forest Labs menerbitkan evaluasi dan grafik perbandingan yang menunjukkan FLUX.2 mengungguli beberapa pesaingnya dalam uji preferensi/tingkat kemenangan manusia secara langsung dan dalam analisis ELO vs. biaya. Sorotan yang dilaporkan dari ringkasan vendor/pers yang dipublikasikan meliputi:
- Tingkat kemenangan Teks→Gambar: FLUX.2 dilaporkan 66.6% tingkat kemenangan (vs ~51.3% Qwen-Image, 48.1% Hunyuan Image 3.0).
- Pengeditan referensi tunggal: 59.8% tingkat kemenangan (vs ~49.3% Qwen-Image, 41.2% FLUX.1 Kontext).
- Pengeditan multi-referensi: 63.6% tingkat kemenangan (vs ~36.4% untuk Qwen-Image).
- ELO vs biaya: Keluarga FLUX.2 (Pro, Flex, Dev) mengelompok dalam pita kualitas atas dengan biaya relatif rendah (ELO ≈1030–1050 saat beroperasi pada ~2–6 sen per gambar dalam tabel harga vendor).
Pembuatan Multi-Referensi
Salah satu fitur terbesar FLUX.2 adalah kemampuannya untuk menghasilkan beberapa keluaran yang konsisten menggunakan beberapa gambar referensi.
Misalnya, saat memotret suatu produk, Anda dapat mengunggah beberapa foto yang diambil dari sudut berbeda, dalam kondisi pencahayaan berbeda, dan dengan latar belakang berbeda, dan menghasilkan beberapa variasi gambar yang sama sekaligus.
Fitur ini memungkinkan Anda dengan cepat membuat sekumpulan foto katalog produk untuk situs web e-dagang, spanduk iklan, rangkaian gambar media sosial, dan banyak lagi.
Tidak seperti pembuatan gambar tunggal tradisional, mekanisme multi-referensi ini ideal untuk alur kerja dunia nyata yang menekankan konsistensi dan integritas.
Resolusi Tinggi, Kualitas Bisnis (Hingga 4MP)
FLUX.2 mendukung keluaran hingga 4 megapiksel (sekitar 2000-3000 piksel), memberikan kualitas gambar yang sesuai untuk aplikasi praktis seperti periklanan, percetakan, papan tanda, dan poster.
Ia menangani teks, logo, tiruan UI, infografis, dan masih banyak lagi dengan sempurna, sehingga cocok tidak hanya untuk kreasi artistik tetapi juga untuk desain dan penggunaan komersial.
Sementara itu, kualitas rendering font dan teks juga telah ditingkatkan, membuatnya cocok untuk membuat spanduk iklan dan label produk.
Mendukung Eksekusi GPU Lokal: Biaya Rendah, Hambatan Masuk Rendah
Hingga saat ini, banyak model pembangkitan gambar berkinerja tinggi hanya praktis di pusat data dengan sumber daya komputasi yang besar. Namun, FLUX.2 dioptimalkan untuk berjalan pada GPU standar (seperti NVIDIA RTX) dengan konsumsi VRAM yang lebih rendah.
Model tidak perlu lagi diakses melalui cloud; model dapat diedit dan dibuat secara lokal, secara signifikan mengurangi biaya dan meningkatkan fleksibilitas operasional.
Ini merupakan keuntungan besar bukan hanya bagi perusahaan tetapi juga bagi kreator individu dan tim kecil.
Alur Kerja Pembuatan dan Pengeditan Terpadu
FLUX.2 tidak hanya mendukung teks-ke-gambar (teks → pembuatan gambar) tetapi juga gambar-ke-gambar (pengeditan dan penataan gambar yang ada).
Hal ini memungkinkan Anda untuk menggunakan satu model secara konsisten untuk tugas-tugas seperti "menggambar gambar baru dari awal", "mengedit dan memperbaiki foto yang sudah ada", dan "menggunakan kembali beberapa gambar untuk menciptakan variasi yang seragam".
Misalnya, mudah untuk mengubah latar belakang foto produk ke suasana yang berbeda atau mengubah ukurannya untuk media sosial.
Cara Mengakses API Flux.2
Dengan bangga kami umumkan bahwa CometAPI telah mengintegrasikan API Flux.2. Kini Mendukung Model Format Replikasi (Harga Lebih Rendah dari Harga Resmi Replikasi), Titik Akhir FLUX.2:
- black-forest-labs/flux-2-pro
- black-forest-labs/flux-2-dev
- black-forest-labs/flux-2-flex
Mulai Membangun Sekarang Buat Prediksi – Dokumen API,
Ingin mencoba dulu? Uji FLUX.2 dan di kami tempat bermain setelah mendaftar dan masuk ke CometAPI, jika Anda ingin mulai membangun dengan API sekarang: Buat Prediksi – Dokumen API.
FLUX.2 bukan sekadar model drop lainnya; ini adalah strategi produk tingkat keluarga yang menjawab realitas produksi: fidelitas, kemudahan edit, koherensi multi-referensi, dan jalur penerapan praktis (API terkelola dan titik pemeriksaan terbuka). Bagi organisasi yang memproduksi konten visual dalam skala besar, FLUX.2 menjanjikan peningkatan produktivitas yang signifikan — asalkan tim memadukan adopsi teknis dengan tata kelola lisensi dan kontrol kualitas yang kuat.
Penggunaan Utama dan Tujuan Penggunaan FLUX.2
Visual Produk/Pembuatan Katalog E-commerce
Bisnis dan merek e-commerce memiliki permintaan tinggi untuk mengambil banyak foto produk dari berbagai sudut, menggunakan pencahayaan, latar belakang, dan mode warna yang berbeda.
- Dengan FLUX.2, Anda dapat dengan cepat menghasilkan berbagai efek visual yang konsisten tanpa benar-benar merekam konten apa pun.
- Hal ini memungkinkan Anda memperluas katalog produk dengan cepat sekaligus mengurangi biaya fotografi, waktu, dan biaya manajemen.
Pembuatan Materi Periklanan dan Pemasaran
Permintaan untuk materi desain luas, termasuk spanduk iklan, gambar posting media sosial, visual kampanye promosi, dan poster hubungan masyarakat.
- Cukup berikan deskripsi teks untuk mendapatkan gambar dengan gaya, komposisi, dan suasana yang diinginkan, sehingga sangat mengurangi beban desainer dan pengiklan.
- Lebih jauh lagi, karena variasi dapat dihasilkan menggunakan beberapa gambar referensi, ini juga cocok untuk pengujian A/B terhadap ide-ide kreatif dan membuat materi yang kompatibel dengan berbagai bahasa dan wilayah.
Desain Antarmuka Pengguna/Pengalaman Pengguna, Pembuatan Prototipe
FLUX.2 juga mendukung pengeditan logo, font, tata letak, dan latar belakang, sehingga cocok tidak hanya untuk pembuatan foto tetapi juga untuk desain visual produk digital.
- Anda dapat dengan cepat membuat desain awal, rangka kerja, situs web acara, contoh layar aplikasi, dan banyak lagi.
- Ini adalah solusi produksi yang hemat biaya, terutama cocok untuk perusahaan rintisan dan tim desain kecil.
Seni/Karya Kreatif dan Penggunaan Pribadi
Tentu saja, ini juga dapat digunakan murni untuk “karya seni,” “ilustrasi,” atau “desain grafis.”
- Perluas cakrawala kreatif Anda dengan menciptakan karya dalam berbagai suasana hati dan gaya menggunakan teks petunjuk dan gambar referensi.
- Anda juga dapat menggunakan fitur penyuntingan gambar untuk secara bebas mengubah foto yang sudah ada menjadi gaya artistik, atau bereksperimen dengan lanskap fantastis atau desain karakter.
Berbeda dari Model dan Pesaing yang Ada—Mengapa Memilih FLUX.2?
Perbandingan dengan Model Pembuatan Gambar AI Lainnya
Saat ini, terdapat banyak model (sumber terbuka dan komersial) di bidang pembuatan citra AI, seperti model difusi tradisional dan model pesaing terbaru. Lalu, mengapa FLUX.2 begitu menarik? Alasannya adalah sebagai berikut:
- Pembuatan dan Pengeditan Terintegrasi: Banyak model berfokus pada "pembuatan (teks menjadi gambar)" atau "pengeditan (gambar menjadi gambar)". FLUX.2 mendukung kedua fungsi secara bersamaan, sehingga menghasilkan alur kerja yang sangat konsisten.
- Beberapa Masukan Referensi: Manfaatkan beberapa gambar referensi untuk kemudahan fotografi produk dan konsistensi visual yang konsisten.
- Kualitas Komersial dan Resolusi Tinggi: Mendukung 4MP untuk periklanan, fotografi produk, dan pencetakan.
- Eksekusi Lokal yang Mudah: Tidak bergantung pada cloud dan dapat berjalan pada GPU standar, menawarkan keuntungan dari segi biaya dan fleksibilitas.
- Pemilihan Model yang Fleksibel: Menawarkan berbagai model yang mencakup semuanya, mulai dari aplikasi standar hingga komersial dan penelitian, memungkinkan Anda memilih salah satu yang paling sesuai dengan kebutuhan dan anggaran Anda.
Hal ini menjadikan FLUX.2 pilihan yang tepat untuk alur kerja profesional, penggunaan komersial, produksi bervolume tinggi, dan proyek yang biaya dan kecepatannya sangat penting.
Pemikiran akhir:
FLUX.2 berada di persimpangan pragmatis: ia menawarkan opsi penelitian bobot terbuka untuk tim yang membutuhkan kontrol dan reproduktifitas, dan API produksi yang dikelola untuk tim yang memprioritaskan latensi rendah, keluaran yang dapat diprediksi, dan asal usul. Dengan menghadirkan varian terbuka dan terkelola (dev/pro/flex), BFL mengakui bahwa alur kerja yang berbeda — eksperimen, desain iteratif, dan produksi — memerlukan pertimbangan yang berbeda antara fidelitas, kecepatan, kustomisasi, dan tata kelola.
Pengembang dapat mengakses Flux.2 Dev API, Flux.2 Flex API dan Flux.2 Pro API melalui CometAPI. Untuk memulai, jelajahi kemampuan model CometAPI di tempat bermainSebelum mengakses, pastikan Anda telah masuk ke CometAPI dan mendapatkan kunci API. cometAPI menawarkan harga yang jauh lebih rendah dari harga resmi untuk membantu Anda berintegrasi.
Siap untuk berangkat?→ Daftar ke CometAPI hari ini !
Jika Anda ingin mengetahui lebih banyak tips, panduan, dan berita tentang AI, ikuti kami di VK, X dan Discord!
