Apakah itu Flux.2 dan Flux 2 kini tersedia di CometAPI

CometAPI
AnnaNov 26, 2025
Apakah itu Flux.2 dan Flux 2 kini tersedia di CometAPI

FLUX.2 ialah keluarga model penjanaan imej dan pengeditan yang baru diumumkan daripada Black Forest Labs yang menawarkan kesetiaan gred pengeluaran, pengeditan berbilang rujukan (sehingga 10 rujukan) dan varian boleh digunakan mulai daripada Dev berat terbuka kepada Pro pengeluaran dan peringkat Flex yang boleh dikawal.

Apakah itu FLUX.2?

FLUX.2 ialah penjanaan imej gred pengeluaran + keluarga penyuntingan Black Forest Labs yang menggabungkan penyaman berbilang rujukan, ruang terpendam (VAE) yang dikerjakan semula dan primitif kawalan lanjutan (stering warna hex, gesaan JSON, panduan pose) untuk menyampaikan hasil yang konsisten dan ketepatan tinggi untuk aliran kerja kreatif dan komersial. Ia menyokong kedua-dua teks → penjanaan imej dan pengeditan imej berbilang rujukan dalam satu keluarga model, dan BFL menghantar titik akhir API yang dihoskan serta artifak berat terbuka untuk penyelidikan dan inferens tempatan. Tawaran itu wujud merentas berbilang saluran pengedaran: wajaran terbuka untuk penyelidik/pembangun (FLUX.2 ), model pengeluaran yang dihoskan seperti Fluks.2 Pro, dan titik akhir dihoskan boleh disesuaikan seperti Fluks.2 Lentur.

Keupayaan utama

  • Penyuntingan berbilang rujukan: menggabungkan sehingga 8–10 imej rujukan untuk satu output sambil mengekalkan identiti dan konsistensi gaya. Ini amat berguna untuk pengiklanan, mockup produk atau kesinambungan watak merentas varian kreatif.
  • Resolusi tinggi (sehingga 4MP): mengeluarkan sehingga 4 megapiksel (contohnya 2048×2048 dan lebih besar, bergantung pada nisbah bidang).
  • Fotorealisme + perincian halus: penambahbaikan dalam tangan, muka, tekstur dan penaakulan spatial berbanding model terbuka yang lebih awal.
  • Gesaan berstruktur & gesaan JSON: FLUX.2 menyokong gesaan berstruktur/JSON yang memetakan secara semula jadi kepada kawalan UI (adegan, subjek[], gaya, pencahayaan, kamera), membolehkan penjanaan terprogram dan boleh dihasilkan semula.
  • Tipografi dan kesetiaan warna: pemaparan teks yang luar biasa baik dan stereng warna tepat (hex) untuk aliran kerja sensitif jenama.
  • Asal kandungan & keselamatan: API Pro menggunakan metadata C2PA yang ditandatangani secara kriptografi untuk imej yang dihasilkan dan mengendalikan penapisan berlapis untuk kategori kandungan yang tidak dibenarkan.

Pro lwn Flex lwn Dev: Model Mana Untuk Dipilih?

PelbagaiLatensi & kosKualitiKawalan & ciriPelbagai rujukan
FLUX.2dioptimumkan untuk kependaman rendah (<10s dalam persediaan API biasa), termasuk penapis kandungan dan metadata C2PA yang ditandatangani secara kriptografi untuk asal.Tertinggi (4MP, kesetiaan terbaik)Ciri penuh, SLA pengeluaranSehingga 8 (API, had 9MP)
FLUX.2kependaman yang lebih tinggi daripada pro tetapi mendedahkan hiperparameter inferens boleh laras (langkah, skala panduan, dsb.)TinggiKesetiaan yang boleh disesuaikan lwn. kepelbagaian; langkah inferens boleh laras, skala panduan dan kawalan pensampelan lain untuk pertukaran kualiti/kelajuan.Sehingga 10
FLUX.2Bergantung pada perkakasanKuat (berat terbuka)Penyuntingan penuh + pelbagai rujukan; buka pusat pemeriksaanMaks 6 yang disyorkan
FLUX.2Tepi / sumber rendahSederhana (suling)Jejak VRAM yang cepat dan kecil

Bila nak pilih yang mana

  • Pilih dev jika anda mesti menjalankan secara tempatan, memerlukan penyelidikan algoritma atau memerlukan penyesuaian berat terbuka (dan menerima keperluan perkakasan yang tinggi).
  • Pilih untuk apabila anda memerlukan imej pengeluaran kependaman rendah yang boleh diramal dengan ciri keselamatan dan asal terbina dalam.
  • Pilih flex jika anda mengulangi hiperparameter penjanaan (langkah penalaan, skala panduan, dsb.) dan mahukan titik akhir terurus yang mendedahkan kawalan tersebut.

Bagaimanakah FLUX.2 berfungsi?

FLUX.2 menghimpunkan tiga elemen seni bina utama:

1. Tulang belakang pengubah aliran diperbetulkan

Pada terasnya FLUX.2 menggunakan a padanan aliran / aliran diperbetulkan seni bina pengubah yang beroperasi dalam ruang terpendam yang dipelajari (alternatif moden kepada penyebaran untuk beberapa saluran paip pengeluaran). Tulang belakang ini membolehkan pemaparan kesetiaan tinggi dan penaakulan spatial yang meningkatkan ketekalan merentas pelbagai rujukan. Pendekatan "padanan aliran" menawarkan pertukaran berbeza dalam kelajuan pensampelan dan kesetiaan berbanding dengan penyebaran klasik.

2. Pengekod auto variasi baharu (VAE)

Pengekod automatik yang dibina khas memampatkan imej menjadi perwakilan terpendam yang dioptimumkan untuk penjanaan dan tugas penyuntingan FLUX.2. BFL menyatakan bahawa VAE baharu meningkatkan kebolehmampatan dan kesetiaan (dinamik pembelajaran yang lebih baik dan pembinaan semula kualiti yang lebih tinggi daripada generasi sebelumnya). VAE ialah penyumbang utama untuk membersihkan peningkatan kepada 4MP dan perincian yang lebih baik.

3. Model penglihatan-bahasa konteks panjang (VLM)

VLM (dilaporkan berkaitan dengan pengekod bahasa visual kelas Mistral dalam nota yang diterbitkan) menyediakan penyaman bahasa dan pengetahuan dunia sebenar yang menjadikan gesaan lebih setia dan model lebih baik dalam mengikuti arahan yang kompleks (panduan pose, suntingan kontekstual, dsb.). Menggabungkan VLM dengan tulang belakang aliran membolehkan FLUX.2 membuat alasan tentang komposisi dan semantik pada tetingkap konteks yang lebih besar.

Cara bahagian ini berinteraksi (aliran masa jalan)

  1. Input kod: imej rujukan dikodkan melalui VAE ke dalam token terpendam; gesaan teks dikodkan oleh VLM.
  2. Percantuman silang modal: tulang belakang pengubah menyerap pendam imej + token teks dan memodelkan hubungan ruang, ciri identiti dan arahan pengeditan.
  3. Penjanaan berasaskan aliran: pensampel aliran diperbetulkan menjana atau mengedit imej terpendam yang dikondisikan pada perwakilan bercantum.
  4. Nyahkod: VAE menyahkod pendam kembali ke ruang piksel, secara pilihan menggunakan kekangan warna akhir dan metadata tera air/C2PA.

Mengapa seni bina ini penting

Gabungan ini menghasilkan tiga kelebihan praktikal: (1) koheren pelbagai rujukan kerana identiti dan gaya dimodelkan secara eksplisit dalam laten; (2) teks dan tipografi yang lebih baik disebabkan oleh penyepaduan yang lebih ketat antara VLM dan ruang terpendam imej; (3) pilihan penggunaan berskala — keluarga model asas yang sama boleh dihantar sebagai pemberat terbuka untuk kegunaan tempatan (dev), sebagai perkhidmatan kependaman rendah terurus (pro), atau sebagai perkhidmatan boleh melaras untuk pembangun (flex).

Bagaimanakah FLUX.2 Bagus ?

Lakukan dalam penanda aras

Black Forest Labs menerbitkan penilaian dan carta perbandingan yang menunjukkan FLUX.2 mengatasi beberapa rakan sezaman terbuka dalam ujian keutamaan/kadar menang manusia dan dalam ELO berbanding analisis kos. Sorotan yang dilaporkan daripada ringkasan vendor/akhbar yang diterbitkan termasuk:

  • Teks→Kadar kemenangan imej: FLUX.2 dilaporkan ≈66.6% kadar kemenangan (vs ~51.3% Qwen-Image, 48.1% Hunyuan Image 3.0).
  • Suntingan rujukan tunggal: ≈59.8% kadar kemenangan (vs ~49.3% Qwen-Image, 41.2% FLUX.1 Konteks).
  • Penyuntingan berbilang rujukan: ≈63.6% kadar kemenangan (vs ~36.4% untuk Qwen-Image).
  • ELO vs kos: Keluarga FLUX.2 (Pro, Flex, Dev) dalam kumpulan berkualiti tinggi, kos yang agak rendah (ELO ≈1030–1050 semasa beroperasi pada ~2–6 sen bagi setiap imej dalam carta harga vendor).

Penjanaan Pelbagai Rujukan

Salah satu ciri terbesar FLUX.2 ialah keupayaannya untuk menjana berbilang output yang konsisten menggunakan berbilang imej rujukan.

Contohnya, apabila mengambil gambar produk, anda boleh memuat naik berbilang foto yang diambil dari sudut berbeza, di bawah keadaan pencahayaan yang berbeza dan dengan latar belakang yang berbeza, dan menjana berbilang variasi imej yang sama sekali gus.

Ciri ini membolehkan anda menjana foto katalog produk dengan cepat untuk tapak web e-dagang, sepanduk pengiklanan, set imej media sosial dan banyak lagi.

Tidak seperti penjanaan imej tunggal tradisional, mekanisme berbilang rujukan ini sesuai untuk aliran kerja dunia sebenar yang menekankan ketekalan dan integriti.

Resolusi Tinggi, Kualiti Perniagaan (Sehingga 4MP)

FLUX.2 menyokong output sehingga 4 megapiksel (kira-kira 2000-3000 piksel), menyediakan kualiti imej yang sesuai untuk aplikasi praktikal seperti pengiklanan, cetakan, papan tanda dan poster.

Ia mengendalikan teks, logo, mockup UI, maklumat grafik dan lebih sempurna, menjadikannya sesuai bukan sahaja untuk penciptaan artistik tetapi juga untuk reka bentuk dan kegunaan komersial.

Sementara itu, kualiti pemaparan fon dan teks juga telah dipertingkatkan, menjadikannya sesuai untuk membuat sepanduk pengiklanan dan label produk.

Menyokong Perlaksanaan GPU Tempatan: Kos Rendah, Halangan Rendah untuk Kemasukan

Sehingga kini, banyak model penjanaan imej berprestasi tinggi hanya praktikal di pusat data dengan sumber pengkomputeran yang besar. Walau bagaimanapun, FLUX.2 dioptimumkan untuk dijalankan pada GPU standard (seperti NVIDIA RTX) dengan penggunaan VRAM yang kurang.

Model tidak lagi perlu diakses melalui awan; ia boleh diedit dan dijana secara tempatan, mengurangkan kos dengan ketara dan meningkatkan fleksibiliti operasi.

Ini adalah kelebihan utama bukan sahaja untuk syarikat tetapi juga untuk pencipta individu dan pasukan kecil.

Aliran Kerja Penciptaan dan Penyuntingan Bersatu

FLUX.2 menyokong bukan sahaja teks ke imej (teks → penjanaan imej) tetapi juga imej ke imej (mengedit dan menggayakan imej sedia ada).

Ini membolehkan anda menggunakan model tunggal secara konsisten untuk tugasan seperti "melukis imej baharu dari awal," "mengedit dan mengubah suai foto sedia ada" dan "menggunakan semula berbilang imej untuk mencipta variasi seragam."

Contohnya, mudah untuk menukar latar belakang foto produk kepada suasana yang berbeza atau mengubah saiznya untuk media sosial.

Cara Mengakses API Flux.2

Kami berbesar hati untuk mengumumkan bahawa CometAPI telah menyepadukan API Flux.2. Kini Menyokong Model Format Replika (Lebih Rendah daripada Harga Rasmi Replika), Titik Akhir FLUX.2:

  • makmal-hutan-hitam/fluks-2-pro
  • makmal-hutan-hitam/flux-2-dev
  • makmal-hutan-hitam/fluks-2-flex

Mula Membina Sekarang Cipta Ramalan – Dokumen API,

Nak cuba dulu? Uji FLUX.2 dan dalam kami taman permainan selepas mendaftar dan log masuk ke CometAPI, jika anda mahu mula membina dengan API sekarang: Cipta Ramalan – Dokumen API.

FLUX.2 bukan sekadar satu lagi penurunan model; ia ialah strategi produk peringkat keluarga yang menangani realiti pengeluaran: kesetiaan, keboleheditan, kepaduan berbilang rujukan dan laluan penggunaan praktikal (API terurus dan pusat pemeriksaan terbuka). Bagi organisasi yang menghasilkan kandungan visual pada skala, FLUX.2 menjanjikan peningkatan produktiviti yang bermakna — dengan syarat pasukan menggandingkan penggunaan teknikal dengan tadbir urus pelesenan yang mantap dan kawalan kualiti.

Kegunaan Utama dan Kes Penggunaan yang Diniatkan bagi FLUX.2

Visual Produk/Penciptaan Katalog E-dagang

Perniagaan dan jenama e-dagang mempunyai permintaan yang tinggi untuk mengambil banyak foto produk dari pelbagai sudut, menggunakan pencahayaan, latar belakang dan mod warna yang berbeza.

  • Dengan FLUX.2, anda boleh menjana berbilang kesan konsisten secara visual dengan cepat tanpa merakam sebarang kandungan.
  • Ini membolehkan anda mengembangkan katalog produk anda dengan cepat sambil mengurangkan kos fotografi, masa dan kos pengurusan.

Pengiklanan dan Penciptaan Bahan Pemasaran

Permintaan untuk bahan reka bentuk adalah luas, termasuk sepanduk pengiklanan, imej siaran media sosial, visual kempen promosi dan poster perhubungan awam.

  • Hanya berikan penerangan teks untuk mendapatkan imej dengan gaya, gubahan dan suasana yang diingini, mengurangkan beban pereka bentuk dan pengiklan.
  • Tambahan pula, kerana variasi boleh dijana menggunakan berbilang imej rujukan, ia juga sesuai untuk ujian A/B idea kreatif dan mencipta bahan yang serasi dengan pelbagai bahasa dan wilayah.

Reka Bentuk Antara Muka Pengguna/Pengalaman Pengguna, Prototaip

FLUX.2 juga menyokong penyuntingan logo, fon, reka letak dan latar belakang, menjadikannya sesuai bukan sahaja untuk penjanaan foto tetapi juga untuk reka bentuk visual produk digital.

  • Anda boleh membuat reka bentuk awal, rangka wayar, tapak web acara, mockup skrin aplikasi dan banyak lagi dengan pantas.
  • Ini adalah penyelesaian pengeluaran yang menjimatkan kos, terutamanya sesuai untuk pemula dan pasukan reka bentuk kecil.

Karya Seni/Kreatif dan Penggunaan Peribadi

Sudah tentu, ia juga boleh digunakan semata-mata untuk "karya seni," "ilustrasi" atau "reka bentuk grafik."

  • Kembangkan ufuk kreatif anda dengan mencipta karya dalam pelbagai mood dan gaya menggunakan gesaan teks dan imej rujukan.
  • Anda juga boleh menggunakan ciri penyuntingan imej untuk menggunakan semula foto sedia ada secara bebas ke dalam gaya artistik, atau bereksperimen dengan landskap atau reka bentuk watak yang hebat.

Dibezakan daripada Model dan Pesaing Sedia Ada—Mengapa Memilih FLUX.2?

Perbandingan dengan Model Penjanaan Imej AI Lain

Pada masa ini, terdapat banyak model (sumber terbuka dan komersial) dalam bidang penjanaan imej AI, seperti model resapan tradisional dan model pesaing terkini. Jadi, mengapakah FLUX.2 begitu menarik? Sebab-sebabnya adalah seperti berikut:

  • Penjanaan dan Penyuntingan Bersepadu: Banyak model memfokuskan sama ada pada "penjanaan (teks ke imej)" atau "penyuntingan (imej ke imej)." FLUX.2 menyokong kedua-dua fungsi secara serentak, mencapai aliran kerja yang sangat konsisten.
  • Input Rujukan Berbilang: Gunakan berbilang imej rujukan untuk fotografi produk yang mudah dan konsistensi visual yang konsisten.
  • Kualiti Komersial dan Resolusi Tinggi: Menyokong 4MP untuk pengiklanan, fotografi produk dan cetakan.
  • Perlaksanaan Tempatan Mudah: Ia bebas awan dan boleh dijalankan pada GPU standard, menawarkan kelebihan dalam kedua-dua kos dan fleksibiliti.
  • Pemilihan Model Fleksibel: Menawarkan pelbagai model yang meliputi segala-galanya daripada aplikasi standard hingga komersial dan penyelidikan, membolehkan anda memilih model yang paling sesuai dengan keperluan dan bajet anda.

Ini menjadikan FLUX.2 pilihan yang hebat untuk aliran kerja profesional, penggunaan komersial, pengeluaran volum tinggi dan projek yang kos dan kelajuan adalah kritikal.

Fikiran akhir:

FLUX.2 terletak di persimpangan pragmatik: ia menawarkan pilihan penyelidikan berat terbuka untuk pasukan yang memerlukan kawalan dan kebolehulangan, dan terurus, API pengeluaran untuk pasukan yang mengutamakan kependaman rendah, output yang boleh diramal dan asal. Dengan menghantar kedua-dua varian terbuka dan terurus (dev/pro/flex), BFL mengakui bahawa aliran kerja yang berbeza — percubaan, reka bentuk berulang dan pengeluaran — memerlukan pertukaran yang berbeza antara kesetiaan, kelajuan, penyesuaian dan tadbir urus

Pembangun boleh mengakses Flux.2 Dev API, Flux.2 Flex API and Flux.2 Pro API melalui CometAPI. Untuk bermula, terokai keupayaan model CometAPI dalam Taman Permainan. Sebelum mengakses, sila pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. cometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda menyepadukan.

Bersedia untuk Pergi?→ Daftar untuk CometAPI hari ini !

Jika anda ingin mengetahui lebih banyak petua, panduan dan berita tentang AI, ikuti kami VKX and Perpecahan!

Baca Lagi

500+ Model dalam Satu API

Sehingga 20% Diskaun