FLUX.2 ialah keluarga generasi kedua model penjanaan imej dan pengeditan imej Black Forest Labs (dikeluarkan pada 25 Nov 2025). Ia menawarkan fotorealisme gred pengeluaran, pengeditan berbilang rujukan sehingga 4MP, gesaan berstruktur/JSON dan pilihan titik akhir terurus (Pro, Flex) dan pilihan berat terbuka (Dev).
Berita baiknya ialah CometAPI telah menyepadukan API Flux.2. Panduan ini menerangkan maksud FLUX.2, , cara memanggil API dan aliran kerja lanjutan (teks→imej, kawalan fleksibel, pengeditan berbilang rujukan), dengan contoh kod dan amalan terbaik.
Apakah FLUX.2 dan mengapa ia penting?
FLUX.2 ialah susulan kepada keluarga model imej FLUX — direka bentuk untuk penjanaan teks-ke-imej kesetiaan tinggi dan pengeditan imej berbilang rujukan pada resolusi pengeluaran (sehingga ~4 megapiksel). FLUX.2 dibina untuk aliran kerja kreatif sebenar (aset selamat jenama, watak dan gaya yang konsisten merentas rujukan, tipografi yang lebih baik dan butiran kecil) berbanding tunjuk cara dan ia bertujuan untuk merapatkan jurang antara imejan yang dijana dan sebenar.
Hasil utama FLUX.2 direka untuk menyampaikan
- Output fotorealistik sesuai untuk pengiklanan, imejan produk dan mockup UI.
- Pengeditan berbilang rujukan asli: menggabungkan, menukar atau mengarang elemen daripada berbilang imej input dalam satu pengeditan.
- Varian untuk kes penggunaan yang berbeza: model pembangun yang tersedia secara terbuka, titik akhir Pro yang dioptimumkan untuk pengeluaran dan titik akhir Flex untuk kawalan peringkat rendah.
Pada tahap yang tinggi, FLUX.2 menggabungkan tulang belakang generatif terpendam (seni bina aliran/transformer) dengan model bahasa penglihatan untuk pembumian semantik dan VAE yang baru dilatih untuk menyediakan ruang terpendam berkongsi merentas varian. Reka bentuk ini membolehkan model melakukan kedua-dua penjanaan dan pembinaan semula (pengeditan) pada ketepatan yang lebih tinggi sambil memastikan perwakilan boleh dipelajari untuk latihan dan penalaan halus. VAE terbuka amat ketara kerana ia menyeragamkan ruang terpendam untuk aliran kerja yang dihoskan dan dihoskan sendiri.
Sebab itu penting: bahasa gandingan dan padanan aliran terpendam menghasilkan ikutan segera yang lebih kuat (jadi berbilang bahagian, arahan komposisi berkelakuan boleh diramal), tipografi yang lebih baik dan satu seni bina yang menyokong penjanaan dan pengeditan dengan berbilang rujukan. Bagi pencipta, ini bermakna output yang lebih dipercayai untuk arahan yang kompleks dan input bercampur (teks + imej).
Bagaimanakah saya boleh mengakses API FLUX.2?
Sediakan persekitaran
Daftar dan log masuk ke CometAPI dan dapatkan kunci API anda daripada panel profil anda. Sebaik-baiknya, anda harus mempunyai sedikit pengetahuan API sebagai pembangun (kami akan memberikan bantuan dalam hal ini, jadi sila jangan risau).
Anda juga perlu memilih kaedah permintaan yang anda inginkan dan model Flux.2 yang sesuai.
Apakah titik akhir, pengesahan yang diperlukan?
API Ramalan Replika menyediakan akses untuk menjana imej berkualiti tinggi menggunakan pelbagai model FLUX daripada Black Forest Labs melalui format Replika standard. API ini menyokong rangkaian komprehensif varian model FLUX, setiap satu dioptimumkan untuk kes penggunaan berbeza daripada prototaip pantas kepada penjanaan imej gred profesional. Pengguna boleh bertukar dengan lancar antara model berbeza dengan hanya menukar nama model dalam laluan URL(https://api.cometapi.com/replicate/v1/models/{models}/predictions), menjadikannya fleksibel untuk pelbagai aplikasi kreatif dan komersial.
CometAPI mendedahkan titik akhir terurus di bawah https://api.cometapi.com/flux/v1/{model} dan menamakan titik akhir seperti flux-2-pro, flux-2-flex dan flux-2-flex untuk penciptaan dan pengeditan imej. Permintaan memerlukan kunci API dalam x-key pengepala .
Keluarga model & tukar ganti pengiraan
- FLUX.2 (berat terbuka) — Gunakan apabila anda memerlukan kawalan tempatan, eksperimen penyelidikan atau untuk menjalankan inferens pada infrastruktur anda sendiri. Dev adalah berwajaran terbuka (32B) dan sangat baik untuk penyelidikan penerokaan dan penalaan halus. Ia lebih boleh dikonfigurasikan, tetapi anda bertanggungjawab untuk infra dan pengoptimuman.
- FLUX.2 pro — Keseimbangan kelajuan, kualiti dan kos terbaik untuk pengeluaran. Pro ditala untuk kependaman yang boleh diramal, pematuhan segera yang konsisten, pemprosesan pantas dan menyokong sehingga 8 imej rujukan API (jumlah 9MP melalui API). Gunakan ini untuk pengeditan volum tinggi dan apabila anda memerlukan kebolehpercayaan dan harga yang boleh diramal.
- FLUX.2 (terurus + kebolehkawalan) — Mendedahkan kawalan penjanaan peringkat rendah (cth,
steps,guidance) dan menyokong lebih banyak rujukan (sehingga 10) dan kualiti/perincian yang lebih tinggi sedikit apabila anda menerima kependaman dan kos yang lebih tinggi. Gunakan Flex apabila anda memerlukan kawalan kreatif terakhir — ketepatan tipografi, warna tepat atau pelarasan komposisi yang sangat terperinci.
Prototaip dihidupkan dev atau kos rendah setiap merancang, kemudian berhijrah ke setiap untuk skala atau Flex untuk render akhir yang sangat terkawal.
Bagaimanakah cara saya menggunakan API FLUX.2?
Permintaan kitaran hayat (tugas + model pengundian)
Respons kepada permintaan penyuntingan/penjanaan ialah objek tugasan yang termasuk a polling_url and id; anda membuat permintaan dan kemudian tinjauan pendapat (atau gunakan webhooks) untuk mendapatkan semula URL hasil yang ditandatangani. URL yang ditandatangani adalah jangka pendek (biasanya ~10 minit) jadi dapatkan output dengan segera.
API yang dihoskan mengikut model tugas tak segerak:
- POST permintaan generasi → kembali a
task idandpolling_urlditambah anggarancost. - Poll the
polling_urlsehinggastatus == "Ready", kemudian dapatkan semula hasil imej (selalunya base64 atau URL yang dihoskan).
Contoh: Python (permintaan) — serahkan & tinjauan pendapat
import time, requests, os
API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"
payload = {
"prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
"width": 1024, "height": 1024, "seed": 42
}
r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task
while True:
time.sleep(0.5)
status_r = requests.get(polling_url, headers={"x-key": API_KEY})
status_r.raise_for_status()
status = status_r.json()
if status == "Ready":
print("Result URL:", status)
break
elif status in ("Error", "Failed"):
print("Generation failed:", status)
break
Corak ini (serahkan → tinjauan pendapat atau webhook) ialah aliran segerak/tak segerak utama untuk titik akhir terurus.
Penyuntingan Imej — contoh minimum (gulungan dengan URL input)
curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
-H "accept: application/json" \
-H "x-key: $CometAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
"input_image": "https://example.com/my-photo.jpg",
"width": 2048,
"height": 1536
}'
Untuk pengeditan berbilang rujukan, gunakan input_image, input_image_2, input_image_3, … (Pro menyokong sehingga 8 rujukan melalui API; Flex sehingga 10; Dev disyorkan maks ~6 bergantung pada memori).
Apakah parameter asas yang perlu saya hantar?
Medan badan permintaan penting (pengeditan / penjanaan imej) termasuk:
guidanceandsteps— membenarkan kawalan halus.prompt(rentetan) — sehingga 32K token; bahasa semula jadi yang terperinci atau JSON berstruktur.input_image(rentetan) — diperlukan untuk pengeditan (URL atau base64).input_image_2...input_image_9— imej berbilang rujukan.width/height— gandaan 16; output maks 4MP.seed— integer untuk kebolehulangan.safety_tolerance- tahap kesederhanaan.
Bagaimanakah saya boleh memanfaatkan FLUX.2 Pro untuk penjanaan teks-ke-imej profesional?
FLUX.2 Pro ditala untuk output yang boleh dipercayai dan berkualiti tinggi. Gunakannya apabila anda memerlukan hasil peringkat jenama yang konsisten, pemulihan pantas dan SLA perusahaan.
Resipi aliran kerja — imejan pengeluaran
- Gesaan praproses: simpan baris "niat" pendek serta bahagian atribut berstruktur (pencahayaan, kanta, mood, kod heks warna untuk warna jenama). FLUX.2 menyokong stereng warna hex untuk membantu mengekalkan palet jenama.
- Mulakan dengan lalai konservatif: langkah 30–50 dan skala bimbingan 6–9.0; tingkatkan langkah untuk mendapatkan butiran, tingkatkan panduan untuk menjadikan keputusan mematuhi arahan dengan lebih ketat.
- Gunakan benih + pensampelan deterministik untuk kebolehulangan dalam ujian A/B.
- Gunakan titik akhir Pro untuk pensampelan berbilang percubaan: minta N variasi selari dan pilih yang terbaik — lebih murah dan lebih pantas daripada penalaan hiperparameter manual.
- Selepas proses: denoise, pemetaan nada kecil atau sentuhan gaya vektor dalam saluran paip yang menentukan. Pertimbangkan GAN kecil atau pas resolusi super jika anda memerlukan lebih tinggi daripada output asli.
Mengapa langkah ini membantu: Pro mengimbangi kepantasan dan kesetiaan serta biasanya menguatkuasakan penapis keselamatan/kandungan selepas generasi, jadi ia adalah lalai yang wajar untuk aset yang dihadapi pelanggan.
Petua terbaik untuk menjana imej
1. Kemenangan dorongan berstruktur untuk pengeluaran. Susun gesaan mengikut keutamaan: subjek → tindakan → gaya → konteks. Gunakan gesaan JSON (adegan, subjek, kamera, pencahayaan, palet_warna) apabila anda memerlukan komposisi deterministik merentas banyak imej. Contoh penggunaan skema JSON (pseudo):
{
"scene": "product shot",
"subjects": [
{"type":"mug","pose":"center","style":"ceramic, matte"},
{"type":"background","style":"wooden desk, window light"}
],
"camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}
2. Kebolehulangan: Pas seed untuk membiak kemudian. Simpan gesaan pemetaan katalog + benih → imej untuk kebolehkesanan.
3. Kelompok & orkestrasi: Untuk pengeluaran besar, serahkan banyak permintaan selari dengan Pro, tetapi had kadar untuk mengelakkan pendikit; lebih suka titik akhir Pro untuk kependaman yang boleh diramal. Gunakan baris gilir kerja dan kumpulan pekerja untuk memuat turun hasil yang ditandatangani dengan cepat setelah bersedia.
4. Kesederhanaan & keselamatan: Penggunaan safety_tolerance untuk mengawal ketegasan kesederhanaan. Titik akhir pro termasuk dasar penggunaan dan cangkuk penyederhanaan kandungan; menyepadukan semakan sisi pelayan sebelum diterbitkan.
5. Pasca pemprosesan: Output pro adalah berkualiti tinggi tetapi kadangkala memerlukan ubah suai kecil. Bina langkah pascaproses automatik (pangkas, gred warna, komposit) dalam perancangan anda dan simpan semakan manusia untuk aset sensitif jenama.
Bagaimanakah saya boleh menyesuaikan output dengan titik akhir FLUX.2 Flex?
Flex ialah varian "alat pembedahan": selaraskan langkah, panduan, gesaan negatif, saiz jubin dan kiraan rujukan untuk membentuk output dengan tepat.
Bila hendak memilih Flex
- Anda memerlukan pemaparan tipografi yang tepat (mockup UI, label).
- Anda mesti mengarang berbilang rujukan dengan kawalan ke atas pose dan pencahayaan.
- Anda sedang bereksperimen dengan teknik gesaan lanjutan (gesaan berstruktur, rantaian kekangan).
Contoh — Kekunci kawalan fleksibel dan kesannya
steps— lebih banyak langkah = perincian yang lebih halus (dengan kos kependaman).guidance_scale— lebih tinggi = lebih dekat dengan gesaan teks, lebih rendah = lebih kreativiti.negative_prompt— mengalih keluar elemen secara eksplisit (cth, “tiada tera air, tiada jari tambahan”).tile_size/tiled_inference— untuk penjanaan resolusi yang sangat tinggi, ruang inferens jubin untuk menukar memori dengan kelajuan.reference_weights— sesetengah titik akhir membolehkan anda merujuk berat kepada berat sebelah yang mana pemacu imej menimbulkan berbanding gaya.
Petua praktikal: Untuk gubahan yang kompleks, jalankan pratonton pendek dan panduan rendah untuk mengesahkan komposisi, kemudian tingkatkan dengan lebih banyak langkah dan panduan yang lebih tinggi. Teknik dua hala ini mengurangkan kos sambil memberikan output akhir yang tepat.
Contoh: Permintaan fleksibel dengan langkah & panduan
curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
-H "Content-Type: application/json" \
-H "x-key: $BFL_API_KEY" \
-d '{
"prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
"width": 1536, "height": 2048,
"steps": 50,
"guidance": 7.5,
"seed": 99999
}'
Petua: Gunakan Flex semasa sign-off kreatif terakhir dan Pro untuk saluran paip berskala besar dan lebih pantas. Flex nyata lebih terkawal untuk tugas tipografi dan butiran mikro.
Amalan terbaik untuk penggunaan pengeluaran
Di bawah ialah corak yang diuji pertempuran dan nasihat pragmatik untuk menyepadukan FLUX.2 pada skala.
1) Kawal kos dengan menjejak megapiksel & caching
Pengebilan FLUX.2 adalah berdasarkan megapiksel daripada input + output. Untuk penjanaan volum tinggi, pilih pemaparan pratonton yang lebih kecil (langkah pantas resolusi rendah) dan hanya meningkat kepada pemaparan akhir MP yang lebih tinggi. Cache memberikan aset (atau perbezaan kedai) supaya anda tidak memaparkan semula kerja yang sama. Sentiasa permukaan cost dalam respons dan logkannya setiap permintaan.
2) Gunakan peringkat dengan bijak: pratonton vs pemisahan pemaparan akhir
- Jalankan dengan pantas, pemaparan Pro langkah rendah untuk prototaip atau banyak varian.
- Gunakan larian Pro Flex atau MP tinggi untuk keluaran yang diluluskan akhir di mana kesetiaan penting. Pendekatan hibrid ini mengimbangi pemprosesan dan kualiti imej akhir.
3) Kejuruteraan segera → gesaan berstruktur & JSON
Manfaatkan FLUX.2's gesaan JSON berstruktur apabila anda memerlukan komposisi deterministik (objek adegan, kamera, pose, swatch warna heks). Ini mengurangkan kitaran gesaan berulang dan membawa kepada kelompok yang lebih boleh dihasilkan semula. Contoh Cloudflare menunjukkan gesaan JSON yang dibenamkan dalam bentuk berbilang bahagian.
4) Benih + versi untuk kebolehulangan
Apabila anda memerlukan hasil yang boleh dihasilkan, lulus a seed dan rekod versi model/cap masa dalam metadata. Untuk saluran paip aset yang menentukan, simpan manifes: gesaan, benih, varian model, resolusi, cincang imej rujukan. Ini meningkatkan kebolehkesanan dan pilihan rollback.
Kesimpulan
FLUX.2 bertujuan untuk menutup jurang antara "demo yang mengagumkan" dan "alat kreatif pengeluaran." Dengan pengeditan berbilang rujukan, output resolusi tinggi dan satu set titik akhir yang dihoskan (ditambah kod inferens terbuka dan binaan pengguna terkuantisasi), ia memberi pasukan banyak pilihan praktikal: dijalankan secara tempatan untuk penyelidikan dan penyesuaian, atau gunakan titik akhir Pro/Flex yang dihoskan untuk saluran paip pengeluaran yang stabil.
Pembangun boleh mengakses Flux.2 Dev API, Flux.2 Flex API and Flux.2 Pro API melalui CometAPI. Untuk bermula, terokai keupayaan model CometAPI dalam Taman Permainan dan berunding dengan Panduan API untuk arahan terperinci. Sebelum mengakses, sila pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. cometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi untuk membantu anda menyepadukan.
Bersedia untuk Pergi?→ Daftar untuk CometAPI hari ini !
Jika anda ingin mengetahui lebih banyak petua, panduan dan berita tentang AI, ikuti kami VK, X and Perpecahan!
