FLUX.2 ialah keluarga generasi kedua model penjanaan dan penyuntingan imej daripada Black Forest Labs (dikeluarkan pada 25 Nov, 2025). Ia menawarkan fotorealistik bertahap produksi, penyuntingan berbilang rujukan sehingga 4MP, pemintaan berstruktur/JSON, serta pilihan titik akhir terurus (Pro, Flex) dan opsyen pemberat terbuka (Dev).
Berita baiknya, CometAPI telah mengintegrasikan API Flux.2. Panduan ini menerangkan apa itu FLUX.2, cara memanggil API, serta aliran kerja lanjutan (teks→imej, kawalan fleksibel, penyuntingan berbilang rujukan), dengan contoh kod dan amalan terbaik.
Apakah FLUX.2 dan mengapa ia penting?
FLUX.2 ialah kesinambungan kepada keluarga model imej FLUX — direka untuk penjanaan teks-ke-imej berketepatan tinggi dan penyuntingan imej berbilang rujukan pada resolusi produksi (sehingga ~4 megapiksel). FLUX.2 dibangunkan untuk aliran kerja kreatif sebenar (aset selamat untuk jenama, watak dan gaya yang konsisten merentas rujukan, tipografi dan butiran kecil yang lebih baik) bukan sekadar demo, serta menyasarkan untuk merapatkan jurang antara imej janaan dan imej sebenar.
Hasil utama yang direka untuk disampaikan oleh FLUX.2
- Output fotorealistik sesuai untuk pengiklanan, imej produk, dan lakaran UI.
- Penyuntingan berbilang rujukan asli: gabung, tukar, atau gubah elemen daripada pelbagai imej input dalam satu suntingan.
- Varian untuk kes penggunaan berbeza: model pembangun yang tersedia secara terbuka, titik akhir Pro yang dioptimumkan untuk produksi, dan titik akhir Flex untuk kawalan aras rendah.
Secara umum, FLUX.2 menggabungkan rangka tulang generatif terpendam (senibina aliran/transformer) dengan model penglihatan–bahasa untuk landasan semantik, dan VAE yang dilatih baharu untuk menyediakan ruang terpendam bersama merentas varian. Reka bentuk ini membolehkan model melakukan kedua-dua penjanaan dan pembinaan semula (penyuntingan) dengan ketepatan lebih tinggi sambil mengekalkan perwakilan yang boleh dipelajari untuk latihan dan penalaan halus. VAE terbuka amat ketara kerana ia menyeragamkan ruang terpendam bagi aliran kerja dihoskan dan dihos sendiri.
Mengapa itu penting: penggandingan bahasa dan pemadanan aliran terpendam menghasilkan pematuhan prompt yang lebih kuat (agar arahan berbilang bahagian dan komposisi berkelakuan boleh dijangka), tipografi lebih baik, serta satu senibina yang menyokong kedua-dua penjanaan dan penyuntingan dengan pelbagai rujukan. Bagi pencipta, ini bermakna output yang lebih boleh diharap untuk arahan kompleks dan input bercampur (teks + imej).
Bagaimanakah saya mengakses API FLUX.2?
Sediakan persekitaran
Daftar dan log masuk ke CometAPI dan dapatkan kunci API anda daripada panel profil. Idealnya, anda harus mempunyai sedikit pengetahuan API sebagai pembangun (kami akan menyediakan bantuan dalam hal ini, jadi jangan risau).
Anda juga perlu memilih kaedah permintaan yang dikehendaki dan model Flux.2 yang sesuai.
Titik akhir dan pengesahan apa yang diperlukan?
Replicate Predictions API menyediakan akses untuk menjana imej berkualiti tinggi menggunakan pelbagai model FLUX daripada Black Forest Labs melalui format Replicate piawai. API ini menyokong rangkaian komprehensif varian model FLUX, masing-masing dioptimumkan untuk kes penggunaan berbeza daripada prototaip pantas hingga penjanaan imej bertahap profesional. Pengguna boleh bertukar antara model berbeza dengan menukar nama model dalam laluan URL (https://api.cometapi.com/replicate/v1/models/{models}/predictions), menjadikannya fleksibel untuk pelbagai aplikasi kreatif dan komersial.
CometAPI mendedahkan titik akhir terurus di bawah https://api.cometapi.com/flux/v1/{model} dan menamakan titik akhir seperti flux-2-pro, flux-2-flex dan flux-2-flex untuk penciptaan dan penyuntingan imej. Permintaan memerlukan kunci API dalam pengepala x-key.
Keluarga model & pertukaran kiraan
- FLUX.2 (open weights) — Gunakan apabila anda memerlukan kawalan setempat, eksperimen penyelidikan, atau menjalankan inferens pada infrastruktur anda sendiri. Dev ialah pemberat terbuka (32B) dan cemerlang untuk penyelidikan eksploratori dan penalaan halus. Ia lebih boleh dikonfigurasi, tetapi anda bertanggungjawab ke atas infra dan pengoptimuman.
- FLUX.2 pro — Keseimbangan terbaik antara kelajuan, kualiti, dan kos untuk produksi. Pro ditala untuk kependaman yang boleh dijangka, pematuhan prompt yang konsisten, kadar pemprosesan pantas, dan menyokong sehingga 8 imej rujukan API (jumlah 9MP melalui API). Gunakan ini untuk penyuntingan volum tinggi apabila anda memerlukan kebolehpercayaan dan harga yang boleh dijangka.
- FLUX.2 (terurus + kebolehkawalan) — Mendedahkan kawalan penjanaan aras rendah (cth.,
steps,guidance) dan menyokong lebih banyak rujukan (sehingga 10) serta kualiti/perincian sedikit lebih tinggi apabila anda menerima kependaman dan kos yang lebih tinggi. Gunakan Flex apabila anda memerlukan kawalan kreatif terakhir — ketepatan tipografi, warna tepat, atau pelarasan komposisi yang sangat terperinci.
Prototip pada Dev atau pelan Pro kos rendah, kemudian pindah ke Pro untuk skala atau Flex untuk render akhir yang sangat terkawal.
Bagaimanakah saya menggunakan API FLUX.2?
Kitar hayat permintaan (tugas + model polling)
Respons kepada permintaan penyuntingan/penjanaan ialah objek tugas yang merangkumi polling_url dan id; anda mencipta permintaan dan kemudian melakukan polling (atau gunakan webhook) untuk mendapatkan URL hasil yang ditandatangani. URL ditandatangani adalah jangka pendek (kebiasaannya ~10 minit) jadi muat turun output dengan segera.
API dihoskan mengikuti model tugas tak segerak:
- POST permintaan penjanaan → mengembalikan
task iddanpolling_urlserta anggarancost. - Poll
polling_urlsehinggastatus == "Ready", kemudian dapatkan hasil imej (sering dalam base64 atau URL dihoskan).
Contoh: Python (requests) — hantar & poll
import time, requests, os
API_KEY = os.environ
API_URL = "https://api.cometapi.com/flux/v1/flux-2-pro"
payload = {
"prompt": "A high-end product photo of a ceramic mug on a wooden desk, soft window light.",
"width": 1024, "height": 1024, "seed": 42
}
r = requests.post(API_URL, headers={"x-key": API_KEY, "accept":"application/json"}, json=payload)
r.raise_for_status()
task = r.json()
polling_url = task
while True:
time.sleep(0.5)
status_r = requests.get(polling_url, headers={"x-key": API_KEY})
status_r.raise_for_status()
status = status_r.json()
if status == "Ready":
print("Result URL:", status)
break
elif status in ("Error", "Failed"):
print("Generation failed:", status)
break
Pola ini (hantar → poll atau webhook) ialah aliran segerak/tak segerak utama untuk titik akhir terurus.
Penyuntingan Imej — contoh minimum (curl dengan URL input)
curl -X POST "https://api.cometapi.com/flux/v1/flux-2-pro" \
-H "accept: application/json" \
-H "x-key: $CometAPI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"prompt": "Replace the background with a sunlit seaside boardwalk, keep the person intact and match lighting",
"input_image": "",
"width": 2048,
"height": 1536
}'
Untuk penyuntingan berbilang rujukan, gunakan input_image, input_image_2, input_image_3, … (Pro menyokong sehingga 8 rujukan melalui API; Flex sehingga 10; Dev disyorkan maksimum ~6 bergantung pada memori).
Parameter asas apa yang harus saya hantar?
Medan badan permintaan penting (penyuntingan/penjanaan imej) termasuk:
guidancedansteps— membenarkan kawalan terperinci.prompt(string) — sehingga 32K token; bahasa semula jadi terperinci atau JSON berstruktur.input_image(string) — diperlukan untuk suntingan (URL atau base64).input_image_2…input_image_9— imej berbilang rujukan.width/height— gandaan 16; output maksimum 4MP.seed— integer untuk kebolehulangan.safety_tolerance— tahap pemoderatan.
Bagaimanakah saya boleh memanfaatkan FLUX.2 Pro untuk penjanaan teks-ke-imej profesional?
FLUX.2 Pro ditala untuk output yang boleh diharap dan berkualiti tinggi. Gunakan apabila anda memerlukan hasil setaraf jenama yang konsisten, pusing ganti pantas, dan SLA perusahaan.
Resipi aliran kerja — imejan produksi
- Prasiap prompt: kekalkan satu baris “niat” yang ringkas diikuti bahagian atribut berstruktur (pencahayaan, lensa, suasana, kod warna hex untuk warna jenama). FLUX.2 menyokong pengarahan warna hex untuk membantu mengekalkan palet jenama.
- Mulakan dengan lalai konservatif: steps 30–50 dan skala guidance 6–9.0; tingkatkan steps untuk butiran, tingkatkan guidance untuk pematuhan hasil yang lebih ketat pada prompt.
- Gunakan seed + pensampelan deterministik untuk kebolehulangan dalam ujian A/B.
- Gunakan titik akhir Pro untuk pensampelan pelbagai cuba: minta variasi N selari dan pilih yang terbaik — lebih murah dan pantas daripada penalaan hiperparameter manual.
- Pascaproses: nyahbunyi, pemetaan ton kecil, atau sentuhan gaya vektor dalam saluran paip deterministik. Pertimbangkan GAN kecil atau lulus super-resolusi jika anda memerlukan lebih tinggi daripada output natif.
Mengapa langkah ini membantu: Pro mengimbangi kelajuan dan ketepatan dan lazimnya menguatkuasakan penapis keselamatan/kandungan selepas penjanaan, jadi ia adalah lalai munasabah untuk aset berorientasikan pelanggan.
Petua terbaik untuk menjana imej
- Pemintaan berstruktur menang untuk produksi. Susun prompt mengikut keutamaan: subjek → aksi → gaya → konteks. Gunakan pemintaan JSON (scene, subjects, camera, lighting, color_palette) apabila anda memerlukan komposisi deterministik merentas banyak imej. Contoh penggunaan skema JSON (pseudo):
{
"scene": "product shot",
"subjects": [
{"type":"mug","pose":"center","style":"ceramic, matte"},
{"type":"background","style":"wooden desk, window light"}
],
"camera": {"focal_length":"85mm","aperture":"f2.8","angle":"slightly above"}
}
-
Kebolehulangan: Hantar
seeduntuk dihasilkan semula kemudian. Kekalkan katalog yang memetakan prompt + seed → imej untuk kebolehjejakkan. -
Kelompok & orkestrasi: Untuk kelompok produksi besar, hantar banyak permintaan selari ke Pro, tetapi hadkan kadar untuk elak throttle; utamakan titik akhir Pro untuk kependaman boleh dijangka. Gunakan baris gilir kerja dan kelompok pekerja untuk memuat turun hasil bertandatangan dengan pantas apabila sedia.
-
Pemoderatan & keselamatan: Gunakan
safety_toleranceuntuk mengawal keketatan pemoderatan. Titik akhir Pro termasuk polisi penggunaan dan cangkuk pemoderatan kandungan; integrasikan semakan sisi pelayan sebelum penerbitan. -
Pascapemprosesan: Output Pro berkualiti tinggi tetapi kadangkala memerlukan retouch kecil. Bina langkah pascaproses automatik (potong, gred warna, komposit) dalam saluran paip anda dan kekalkan semakan manusia untuk aset sensitif jenama.
Bagaimanakah saya boleh suasikan output dengan titik akhir FLUX.2 Flex?
Flex ialah varian “alat pembedahan”: tala steps, guidance, prompt negatif, saiz jubin, dan kiraan rujukan untuk membentuk output dengan tepat.
Bila hendak memilih Flex
- Anda memerlukan perenderan tipografi yang tepat (mockup UI, label).
- Anda mesti menggubah berbilang rujukan dengan kawalan ke atas pose dan pencahayaan.
- Anda bereksperimen dengan teknik prompt lanjutan (prompt berstruktur, rantaian kekangan).
Contoh — kekunci kawalan Flex dan kesannya
steps— lebih banyak steps = perincian lebih halus (dengan kos kependaman).guidance_scale— lebih tinggi = lebih dekat kepada prompt teks, lebih rendah = lebih kreatif.negative_prompt— menyingkirkan elemen secara jelas (cth., “no watermark, no extra fingers”).tile_size/tiled_inference— untuk penjanaan resolusi sangat tinggi, jubinkan ruang inferens untuk menukar memori kepada kelajuan.reference_weights— sesetengah titik akhir membolehkan anda pemberat rujukan untuk memihak imej mana yang memacu pose vs. gaya.
Petua praktikal: Untuk komposisi kompleks, jalankan pratonton pendek dengan guidance rendah untuk sahkan komposisi, kemudian besarkan dengan lebih banyak steps dan guidance lebih tinggi. Teknik dua lejang ini mengurangkan kos sambil memberikan output akhir yang tepat.
Contoh: permintaan Flex dengan steps & guidance
curl -X POST "https://api.bfl.ai/v1/flux-2-flex" \
-H "Content-Type: application/json" \
-H "x-key: $BFL_API_KEY" \
-d '{
"prompt": "Cinematic movie poster, bold typography at top, main character centered, dramatic rim lighting",
"width": 1536, "height": 2048,
"steps": 50,
"guidance": 7.5,
"seed": 99999
}'
Petua: Gunakan Flex semasa kelulusan kreatif akhir dan Pro untuk saluran paip berskala besar yang lebih pantas. Flex nyata lebih boleh dikawal untuk tugasan tipografi dan perincian mikro.
Amalan terbaik untuk penggunaan produksi
Di bawah ialah corak yang telah diuji dan nasihat pragmatik untuk mengintegrasikan FLUX.2 pada skala.
1) Kawal kos dengan menjejak megapiksel & caching
Pengebilan FLUX.2 berdasarkan megapiksel input + output. Untuk penjanaan volum tinggi, utamakan render pratonton yang lebih kecil (resolusi rendah, steps pantas) dan hanya tingkatkan ke render akhir MP lebih tinggi. Cache aset yang telah dirender (atau simpan diff) agar anda tidak merender semula tugasan serupa. Sentiasa pamerkan cost dalam respons dan logkannya bagi setiap permintaan.
2) Gunakan aras bijak: belah pratonton vs render akhir
- Jalankan render Pro yang pantas dan steps rendah untuk prototaip atau banyak variasi.
- Gunakan Flex atau larian Pro MP tinggi untuk output diluluskan akhir apabila ketepatan penting. Pendekatan hibrid ini mengimbangi keluaran dan kualiti imej akhir.
3) Kejuruteraan prompt → prompt berstruktur & JSON
Manfaatkan pemintaan JSON berstruktur FLUX.2 apabila anda memerlukan komposisi deterministik (objek adegan, kamera, pose, sampel warna hex). Ini mengurangkan kitaran pemintaan berulang dan membawa kepada kelompok yang lebih boleh dihasilkan semula. Contoh Cloudflare menunjukkan prompt JSON yang terbenam dalam borang berbilang bahagian.
4) Seed + perversian untuk kebolehulangan
Apabila anda memerlukan hasil yang boleh dihasilkan semula, hantarkan seed dan rekod versi model/cap masa dalam metadata. Untuk saluran paip aset deterministik, kekalkan manifes: prompt, seed, varian model, resolusi, hash imej rujukan. Ini memperbaiki kebolehjejakkan dan pilihan gulung balik.
Kesimpulan
FLUX.2 disasarkan tepat untuk merapatkan jurang antara “demo mengagumkan” dan “alat kreatif produksi.” Dengan penyuntingan berbilang rujukan, output resolusi tinggi, dan set titik akhir dihoskan (serta kod inferens terbuka dan binaan kuantum untuk pengguna), ia memberi pasukan banyak pilihan praktikal: jalankan setempat untuk penyelidikan dan penyesuaian, atau gunakan titik akhir Pro/Flex dihoskan untuk saluran paip produksi yang stabil.
Pembangun boleh mengakses Flux.2 Dev API, Flux.2 Flex API dan Flux.2 Pro API melalui CometAPI. Untuk bermula, terokai keupayaan model CometAPI dalam Playground dan rujuk API guide untuk arahan terperinci. Sebelum mengakses, pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga yang jauh lebih rendah daripada harga rasmi bagi membantu anda mengintegrasi.
Sedia untuk Bermula?→ Daftar CometAPI hari ini!
Jika anda ingin mengetahui lebih banyak petua, panduan dan berita tentang AI ikuti kami di VK, X dan Discord!
