Qwen-Image-Edit ialah cawangan penyuntingan keluarga imej Qwen yang dibangunkan oleh pasukan Qwen (Ekosistem Alibaba / QwenLM). Ia dibina di atas tulang belakang MMDiT 20 bilion parameter dan secara eksplisit memanjangkan keupayaan pemaparan teks lanjutan Qwen-Image ke dalam aliran kerja pengeditan imej yang mantap. Model ini bertujuan untuk tugas yang menyunting kesetiaan penting — cth, menukar teks secara langsung pada papan tanda, memelihara fon dan reka letak, menambah/mengalih keluar objek sambil mengekalkan konsistensi semantik, perubahan sudut pandang/pose dan pemindahan gaya yang terperinci.
Ciri-ciri utama
- Penyuntingan teks dalam imej yang tepat (dwibahasa: Cina & Inggeris) — menambah, mengalih keluar atau menggantikan teks sambil mengekalkan fon/saiz/gaya sebanyak mungkin.
- Mod pengeditan dwi: semantik + penampilan — menyokong perubahan semantik peringkat tinggi (beristirahat, penggantian objek, sudut pandangan) dan pengeditan penampilan peringkat rendah (pemindahan gaya, tekstur, ubah suai setempat).
- Pengeditan topeng / rantau / berbilang pusingan — menyokong lukisan dalam bertopeng, gesaan rantau dan suntingan berantai untuk aliran kerja penghalusan berulang.
- Input berbilang imej (versi terkini): lelaran 2509 menambah sokongan pengeditan berbilang imej (cth, orang+orang, orang+produk), identiti/produk/teks yang dipertingkatkan dan input gaya ControlNet asli.
Maklumat teknikal
- Skala asas / keluarga: dibina di atas Parameter 20B Model asas Qwen-Imej (reka bentuk resapan gaya MMDiT / pelbagai mod).
- Saluran pengeditan dwi pengekodan: modul edit menerima (1) perwakilan semantik melalui pengekod visual Qwen2.5-VL dan (2) perwakilan rekonstruktif melalui pengekod VAE. Memakan kedua-dua perwakilan secara selari membolehkan kepala pengeditan menukar perubahan semantik berbanding kesetiaan piksel. Pengekodan dwi ini ialah pilihan kejuruteraan teras untuk pengeditan yang mantap.
- Latihan progresif / kurikulum: latihan berkembang daripada pemaparan teks dan penjanaan tugas yang lebih mudah kepada pemaparan teks peringkat perenggan yang kompleks dan objektif penyuntingan berbilang tugas (pembinaan semula T2I, TI2I, I2I). Kurikulum ini dilaporkan menjadi faktor utama dalam peningkatan kesetiaan teks dan kestabilan penyuntingan model.
- Perisa / modul model: Qwen-Image-Edit digambarkan sebagai model 20B gaya MMDiT yang menyepadukan komponen Qwen2.5-VL, kepala penyuntingan resapan dan komponen VAE untuk kawalan penampilan.
Prestasi penanda aras
SOTA tanda aras silang yang dituntut: pasukan Qwen melaporkan hasil terkini (SOTA) atau peringkat atasan pada berbilang penjanaan imej awam dan penanda aras penyuntingan — termasuk Geneval, DPG, OneIG-Bench (generasi) dan GEdit, ImgEdit, GSO (suntingan).

Had & kaveat (praktikal)
- Artifak & bekas tepi: ujian komuniti menunjukkan ketepuan berlebihan sekali-sekala, artifak tekstur kulit atau jahitan penggubahan dalam beberapa suntingan terperinci tinggi; garpu kilat komuniti bertujuan untuk mengurangkan ini.
- Pengiraan / ingatan: model 20B dan saluran paip penyuntingan ketepatan penuh adalah intensif GPU. Manfaat penggunaan tempatan daripada bfloat16/FP8 dan aliran kerja pensampelan yang dioptimumkan (varian "kilat" 4/8 langkah wujud untuk mengurangkan VRAM dan kependaman).
- Keselamatan & IP: seperti semua pengimej tujuan umum, Qwen-Image-Edit boleh menjana aksara berhak cipta atau kandungan sensitif — penggunaan pengeluaran memerlukan kawalan penyederhanaan dan pelepasan hak. (Amalan terbaik perusahaan biasa.)
- Mod kegagalan: aksara/perkataan yang tidak jelas atau sangat jarang berlaku mungkin masih tersalah tafsir atau memerlukan suntingan berulang (“dirantai”) untuk menumpu (pengarang mencatat contoh seperti glyph Cina yang jarang berlaku yang memerlukan pembetulan berperingkat).
Bagaimana Qwen-Image-Edit membandingkan dengan pilihan lain
- Resapan Stabil / SDXL (mengecat): SDXL ditambah ControlNet dan saluran paip mengecat khusus adalah pantas, mempunyai sokongan alat komuniti yang luas dan banyak LoRA; mereka cemerlang dalam aliran kerja lukisan umum dan kelajuan/kecekapan. Kekuatan Qwen-Image-Edit ialah penyuntingan teks dwibahasa asli, ketekalan identiti/produk yang lebih ketat dalam sesetengah kes, dan pertukaran semantik+penampilan bersepadu. Perbandingan komuniti menunjukkan Qwen sering berada di kedudukan yang lebih tinggi dalam kesetiaan penyuntingan dan pematuhan teks tetapi pada kos pengiraan yang lebih tinggi.
- Editor sumber tertutup (Adobe Firefly / DALL·E / Landasan): API tertutup boleh menjadi sangat digilap (UI, penyederhanaan bersepadu, jaminan kependaman), tetapi Qwen-Image-Edit menonjol sebagai alternatif terbuka sepenuhnya yang secara khusus menyasarkan penyuntingan teks dwibahasa yang mantap dan menawarkan penggunaan setempat. Pilihan praktikal selalunya bergantung pada sama ada anda memerlukan kawalan tempatan / pelesenan terbuka atau UX awan yang digilap.
Kes penggunaan praktikal
- Suntingan poster & papan tanda — tukar teks pada poster sambil mengekalkan fon/tekstur.
- Pemasaran produk / penjanaan poster — tambah/buang item, kekalkan identiti produk untuk imej e-dagang.
- Suntingan mengekalkan identiti potret — perubahan pose, pemindahan gaya sambil mengekalkan identiti yang konsisten (diperbaiki pada 2509).
- Pemulihan & pembetulan kaligrafi — pemulihan foto lama dan pembetulan berperingkat bagi aksara tulisan tangan/cetakan.
- Aliran kerja kreatif/reka bentuk — suntingan gubahan berbilang imej, penjanaan meme, penggayaan avatar di mana teks dwibahasa mungkin terlibat.
Bagaimana untuk memanggil qwen-image-edit API dari CometAPI
qwen-image-edit Harga API dalam CometAPI,diskaun 20% daripada harga rasmi:
| Token Input | $2.00 |
| Token Keluaran | $6.40 |
Langkah yang Diperlukan
- Log masuk ke cometapi.com. Jika anda belum menjadi pengguna kami, sila daftar dahulu.
- Masuk ke dalam anda Konsol CometAPI.
- Dapatkan kunci API kelayakan akses antara muka. Klik "Tambah Token" pada token API di pusat peribadi, dapatkan kunci token: sk-xxxxx dan serahkan.

Gunakan Kaedah
- Pilih titik akhir "qwen-image-edit" untuk menghantar permintaan API dan menetapkan badan permintaan. Kaedah permintaan dan badan permintaan diperoleh daripada dokumen API tapak web kami. Laman web kami juga menyediakan ujian Apifox untuk kemudahan anda.
- Gantikan dengan kunci CometAPI sebenar anda daripada akaun anda.
- Masukkan soalan atau permintaan anda ke dalam medan kandungan—inilah yang akan dijawab oleh model.
- . Proses respons API untuk mendapatkan jawapan yang dijana.
CometAPI menyediakan REST API yang serasi sepenuhnya—untuk penghijrahan yang lancar. Butiran penting kepada suntingan gambar:
- URL asas: https://api.cometapi.com/v1/images/edits
- Nama Model: qwen-image-edit
- Pengesahan:
Bearer YOUR_CometAPI_API_KEYheader - Jenis kandungan:
application/json.
Lihat juga API imej Qwen
