Qwen-Image-Edit, Qwen ekibi (Alibaba/QwenLM ekosistemi) tarafından geliştirilen Qwen görüntü ailesinin düzenleme koludur. 20 milyar parametreli bir MMDiT omurgası üzerine kuruludur ve Qwen-Image'ın gelişmiş metin oluşturma yeteneklerini güçlü görüntü düzenleme iş akışlarına açıkça genişletir. Model, düzenleme doğruluğunun önemli olduğu görevler için tasarlanmıştır; örneğin, tabelalardaki metni doğrudan değiştirme, yazı tiplerini ve düzeni koruma, anlamsal tutarlılığı koruyarak nesne ekleme/kaldırma, bakış açısı/poz dönüşümleri ve ince ayarlı stil aktarımları.
anahtar özellikler
- Görüntü içi metin düzenlemede hassaslık (çift dilli: Çince ve İngilizce) — Yazı tipini/boyutunu/stili mümkün olduğunca koruyarak metin ekleyin, kaldırın veya değiştirin.
- Çift düzenleme modları: anlamsal + görünüm — yüksek seviyeli anlamsal değişiklikleri (duruş, nesne değişimi, bakış açısı) ve düşük seviyeli görünüm düzenlemelerini (stil transferi, doku, yerel rötuş) destekler.
- Maske / bölge / çoklu tur düzenlemeleri — yinelemeli iyileştirme iş akışları için maskeli boyama, bölge istemleri ve zincirleme düzenlemeleri destekler.
- Çoklu görüntü girişleri (en son sürüm): 2509 yinelemesi çoklu görüntü düzenleme desteği (örneğin, kişi+kişi, kişi+ürün), geliştirilmiş kimlik/ürün/metin tutarlılığı ve yerel ControlNet tarzı girdiler ekler.
Teknik detaylar
- Temel ölçek / aile: üzerine inşa edilmiş 20B parametresi Qwen-Image temel modeli (MMDiT tarzı difüzyon / multimodal tasarım).
- Çift kodlamalı düzenleme hattı: Düzenleme modülü, (1) bir Qwen2.5-VL görsel kodlayıcı aracılığıyla bir anlamsal gösterim ve (2) bir VAE kodlayıcı aracılığıyla bir yeniden yapılandırma gösterimi alır. Her iki gösterimin paralel olarak beslenmesi, düzenleme kafasının anlamsal değişim ile piksel doğruluğu arasında denge kurmasını sağlar. Bu çift kodlama, sağlam düzenlemeler için temel bir mühendislik seçeneğidir.
- İlerici/müfredat eğitimi: Eğitim, daha basit metin oluşturma ve oluşturma görevlerinden, karmaşık paragraf düzeyinde metin oluşturma ve çoklu görev düzenleme hedeflerine (T2I, TI2I, I2I yeniden yapılandırma) doğru ilerledi. Bu müfredatın, modelin gelişmiş metin doğruluğu ve düzenleme kararlılığında merkezi bir faktör olduğu bildirilmektedir.
- Model çeşidi / modülleri: Qwen-Image-Edit, Qwen2.5-VL bileşenlerini, bir difüzyon düzenleme kafasını ve görünüm kontrolü için VAE bileşenlerini entegre eden bir MMDiT tarzı 20B modeli olarak tanımlanmaktadır.
Karşılaştırma performansı
İddia edilen çapraz kıyaslama SOTA: Qwen ekibi, birden fazla genel görüntü oluşturma ve düzenleme kıyaslamasında en son teknoloji (SOTA) veya en üst düzey sonuçları bildiriyor; bunlar arasında şunlar yer alıyor: GenEval, DPG, OneIG-Bench (nesil) ve GEdit, ImgEdit, GSO (düzenleme).

Sınırlamalar ve uyarılar (pratik)
- Eserler ve uç durumlar: Topluluk testleri, bazı yüksek detaylı düzenlemelerde ara sıra aşırı doygunluk, cilt dokusu eserleri veya birleştirme dikişleri olduğunu gösteriyor; topluluk aydınlatma çatalları bunları hafifletmeyi amaçlıyor.
- Hesaplama / bellek: 20B modeli ve tam hassasiyetli düzenleme kanalları GPU yoğunlukludur. Yerel dağıtım, bfloat16/FP8 ve optimize edilmiş örnekleme iş akışlarından faydalanır (VRAM ve gecikmeyi azaltmak için 4/8 adımlı "lightning" varyantları mevcuttur).
- Güvenlik ve Fikri Mülkiyet: Tüm genel amaçlı görüntüleyicilerde olduğu gibi, Qwen-Image-Edit telif hakkıyla korunan karakterler veya hassas içerikler üretebilir; üretim kullanımı için denetim kontrolleri ve hak izni gerekir. (Tipik kurumsal en iyi uygulama.)
- Başarısızlık modları: belirsiz veya çok nadir karakterler/kelimeler hala yanlış bir şekilde işlenebilir veya bir araya getirilmek için yinelemeli ("zincirleme") düzenlemeler gerekebilir (yazarlar nadir Çince gliflerin aşamalı düzeltmeler gerektirmesi gibi örneklere dikkat çekiyor).
Qwen-Image-Edit'in diğer seçeneklerle karşılaştırılması
- Kararlı Difüzyon / SDXL (iç boyama): SDXL artı ControlNet ve özel iç boyama hatları hızlıdır, geniş topluluk araç desteğine ve birçok LoRA'ya sahiptir; genel iç boyama iş akışlarında ve hız/verimlilikte mükemmeldirler. Qwen-Image-Edit'in güçlü yönleri şunlardır: ana dil düzeyinde iki dilli metin düzenleme, bazı durumlarda daha sıkı kimlik/ürün tutarlılığı ve entegre anlamsal ve görünüm dengeleri. Topluluk karşılaştırmaları, Qwen'in düzenleme doğruluğu ve metin uyumu açısından genellikle daha yüksek sıralamalara sahip olduğunu, ancak daha yüksek işlem maliyetiyle çalıştığını göstermektedir.
- Kapalı kaynak editörleri (Adobe Firefly / DALL·E / Runway): Kapalı API'ler oldukça gelişmiş olabilir (kullanıcı arayüzü, entegre moderasyon, gecikme garantileri), ancak Qwen-Image-Edit, özellikle güçlü iki dilli metin düzenlemeyi hedefleyen ve yerel dağıtım sunan tamamen açık bir alternatif olarak öne çıkıyor. Pratik tercih genellikle yerel kontrol/açık lisanslama mı yoksa gelişmiş bulut kullanıcı deneyimi mi istediğinize bağlıdır.
Pratik kullanım durumları
- Poster ve tabela düzenlemeleri — posterlerdeki metni yazı tipi/dokuyu koruyarak değiştirin.
- Ürün pazarlaması / poster üretimi — e-ticaret görselleri için ürün ekleme/kaldırma, ürün kimliğini koruma.
- Portre kimliğini koruyan düzenlemeler — kimliğin tutarlılığını koruyarak poz değişiklikleri, stil transferleri (2509'da geliştirildi).
- Restorasyon ve kaligrafi düzeltme — eski fotoğraf restorasyonu ve el yazısı/baskı karakterlerin aşamalı olarak düzeltilmesi.
- Yaratıcı/Tasarım iş akışları — çoklu resim kompozisyon düzenlemeleri, meme oluşturma, iki dilli metnin yer alabileceği avatar şekillendirme.
CometAPI'den qwen-image-edit API'si nasıl çağrılır?
qwen-image-edit CometAPI'de API Fiyatlandırması, resmi fiyattan %20 indirim:
| Giriş Jetonları | $2.00 |
| Çıkış Tokenları | $6.40 |
Gerekli Adımlar
- Giriş cometapi.com. Eğer henüz kullanıcımız değilseniz lütfen önce kayıt olun.
- oturum senin CometAPI konsolu.
- Arayüzün erişim kimlik bilgisi API anahtarını edinin. Kişisel merkezdeki API belirtecinde “Token Ekle”ye tıklayın, belirteç anahtarını edinin: sk-xxxxx ve gönderin.

Kullanım Yöntemi
- API isteğini göndermek için "qwen-image-edit" uç noktasını seçin ve istek gövdesini ayarlayın. İstek yöntemi ve istek gövdesi, web sitemizdeki API dokümanından edinilebilir. Web sitemizde ayrıca kolaylık olması açısından Apifox testi de mevcuttur.
- Yer değiştirmek Hesabınızdaki gerçek CometAPI anahtarınızla.
- Sorunuzu veya isteğinizi içerik alanına girin; model buna cevap verecektir.
- . Üretilen cevabı almak için API yanıtını işleyin.
CometAPI, sorunsuz geçiş için tamamen uyumlu bir REST API sağlar. Temel ayrıntılar görüntü düzenleme:
- Temel URL: https://api.cometapi.com/v1/images/edits
- Model İsimleri: qwen-görüntü-düzenleme
- Kimlik doğrulama:
Bearer YOUR_CometAPI_API_KEYbaşlık - İçerik türü:
application/json.
Ayrıca bakınız Qwen-görüntü API'si
