API Runway/gen4_image

gen4_gambar adalah model pembangkit gambar multimoda andalan Runway dalam keluarga Gen-4 yang mendukung generasi yang diminta ditambah referensi visual (Anda dapat “@menyebut” gambar referensi) untuk menghasilkan keluaran yang sangat terkendali dan konsisten secara gaya untuk jalur gambar dan gambar→video.

Pendahuluan — apa Gambar Gen-4 is

gen4_gambar adalah keluarga model generatif visual generasi keempat Runway, yang dirancang untuk mengambil petunjuk teks + referensi visual dan menghasilkan gambar diam fidelitas tinggi atau bingkai siap media yang mempertahankan identitas dan gaya di seluruh sudut dan pencahayaan. Model ini disajikan sebagai bagian dari rangkaian Gen-4 yang lebih luas (termasuk varian video seperti gen4_turbo) dan secara eksplisit dirancang untuk produksi kreatif — misalnya, rendering karakter yang konsisten, fotografi produk dalam skala besar, uji coba virtual, dan pembuatan aset game.

Fitur Utama

Pembuatan berbasis referensi (1–3 referensi). Gunakan hingga tiga gambar referensi sehingga model dapat mempertahankan identitas, gaya, atau lokasi sambil mengubah pose, pencahayaan, latar belakang, dll.
Kesetiaan visual yang tinggi (output siap produksi). Output menargetkan resolusi tinggi (tersedia pilihan 1080p) dengan detail yang kuat dan kontrol gaya.
Identitas & konsistensi adegan. Dirancang untuk menjaga karakter atau lingkungan yang sama tetap konsisten di beberapa generasi — berguna untuk visual multi-shot atau aset yang berpusat pada karakter.
Petunjuk multimoda (teks + gambar). Gabungkan instruksi bahasa alami dengan gambar referensi untuk mengarahkan komposisi, suasana hati, pakaian, sudut kamera, dll.
Gambar → gambar plus teks → alur kerja gambar. Berfungsi sebagai gambar-ke-gambar (edit/transformasi) dan sebagai teks-ke-gambar menggunakan referensi untuk menjaga kesinambungan.
Tingkat kinerja (Turbo) tersedia. Varian “Gen-4 Image Turbo” mengorbankan biaya dan kecepatan (misalnya, ~2.5× lebih cepat) dengan tetap mempertahankan fitur-fitur yang menjadi acuan.
Kontrol & reproduktifitas. Pilihan API yang umum meliputi prasetel rasio aspek, resolusi (720p/1080p), seed untuk reproduktifitas, dan tag referensi untuk menunjuk ke masukan tertentu.

Detail teknis

Memasukkan: Teks/Gambar

Output: Gambar

alur kerja:

Perlengkapan pengguna: perintah teks + 0–3 gambar referensi (dan masker opsional, bingkai utama, instruksi gerakan kamera).
PraprosesReferensi dinormalisasi dan dikodekan; teks ditokenisasi. Penyematan identitas/gaya diekstraksi dan di-cache untuk digunakan kembali.
Penyejuk: penyertaan teks dan referensi digabungkan dalam tulang punggung multimoda; sinyal kontrol opsional (pose, kedalaman, topeng) dilampirkan.
Pengambilan sampel / pengurangan kebisingan:dekoder menjalankan iterasi pengurangan derau (langkah difusi) yang menghasilkan gambar (atau rangkaian bingkai untuk video).

gen4_image — batasan konkret

Kasus tepi temporal/gerakan. Para pengulas dan kreator melaporkan artefak gerakan sesekali, dinamika temporal ganjil (gangguan di awal/akhir klip yang dihasilkan), dan kegagalan pada koreografi multi-aktor yang sangat rumit — ujilah dengan adegan target Anda.

Hitung, biaya & antri. Pembuatan gambar→video berkualitas tinggi membutuhkan GPU yang besar; pengguna melaporkan waktu antrean dan biaya per-render yang signifikan untuk produksi massal. Rencanakan anggaran/throughput dengan tepat.

Pertukaran kreatif vs model seni murni. Kekuatan Gen-4 adalah konsistensi; jika Anda membutuhkan keluaran yang sangat bergaya, seperti lukisan, atau estetika yang "mengejutkan", Midjourney atau titik pemeriksaan SDXL yang disetel dapat menghasilkan arahan seni yang disukai.

Kasus penggunaan kanonik

Praproduksi & pembuatan papan cerita: dengan cepat membuat varian karakter/adegan yang konsisten gayanya dari foto referensi.
Pemasaran & pembuatan konten: Produksi cepat gambar hero, klip media sosial animasi, dan aset kampanye dengan karakter merek yang konsisten. (Runway mencantumkan contoh perusahaan termasuk tur langsung dan video musik.)
Pembuatan prototipe game/aset & uji coba virtual: menghasilkan berbagai sudut kamera, varian pakaian, dan konsep lingkungan dari sekumpulan referensi kecil.

Perbandingan dengan model lain

gen4_image→ terbaik ketika Anda membutuhkannya konsistensi referensi/identitas (karakter tunggal atau objek tetap sama di seluruh bidikan) dan saat Anda menginginkannya gambar→video dan jalur pipa multi-shot.
DALL·E 3 → terbaik untuk kesetiaan yang ketat terhadap perintah ke gambar dan alur penyuntingan berbasis ChatGPT yang bersifat percakapan, ditambah pekerjaan keamanan/asal-usul yang sudah terintegrasi.
SDXL (keluarga Difusi Stabil) → terbaik ketika Anda menginginkan model terbuka, penyempurnaan lokal/khusus, dan penerapan yang fleksibel dari segi biaya.
Midjourney → terbaik untuk render yang sangat bergaya, menarik secara artistik, dan preset / kontrol “gaya” yang digerakkan oleh komunitas yang kuat.
Model Runway Gen-4 vs. ByteDance Seedream 4.0 / Google “Nano Banana”: peluncuran pesaing baru-baru ini (misalnya, Seedream 4.0) menekankan rendering ultra-cepat dan penanganan multi-referensi ditujukan untuk kreator komersial; Keunggulan Runway adalah jaringan gambar→video yang terintegrasi erat dan kontrol berorientasi produksi ditambah ekosistem API dan SDK yang matang.

Bagaimana cara menelepon gen4_gambar API dari CometAPI


Harga	$0.32000

Langkah-langkah yang Diperlukan

Masuk ke cometapi.comJika Anda belum menjadi pengguna kami, silakan mendaftar terlebih dahulu
Dapatkan kunci API kredensial akses antarmuka. Klik “Tambahkan Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.
Dapatkan url situs ini: https://api.cometapi.com/

Gunakan Metode

Pilih titik akhir "gen4_image" untuk mengirim permintaan API dan atur isi permintaan. Metode dan isi permintaan diperoleh dari dokumen API situs web kami. Situs web kami juga menyediakan uji Apifox untuk kenyamanan Anda.
Mengganti dengan kunci CometAPI Anda yang sebenarnya dari akun Anda.
Masukkan pertanyaan atau permintaan Anda ke dalam kolom konten—inilah yang akan ditanggapi oleh model.
Memproses respons API untuk mendapatkan jawaban yang dihasilkan.

CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi yang lancar. Detail penting untuk Dokumen API:

Titik akhir: https://api.cometapi.com/runwayml/v1/text_to_image
Parameter Model: gen4_image
Otentikasi: Bearer YOUR_CometAPI_API_KEY
Jenis konten: application/json .

curl --location --request POST 'https://api.cometapi.com/runwayml/v1/text_to_image' \  
--header 'X-Runway-Version: 2024-11-06' \  
--header 'Authorization: {{api-key}}' \  
--header 'Content-Type: application/json' \  
--data-raw '{  
"promptText": "cat",  
"ratio": "1920:1080",  
"seed": 4294967295,  
"model": "gen4_image",  
"referenceImages": ,  
"contentModeration": {  
"publicFigureThreshold": "auto"  
}  
}'

Lihat juga Landasan Pacu/Babak_kedua