gen4_gambar adalah model pembangkit gambar multimoda andalan Runway dalam keluarga Gen-4 yang mendukung generasi yang diminta ditambah referensi visual (Anda dapat “@menyebut” gambar referensi) untuk menghasilkan keluaran yang sangat terkendali dan konsisten secara gaya untuk jalur gambar dan gambar→video.
Pendahuluan — apa Gambar Gen-4 is
gen4_gambar adalah keluarga model generatif visual generasi keempat Runway, yang dirancang untuk mengambil petunjuk teks + referensi visual dan menghasilkan gambar diam fidelitas tinggi atau bingkai siap media yang mempertahankan identitas dan gaya di seluruh sudut dan pencahayaan. Model ini disajikan sebagai bagian dari rangkaian Gen-4 yang lebih luas (termasuk varian video seperti gen4_turbo) dan secara eksplisit dirancang untuk produksi kreatif — misalnya, rendering karakter yang konsisten, fotografi produk dalam skala besar, uji coba virtual, dan pembuatan aset game.
Fitur Utama
- Pembuatan berbasis referensi (1–3 referensi). Gunakan hingga tiga gambar referensi sehingga model dapat mempertahankan identitas, gaya, atau lokasi sambil mengubah pose, pencahayaan, latar belakang, dll.
- Kesetiaan visual yang tinggi (output siap produksi). Output menargetkan resolusi tinggi (tersedia pilihan 1080p) dengan detail yang kuat dan kontrol gaya.
- Identitas & konsistensi adegan. Dirancang untuk menjaga karakter atau lingkungan yang sama tetap konsisten di beberapa generasi — berguna untuk visual multi-shot atau aset yang berpusat pada karakter.
- Petunjuk multimoda (teks + gambar). Gabungkan instruksi bahasa alami dengan gambar referensi untuk mengarahkan komposisi, suasana hati, pakaian, sudut kamera, dll.
- Gambar → gambar plus teks → alur kerja gambar. Berfungsi sebagai gambar-ke-gambar (edit/transformasi) dan sebagai teks-ke-gambar menggunakan referensi untuk menjaga kesinambungan.
- Tingkat kinerja (Turbo) tersedia. Varian “Gen-4 Image Turbo” mengorbankan biaya dan kecepatan (misalnya, ~2.5× lebih cepat) dengan tetap mempertahankan fitur-fitur yang menjadi acuan.
- Kontrol & reproduktifitas. Pilihan API yang umum meliputi prasetel rasio aspek, resolusi (720p/1080p), seed untuk reproduktifitas, dan tag referensi untuk menunjuk ke masukan tertentu.
Detail teknis
Memasukkan: Teks/Gambar
Output: Gambar
alur kerja:
- Perlengkapan pengguna: perintah teks + 0–3 gambar referensi (dan masker opsional, bingkai utama, instruksi gerakan kamera).
- PraprosesReferensi dinormalisasi dan dikodekan; teks ditokenisasi. Penyematan identitas/gaya diekstraksi dan di-cache untuk digunakan kembali.
- Penyejuk: penyertaan teks dan referensi digabungkan dalam tulang punggung multimoda; sinyal kontrol opsional (pose, kedalaman, topeng) dilampirkan.
- Pengambilan sampel / pengurangan kebisingan:dekoder menjalankan iterasi pengurangan derau (langkah difusi) yang menghasilkan gambar (atau rangkaian bingkai untuk video).
gen4_image — batasan konkret
Kasus tepi temporal/gerakan. Para pengulas dan kreator melaporkan artefak gerakan sesekali, dinamika temporal ganjil (gangguan di awal/akhir klip yang dihasilkan), dan kegagalan pada koreografi multi-aktor yang sangat rumit — ujilah dengan adegan target Anda.
Hitung, biaya & antri. Pembuatan gambar→video berkualitas tinggi membutuhkan GPU yang besar; pengguna melaporkan waktu antrean dan biaya per-render yang signifikan untuk produksi massal. Rencanakan anggaran/throughput dengan tepat.
Pertukaran kreatif vs model seni murni. Kekuatan Gen-4 adalah konsistensi; jika Anda membutuhkan keluaran yang sangat bergaya, seperti lukisan, atau estetika yang "mengejutkan", Midjourney atau titik pemeriksaan SDXL yang disetel dapat menghasilkan arahan seni yang disukai.
Kasus penggunaan kanonik
- Praproduksi & pembuatan papan cerita: dengan cepat membuat varian karakter/adegan yang konsisten gayanya dari foto referensi.
- Pemasaran & pembuatan konten: Produksi cepat gambar hero, klip media sosial animasi, dan aset kampanye dengan karakter merek yang konsisten. (Runway mencantumkan contoh perusahaan termasuk tur langsung dan video musik.)
- Pembuatan prototipe game/aset & uji coba virtual: menghasilkan berbagai sudut kamera, varian pakaian, dan konsep lingkungan dari sekumpulan referensi kecil.
Perbandingan dengan model lain
- gen4_image→ terbaik ketika Anda membutuhkannya konsistensi referensi/identitas (karakter tunggal atau objek tetap sama di seluruh bidikan) dan saat Anda menginginkannya gambar→video dan jalur pipa multi-shot.
- DALL·E 3 → terbaik untuk kesetiaan yang ketat terhadap perintah ke gambar dan alur penyuntingan berbasis ChatGPT yang bersifat percakapan, ditambah pekerjaan keamanan/asal-usul yang sudah terintegrasi.
- SDXL (keluarga Difusi Stabil) → terbaik ketika Anda menginginkan model terbuka, penyempurnaan lokal/khusus, dan penerapan yang fleksibel dari segi biaya.
- Midjourney → terbaik untuk render yang sangat bergaya, menarik secara artistik, dan preset / kontrol “gaya” yang digerakkan oleh komunitas yang kuat.
- Model Runway Gen-4 vs. ByteDance Seedream 4.0 / Google “Nano Banana”: peluncuran pesaing baru-baru ini (misalnya, Seedream 4.0) menekankan rendering ultra-cepat dan penanganan multi-referensi ditujukan untuk kreator komersial; Keunggulan Runway adalah jaringan gambar→video yang terintegrasi erat dan kontrol berorientasi produksi ditambah ekosistem API dan SDK yang matang.
Bagaimana cara menelepon gen4_gambar API dari CometAPI
| Harga | $0.32000 |
Langkah-langkah yang Diperlukan
- Masuk ke cometapi.comJika Anda belum menjadi pengguna kami, silakan mendaftar terlebih dahulu
- Dapatkan kunci API kredensial akses antarmuka. Klik “Tambahkan Token” pada token API di pusat personal, dapatkan kunci token: sk-xxxxx dan kirimkan.
- Dapatkan url situs ini: https://api.cometapi.com/
Gunakan Metode
- Pilih titik akhir "gen4_image" untuk mengirim permintaan API dan atur isi permintaan. Metode dan isi permintaan diperoleh dari dokumen API situs web kami. Situs web kami juga menyediakan uji Apifox untuk kenyamanan Anda.
- Mengganti dengan kunci CometAPI Anda yang sebenarnya dari akun Anda.
- Masukkan pertanyaan atau permintaan Anda ke dalam kolom konten—inilah yang akan ditanggapi oleh model.
- Memproses respons API untuk mendapatkan jawaban yang dihasilkan.
CometAPI menyediakan REST API yang sepenuhnya kompatibel—untuk migrasi yang lancar. Detail penting untuk Dokumen API:
- Titik akhir:
https://api.cometapi.com/runwayml/v1/text_to_image - Parameter Model:
gen4_image - Otentikasi:
Bearer YOUR_CometAPI_API_KEY - Jenis konten:
application/json.
curl --location --request POST 'https://api.cometapi.com/runwayml/v1/text_to_image' \
--header 'X-Runway-Version: 2024-11-06' \
--header 'Authorization: {{api-key}}' \
--header 'Content-Type: application/json' \
--data-raw '{
"promptText": "cat",
"ratio": "1920:1080",
"seed": 4294967295,
"model": "gen4_image",
"referenceImages": ,
"contentModeration": {
"publicFigureThreshold": "auto"
}
}'
Lihat juga Landasan Pacu/Babak_kedua
