Cara menggunakan Seedgream 4.5 API

CometAPI
AnnaDec 9, 2025
Cara menggunakan Seedgream 4.5 API

Seedream 4.5 ialah evolusi terbaharu dalam keluarga model teks-ke-imej / penyuntingan imej Seedream (dibangunkan di bawah penyelidikan Byte/BytePlus). Ia sedang dilancarkan merentasi titik akhir rasmi BytePlus dan pelbagai platform pihak ketiga — termasuk capaian bersepadu melalui gerbang berbilang model seperti CometAPI — serta membawa peningkatan pada kekonsistenan subjek, tipografi/pemapar teks, dan kesetiaan penyuntingan berbilang imej.

Artikel ini ialah panduan profesional hands-on untuk menggunakan API Seedream 4.5. Anda akan mendapat langkah persediaan praktikal, corak pengesahan dan permintaan, amalan terbaik untuk prompt dan parameter, aliran kerja penyuntingan & berbilang imej, pengendalian ralat, corak pengelasan (deployment), serta pertimbangan undang-undang/ keselamatan.

Apakah Seedream 4.5?

Seedream 4.5 ialah iterasi terbaharu keluarga Seedream — model penjanaan dan penyuntingan imej multimodal yang direka untuk penciptaan teks-ke-imej berketelitian tinggi dan penyuntingan imej peka konteks (imej-ke-imej, penyuntingan rujukan berbilang, inpainting/outpainting, tipografi dan pengendalian teks padat). Berbanding keluaran Seedream terdahulu, 4.5 memberi tumpuan pada peningkatan kekonsistenan subjek merentasi aliran kerja berbilang imej, pemuliharaan butiran rujukan yang lebih ketat, ketepatan tipografi yang lebih tinggi (teks dalam imej), dan kualiti output yang lebih baik sehingga 4K/ultra-HD dalam tetapan “high quality”. Penambahbaikan ini hadir sebagai sebahagian daripada senibina berskala dan penalaan prompt/heuristik pada sisi enjin yang dikemas kini.

Mengapa ini penting: 4.5 dibina khusus untuk mengendalikan tugasan kreatif profesional — variasi produk secara kelompok (batch), suntingan berbilang imej yang konsisten dengan jenama, dan aset cetakan resolusi tinggi — sambil membolehkan kawalan lebih halus dengan imej rujukan dan operasi penyuntingan khusus.

Keupayaan teras

  • Penjanaan teks-ke-imej (tunggal dan kelompok): jana 1–15 imej bagi setiap panggilan API, dengan mod kualiti boleh pilih (Basic vs High) yang mengimbangi kelajuan dan resolusi.
  • Penyuntingan imej (i2i / inpainting / outpainting): gunakan satu atau lebih imej rujukan; mengekalkan butiran dan hubungan spatial merentasi pelbagai rujukan.
  • Pencampuran rujukan berbilang & penyalinan elemen: sehingga ~10 imej rujukan boleh digunakan dalam satu tugasan untuk memindahkan elemen sambil mengekalkan pencahayaan/perspektif yang koheren.
  • Pemapar tipografi/teks padat tahap tinggi: pengendalian lebih baik untuk imej dengan teks atau papan tanda (berguna bagi mockup, label produk, tangkapan skrin UI).
  • Output penstriman/berperingkat: sesetengah titik akhir pengelasan menyokong penstriman keputusan supaya klien boleh menerima hasil separa sementara penjanaan diteruskan.

Bagaimanakah saya menggunakan API Seedream 4.5 melalui CometAPI?

Di bawah ialah panduan praktikal yang boleh salin-tampal untuk menjana imej melalui CometAPI (sebuah pengagregat yang mendedahkan model Seedream 4.5 sebagai parameter model). Gunakan CometAPI apabila anda mahu satu kunci API untuk mengakses puluhan/ratusan model dan permukaan REST yang stabil serta mudah diintegrasi. Dokumentasi CometAPI menunjukkan alias model doubao-seedream-4-5-251128 dan titik akhir penjanaan imej piawai.

Langkah umum

  1. Daftar CometAPI dan dapatkan kunci API.
  2. Gunakan titik akhir penjanaan imej (POST https://api.cometapi.com/v1/images/generations) dengan parameter model ditetapkan kepada pengecam Seedream 4.5 (contoh: doubao-seedream-4-5-251128).
  3. Sertakan prompt, imej rujukan pilihan (URL atau muat naik multipart bergantung pada pengagregat), saiz/kualiti output, dan parameter lain.
  4. Terima respons JSON yang mengandungi URL imej terjana (atau base64) dan metadata.

Jenis permintaan dan mod

Seedream 4.5 lazimnya menyokong:

  • Teks → Imej (prompt teks → imej baharu)
  • Imej → Imej (imej rujukan + prompt untuk transformasi berstail)
  • Penyuntingan Imej / Inpainting (mask + arahan suntingan untuk perubahan terarah)
    API yang dihoskan menyokong mod tugasan tak segerak (hantar tugasan → tinjau dengan taskId) yang sesuai untuk render panjang dan aliran kerja secara kelompok. Pautan terjana selalunya bertempoh (cth., sah selama 24 jam pada sesetengah gerbang) jadi rancang untuk storan/eksport.

Contoh curl (teks-ke-imej, prompt tunggal)

curl -X POST "https://api.cometapi.com/v1/images/generations" \
  -H "Authorization: Bearer COMETAPI_KEY_GOES_HERE" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "doubao-seedream-4-5-251128",
    "prompt": "A cinematic portrait of a cyberpunk fox in neon rain, 4k, detailed lighting, film grain",
    "n": 3,
    "width": 2048,
    "height": 2048,
    "quality": "high",     # or "basic"
    "seed": 12345,
    "style": "photorealistic"
  }'

Nota

  • Gantikan COMETAPI_KEY_GOES_HERE dengan kunci CometAPI anda.
  • Parameter n menjana variasi berganda dalam satu panggilan (menjimatkan overhead).
  • quality: "high" lazimnya memetakan kepada resolusi lebih tinggi / kos pengiraan lebih tinggi (sering menyokong 4K).

Contoh Python requests (teks-ke-imej + menyimpan hasil)

import requests, base64, os

API_URL = "https://api.cometapi.com/v1/images/generations"
API_KEY = os.environ.get("COMETAPI_KEY")  # set env var for safety

payload = {
  "model": "doubao-seedream-4-5-251128",
  "prompt": "Studio shot of a ceramic mug on a wooden table, warm natural light, ultra-detailed, 2k",
  "n": 2,
  "width": 1024,
  "height": 1024,
  "quality": "basic"
}

resp = requests.post(API_URL, json=payload, headers={
    "Authorization": f"Bearer {API_KEY}",
    "Content-Type": "application/json"
})
resp.raise_for_status()
data = resp.json()

# Example: each item has 'b64_json' or 'url' depending on provider
for i, item in enumerate(data.get("data", [])):
    img_b64 = item.get("b64_json")
    if img_b64:
        img_bytes = base64.b64decode(img_b64)
        with open(f"seedream_result_{i}.png", "wb") as f:
            f.write(img_bytes)
    else:
        print("Image URL:", item.get("url"))

Mengapa corak ini? Pengagregat lazimnya memulangkan sama ada payload base64 atau URL yang dihoskan; kod mengendalikan kedua-duanya. Titik akhir lazimnya akan memulangkan task_id. Tinjau titik akhir GET /tasks/{task_id} sehingga status succeeded dan kemudian muat turun hasilnya. Banyak penyedia menyertakan SDK dengan pembantu terbina untuk corak ini.

Bagaimana mengoptimumkan kualiti imej dan memastikan teks boleh dibaca?

  1. Gunakan imej rujukan untuk konteks dan padanan warna yang konsisten.
  2. Nyatakan tipografi secara eksplisit dalam prompt (keluarga fon, berat, penjajaran) dan pertimbangkan untuk menambah teks tepat sebagai tindanan dalam langkah kedua bagi memastikan kebolehbacaan.
  3. Jalankan proses dua langkah: (a) jana komposisi asas; (b) render semula atau edit dalam lintasan kedua yang memfokus pada jarak dekat atau kawasan label dengan resolusi lebih tinggi.

Bagaimana anda harus menulis prompt untuk Seedream 4.5?

Prinsip kejuruteraan prompt

  • Jelas dan eksplisit: senaraikan subjek, tindakan, gaya, kanta/kamera, waktu hari, dan palet warna yang diingini.
  • Sauh identiti: Jika anda perlukan muka/prop yang sama merentasi imej, sertakan deskriptor berterusan (cth., “wanita yang sama berambut pendek beralun, jaket hijau, parut pada kening kiri”) dan bekalkan 1–3 imej rujukan. Gabungan rujukan berbilang Seedream 4.5 bertambah baik, tetapi sauh membantu.
  • Prompt negatif: nyatakan dengan jelas perkara yang perlu dielakkan (cth., “tiada teks”, “tiada tera air”, “tiada anggota tambahan”).
  • Hibrid pendek + panjang: berikan arahan ringkas yang kanonik kemudian huraikan dengan beberapa baris perincian dan kekangan.

Templat prompt contoh

Hero shot produk (fotorealistik): "Sebuah hero shot produk yang bersih bagi pembesar suara tanpa wayar matte hitam di atas meja putih, pencahayaan softbox, 50mm, kedalaman medan cetek, latar studio, fotorealistik, tiada teks"

Ilustrasi fantasi (berstail): "Landskap fantasi epik, istana kaca menjulang di atas tebing, golden hour, kabus volumetrik, gaya pelukis, sangat terperinci, seni konsep"

Penyuntingan imej (alih keluar objek) : "Alih keluar orang di sebelah kiri dan lanjutkan latar belakang untuk mengisi ruang, kekalkan pencahayaan konsisten, tiada artifak"

Mockup sarat tipografi: "Mockup skrin landas aplikasi mudah alih pada iPhone 14, dengan teks 'Launch Now' dalam Gotham Bold, jadikan butang berwarna hijau dan kekalkan bayang-bayang lembut"

Potret watak: "Potret heroik seorang pahlawan wanita, pencahayaan rim sinematik, kanta potret 85mm, tekstur kulit sangat terperinci, bintik semula jadi, perisai kulit, latar neutral, fotorealistik."

Prompt rujukan dan berbilang imej

Apabila menggunakan penyuntingan berbilang imej, nyatakan imej rujukan mana dipetakan kepada bahagian mana dalam prompt. Seedream 4.5 bertambah baik dalam mengenal pasti subjek utama merentasi pelbagai rujukan — tetapi bersikap eksplisit (cth., “gunakan image_1 untuk muka, image_2 untuk tekstur pakaian”) menghasilkan keputusan yang lebih baik.

Pemilihan output & pascapemprosesan

  • Jana N varian dan jalankan penapis objektif: skor persamaan wajah, perbandingan histogram warna, OCR tipografi untuk menyemak ketepatan teks.
  • Automasi ambang QC untuk menghala output di bawah ambang kepada sentuhan semula manual.
  • Serahkan tipografi akhir kepada alat susun atur jika anda perlukan teks tepat pada aras piksel — gunakan model untuk latar dan imejan, kemudian gabungkan teks tepat dalam pasca. Ini mengurangkan keperluan bergantung pada ketelitian teks model bagi aset pemasaran.

Bagaimana anda melakukan penyuntingan imej, inpainting, dan komposisi berbilang imej?

Aliran kerja penyuntingan imej

  1. Muat naik imej rujukan ke penyedia atau hantar secara inline bersama permintaan.
  2. Sediakan mask (imej binari) untuk inpainting atau anotasi sempadan untuk suntingan terarah.
  3. Hantar prompt suntingan yang menjelaskan kawasan mana perlu diubah dan mana perlu dikekalkan.

Banyak API menyokong kedua-dua mod suntingan imej tunggal dan komposisi berbilang imej; 4.5 ditala secara eksplisit untuk memelihara identiti subjek dan meningkatkan konsistensi berbilang imej.

Contoh: Payload Inpainting (pseudokod JSON)

{
  "model": "seedream-4.5",
  "mode": "image_edit",
  "image_url": "https://.../original.png",
  "mask_url": "https://.../mask.png",
  "prompt": "Replace background with a sunset beach — keep subject untouched, maintain original lighting on subject",
  "guidance": 9,
  "steps": 40
}

Petua untuk penyuntingan berbilang imej yang konsisten

  • Gunakan seed yang sama untuk render berkaitan bagi mengekalkan konsistensi merentasi bingkai.
  • Kekalkan deskriptor kamera konsisten merentasi prompt (cth., “potret 85mm, softbox, 3/4”) untuk mengekalkan konsistensi sudut pandang.
  • Apabila menyunting wajah, minta klausa pemeliharaan butiran yang halus (“kekalkan struktur wajah, tukar warna rambut sahaja”) untuk mengurangkan hanyutan identiti.

Apakah amalan terbaik apabila menggunakan Seedream 4.5

Bagaimana anda menyelesaikan isu lazim?

Berikut ialah langkah penyelesaian masalah praktikal apabila hasil tidak memuaskan:

Wajah kabur / butiran tidak tepat

Tingkatkan kekhususan prompt untuk butiran wajah (umur, ekspresi, pencahayaan), sediakan imej rujukan berkualiti lebih tinggi, atau cuba arahan “kekalkan wajah” yang eksplisit dan rendahkan strength suntingan untuk mengekalkan lebih banyak daripada asal. Seedream 4.5 memperbaiki realisme wajah, namun input masih penting.

Teks tidak boleh dibaca atau terabur

Sediakan teks vektor atau raster sebagai tindanan berasingan jika anda perlukan tipografi tepat piksel; jika tidak, gunakan tetapan resolusi lebih tinggi dan arahan gaya “render teks boleh dibaca: ya” yang eksplisit. 4.5 meningkatkan pengendalian teks padat berbanding versi terdahulu, tetapi kesempurnaan tipografi mungkin masih memerlukan komposit dalam pasca.

Pencahayaan atau komposisi kelompok tidak konsisten

Gunakan prompt templat dengan pernyataan pencahayaan/kamera tetap, atau jana dalam satu panggilan kelompok untuk meningkatkan konsistensi. BytePlus dan CometAPI menyediakan corak inferens kelompok atas sebab itu.

Nota akhir dan langkah seterusnya

Seedream 4.5 ialah model imej yang matang dan berorientasikan produksi dengan penambahbaikan jelas yang disasarkan pada aliran kerja kreatif sebenar: konsistensi lebih baik, teks dan render wajah bertambah baik, serta sokongan rujukan berbilang. Gunakan CometAPI atau pengagregat serupa apabila anda mahukan eksperimen pantas dan fleksibiliti berbilang model.

Pembangun boleh mengakses API Seedream 4.5 dsb. melalui CometAPI, versi model terkini sentiasa dikemas kini dengan laman rasmi. Untuk bermula, terokai keupayaan model dalam Playground dan rujuk panduan API untuk arahan terperinci. Sebelum mengakses, pastikan anda telah log masuk ke CometAPI dan memperoleh kunci API. CometAPI menawarkan harga jauh lebih rendah daripada harga rasmi untuk membantu anda mengintegrasikan.

Sedia untuk Bermula?→ Percubaan percuma Seedream 4.5 !

Jika anda mahu mengetahui lebih banyak petua, panduan dan berita tentang AI ikuti kami di VK, X dan Discord!

Baca Lagi

500+ Model dalam Satu API

Sehingga 20% Diskaun