ModelSokonganPerusahaanBlog
500+ API Model AI, Semua Dalam Satu API. Hanya Di CometAPI
API Model
Pembangun
Mula PantasDokumentasiPapan Pemuka API
Sumber
Model AIBlogPerusahaanLog PerubahanTentang
2025 CometAPI. Hak cipta terpelihara.Dasar PrivasiTerma Perkhidmatan
Home/Models/Kling/Kling Image Recognize
K

Kling Image Recognize

Setiap Permintaan:$0.013216
API pengecaman elemen imej Keling, boleh digunakan untuk penjanaan video rujukan berbilang imej, ciri penyuntingan video multimodal ● Boleh mengenali subjek, wajah, pakaian, dan lain-lain, serta boleh memperoleh 4 set keputusan (jika tersedia) bagi setiap permintaan.
Baru
Penggunaan komersial
Gambaran Keseluruhan
Ciri-ciri
Harga
API

Technical Specifications of kling-image-recognize

SpecificationDetails
Model IDkling-image-recognize
CategoryImage recognition / multimodal analysis
Primary CapabilityRecognizes image elements for downstream creative workflows, including multi-image reference video generation and multimodal video editing
Input TypeImage input
Output TypeStructured recognition results
Recognition ScopeSubjects, faces, clothing, and other visual elements
Result VolumeCan return up to 4 sets of results per request, if available
Use CasesVisual asset analysis, reference preparation for video generation, content understanding for editing pipelines, subject and apparel recognition

What is kling-image-recognize?

kling-image-recognize is a Keling image element recognition API designed to analyze visual content and identify important elements within an image. It is especially useful in workflows that require multi-image reference video generation or multimodal video editing, where understanding the contents of source images is an important preprocessing step.

The model can recognize a range of visual attributes such as subjects, faces, clothing, and related image components. Depending on the input, it can provide up to 4 sets of recognition results in a single request, helping developers capture multiple possible detections or interpretations when available.

Main features of kling-image-recognize

  • Image element recognition: Detects and identifies important visual elements contained in an input image.
  • Subject analysis: Recognizes primary subjects that can be used in downstream media generation or editing workflows.
  • Face recognition support: Extracts face-related recognition results when faces are present in the image.
  • Clothing identification: Detects apparel and clothing-related elements to support more detailed visual understanding.
  • Multi-image reference workflow support: Useful for preparing and analyzing image references used in video generation pipelines.
  • Multimodal video editing compatibility: Helps power editing scenarios where image content needs to be understood before transformation or composition.
  • Multiple result sets per request: Can obtain up to 4 sets of results per request, if available, enabling richer recognition output.
  • Integration-friendly API usage: Suitable for developers building automated media analysis and creative application pipelines.

How to access and integrate kling-image-recognize

Step 1: Sign Up for API Key

To get started, sign up on the CometAPI platform and generate your API key from the dashboard. After obtaining your key, store it securely and use it to authenticate every request to the kling-image-recognize API.

Step 2: Send Requests to kling-image-recognize API

Once you have your API key, send requests to the CometAPI endpoint using kling-image-recognize as the model ID. Include your authentication headers and provide the required image input payload based on your application workflow.

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "kling-image-recognize",
    "input": [
      {
        "role": "user",
        "content": [
          {
            "type": "input_text",
            "text": "Recognize the main visual elements in this image."
          },
          {
            "type": "input_image",
            "image_url": "YOUR_IMAGE_URL"
          }
        ]
      }
    ]
  }'

Step 3: Retrieve and Verify Results

After submission, the API returns recognition results generated by kling-image-recognize. Parse the response in your application, verify the detected subjects or attributes, and store the returned data for use in video generation, editing, or other downstream automation tasks.

Ciri-ciri untuk Kling Image Recognize

Terokai ciri-ciri utama Kling Image Recognize, yang direka untuk meningkatkan prestasi dan kebolehgunaan. Temui bagaimana keupayaan ini boleh memberi manfaat kepada projek anda dan meningkatkan pengalaman pengguna.

Harga untuk Kling Image Recognize

Terokai harga yang kompetitif untuk Kling Image Recognize, direka bentuk untuk memenuhi pelbagai bajet dan keperluan penggunaan. Pelan fleksibel kami memastikan anda hanya membayar untuk apa yang anda gunakan, menjadikannya mudah untuk meningkatkan skala apabila keperluan anda berkembang. Temui bagaimana Kling Image Recognize boleh meningkatkan projek anda sambil mengekalkan kos yang terurus.
Harga Comet (USD / M Tokens)Harga Rasmi (USD / M Tokens)Diskaun
Setiap Permintaan:$0.013216
Setiap Permintaan:$0.01652
-20%

Kod contoh dan API untuk Kling Image Recognize

Akses kod sampel yang komprehensif dan sumber API untuk Kling Image Recognize bagi memperlancar proses integrasi anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu anda memanfaatkan potensi penuh Kling Image Recognize dalam projek anda.

Lebih Banyak Model

O

Sora 2 Pro

Setiap Saat:$0.24
Sora 2 Pro ialah model generatif media kami yang paling canggih dan berkuasa, mampu menjana video dengan Audio yang disegerakkan. Ia boleh mencipta klip video yang terperinci dan dinamik daripada bahasa semula jadi atau imej.
O

Sora 2

Setiap Saat:$0.08
Model penjanaan video yang sangat berkuasa, dengan kesan bunyi, menyokong format sembang.
M

mj_fast_video

Setiap Permintaan:$0.6
Midjourney video generation
X

Grok Imagine Video

Setiap Saat:$0.04
Hasilkan video daripada gesaan teks, animasikan imej pegun, atau sunting video sedia ada menggunakan bahasa semula jadi. API menyokong tempoh, nisbah aspek dan resolusi yang boleh dikonfigurasi untuk video yang dijana — dengan SDK mengendalikan polling asinkron secara automatik.
G

Veo 3.1 Pro

Setiap Saat:$0.25
Veo 3.1-Pro merujuk kepada akses/konfigurasi berkeupayaan tinggi bagi keluarga Veo 3.1 daripada Google — satu generasi model video bentuk pendek dengan sokongan audio yang menambah audio natif yang lebih kaya, kawalan penceritaan/penyuntingan yang dipertingkat dan alat peluasan adegan.
G

Veo 3.1

Setiap Saat:$0.05
Veo 3.1 ialah kemas kini bertahap namun signifikan daripada Google kepada keluarga Veo teks dan imej→video miliknya, yang menambah audio natif yang lebih kaya, output video yang lebih panjang dan lebih terkawal, serta suntingan yang lebih halus dan kawalan pada tahap adegan.