ModelliSupportoAziendaBlog
500+ API di Modelli AI, Tutto In Una Sola API. Solo In CometAPI
API dei Modelli
Sviluppatore
Avvio RapidoDocumentazioneDashboard API
Risorse
Modelli di Intelligenza ArtificialeBlogAziendaRegistro delle modificheChi siamo
2025 CometAPI. Tutti i diritti riservati.Informativa sulla PrivacyTermini di Servizio
Home/Models/Kling/Kling Image Recognize
K

Kling Image Recognize

Per Richiesta:$0.013216
API di riconoscimento degli elementi dell'immagine Keling, utilizzabile per la generazione di video con riferimento multi-immagine, funzionalità di editing video multimodale ● Può riconoscere soggetti, volti, abbigliamento, ecc., e può ottenere 4 set di risultati (se disponibili) per richiesta.
Nuovo
Uso commerciale
Panoramica
Caratteristiche
Prezzi
API

Technical Specifications of kling-image-recognize

SpecificationDetails
Model IDkling-image-recognize
CategoryImage recognition / multimodal analysis
Primary CapabilityRecognizes image elements for downstream creative workflows, including multi-image reference video generation and multimodal video editing
Input TypeImage input
Output TypeStructured recognition results
Recognition ScopeSubjects, faces, clothing, and other visual elements
Result VolumeCan return up to 4 sets of results per request, if available
Use CasesVisual asset analysis, reference preparation for video generation, content understanding for editing pipelines, subject and apparel recognition

What is kling-image-recognize?

kling-image-recognize is a Keling image element recognition API designed to analyze visual content and identify important elements within an image. It is especially useful in workflows that require multi-image reference video generation or multimodal video editing, where understanding the contents of source images is an important preprocessing step.

The model can recognize a range of visual attributes such as subjects, faces, clothing, and related image components. Depending on the input, it can provide up to 4 sets of recognition results in a single request, helping developers capture multiple possible detections or interpretations when available.

Main features of kling-image-recognize

  • Image element recognition: Detects and identifies important visual elements contained in an input image.
  • Subject analysis: Recognizes primary subjects that can be used in downstream media generation or editing workflows.
  • Face recognition support: Extracts face-related recognition results when faces are present in the image.
  • Clothing identification: Detects apparel and clothing-related elements to support more detailed visual understanding.
  • Multi-image reference workflow support: Useful for preparing and analyzing image references used in video generation pipelines.
  • Multimodal video editing compatibility: Helps power editing scenarios where image content needs to be understood before transformation or composition.
  • Multiple result sets per request: Can obtain up to 4 sets of results per request, if available, enabling richer recognition output.
  • Integration-friendly API usage: Suitable for developers building automated media analysis and creative application pipelines.

How to access and integrate kling-image-recognize

Step 1: Sign Up for API Key

To get started, sign up on the CometAPI platform and generate your API key from the dashboard. After obtaining your key, store it securely and use it to authenticate every request to the kling-image-recognize API.

Step 2: Send Requests to kling-image-recognize API

Once you have your API key, send requests to the CometAPI endpoint using kling-image-recognize as the model ID. Include your authentication headers and provide the required image input payload based on your application workflow.

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "kling-image-recognize",
    "input": [
      {
        "role": "user",
        "content": [
          {
            "type": "input_text",
            "text": "Recognize the main visual elements in this image."
          },
          {
            "type": "input_image",
            "image_url": "YOUR_IMAGE_URL"
          }
        ]
      }
    ]
  }'

Step 3: Retrieve and Verify Results

After submission, the API returns recognition results generated by kling-image-recognize. Parse the response in your application, verify the detected subjects or attributes, and store the returned data for use in video generation, editing, or other downstream automation tasks.

Funzionalità per Kling Image Recognize

Esplora le caratteristiche principali di Kling Image Recognize, progettato per migliorare le prestazioni e l'usabilità. Scopri come queste funzionalità possono beneficiare i tuoi progetti e migliorare l'esperienza utente.

Prezzi per Kling Image Recognize

Esplora i prezzi competitivi per Kling Image Recognize, progettato per adattarsi a vari budget e necessità di utilizzo. I nostri piani flessibili garantiscono che paghi solo per quello che usi, rendendo facile scalare man mano che i tuoi requisiti crescono. Scopri come Kling Image Recognize può migliorare i tuoi progetti mantenendo i costi gestibili.
Prezzo Comet (USD / M Tokens)Prezzo Ufficiale (USD / M Tokens)Sconto
Per Richiesta:$0.013216
Per Richiesta:$0.01652
-20%

Codice di esempio e API per Kling Image Recognize

Accedi a codice di esempio completo e risorse API per Kling Image Recognize per semplificare il tuo processo di integrazione. La nostra documentazione dettagliata fornisce una guida passo dopo passo, aiutandoti a sfruttare appieno il potenziale di Kling Image Recognize nei tuoi progetti.

Altri modelli

O

Sora 2 Pro

Al Secondo:$0.24
Sora 2 Pro è il nostro modello di generazione di contenuti multimediali più avanzato e potente, in grado di generare video con audio sincronizzato. Può creare clip video dettagliate e dinamiche a partire da linguaggio naturale o immagini.
O

Sora 2

Al Secondo:$0.08
Modello di generazione di video estremamente potente, con effetti sonori e supporto per il formato chat.
M

mj_fast_video

Per Richiesta:$0.6
Midjourney video generation
X

Grok Imagine Video

Al Secondo:$0.04
Genera video da prompt testuali, anima immagini statiche o modifica video esistenti con il linguaggio naturale. L'API supporta la configurazione di durata, rapporto d'aspetto e risoluzione per i video generati — con l'SDK che gestisce automaticamente il polling asincrono.
G

Veo 3.1 Pro

Al Secondo:$0.25
Veo 3.1-Pro si riferisce all’accesso/configurazione con capacità elevate della famiglia Veo 3.1 di Google — una generazione di modelli video in formato breve, con supporto audio, che aggiungono un audio nativo più ricco, controlli narrativi/di montaggio migliorati e strumenti per l’estensione delle scene.
G

Veo 3.1

Al Secondo:$0.05
Veo 3.1 è l'aggiornamento incrementale ma significativo di Google alla sua famiglia Veo testo-e-immagine→video, che introduce audio nativo più ricco, output video più lunghi e più controllabili e controlli di editing più precisi e a livello di scena.