ModellenOndersteuningOndernemingBlog
500+ AI Model API, Alles In Één API. Gewoon In CometAPI
Modellen API
Ontwikkelaar
Snelle StartDocumentatieAPI Dashboard
Bronnen
AI-modellenBlogOndernemingWijzigingslogboekOver ons
2025 CometAPI. Alle rechten voorbehouden.PrivacybeleidServicevoorwaarden
Home/Models/Kling/Kling Image Recognize
K

Kling Image Recognize

Per Verzoek:$0.013216
Keling API voor herkenning van beeldelementen, bruikbaar voor videogeneratie met meerdere referentieafbeeldingen, multimodale videobewerkingsfuncties ● Kan objecten, gezichten, kleding enz. herkennen en per verzoek 4 resultaatsets verkrijgen (indien beschikbaar).
Nieuw
Commercieel gebruik
Overzicht
Functies
Prijzen
API

Technical Specifications of kling-image-recognize

SpecificationDetails
Model IDkling-image-recognize
CategoryImage recognition / multimodal analysis
Primary CapabilityRecognizes image elements for downstream creative workflows, including multi-image reference video generation and multimodal video editing
Input TypeImage input
Output TypeStructured recognition results
Recognition ScopeSubjects, faces, clothing, and other visual elements
Result VolumeCan return up to 4 sets of results per request, if available
Use CasesVisual asset analysis, reference preparation for video generation, content understanding for editing pipelines, subject and apparel recognition

What is kling-image-recognize?

kling-image-recognize is a Keling image element recognition API designed to analyze visual content and identify important elements within an image. It is especially useful in workflows that require multi-image reference video generation or multimodal video editing, where understanding the contents of source images is an important preprocessing step.

The model can recognize a range of visual attributes such as subjects, faces, clothing, and related image components. Depending on the input, it can provide up to 4 sets of recognition results in a single request, helping developers capture multiple possible detections or interpretations when available.

Main features of kling-image-recognize

  • Image element recognition: Detects and identifies important visual elements contained in an input image.
  • Subject analysis: Recognizes primary subjects that can be used in downstream media generation or editing workflows.
  • Face recognition support: Extracts face-related recognition results when faces are present in the image.
  • Clothing identification: Detects apparel and clothing-related elements to support more detailed visual understanding.
  • Multi-image reference workflow support: Useful for preparing and analyzing image references used in video generation pipelines.
  • Multimodal video editing compatibility: Helps power editing scenarios where image content needs to be understood before transformation or composition.
  • Multiple result sets per request: Can obtain up to 4 sets of results per request, if available, enabling richer recognition output.
  • Integration-friendly API usage: Suitable for developers building automated media analysis and creative application pipelines.

How to access and integrate kling-image-recognize

Step 1: Sign Up for API Key

To get started, sign up on the CometAPI platform and generate your API key from the dashboard. After obtaining your key, store it securely and use it to authenticate every request to the kling-image-recognize API.

Step 2: Send Requests to kling-image-recognize API

Once you have your API key, send requests to the CometAPI endpoint using kling-image-recognize as the model ID. Include your authentication headers and provide the required image input payload based on your application workflow.

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "kling-image-recognize",
    "input": [
      {
        "role": "user",
        "content": [
          {
            "type": "input_text",
            "text": "Recognize the main visual elements in this image."
          },
          {
            "type": "input_image",
            "image_url": "YOUR_IMAGE_URL"
          }
        ]
      }
    ]
  }'

Step 3: Retrieve and Verify Results

After submission, the API returns recognition results generated by kling-image-recognize. Parse the response in your application, verify the detected subjects or attributes, and store the returned data for use in video generation, editing, or other downstream automation tasks.

Functies voor Kling Image Recognize

<think> 用户要求我将英文文本翻译成荷兰语(Nederlands)。我需要注意: 1. 保持格式和特殊字符(如{} 变量占位符) 2. 技术术语保持准确性 3. 保持语气和风格 4. UI文本要简洁明了 5. 只返回翻译文本,不要添加解释 6. 不要添加任何前缀或说明 原文是: "Explore the key features of Kling Image Recognize, designed to enhance performance and usability. Discover how these capabilities can benefit your projects and improve user experience." 这看起来是产品或技术介绍的文本,需要翻译成荷兰语。我需要保持Kling Image Recognize这个占位符不变。 让我翻译: - Explore = Ontdek/Verken - key features = belangrijkste functies/eigenschappen - designed to enhance = ontworpen om te verbeteren - performance = prestaties - usability = bruikbaarheid - Discover = Ontdek - capabilities = mogelijkheden - benefit = ten goede komen/voordeel opleveren - projects = projecten - improve = verbeteren - user experience = gebruikerservaring 翻译: Ontdek de belangrijkste functies van Kling Image Recognize, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. 不过"Ontdek"出现了两次,可能需要调整一下: Verken de belangrijkste functies van Kling Image Recognize, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring kunnen verbeteren. I'll explore how these capabilities can positively impact your projects and optimize the user experience. </think> Verken de belangrijkste functies van Kling Image Recognize, ontworpen om prestaties en bruikbaarheid te verbeteren. Ontdek hoe deze mogelijkheden uw projecten ten goede kunnen komen en de gebruikerservaring verbeteren.

Prijzen voor Kling Image Recognize

Ontdek concurrerende prijzen voor Kling Image Recognize, ontworpen om te passen bij verschillende budgetten en gebruiksbehoeften. Onze flexibele abonnementen zorgen ervoor dat u alleen betaalt voor wat u gebruikt, waardoor het gemakkelijk is om op te schalen naarmate uw vereisten groeien. Ontdek hoe Kling Image Recognize uw projecten kan verbeteren terwijl de kosten beheersbaar blijven.
Comet Prijs (USD / M Tokens)Officiële Prijs (USD / M Tokens)Korting
Per Verzoek:$0.013216
Per Verzoek:$0.01652
-20%

Voorbeeldcode en API voor Kling Image Recognize

Krijg toegang tot uitgebreide voorbeeldcode en API-bronnen voor Kling Image Recognize om uw integratieproces te stroomlijnen. Onze gedetailleerde documentatie biedt stapsgewijze begeleiding en helpt u het volledige potentieel van Kling Image Recognize in uw projecten te benutten.

Meer modellen

O

Sora 2 Pro

Per Seconde:$0.24
Sora 2 Pro is ons meest geavanceerde en krachtige mediageneratiemodel, in staat om video's met gesynchroniseerde audio te genereren. Het kan gedetailleerde, dynamische videoclips genereren op basis van natuurlijke taal of afbeeldingen.
O

Sora 2

Per Seconde:$0.08
Zeer krachtig model voor videogeneratie, met geluidseffecten, ondersteunt chatformaat.
M

mj_fast_video

Per Verzoek:$0.6
Midjourney video generation
X

Grok Imagine Video

Per Seconde:$0.04
Genereer video's op basis van tekstprompts, animeer stilstaande afbeeldingen of bewerk bestaande video's met natuurlijke taal. De API ondersteunt instelbare duur, beeldverhouding en resolutie voor gegenereerde video's — waarbij de SDK de asynchrone polling automatisch afhandelt.
G

Veo 3.1 Pro

Per Seconde:$0.25
Veo 3.1-Pro verwijst naar de geavanceerde toegang/configuratie van de Veo 3.1-familie van Google — een generatie videomodellen voor kortevormcontent met audio-ondersteuning die rijkere native audio, verbeterde besturingselementen voor verhaal en montage en tools voor scène-uitbreiding toevoegen.
G

Veo 3.1

Per Seconde:$0.05
Veo 3.1 is de stapsgewijze maar aanzienlijke update van Google voor zijn Veo-tekst-en-beeld→videofamilie, met rijkere natieve audio, langere en beter beheersbare videouitvoer en nauwkeurigere bewerkingsmogelijkheden en regelaars op sceneniveau.