ModellerStøtteBedriftBlogg
500+ AI-modell API, Alt I Én API. Bare I CometAPI
Modeller API
Utvikler
HurtigstartDokumentasjonAPI Dashbord
Ressurser
AI-modellerBloggBedriftEndringsloggOm oss
2025 CometAPI. Alle rettigheter reservert.PersonvernerklæringTjenestevilkår
Home/Models/Kling/Kling Image Recognize
K

Kling Image Recognize

Per forespørsel:$0.013216
Keling API for gjenkjenning av bildeelementer, kan brukes til generering av video med flere referansebilder, multimodale videoredigeringsfunksjoner ● Kan gjenkjenne objekter, ansikter, klær osv., og kan hente opptil 4 sett med resultater (hvis tilgjengelig) per forespørsel.
Ny
Kommersiell bruk
Oversikt
Funksjoner
Priser
API

Technical Specifications of kling-image-recognize

SpecificationDetails
Model IDkling-image-recognize
CategoryImage recognition / multimodal analysis
Primary CapabilityRecognizes image elements for downstream creative workflows, including multi-image reference video generation and multimodal video editing
Input TypeImage input
Output TypeStructured recognition results
Recognition ScopeSubjects, faces, clothing, and other visual elements
Result VolumeCan return up to 4 sets of results per request, if available
Use CasesVisual asset analysis, reference preparation for video generation, content understanding for editing pipelines, subject and apparel recognition

What is kling-image-recognize?

kling-image-recognize is a Keling image element recognition API designed to analyze visual content and identify important elements within an image. It is especially useful in workflows that require multi-image reference video generation or multimodal video editing, where understanding the contents of source images is an important preprocessing step.

The model can recognize a range of visual attributes such as subjects, faces, clothing, and related image components. Depending on the input, it can provide up to 4 sets of recognition results in a single request, helping developers capture multiple possible detections or interpretations when available.

Main features of kling-image-recognize

  • Image element recognition: Detects and identifies important visual elements contained in an input image.
  • Subject analysis: Recognizes primary subjects that can be used in downstream media generation or editing workflows.
  • Face recognition support: Extracts face-related recognition results when faces are present in the image.
  • Clothing identification: Detects apparel and clothing-related elements to support more detailed visual understanding.
  • Multi-image reference workflow support: Useful for preparing and analyzing image references used in video generation pipelines.
  • Multimodal video editing compatibility: Helps power editing scenarios where image content needs to be understood before transformation or composition.
  • Multiple result sets per request: Can obtain up to 4 sets of results per request, if available, enabling richer recognition output.
  • Integration-friendly API usage: Suitable for developers building automated media analysis and creative application pipelines.

How to access and integrate kling-image-recognize

Step 1: Sign Up for API Key

To get started, sign up on the CometAPI platform and generate your API key from the dashboard. After obtaining your key, store it securely and use it to authenticate every request to the kling-image-recognize API.

Step 2: Send Requests to kling-image-recognize API

Once you have your API key, send requests to the CometAPI endpoint using kling-image-recognize as the model ID. Include your authentication headers and provide the required image input payload based on your application workflow.

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "kling-image-recognize",
    "input": [
      {
        "role": "user",
        "content": [
          {
            "type": "input_text",
            "text": "Recognize the main visual elements in this image."
          },
          {
            "type": "input_image",
            "image_url": "YOUR_IMAGE_URL"
          }
        ]
      }
    ]
  }'

Step 3: Retrieve and Verify Results

After submission, the API returns recognition results generated by kling-image-recognize. Parse the response in your application, verify the detected subjects or attributes, and store the returned data for use in video generation, editing, or other downstream automation tasks.

Funksjoner for Kling Image Recognize

Utforsk nøkkelfunksjonene til Kling Image Recognize, designet for å forbedre ytelse og brukervennlighet. Oppdag hvordan disse mulighetene kan være til nytte for prosjektene dine og forbedre brukeropplevelsen.

Priser for Kling Image Recognize

Utforsk konkurransedyktige priser for Kling Image Recognize, designet for å passe ulike budsjetter og bruksbehov. Våre fleksible planer sikrer at du bare betaler for det du bruker, noe som gjør det enkelt å skalere etter hvert som kravene dine vokser. Oppdag hvordan Kling Image Recognize kan forbedre prosjektene dine samtidig som kostnadene holdes håndterbare.
Komet-pris (USD / M Tokens)Offisiell pris (USD / M Tokens)Rabatt
Per forespørsel:$0.013216
Per forespørsel:$0.01652
-20%

Eksempelkode og API for Kling Image Recognize

Få tilgang til omfattende eksempelkode og API-ressurser for Kling Image Recognize for å effektivisere integreringsprosessen din. Vår detaljerte dokumentasjon gir trinn-for-trinn-veiledning som hjelper deg med å utnytte det fulle potensialet til Kling Image Recognize i prosjektene dine.

Flere modeller

O

Sora 2 Pro

Per sekund:$0.24
Sora 2 Pro er vår mest avanserte og kraftigste mediegenereringsmodell, som kan generere videoer med synkronisert lyd. Den kan skape detaljerte, dynamiske videoklipp fra naturlig språk eller bilder.
O

Sora 2

Per sekund:$0.08
Superkraftig videogenereringsmodell med lydeffekter som støtter chatformat.
M

mj_fast_video

Per forespørsel:$0.6
Midjourney video generation
X

Grok Imagine Video

Per sekund:$0.04
Generer videoer fra tekstprompter, animer stillbilder eller rediger eksisterende videoer ved hjelp av naturlig språk. API-et støtter konfigurerbar varighet, sideforhold og oppløsning for genererte videoer — og SDK-en håndterer asynkron polling automatisk.
G

Veo 3.1 Pro

Per sekund:$0.25
Veo 3.1-Pro betegner den avanserte tilgangs-/konfigurasjonsvarianten i Googles Veo 3.1-familie — en generasjon videomodeller for kortformat med lydstøtte som tilfører rikere innebygd lyd, forbedrede kontroller for fortelling/redigering og verktøy for utvidelse av scener.
G

Veo 3.1

Per sekund:$0.05
Veo 3.1 er Googles inkrementell, men betydelig oppdatering av sin Veo-familie for tekst- og bilde→video, som tilfører rikere innebygd lyd, lengre og mer kontrollerbare videoutdata og mer presis redigering og kontroller på scenenivå.