ModeleWsparciePrzedsiębiorstwoBlog
Ponad 500 API modeli AI, wszystko w jednym API. Tylko w CometAPI
API modeli
Deweloper
Szybki startDokumentacjaPanel API
Zasoby
Modele Sztucznej InteligencjiBlogPrzedsiębiorstwoDziennik zmianO nas
2025 CometAPI. Wszelkie prawa zastrzeżone.Polityka PrywatnościWarunki korzystania z usługi
Home/Models/Kling/Kling Image Recognize
K

Kling Image Recognize

Na żądanie:$0.013216
API rozpoznawania elementów obrazu Keling, użyteczne do generowania wideo na podstawie wielu obrazów referencyjnych, funkcje multimodalnej edycji wideo ● Może rozpoznawać obiekty, twarze, odzież itp., i w każdym żądaniu może uzyskać 4 zestawy wyników (jeśli są dostępne).
Nowy
Użycie komercyjne
Przegląd
Funkcje
Cennik
API

Technical Specifications of kling-image-recognize

SpecificationDetails
Model IDkling-image-recognize
CategoryImage recognition / multimodal analysis
Primary CapabilityRecognizes image elements for downstream creative workflows, including multi-image reference video generation and multimodal video editing
Input TypeImage input
Output TypeStructured recognition results
Recognition ScopeSubjects, faces, clothing, and other visual elements
Result VolumeCan return up to 4 sets of results per request, if available
Use CasesVisual asset analysis, reference preparation for video generation, content understanding for editing pipelines, subject and apparel recognition

What is kling-image-recognize?

kling-image-recognize is a Keling image element recognition API designed to analyze visual content and identify important elements within an image. It is especially useful in workflows that require multi-image reference video generation or multimodal video editing, where understanding the contents of source images is an important preprocessing step.

The model can recognize a range of visual attributes such as subjects, faces, clothing, and related image components. Depending on the input, it can provide up to 4 sets of recognition results in a single request, helping developers capture multiple possible detections or interpretations when available.

Main features of kling-image-recognize

  • Image element recognition: Detects and identifies important visual elements contained in an input image.
  • Subject analysis: Recognizes primary subjects that can be used in downstream media generation or editing workflows.
  • Face recognition support: Extracts face-related recognition results when faces are present in the image.
  • Clothing identification: Detects apparel and clothing-related elements to support more detailed visual understanding.
  • Multi-image reference workflow support: Useful for preparing and analyzing image references used in video generation pipelines.
  • Multimodal video editing compatibility: Helps power editing scenarios where image content needs to be understood before transformation or composition.
  • Multiple result sets per request: Can obtain up to 4 sets of results per request, if available, enabling richer recognition output.
  • Integration-friendly API usage: Suitable for developers building automated media analysis and creative application pipelines.

How to access and integrate kling-image-recognize

Step 1: Sign Up for API Key

To get started, sign up on the CometAPI platform and generate your API key from the dashboard. After obtaining your key, store it securely and use it to authenticate every request to the kling-image-recognize API.

Step 2: Send Requests to kling-image-recognize API

Once you have your API key, send requests to the CometAPI endpoint using kling-image-recognize as the model ID. Include your authentication headers and provide the required image input payload based on your application workflow.

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "kling-image-recognize",
    "input": [
      {
        "role": "user",
        "content": [
          {
            "type": "input_text",
            "text": "Recognize the main visual elements in this image."
          },
          {
            "type": "input_image",
            "image_url": "YOUR_IMAGE_URL"
          }
        ]
      }
    ]
  }'

Step 3: Retrieve and Verify Results

After submission, the API returns recognition results generated by kling-image-recognize. Parse the response in your application, verify the detected subjects or attributes, and store the returned data for use in video generation, editing, or other downstream automation tasks.

Funkcje dla Kling Image Recognize

Poznaj kluczowe funkcje Kling Image Recognize, zaprojektowane w celu zwiększenia wydajności i użyteczności. Odkryj, jak te możliwości mogą przynieść korzyści Twoim projektom i poprawić doświadczenie użytkownika.

Cennik dla Kling Image Recognize

Poznaj konkurencyjne ceny dla Kling Image Recognize, zaprojektowane tak, aby pasowały do różnych budżetów i potrzeb użytkowania. Nasze elastyczne plany zapewniają, że płacisz tylko za to, czego używasz, co ułatwia skalowanie w miarę wzrostu Twoich wymagań. Odkryj, jak Kling Image Recognize może ulepszyć Twoje projekty przy jednoczesnym utrzymaniu kosztów na rozsądnym poziomie.
Cena Comet (USD / M Tokens)Oficjalna cena (USD / M Tokens)Zniżka
Na żądanie:$0.013216
Na żądanie:$0.01652
-20%

Przykładowy kod i API dla Kling Image Recognize

Uzyskaj dostęp do kompleksowego przykładowego kodu i zasobów API dla Kling Image Recognize, aby usprawnić proces integracji. Nasza szczegółowa dokumentacja zapewnia wskazówki krok po kroku, pomagając wykorzystać pełny potencjał Kling Image Recognize w Twoich projektach.

Więcej modeli

O

Sora 2 Pro

Na Sekundę:$0.24
Sora 2 Pro to nasz najbardziej zaawansowany i najpotężniejszy model generowania multimediów, zdolny do generowania wideo z zsynchronizowanym dźwiękiem. Może tworzyć szczegółowe, dynamiczne klipy wideo na podstawie języka naturalnego lub obrazów.
O

Sora 2

Na Sekundę:$0.08
Niezwykle potężny model generowania wideo, z efektami dźwiękowymi, obsługuje format czatu.
M

mj_fast_video

Na żądanie:$0.6
Midjourney video generation
X

Grok Imagine Video

Na Sekundę:$0.04
Generuj materiały wideo na podstawie promptów tekstowych, animuj statyczne obrazy lub edytuj istniejące materiały wideo za pomocą języka naturalnego. API obsługuje konfigurowalny czas trwania, proporcje obrazu i rozdzielczość generowanych materiałów wideo — przy czym SDK automatycznie obsługuje asynchroniczne odpytywanie.
G

Veo 3.1 Pro

Na Sekundę:$0.25
Veo 3.1‑Pro oznacza dostęp/konfigurację o wysokich możliwościach w rodzinie Veo 3.1 firmy Google — generacji modeli wideo do krótkich form z obsługą audio, które wprowadzają bogatsze natywne audio, ulepszone narzędzia sterowania narracją i montażem oraz narzędzia do rozszerzania scen.
G

Veo 3.1

Na Sekundę:$0.05
Veo 3.1 to inkrementalna, lecz znacząca aktualizacja Google’a rodziny Veo typu tekst‑i‑obraz→wideo, wprowadzająca bogatsze natywne audio, dłuższe i lepiej kontrolowalne materiały wideo oraz bardziej precyzyjną edycję i sterowanie na poziomie scen.