МодельдерҚолдауКәсіпорынБлог
500+ AI Model API, Барлығы Бір API-да. Тек CometAPI-де
Модельдер API
Әзірлеуші
Жылдам бастауҚұжаттамаAPI Бақылау Тақтасы
Ресурстар
AI МодельдеріБлогКәсіпорынӨзгерістер журналыБіз туралы
2025 CometAPI. Барлық құқықтар қорғалған.Құпиялылық саясатыҚызмет көрсету шарттары
Home/Models/Kling/Kling Image Recognize
K

Kling Image Recognize

Сұраным бойынша:$0.013216
Keling сурет элементтерін тану API, бірнеше үлгі суретке негізделген бейне генерациясында қолдануға болады, мультимодальды бейне өңдеу мүмкіндіктері ● Нысандарды, бет-әлпеттерді, киім-кешекті және т.б. тани алады, әрі әрбір сұраным бойынша (қолжетімді болса) 4 нәтиже жиынтығын ала алады.
Жаңа
Коммерциялық пайдалану
Шолу
Мүмкіндіктер
Баға белгілеу
API

Technical Specifications of kling-image-recognize

SpecificationDetails
Model IDkling-image-recognize
CategoryImage recognition / multimodal analysis
Primary CapabilityRecognizes image elements for downstream creative workflows, including multi-image reference video generation and multimodal video editing
Input TypeImage input
Output TypeStructured recognition results
Recognition ScopeSubjects, faces, clothing, and other visual elements
Result VolumeCan return up to 4 sets of results per request, if available
Use CasesVisual asset analysis, reference preparation for video generation, content understanding for editing pipelines, subject and apparel recognition

What is kling-image-recognize?

kling-image-recognize is a Keling image element recognition API designed to analyze visual content and identify important elements within an image. It is especially useful in workflows that require multi-image reference video generation or multimodal video editing, where understanding the contents of source images is an important preprocessing step.

The model can recognize a range of visual attributes such as subjects, faces, clothing, and related image components. Depending on the input, it can provide up to 4 sets of recognition results in a single request, helping developers capture multiple possible detections or interpretations when available.

Main features of kling-image-recognize

  • Image element recognition: Detects and identifies important visual elements contained in an input image.
  • Subject analysis: Recognizes primary subjects that can be used in downstream media generation or editing workflows.
  • Face recognition support: Extracts face-related recognition results when faces are present in the image.
  • Clothing identification: Detects apparel and clothing-related elements to support more detailed visual understanding.
  • Multi-image reference workflow support: Useful for preparing and analyzing image references used in video generation pipelines.
  • Multimodal video editing compatibility: Helps power editing scenarios where image content needs to be understood before transformation or composition.
  • Multiple result sets per request: Can obtain up to 4 sets of results per request, if available, enabling richer recognition output.
  • Integration-friendly API usage: Suitable for developers building automated media analysis and creative application pipelines.

How to access and integrate kling-image-recognize

Step 1: Sign Up for API Key

To get started, sign up on the CometAPI platform and generate your API key from the dashboard. After obtaining your key, store it securely and use it to authenticate every request to the kling-image-recognize API.

Step 2: Send Requests to kling-image-recognize API

Once you have your API key, send requests to the CometAPI endpoint using kling-image-recognize as the model ID. Include your authentication headers and provide the required image input payload based on your application workflow.

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "kling-image-recognize",
    "input": [
      {
        "role": "user",
        "content": [
          {
            "type": "input_text",
            "text": "Recognize the main visual elements in this image."
          },
          {
            "type": "input_image",
            "image_url": "YOUR_IMAGE_URL"
          }
        ]
      }
    ]
  }'

Step 3: Retrieve and Verify Results

After submission, the API returns recognition results generated by kling-image-recognize. Parse the response in your application, verify the detected subjects or attributes, and store the returned data for use in video generation, editing, or other downstream automation tasks.

Kling Image Recognize үшін мүмкіндіктер

[Модель атауы] негізгі мүмкіндіктерін зерттеңіз, олар өнімділік пен пайдалану ыңғайлылығын арттыруға арналған. Бұл мүмкіндіктердің сіздің жобаларыңызға қалай пайда әкелетінін және пайдаланушы тәжірибесін қалай жақсартатынын біліңіз.

Kling Image Recognize үшін баға белгілеу

[Модель атауы] үшін әртүрлі бюджеттер мен пайдалану қажеттіліктеріне сәйкес келетін бәсекеге қабілетті баға белгілеуді зерттеңіз. Біздің икемді жоспарларымыз сіз тек пайдаланған нәрсеңіз үшін ғана төлеуіңізді қамтамасыз етеді, бұл сіздің талаптарыңыз өскен сайын масштабтауды жеңілдетеді. [Модель атауы] шығындарды басқарылатын деңгейде ұстай отырып, сіздің жобаларыңызды қалай жақсарта алатынын біліңіз.
Комета бағасы (USD / M Tokens)Ресми баға (USD / M Tokens)Жеңілдік
Сұраным бойынша:$0.013216
Сұраным бойынша:$0.01652
-20%

Kling Image Recognize үшін үлгі код және API

[Модель атауы] үшін кешенді үлгі кодтары мен API ресурстарына қол жеткізіп, интеграция процесіңізді жеңілдетіңіз. Біздің толық құжаттама қадам-қадаммен нұсқаулық береді, жобаларыңызда [Модель атауы] мүмкіндіктерін толық пайдалануға көмектеседі.

Көбірек модельдер

O

Sora 2 Pro

Секундына:$0.24
Sora 2 Pro — аудиомен синхрондалған бейнелерді жасай алатын, біздің ең озық әрі қуатты медиа генерациялау моделіміз. Ол табиғи тілден немесе кескіндерден егжей-тегжейлі, динамикалық бейне клиптер жасай алады.
O

Sora 2

Секундына:$0.08
Аса қуатты генеративті бейне модель, дыбыстық әсерлері бар, чат пішімін қолдайды.
M

mj_fast_video

Сұраным бойынша:$0.6
Midjourney video generation
X

Grok Imagine Video

Секундына:$0.04
Мәтіндік промпттардан видеолар жасаңыз, статикалық суреттерді анимациялаңыз немесе табиғи тіл арқылы бар видеоларды өңдеңіз. API жасалатын видеолардың ұзақтығын, аспект қатынасын және ажыратымдылығын баптауды қолдайды — асинхронды поллингті SDK автоматты түрде жүргізеді.
G

Veo 3.1 Pro

Секундына:$0.25
Veo 3.1-Pro Google-дың Veo 3.1 отбасының жоғары мүмкіндікті қолжетімділігі/конфигурациясын білдіреді — бұл қысқа форматтағы, аудио қолдауы бар бейне модельдерінің буыны, ол одан да бай нативті аудионы, жақсартылған баяндау/монтажды басқару элементтерін және сахнаны кеңейту құралдарын ұсынады.
G

Veo 3.1

Секундына:$0.05
Veo 3.1 — Google компаниясының Veo мәтін мен кескін→бейне модельдер отбасына арналған эволюциялық, бірақ елеулі жаңарту, ол неғұрлым бай нативті аудионы, ұзағырақ әрі басқаруға көбірек икемді бейне нәтижелерін және неғұрлым нәзік өңдеу мен көрініс деңгейіндегі басқару мүмкіндіктерін енгізеді.