ماڈلزسپورٹانٹرپرائزبلاگ
500+ AI ماڈل API، تمام ایک API میں۔ صرف CometAPI میں
ماڈلز API
ڈویلپر
فوری آغازدستاویزاتAPI ڈیش بورڈ
وسائل
AI ماڈلزبلاگانٹرپرائزتبدیلیوں کا ریکارڈہمارے بارے میں
2025 CometAPI۔ تمام حقوق محفوظ ہیں۔رازداری کی پالیسیخدمات کی شرائط
Home/Models/Kling/Kling Image Recognize
K

Kling Image Recognize

فی درخواست:$0.013216
Keling تصویر کے عناصر کی شناخت کا API، متعدد تصاویر پر مبنی حوالہ جاتی ویڈیو کی تیاری کے لیے قابلِ استعمال، ملٹی موڈل ویڈیو ایڈیٹنگ کی خصوصیات ● موضوعات، چہروں، ملبوسات وغیرہ کی شناخت کر سکتا ہے، اور فی درخواست (اگر دستیاب ہوں) نتائج کے 4 سیٹ حاصل کیے جا سکتے ہیں۔
نیا
تجارتی استعمال
خلاصہ
خصوصیات
قیمت
API

Technical Specifications of kling-image-recognize

SpecificationDetails
Model IDkling-image-recognize
CategoryImage recognition / multimodal analysis
Primary CapabilityRecognizes image elements for downstream creative workflows, including multi-image reference video generation and multimodal video editing
Input TypeImage input
Output TypeStructured recognition results
Recognition ScopeSubjects, faces, clothing, and other visual elements
Result VolumeCan return up to 4 sets of results per request, if available
Use CasesVisual asset analysis, reference preparation for video generation, content understanding for editing pipelines, subject and apparel recognition

What is kling-image-recognize?

kling-image-recognize is a Keling image element recognition API designed to analyze visual content and identify important elements within an image. It is especially useful in workflows that require multi-image reference video generation or multimodal video editing, where understanding the contents of source images is an important preprocessing step.

The model can recognize a range of visual attributes such as subjects, faces, clothing, and related image components. Depending on the input, it can provide up to 4 sets of recognition results in a single request, helping developers capture multiple possible detections or interpretations when available.

Main features of kling-image-recognize

  • Image element recognition: Detects and identifies important visual elements contained in an input image.
  • Subject analysis: Recognizes primary subjects that can be used in downstream media generation or editing workflows.
  • Face recognition support: Extracts face-related recognition results when faces are present in the image.
  • Clothing identification: Detects apparel and clothing-related elements to support more detailed visual understanding.
  • Multi-image reference workflow support: Useful for preparing and analyzing image references used in video generation pipelines.
  • Multimodal video editing compatibility: Helps power editing scenarios where image content needs to be understood before transformation or composition.
  • Multiple result sets per request: Can obtain up to 4 sets of results per request, if available, enabling richer recognition output.
  • Integration-friendly API usage: Suitable for developers building automated media analysis and creative application pipelines.

How to access and integrate kling-image-recognize

Step 1: Sign Up for API Key

To get started, sign up on the CometAPI platform and generate your API key from the dashboard. After obtaining your key, store it securely and use it to authenticate every request to the kling-image-recognize API.

Step 2: Send Requests to kling-image-recognize API

Once you have your API key, send requests to the CometAPI endpoint using kling-image-recognize as the model ID. Include your authentication headers and provide the required image input payload based on your application workflow.

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "kling-image-recognize",
    "input": [
      {
        "role": "user",
        "content": [
          {
            "type": "input_text",
            "text": "Recognize the main visual elements in this image."
          },
          {
            "type": "input_image",
            "image_url": "YOUR_IMAGE_URL"
          }
        ]
      }
    ]
  }'

Step 3: Retrieve and Verify Results

After submission, the API returns recognition results generated by kling-image-recognize. Parse the response in your application, verify the detected subjects or attributes, and store the returned data for use in video generation, editing, or other downstream automation tasks.

Kling Image Recognize کے لیے خصوصیات

[ماڈل کا نام] کی اہم خصوصیات دریافت کریں، جو کارکردگی اور قابل استعمال کو بہتر بنانے کے لیے ڈیزائن کی گئی ہیں۔ جانیں کہ یہ صلاحیتیں آپ کے منصوبوں کو کیسے فائدہ پہنچا سکتی ہیں اور صارف کے تجربے کو بہتر بنا سکتی ہیں۔

Kling Image Recognize کی قیمتیں

[ماڈل کا نام] کے لیے مسابقتی قیمتوں کو دریافت کریں، جو مختلف بجٹ اور استعمال کی ضروریات کے مطابق ڈیزائن کیا گیا ہے۔ ہمارے لچکدار منصوبے اس بات کو یقینی بناتے ہیں کہ آپ صرف اسی کے لیے ادائیگی کریں جو آپ استعمال کرتے ہیں، جس سے آپ کی ضروریات بڑھنے کے ساتھ ساتھ اسکیل کرنا آسان ہو جاتا ہے۔ دریافت کریں کہ [ماڈل کا نام] کیسے آپ کے پروجیکٹس کو بہتر بنا سکتا ہے جبکہ اخراجات کو قابو میں رکھتا ہے۔
Comet قیمت (USD / M Tokens)سرکاری قیمت (USD / M Tokens)رعایت
فی درخواست:$0.013216
فی درخواست:$0.01652
-20%

Kling Image Recognize کے لیے نمونہ کوڈ اور API

Kling Image Recognize کے لیے جامع نمونہ کوڈ اور API وسائل تک رسائی حاصل کریں تاکہ آپ کے انضمام کے عمل کو آسان بنایا جا سکے۔ ہماری تفصیلی دستاویزات قدم بہ قدم رہنمائی فراہم کرتی ہیں، جو آپ کو اپنے پروجیکٹس میں Kling Image Recognize کی مکمل صلاحیت سے فائدہ اٹھانے میں مدد کرتی ہیں۔

مزید ماڈلز

O

Sora 2 Pro

فی سیکنڈ:$0.24
Sora 2 Pro ہمارا سب سے جدید اور طاقتور میڈیا تخلیق کا ماڈل ہے، جو ہم آہنگ آڈیو کے ساتھ ویڈیوز تیار کرنے کی صلاحیت رکھتا ہے۔ یہ قدرتی زبان یا تصاویر سے تفصیلی اور متحرک ویڈیو کلپس بنا سکتا ہے۔
O

Sora 2

فی سیکنڈ:$0.08
انتہائی طاقتور ویڈیو تخلیق کا ماڈل، صوتی اثرات کے ساتھ، چیٹ فارمیٹ کی حمایت کرتا ہے۔
M

mj_fast_video

فی درخواست:$0.6
Midjourney video generation
X

Grok Imagine Video

فی سیکنڈ:$0.04
ٹیکسٹ پرامپٹس سے ویڈیوز تیار کریں، جامد تصاویر کو متحرک بنائیں، یا قدرتی زبان کے ذریعے موجودہ ویڈیوز میں ترمیم کریں۔ API تیار کردہ ویڈیوز کے لیے قابلِ ترتیب دورانیہ، ایسپیکٹ ریشو، اور ریزولوشن کی حمایت کرتی ہے — اور SDK غیر ہم زمانی پولنگ کو خودکار طور پر سنبھالتا ہے۔
G

Veo 3.1 Pro

فی سیکنڈ:$0.25
Veo 3.1-Pro سے مراد Google کی Veo 3.1 فیملی کی اعلیٰ صلاحیتوں والی رسائی/کنفیگریشن ہے — یہ مختصر فارمیٹ، آڈیو سے لیس ویڈیو ماڈلز کی ایک جنریشن ہے جو زیادہ بھرپور بِلٹ اِن آڈیو، بہتر بیانیہ/ایڈیٹنگ کنٹرولز اور سین ایکسٹینشن ٹولز فراہم کرتی ہے۔
G

Veo 3.1

فی سیکنڈ:$0.05
Veo 3.1، Google کی اپنی Veo متن-اور-تصویر→ویڈیو فیملی کے لیے تدریجی مگر معنی خیز اپ ڈیٹ ہے، جس میں مزید بھرپور نیٹو آڈیو، طویل تر اور زیادہ قابلِ کنٹرول ویڈیو آؤٹ پٹس، اور مزید نفیس ایڈیٹنگ اور سین-لیول کنٹرولز شامل ہیں۔