النماذجالدعمالمؤسسةمدونة
أكثر من 500 واجهة برمجة تطبيقات لنماذج الذكاء الاصطناعي، الكل في واجهة واحدة. فقط في CometAPI
واجهة برمجة التطبيقات للنماذج
مطور
البدء السريعالتوثيقلوحة تحكم API
الموارد
نماذج الذكاء الاصطناعيمدونةالمؤسسةالسجل التاريخي للتغييراتحول
2025 CometAPI. جميع الحقوق محفوظة.سياسة الخصوصيةشروط الخدمة
Home/Models/Kling/Kling Image Recognize
K

Kling Image Recognize

لكل طلب:$0.013216
واجهة برمجة تطبيقات Keling للتعرّف على عناصر الصورة، قابلة للاستخدام في إنشاء فيديو مرجعي متعدد الصور، وميزات لتحرير الفيديو متعدد الوسائط ● يمكنها التعرّف على الموضوعات، والوجوه، والملابس، وغير ذلك، ويمكن الحصول على 4 مجموعات من النتائج (إن توفرت) لكل طلب.
جديد
الاستخدام التجاري
نظرة عامة
الميزات
التسعير
API

Technical Specifications of kling-image-recognize

SpecificationDetails
Model IDkling-image-recognize
CategoryImage recognition / multimodal analysis
Primary CapabilityRecognizes image elements for downstream creative workflows, including multi-image reference video generation and multimodal video editing
Input TypeImage input
Output TypeStructured recognition results
Recognition ScopeSubjects, faces, clothing, and other visual elements
Result VolumeCan return up to 4 sets of results per request, if available
Use CasesVisual asset analysis, reference preparation for video generation, content understanding for editing pipelines, subject and apparel recognition

What is kling-image-recognize?

kling-image-recognize is a Keling image element recognition API designed to analyze visual content and identify important elements within an image. It is especially useful in workflows that require multi-image reference video generation or multimodal video editing, where understanding the contents of source images is an important preprocessing step.

The model can recognize a range of visual attributes such as subjects, faces, clothing, and related image components. Depending on the input, it can provide up to 4 sets of recognition results in a single request, helping developers capture multiple possible detections or interpretations when available.

Main features of kling-image-recognize

  • Image element recognition: Detects and identifies important visual elements contained in an input image.
  • Subject analysis: Recognizes primary subjects that can be used in downstream media generation or editing workflows.
  • Face recognition support: Extracts face-related recognition results when faces are present in the image.
  • Clothing identification: Detects apparel and clothing-related elements to support more detailed visual understanding.
  • Multi-image reference workflow support: Useful for preparing and analyzing image references used in video generation pipelines.
  • Multimodal video editing compatibility: Helps power editing scenarios where image content needs to be understood before transformation or composition.
  • Multiple result sets per request: Can obtain up to 4 sets of results per request, if available, enabling richer recognition output.
  • Integration-friendly API usage: Suitable for developers building automated media analysis and creative application pipelines.

How to access and integrate kling-image-recognize

Step 1: Sign Up for API Key

To get started, sign up on the CometAPI platform and generate your API key from the dashboard. After obtaining your key, store it securely and use it to authenticate every request to the kling-image-recognize API.

Step 2: Send Requests to kling-image-recognize API

Once you have your API key, send requests to the CometAPI endpoint using kling-image-recognize as the model ID. Include your authentication headers and provide the required image input payload based on your application workflow.

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "kling-image-recognize",
    "input": [
      {
        "role": "user",
        "content": [
          {
            "type": "input_text",
            "text": "Recognize the main visual elements in this image."
          },
          {
            "type": "input_image",
            "image_url": "YOUR_IMAGE_URL"
          }
        ]
      }
    ]
  }'

Step 3: Retrieve and Verify Results

After submission, the API returns recognition results generated by kling-image-recognize. Parse the response in your application, verify the detected subjects or attributes, and store the returned data for use in video generation, editing, or other downstream automation tasks.

الميزات لـ Kling Image Recognize

استكشف الميزات الرئيسية لـ Kling Image Recognize، المصممة لتعزيز الأداء وسهولة الاستخدام. اكتشف كيف يمكن لهذه القدرات أن تفيد مشاريعك وتحسن تجربة المستخدم.

التسعير لـ Kling Image Recognize

استكشف الأسعار التنافسية لـ Kling Image Recognize، المصمم ليناسب الميزانيات المختلفة واحتياجات الاستخدام المتنوعة. تضمن خططنا المرنة أن تدفع فقط مقابل ما تستخدمه، مما يجعل من السهل التوسع مع نمو متطلباتك. اكتشف كيف يمكن لـ Kling Image Recognize تحسين مشاريعك مع الحفاظ على التكاليف قابلة للإدارة.
سعر كوميت (USD / M Tokens)السعر الرسمي (USD / M Tokens)خصم
لكل طلب:$0.013216
لكل طلب:$0.01652
-20%

نموذج الكود وواجهة برمجة التطبيقات لـ Kling Image Recognize

احصل على أكواد نماذجية شاملة وموارد API لـ Kling Image Recognize لتبسيط عملية التكامل الخاصة بك. توفر وثائقنا التفصيلية إرشادات خطوة بخطوة، مما يساعدك على الاستفادة من الإمكانات الكاملة لـ Kling Image Recognize في مشاريعك.

المزيد من النماذج

O

Sora 2 Pro

في الثانية:$0.24
Sora 2 Pro هو نموذج توليد الوسائط الأكثر تقدمًا وقوة لدينا، وقادر على توليد مقاطع فيديو بصوت متزامن. يمكنه إنشاء مقاطع فيديو مفصلة وديناميكية بالاعتماد على اللغة الطبيعية أو الصور.
O

Sora 2

في الثانية:$0.08
نموذج توليد فيديو فائق القوة، مع مؤثرات صوتية، ويدعم نمط المحادثة.
M

mj_fast_video

لكل طلب:$0.6
Midjourney video generation
X

Grok Imagine Video

في الثانية:$0.04
أنشئ مقاطع فيديو من موجهات نصية، حرّك الصور الثابتة، أو عدّل مقاطع الفيديو الموجودة باستخدام اللغة الطبيعية. تدعم واجهة برمجة التطبيقات (API) ضبط المدة ونسبة العرض إلى الارتفاع والدقة لمقاطع الفيديو المولدة — مع تولّي حزمة تطوير البرمجيات (SDK) الاستقصاء الدوري غير المتزامن تلقائيًا.
G

Veo 3.1 Pro

في الثانية:$0.25
يشير Veo 3.1-Pro إلى وصول/تكوين عالي الإمكانات لعائلة Veo 3.1 من Google — وهو جيل من نماذج الفيديو القصيرة المزوّدة بدعم صوتي، والتي تضيف صوتًا أصليًا أكثر ثراءً، وعناصر تحكم سردية/تحريرية محسّنة، وأدوات لتوسيع المشاهد.
G

Veo 3.1

في الثانية:$0.05
Veo 3.1 هو تحديث تدريجي لكنه مهم من Google لعائلة Veo للنص والصورة→فيديو، ويضيف صوتًا أصليًا أكثر ثراءً، ومخرجات فيديو أطول وأكثر قابلية للتحكم، وتحريرًا أدق وضوابط على مستوى المشهد.