Mô hìnhHỗ trợDoanh nghiệpBlog
500+ API Mô hình AI, Tất cả trong Một API. Chỉ cần CometAPI
API Mô hình
Nhà phát triển
Bắt đầu nhanhTài liệuBảng Điều Khiển API
Tài nguyên
Mô hình AIBlogDoanh nghiệpNhật ký thay đổiGiới thiệu
2025 CometAPI. Bảo lưu mọi quyền.Chính sách Bảo mậtĐiều khoản Dịch vụ
Home/Models/Kling/Kling Image Recognize
K

Kling Image Recognize

Theo Yêu cầu:$0.013216
API nhận dạng các thành phần hình ảnh Keling, có thể dùng để tạo video tham chiếu từ nhiều hình ảnh, các tính năng chỉnh sửa video đa mô thức ● Có thể nhận dạng chủ thể, khuôn mặt, trang phục, v.v., và có thể nhận được 4 bộ kết quả (nếu có) cho mỗi yêu cầu.
Mới
Sử dụng thương mại
Tổng quan
Tính năng
Giá cả
API

Technical Specifications of kling-image-recognize

SpecificationDetails
Model IDkling-image-recognize
CategoryImage recognition / multimodal analysis
Primary CapabilityRecognizes image elements for downstream creative workflows, including multi-image reference video generation and multimodal video editing
Input TypeImage input
Output TypeStructured recognition results
Recognition ScopeSubjects, faces, clothing, and other visual elements
Result VolumeCan return up to 4 sets of results per request, if available
Use CasesVisual asset analysis, reference preparation for video generation, content understanding for editing pipelines, subject and apparel recognition

What is kling-image-recognize?

kling-image-recognize is a Keling image element recognition API designed to analyze visual content and identify important elements within an image. It is especially useful in workflows that require multi-image reference video generation or multimodal video editing, where understanding the contents of source images is an important preprocessing step.

The model can recognize a range of visual attributes such as subjects, faces, clothing, and related image components. Depending on the input, it can provide up to 4 sets of recognition results in a single request, helping developers capture multiple possible detections or interpretations when available.

Main features of kling-image-recognize

  • Image element recognition: Detects and identifies important visual elements contained in an input image.
  • Subject analysis: Recognizes primary subjects that can be used in downstream media generation or editing workflows.
  • Face recognition support: Extracts face-related recognition results when faces are present in the image.
  • Clothing identification: Detects apparel and clothing-related elements to support more detailed visual understanding.
  • Multi-image reference workflow support: Useful for preparing and analyzing image references used in video generation pipelines.
  • Multimodal video editing compatibility: Helps power editing scenarios where image content needs to be understood before transformation or composition.
  • Multiple result sets per request: Can obtain up to 4 sets of results per request, if available, enabling richer recognition output.
  • Integration-friendly API usage: Suitable for developers building automated media analysis and creative application pipelines.

How to access and integrate kling-image-recognize

Step 1: Sign Up for API Key

To get started, sign up on the CometAPI platform and generate your API key from the dashboard. After obtaining your key, store it securely and use it to authenticate every request to the kling-image-recognize API.

Step 2: Send Requests to kling-image-recognize API

Once you have your API key, send requests to the CometAPI endpoint using kling-image-recognize as the model ID. Include your authentication headers and provide the required image input payload based on your application workflow.

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "kling-image-recognize",
    "input": [
      {
        "role": "user",
        "content": [
          {
            "type": "input_text",
            "text": "Recognize the main visual elements in this image."
          },
          {
            "type": "input_image",
            "image_url": "YOUR_IMAGE_URL"
          }
        ]
      }
    ]
  }'

Step 3: Retrieve and Verify Results

After submission, the API returns recognition results generated by kling-image-recognize. Parse the response in your application, verify the detected subjects or attributes, and store the returned data for use in video generation, editing, or other downstream automation tasks.

Tính năng cho Kling Image Recognize

Khám phá các tính năng chính của Kling Image Recognize, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.

Giá cả cho Kling Image Recognize

Khám phá mức giá cạnh tranh cho Kling Image Recognize, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách Kling Image Recognize có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Giá Comet (USD / M Tokens)Giá Chính Thức (USD / M Tokens)Giảm giá
Theo Yêu cầu:$0.013216
Theo Yêu cầu:$0.01652
-20%

Mã mẫu và API cho Kling Image Recognize

Truy cập mã mẫu toàn diện và tài nguyên API cho Kling Image Recognize để tối ưu hóa quy trình tích hợp của bạn. Tài liệu chi tiết của chúng tôi cung cấp hướng dẫn từng bước, giúp bạn khai thác toàn bộ tiềm năng của Kling Image Recognize trong các dự án của mình.

Thêm mô hình

O

Sora 2 Pro

Mỗi Giây:$0.24
Sora 2 Pro là mô hình tạo sinh đa phương tiện tiên tiến và mạnh mẽ nhất của chúng tôi, có khả năng tạo video với âm thanh được đồng bộ hóa. Nó có thể tạo các đoạn video chi tiết, sinh động từ ngôn ngữ tự nhiên hoặc hình ảnh.
O

Sora 2

Mỗi Giây:$0.08
Mô hình tạo video siêu mạnh mẽ, kèm hiệu ứng âm thanh, hỗ trợ định dạng chat.
M

mj_fast_video

Theo Yêu cầu:$0.6
Midjourney video generation
X

Grok Imagine Video

Mỗi Giây:$0.04
Tạo video từ prompt văn bản, làm động ảnh tĩnh hoặc chỉnh sửa video hiện có bằng ngôn ngữ tự nhiên. API hỗ trợ cấu hình thời lượng, tỷ lệ khung hình và độ phân giải cho các video được tạo — với SDK tự động xử lý việc thăm dò bất đồng bộ.
G

Veo 3.1 Pro

Mỗi Giây:$0.25
Veo 3.1-Pro đề cập đến quyền truy cập/cấu hình có khả năng cao của dòng Veo 3.1 của Google — một thế hệ mô hình video dạng ngắn, có hỗ trợ âm thanh, bổ sung âm thanh gốc phong phú hơn, các điều khiển tường thuật/chỉnh sửa được cải thiện và các công cụ mở rộng cảnh.
G

Veo 3.1

Mỗi Giây:$0.05
Veo 3.1 là bản cập nhật tiệm tiến nhưng đáng kể của Google cho dòng Veo chuyển đổi văn bản và hình ảnh→video, bổ sung âm thanh gốc phong phú hơn, đầu ra video dài hơn và dễ kiểm soát hơn, cùng khả năng chỉnh sửa tinh vi và điều khiển ở cấp độ cảnh.