ModelosSuporteEmpresarialBlog
500+ APIs de Modelos de IA, Tudo em Uma API. Apenas na CometAPI
API de Modelos
Desenvolvedor
Início RápidoDocumentaçãoPainel de API
Recursos
Modelos de IABlogEmpresarialRegistro de AlteraçõesSobre
2025 CometAPI. Todos os direitos reservados.Política de PrivacidadeTermos de Serviço
Home/Models/Kling/Kling Image Recognize
K

Kling Image Recognize

Por Solicitação:$0.013216
API de reconhecimento de elementos de imagem Keling, utilizável para geração de vídeo por referência de múltiplas imagens, recursos de edição de vídeo multimodal ● Pode reconhecer sujeitos, rostos, roupas etc., e pode obter 4 conjuntos de resultados (se disponíveis) por requisição.
Novo
Uso comercial
Visão Geral
Recursos
Preços
API

Technical Specifications of kling-image-recognize

SpecificationDetails
Model IDkling-image-recognize
CategoryImage recognition / multimodal analysis
Primary CapabilityRecognizes image elements for downstream creative workflows, including multi-image reference video generation and multimodal video editing
Input TypeImage input
Output TypeStructured recognition results
Recognition ScopeSubjects, faces, clothing, and other visual elements
Result VolumeCan return up to 4 sets of results per request, if available
Use CasesVisual asset analysis, reference preparation for video generation, content understanding for editing pipelines, subject and apparel recognition

What is kling-image-recognize?

kling-image-recognize is a Keling image element recognition API designed to analyze visual content and identify important elements within an image. It is especially useful in workflows that require multi-image reference video generation or multimodal video editing, where understanding the contents of source images is an important preprocessing step.

The model can recognize a range of visual attributes such as subjects, faces, clothing, and related image components. Depending on the input, it can provide up to 4 sets of recognition results in a single request, helping developers capture multiple possible detections or interpretations when available.

Main features of kling-image-recognize

  • Image element recognition: Detects and identifies important visual elements contained in an input image.
  • Subject analysis: Recognizes primary subjects that can be used in downstream media generation or editing workflows.
  • Face recognition support: Extracts face-related recognition results when faces are present in the image.
  • Clothing identification: Detects apparel and clothing-related elements to support more detailed visual understanding.
  • Multi-image reference workflow support: Useful for preparing and analyzing image references used in video generation pipelines.
  • Multimodal video editing compatibility: Helps power editing scenarios where image content needs to be understood before transformation or composition.
  • Multiple result sets per request: Can obtain up to 4 sets of results per request, if available, enabling richer recognition output.
  • Integration-friendly API usage: Suitable for developers building automated media analysis and creative application pipelines.

How to access and integrate kling-image-recognize

Step 1: Sign Up for API Key

To get started, sign up on the CometAPI platform and generate your API key from the dashboard. After obtaining your key, store it securely and use it to authenticate every request to the kling-image-recognize API.

Step 2: Send Requests to kling-image-recognize API

Once you have your API key, send requests to the CometAPI endpoint using kling-image-recognize as the model ID. Include your authentication headers and provide the required image input payload based on your application workflow.

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "kling-image-recognize",
    "input": [
      {
        "role": "user",
        "content": [
          {
            "type": "input_text",
            "text": "Recognize the main visual elements in this image."
          },
          {
            "type": "input_image",
            "image_url": "YOUR_IMAGE_URL"
          }
        ]
      }
    ]
  }'

Step 3: Retrieve and Verify Results

After submission, the API returns recognition results generated by kling-image-recognize. Parse the response in your application, verify the detected subjects or attributes, and store the returned data for use in video generation, editing, or other downstream automation tasks.

Recursos para Kling Image Recognize

Explore os principais recursos do Kling Image Recognize, projetado para aprimorar o desempenho e a usabilidade. Descubra como essas capacidades podem beneficiar seus projetos e melhorar a experiência do usuário.

Preços para Kling Image Recognize

Explore preços competitivos para Kling Image Recognize, projetado para atender diversos orçamentos e necessidades de uso. Nossos planos flexíveis garantem que você pague apenas pelo que usar, facilitando o dimensionamento conforme suas necessidades crescem. Descubra como Kling Image Recognize pode aprimorar seus projetos mantendo os custos gerenciáveis.
Preço do Comet (USD / M Tokens)Preço Oficial (USD / M Tokens)Desconto
Por Solicitação:$0.013216
Por Solicitação:$0.01652
-20%

Código de exemplo e API para Kling Image Recognize

Acesse código de exemplo abrangente e recursos de API para Kling Image Recognize para otimizar seu processo de integração. Nossa documentação detalhada fornece orientação passo a passo, ajudando você a aproveitar todo o potencial do Kling Image Recognize em seus projetos.

Mais modelos

O

Sora 2 Pro

Por Segundo:$0.24
Sora 2 Pro é nosso modelo de geração de mídia mais avançado e poderoso, capaz de gerar vídeos com áudio sincronizado. Ele pode criar clipes de vídeo detalhados e dinâmicos a partir de linguagem natural ou imagens.
O

Sora 2

Por Segundo:$0.08
Modelo de geração de vídeo superpotente, com efeitos sonoros, suporta o formato de chat.
M

mj_fast_video

Por Solicitação:$0.6
Midjourney video generation
X

Grok Imagine Video

Por Segundo:$0.04
Gere vídeos a partir de prompts de texto, anime imagens estáticas ou edite vídeos existentes com linguagem natural. A API suporta duração, proporção de aspecto e resolução configuráveis para os vídeos gerados — com o SDK gerenciando automaticamente o polling assíncrono.
G

Veo 3.1 Pro

Por Segundo:$0.25
Veo 3.1-Pro refere-se ao acesso/configuração avançados da família Veo 3.1 do Google — uma geração de modelos de vídeo de curta duração, com suporte a áudio, que acrescentam áudio nativo mais rico, controles de narrativa/edição aprimorados e ferramentas de extensão de cenas.
G

Veo 3.1

Por Segundo:$0.05
Veo 3.1 é a atualização incremental, porém significativa, da família Veo de texto e imagem→vídeo do Google, adicionando áudio nativo mais rico, saídas de vídeo mais longas e mais controláveis e controles de edição e em nível de cena mais refinados.