ModelosSoporteEmpresaBlog
500+ API de Modelos de IA, Todo en Una API. Solo en CometAPI
API de Modelos
Desarrollador
Inicio RápidoDocumentaciónPanel de API
Recursos
Modelos de IABlogEmpresaRegistro de cambiosAcerca de
2025 CometAPI. Todos los derechos reservados.Política de PrivacidadTérminos de Servicio
Home/Models/Kling/Kling Image Recognize
K

Kling Image Recognize

Por Solicitud:$0.013216
API de reconocimiento de elementos de imagen de Keling, utilizable para la generación de video con referencia a múltiples imágenes, funciones de edición de video multimodal ● Puede reconocer sujetos, rostros, ropa, etc., y puede obtener 4 conjuntos de resultados (si están disponibles) por solicitud.
Nuevo
Uso comercial
Resumen
Características
Precios
API

Technical Specifications of kling-image-recognize

SpecificationDetails
Model IDkling-image-recognize
CategoryImage recognition / multimodal analysis
Primary CapabilityRecognizes image elements for downstream creative workflows, including multi-image reference video generation and multimodal video editing
Input TypeImage input
Output TypeStructured recognition results
Recognition ScopeSubjects, faces, clothing, and other visual elements
Result VolumeCan return up to 4 sets of results per request, if available
Use CasesVisual asset analysis, reference preparation for video generation, content understanding for editing pipelines, subject and apparel recognition

What is kling-image-recognize?

kling-image-recognize is a Keling image element recognition API designed to analyze visual content and identify important elements within an image. It is especially useful in workflows that require multi-image reference video generation or multimodal video editing, where understanding the contents of source images is an important preprocessing step.

The model can recognize a range of visual attributes such as subjects, faces, clothing, and related image components. Depending on the input, it can provide up to 4 sets of recognition results in a single request, helping developers capture multiple possible detections or interpretations when available.

Main features of kling-image-recognize

  • Image element recognition: Detects and identifies important visual elements contained in an input image.
  • Subject analysis: Recognizes primary subjects that can be used in downstream media generation or editing workflows.
  • Face recognition support: Extracts face-related recognition results when faces are present in the image.
  • Clothing identification: Detects apparel and clothing-related elements to support more detailed visual understanding.
  • Multi-image reference workflow support: Useful for preparing and analyzing image references used in video generation pipelines.
  • Multimodal video editing compatibility: Helps power editing scenarios where image content needs to be understood before transformation or composition.
  • Multiple result sets per request: Can obtain up to 4 sets of results per request, if available, enabling richer recognition output.
  • Integration-friendly API usage: Suitable for developers building automated media analysis and creative application pipelines.

How to access and integrate kling-image-recognize

Step 1: Sign Up for API Key

To get started, sign up on the CometAPI platform and generate your API key from the dashboard. After obtaining your key, store it securely and use it to authenticate every request to the kling-image-recognize API.

Step 2: Send Requests to kling-image-recognize API

Once you have your API key, send requests to the CometAPI endpoint using kling-image-recognize as the model ID. Include your authentication headers and provide the required image input payload based on your application workflow.

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "kling-image-recognize",
    "input": [
      {
        "role": "user",
        "content": [
          {
            "type": "input_text",
            "text": "Recognize the main visual elements in this image."
          },
          {
            "type": "input_image",
            "image_url": "YOUR_IMAGE_URL"
          }
        ]
      }
    ]
  }'

Step 3: Retrieve and Verify Results

After submission, the API returns recognition results generated by kling-image-recognize. Parse the response in your application, verify the detected subjects or attributes, and store the returned data for use in video generation, editing, or other downstream automation tasks.

Características para Kling Image Recognize

Explora las características clave de Kling Image Recognize, diseñado para mejorar el rendimiento y la usabilidad. Descubre cómo estas capacidades pueden beneficiar tus proyectos y mejorar la experiencia del usuario.

Precios para Kling Image Recognize

Explora precios competitivos para Kling Image Recognize, diseñado para adaptarse a diversos presupuestos y necesidades de uso. Nuestros planes flexibles garantizan que solo pagues por lo que uses, facilitando el escalado a medida que crecen tus requisitos. Descubre cómo Kling Image Recognize puede mejorar tus proyectos mientras mantienes los costos manejables.
Precio de Comet (USD / M Tokens)Precio Oficial (USD / M Tokens)Descuento
Por Solicitud:$0.013216
Por Solicitud:$0.01652
-20%

Código de ejemplo y API para Kling Image Recognize

Accede a código de muestra completo y recursos de API para Kling Image Recognize para agilizar tu proceso de integración. Nuestra documentación detallada proporciona orientación paso a paso, ayudándote a aprovechar todo el potencial de Kling Image Recognize en tus proyectos.

Más modelos

O

Sora 2 Pro

Por Segundo:$0.24
Sora 2 Pro es nuestro modelo de generación multimedia más avanzado y potente, capaz de generar videos con audio sincronizado. Puede crear clips de video detallados y dinámicos a partir de lenguaje natural o imágenes.
O

Sora 2

Por Segundo:$0.08
Modelo de generación de video súper potente, con efectos de sonido, admite formato de chat.
M

mj_fast_video

Por Solicitud:$0.6
Midjourney video generation
X

Grok Imagine Video

Por Segundo:$0.04
Genera videos a partir de prompts de texto, anima imágenes fijas o edita videos existentes con lenguaje natural. La API admite duración, relación de aspecto y resolución configurables para los videos generados — y el SDK se encarga automáticamente del sondeo asíncrono.
G

Veo 3.1 Pro

Por Segundo:$0.25
Veo 3.1-Pro se refiere al acceso/configuración de altas prestaciones de la familia Veo 3.1 de Google — una generación de modelos de vídeo de formato corto con audio integrado que incorpora un audio nativo más rico, controles de narrativa y edición mejorados y herramientas de extensión de escenas.
G

Veo 3.1

Por Segundo:$0.05
Veo 3.1 es la actualización incremental pero significativa de Google para su familia Veo de texto e imagen → video, que añade audio nativo más rico, salidas de video más largas y más controlables, y una edición más precisa y controles a nivel de escena más detallados.