ModèlesSupportEntrepriseBlog
500+ API de modèles IA, toutes en une seule API. Simplement avec CometAPI
API des modèles
Développeur
Démarrage rapideDocumentationTableau de bord API
Ressources
Modèles d'IABlogEntrepriseJournal des modificationsÀ propos
2025 CometAPI. Tous droits réservés.Politique de confidentialitéConditions d'utilisation
Home/Models/Kling/Kling Image Recognize
K

Kling Image Recognize

Par requête:$0.013216
API de reconnaissance des éléments d’image Keling, utilisable pour la génération de vidéos à partir de références multi-images, fonctionnalités de montage vidéo multimodales ● Peut reconnaître des sujets, des visages, des vêtements, etc., et peut obtenir 4 ensembles de résultats (si disponibles) par requête.
Nouveau
Usage commercial
Aperçu
Fonctionnalités
Tarification
API

Technical Specifications of kling-image-recognize

SpecificationDetails
Model IDkling-image-recognize
CategoryImage recognition / multimodal analysis
Primary CapabilityRecognizes image elements for downstream creative workflows, including multi-image reference video generation and multimodal video editing
Input TypeImage input
Output TypeStructured recognition results
Recognition ScopeSubjects, faces, clothing, and other visual elements
Result VolumeCan return up to 4 sets of results per request, if available
Use CasesVisual asset analysis, reference preparation for video generation, content understanding for editing pipelines, subject and apparel recognition

What is kling-image-recognize?

kling-image-recognize is a Keling image element recognition API designed to analyze visual content and identify important elements within an image. It is especially useful in workflows that require multi-image reference video generation or multimodal video editing, where understanding the contents of source images is an important preprocessing step.

The model can recognize a range of visual attributes such as subjects, faces, clothing, and related image components. Depending on the input, it can provide up to 4 sets of recognition results in a single request, helping developers capture multiple possible detections or interpretations when available.

Main features of kling-image-recognize

  • Image element recognition: Detects and identifies important visual elements contained in an input image.
  • Subject analysis: Recognizes primary subjects that can be used in downstream media generation or editing workflows.
  • Face recognition support: Extracts face-related recognition results when faces are present in the image.
  • Clothing identification: Detects apparel and clothing-related elements to support more detailed visual understanding.
  • Multi-image reference workflow support: Useful for preparing and analyzing image references used in video generation pipelines.
  • Multimodal video editing compatibility: Helps power editing scenarios where image content needs to be understood before transformation or composition.
  • Multiple result sets per request: Can obtain up to 4 sets of results per request, if available, enabling richer recognition output.
  • Integration-friendly API usage: Suitable for developers building automated media analysis and creative application pipelines.

How to access and integrate kling-image-recognize

Step 1: Sign Up for API Key

To get started, sign up on the CometAPI platform and generate your API key from the dashboard. After obtaining your key, store it securely and use it to authenticate every request to the kling-image-recognize API.

Step 2: Send Requests to kling-image-recognize API

Once you have your API key, send requests to the CometAPI endpoint using kling-image-recognize as the model ID. Include your authentication headers and provide the required image input payload based on your application workflow.

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "kling-image-recognize",
    "input": [
      {
        "role": "user",
        "content": [
          {
            "type": "input_text",
            "text": "Recognize the main visual elements in this image."
          },
          {
            "type": "input_image",
            "image_url": "YOUR_IMAGE_URL"
          }
        ]
      }
    ]
  }'

Step 3: Retrieve and Verify Results

After submission, the API returns recognition results generated by kling-image-recognize. Parse the response in your application, verify the detected subjects or attributes, and store the returned data for use in video generation, editing, or other downstream automation tasks.

Fonctionnalités pour Kling Image Recognize

Découvrez les fonctionnalités clés de Kling Image Recognize, conçues pour améliorer les performances et la facilité d'utilisation. Explorez comment ces capacités peuvent bénéficier à vos projets et améliorer l'expérience utilisateur.

Tarification pour Kling Image Recognize

Découvrez des tarifs compétitifs pour Kling Image Recognize, conçus pour s'adapter à différents budgets et besoins d'utilisation. Nos formules flexibles garantissent que vous ne payez que ce que vous utilisez, ce qui facilite l'adaptation à mesure que vos besoins évoluent. Découvrez comment Kling Image Recognize peut améliorer vos projets tout en maîtrisant les coûts.
Prix de Comet (USD / M Tokens)Prix officiel (USD / M Tokens)Remise
Par requête:$0.013216
Par requête:$0.01652
-20%

Exemple de code et API pour Kling Image Recognize

Accédez à des exemples de code complets et aux ressources API pour Kling Image Recognize afin de simplifier votre processus d'intégration. Notre documentation détaillée fournit des instructions étape par étape pour vous aider à exploiter tout le potentiel de Kling Image Recognize dans vos projets.

Plus de modèles

O

Sora 2 Pro

Par Seconde:$0.24
Sora 2 Pro est notre modèle de génération de médias le plus avancé et le plus puissant, capable de générer des vidéos avec audio synchronisé. Il peut créer des clips vidéo détaillés et dynamiques à partir de langage naturel ou d’images.
O

Sora 2

Par Seconde:$0.08
Modèle de génération vidéo ultra-puissant, avec des effets sonores, prend en charge le format conversationnel.
M

mj_fast_video

Par requête:$0.6
Midjourney video generation
X

Grok Imagine Video

Par Seconde:$0.04
Générez des vidéos à partir d'instructions textuelles, animez des images fixes ou modifiez des vidéos existantes à l'aide du langage naturel. L'API permet de configurer la durée, le ratio d'aspect et la résolution des vidéos générées — le SDK gère automatiquement le sondage asynchrone.
G

Veo 3.1 Pro

Par Seconde:$0.25
Veo 3.1‑Pro désigne l’accès/la configuration à capacités étendues de la famille Veo 3.1 de Google — une génération de modèles vidéo de format court, avec prise en charge de l’audio, qui ajoutent un audio natif plus riche, des contrôles de narration/montage améliorés et des outils d’extension de scène.
G

Veo 3.1

Par Seconde:$0.05
Veo 3.1 est une mise à jour incrémentale mais significative de Google pour sa famille Veo texte-et-image→vidéo, ajoutant un son natif plus riche, des sorties vidéo plus longues et plus facilement contrôlables, ainsi que des outils de montage plus précis et des contrôles au niveau des scènes.