ModelleSupportUnternehmenBlog
500+ KI-Modell-APIs, Alles in einer API. Nur bei CometAPI
Modelle-API
Entwickler
SchnellstartDokumentationAPI Dashboard
Ressourcen
KI-ModelleBlogUnternehmenÄnderungsprotokollÜber uns
2025 CometAPI. Alle Rechte vorbehalten.DatenschutzrichtlinieNutzungsbedingungen
Home/Models/Kling/Kling Image Recognize
K

Kling Image Recognize

Pro Anfrage:$0.013216
Keling API zur Erkennung von Bildelementen, nutzbar für die Videogenerierung mit mehreren Referenzbildern, multimodale Videobearbeitungsfunktionen ● Erkennt Motive, Gesichter, Kleidung usw. und liefert pro Anfrage bis zu 4 Ergebnissätze (falls verfügbar).
Neu
Kommerzielle Nutzung
Überblick
Funktionen
Preisgestaltung
API

Technical Specifications of kling-image-recognize

SpecificationDetails
Model IDkling-image-recognize
CategoryImage recognition / multimodal analysis
Primary CapabilityRecognizes image elements for downstream creative workflows, including multi-image reference video generation and multimodal video editing
Input TypeImage input
Output TypeStructured recognition results
Recognition ScopeSubjects, faces, clothing, and other visual elements
Result VolumeCan return up to 4 sets of results per request, if available
Use CasesVisual asset analysis, reference preparation for video generation, content understanding for editing pipelines, subject and apparel recognition

What is kling-image-recognize?

kling-image-recognize is a Keling image element recognition API designed to analyze visual content and identify important elements within an image. It is especially useful in workflows that require multi-image reference video generation or multimodal video editing, where understanding the contents of source images is an important preprocessing step.

The model can recognize a range of visual attributes such as subjects, faces, clothing, and related image components. Depending on the input, it can provide up to 4 sets of recognition results in a single request, helping developers capture multiple possible detections or interpretations when available.

Main features of kling-image-recognize

  • Image element recognition: Detects and identifies important visual elements contained in an input image.
  • Subject analysis: Recognizes primary subjects that can be used in downstream media generation or editing workflows.
  • Face recognition support: Extracts face-related recognition results when faces are present in the image.
  • Clothing identification: Detects apparel and clothing-related elements to support more detailed visual understanding.
  • Multi-image reference workflow support: Useful for preparing and analyzing image references used in video generation pipelines.
  • Multimodal video editing compatibility: Helps power editing scenarios where image content needs to be understood before transformation or composition.
  • Multiple result sets per request: Can obtain up to 4 sets of results per request, if available, enabling richer recognition output.
  • Integration-friendly API usage: Suitable for developers building automated media analysis and creative application pipelines.

How to access and integrate kling-image-recognize

Step 1: Sign Up for API Key

To get started, sign up on the CometAPI platform and generate your API key from the dashboard. After obtaining your key, store it securely and use it to authenticate every request to the kling-image-recognize API.

Step 2: Send Requests to kling-image-recognize API

Once you have your API key, send requests to the CometAPI endpoint using kling-image-recognize as the model ID. Include your authentication headers and provide the required image input payload based on your application workflow.

curl --request POST \
  --url https://api.cometapi.com/v1/responses \
  --header "Authorization: Bearer YOUR_COMETAPI_KEY" \
  --header "Content-Type: application/json" \
  --data '{
    "model": "kling-image-recognize",
    "input": [
      {
        "role": "user",
        "content": [
          {
            "type": "input_text",
            "text": "Recognize the main visual elements in this image."
          },
          {
            "type": "input_image",
            "image_url": "YOUR_IMAGE_URL"
          }
        ]
      }
    ]
  }'

Step 3: Retrieve and Verify Results

After submission, the API returns recognition results generated by kling-image-recognize. Parse the response in your application, verify the detected subjects or attributes, and store the returned data for use in video generation, editing, or other downstream automation tasks.

Funktionen für Kling Image Recognize

Entdecken Sie die wichtigsten Funktionen von Kling Image Recognize, die darauf ausgelegt sind, Leistung und Benutzerfreundlichkeit zu verbessern. Erfahren Sie, wie diese Fähigkeiten Ihren Projekten zugutekommen und die Benutzererfahrung verbessern können.

Preise für Kling Image Recognize

Entdecken Sie wettbewerbsfähige Preise für Kling Image Recognize, die für verschiedene Budgets und Nutzungsanforderungen konzipiert sind. Unsere flexiblen Tarife stellen sicher, dass Sie nur für das bezahlen, was Sie nutzen, und erleichtern die Skalierung entsprechend Ihren wachsenden Anforderungen. Erfahren Sie, wie Kling Image Recognize Ihre Projekte verbessern kann, während die Kosten überschaubar bleiben.
Comet-Preis (USD / M Tokens)Offizieller Preis (USD / M Tokens)Rabatt
Pro Anfrage:$0.013216
Pro Anfrage:$0.01652
-20%

Beispielcode und API für Kling Image Recognize

Greifen Sie auf umfassende Beispielcodes und API-Ressourcen für Kling Image Recognize zu, um Ihren Integrationsprozess zu optimieren. Unsere detaillierte Dokumentation bietet schrittweise Anleitungen und hilft Ihnen dabei, das volle Potenzial von Kling Image Recognize in Ihren Projekten zu nutzen.

Weitere Modelle

O

Sora 2 Pro

Pro Sekunde:$0.24
Sora 2 Pro ist unser fortschrittlichstes und leistungsstärkstes Modell zur Mediengenerierung, das Videos mit synchronisiertem Audio generieren kann. Es kann aus natürlicher Sprache oder Bildern detaillierte, dynamische Videoclips generieren.
O

Sora 2

Pro Sekunde:$0.08
Äußerst leistungsstarkes Modell zur Videogenerierung, mit Soundeffekten, unterstützt das Chat-Format.
M

mj_fast_video

Pro Anfrage:$0.6
Midjourney video generation
X

Grok Imagine Video

Pro Sekunde:$0.04
Generieren Sie Videos aus Text-Prompts, animieren Sie Standbilder oder bearbeiten Sie vorhandene Videos mit natürlicher Sprache. Die API unterstützt konfigurierbare Dauer, Seitenverhältnis und Auflösung für generierte Videos — das SDK übernimmt das asynchrone Polling automatisch.
G

Veo 3.1 Pro

Pro Sekunde:$0.25
Veo 3.1-Pro bezeichnet die leistungsstarke Zugangs-/Konfigurationsstufe der Veo 3.1 Familie von Google — eine Generation von Kurzform-Videomodellen mit Audiofunktion, die reichhaltigeres natives Audio, verbesserte Steuerungsmöglichkeiten für Erzählung und Schnitt sowie Werkzeuge zur Szenenerweiterung bieten.
G

Veo 3.1

Pro Sekunde:$0.05
Veo 3.1 ist Googles inkrementelles, aber bedeutendes Update für seine Veo-Text-und-Bild→Video-Familie, das reichhaltigeren nativen Ton, längere und besser steuerbare Videoausgaben sowie feinere Bearbeitungs- und Steuerungsmöglichkeiten auf Szenenebene hinzufügt.