ModellePreiseUnternehmen
500+ KI-Modell-APIs, Alles in einer API. Nur bei CometAPI
Modelle-API
Entwickler
SchnellstartDokumentationAPI Dashboard
Unternehmen
Über unsUnternehmen
Ressourcen
KI-ModelleBlogÄnderungsprotokollSupport
NutzungsbedingungenDatenschutzrichtlinie
© 2026 CometAPI · All rights reserved
Home/Models/Google/Veo 3.1
G

Veo 3.1

Pro Sekunde:$0.05
Veo 3.1 ist Googles inkrementelles, aber bedeutendes Update für seine Veo-Text-und-Bild→Video-Familie, das reichhaltigeren nativen Ton, längere und besser steuerbare Videoausgaben sowie feinere Bearbeitungs- und Steuerungsmöglichkeiten auf Szenenebene hinzufügt.
Neu
Kommerzielle Nutzung
Playground
Überblick
Funktionen
Preisgestaltung
API
Versionen

Kernfunktionen

Veo 3.1 konzentriert sich auf praktische Funktionen zur Inhaltserstellung:

  • Native Audio-Generierung (Dialog, Umgebungsgeräusche, SFX) in Ausgaben integriert. Veo 3.1 erzeugt native Audio (Dialog + Umgebungsgeräusche + SFX), abgestimmt auf die visuelle Zeitachse; das Modell zielt darauf ab, Lippensynchronität und audio–visuelle Ausrichtung für Dialoge und Szenenhinweise zu bewahren.
  • Längere Ausgaben (Unterstützung für bis zu ~60 Sekunden / 1080p im Vergleich zu den sehr kurzen Clips von Veo 3, 8s) sowie Multi‑Shot‑Sequenzen mit mehreren Prompts für narrative Kontinuität.
  • Scene Extension und First/Last Frame Modi, die Bildmaterial zwischen Keyframes erweitern oder interpolieren.
  • Objekteinfügung und (in Kürze) Objektentfernung sowie Bearbeitungsprimitiven innerhalb von Flow.

Jeder der oben genannten Punkte ist darauf ausgelegt, manuelle VFX‑Arbeit zu reduzieren: Audio und Szenenkontinuität sind jetzt erstklassige Ausgaben statt nachträglicher Ergänzungen.

Technische Details (Modellverhalten & Eingaben)

Model family & variants: Veo gehört zu Googles Veo‑3‑Familie; die Vorschau‑Modell‑ID ist typischerweise veo3.1-pro; veo3.1 (CometAPI doc). Es akzeptiert Text‑Prompts, Bildreferenzen (Einzelbild oder Sequenzen) und strukturierte Multi‑Prompt‑Layouts für die Multi‑Shot‑Generierung.

Resolution & duration: Die Vorschau‑Dokumentation beschreibt Ausgaben bei 720p/1080p mit Optionen für längere Dauer (bis zu ~60s in bestimmten Vorschau‑Einstellungen) und höherer Wiedergabetreue als frühere Veo‑Varianten.

Aspect ratios: 16:9 (unterstützt) und 9:16 (unterstützt, außer in einigen Referenzbild‑Flows).

Prompt language: Englisch (Vorschau).

API limits: Typische Vorschau‑Limits umfassen max 10 API requests/min pro Projekt, max 4 Videos pro Request, und Videolängen wählbar unter 4, 6 oder 8 Sekunden (Referenzbild‑Flows unterstützen 8s).

Benchmark-Leistung

Googles interne und öffentlich zusammengefasste Auswertungen berichten von starker Präferenz für Veo 3.1‑Ausgaben über Vergleiche durch menschliche Bewerter hinweg, basierend auf Metriken wie Textausrichtung, visuelle Qualität und audio–visuelle Kohärenz (Text→Video‑ und Bild→Video‑Aufgaben).

Veo 3.1 erzielte State‑of‑the‑Art‑Ergebnisse in internen Vergleichen mit menschlichen Bewertern über mehrere objektive Achsen hinweg — Gesamtpräferenz, Prompt‑Ausrichtung (Text→Video und Bild→Video), visuelle Qualität, Audio‑Video‑Ausrichtung und „visuell realistische Physik“ auf Benchmark‑Datensätzen wie MovieGenBench und VBench.

Einschränkungen & Sicherheitsaspekte

Einschränkungen:

  • Artefakte & Inkonsistenzen: Trotz Verbesserungen können bestimmte Beleuchtung, fein­granulare Physik und komplexe Okklusionen weiterhin Artefakte erzeugen; die Konsistenz bei Bild→Video (insbesondere über lange Dauer) ist verbessert, aber nicht perfekt.
  • Fehlinformation/Deepfake‑Risiko: Reichhaltigeres Audio plus Objekteinfügung/‑entfernung erhöht das Missbrauchsrisiko (realistisches Fake‑Audio und verlängerte Clips). Google weist auf Gegenmaßnahmen hin (Richtlinien, Schutzmechanismen) und frühere Veo‑Veröffentlichungen verwiesen auf Watermarking/SynthID zur Herkunftssicherung; technische Schutzmaßnahmen beseitigen das Missbrauchsrisiko jedoch nicht.
  • Kosten- & Durchsatzbeschränkungen: Hochauflösende, lange Videos sind rechnerisch teuer und derzeit in einer kostenpflichtigen Vorschau beschränkt — erwarten Sie höhere Latenz und Kosten im Vergleich zu Bildmodellen. Community‑Beiträge und Google‑Forum‑Threads diskutieren Verfügbarkeitsfenster und Fallback‑Strategien.

Safety controls: Veo 3.1 verfügt über integrierte Inhaltsrichtlinien, Watermarking/SynthID‑Signale in früheren Veo‑Veröffentlichungen und Vorschau‑Zugriffskontrollen; Kunden wird geraten, der Plattformrichtlinie zu folgen und für risikoreiche Ausgaben eine menschliche Prüfung einzuführen.

Praktische Anwendungsfälle

  • Schnelles Prototyping für Kreative: Storyboards → Multi‑Shot‑Clips und Animatics mit nativen Dialogen für frühe kreative Begutachtung.
  • Marketing & Kurzform‑Content: 15–60s Produkt‑Spots, Social‑Clips und Konzept‑Teaser, bei denen Geschwindigkeit wichtiger ist als perfekte Fotorealistik.
  • Bild→Video‑Adaption: Illustrationen, Figuren oder zwei Frames in fließende Übergänge oder animierte Szenen verwandeln, über First/Last Frame und Scene Extension.
  • Tooling‑Erweiterung: In Flow integriert für iterative Bearbeitung (Objekteinfügung/‑entfernung, Licht‑Presets), die manuelle VFX‑Durchgänge reduziert.

Vergleich mit anderen führenden Modellen

Veo 3.1 vs Veo 3 (Vorgänger): Veo 3.1 konzentriert sich auf verbesserte Prompt‑Einhaltung, Audioqualität und Multi‑Shot‑Konsistenz — inkrementelle, aber wirkungsvolle Updates, die darauf abzielen, Artefakte zu reduzieren und die Editierbarkeit zu verbessern.

Veo 3.1 vs OpenAI Sora 2: In der Presse berichtete Abwägungen: Veo 3.1 betont narrative Steuerung in längeren Formaten, integriertes Audio und Flow‑Editingintegration; Sora 2 (in der Presse verglichen) fokussiert auf andere Stärken (Geschwindigkeit, verschiedene Editing‑Pipelines). TechRadar und andere Medien ordnen Veo 3.1 als Googles zielgerichteten Konkurrenten zu Sora 2 für narrative und längere Video‑Unterstützung ein. Unabhängige Side‑by‑Side‑Tests bleiben begrenzt.

Funktionen für Veo 3.1

Entdecken Sie die wichtigsten Funktionen von Veo 3.1, die darauf ausgelegt sind, Leistung und Benutzerfreundlichkeit zu verbessern. Erfahren Sie, wie diese Fähigkeiten Ihren Projekten zugutekommen und die Benutzererfahrung verbessern können.

Preise für Veo 3.1

Entdecken Sie wettbewerbsfähige Preise für Veo 3.1, die für verschiedene Budgets und Nutzungsanforderungen konzipiert sind. Unsere flexiblen Tarife stellen sicher, dass Sie nur für das bezahlen, was Sie nutzen, und erleichtern die Skalierung entsprechend Ihren wachsenden Anforderungen. Erfahren Sie, wie Veo 3.1 Ihre Projekte verbessern kann, während die Kosten überschaubar bleiben.

veo3.1(videos)

Model nameTagsCalculate price
veo3.1-allvideos$0.20000
veo3.1videos$0.40000

Beispielcode und API für Veo 3.1

Greifen Sie auf umfassende Beispielcodes und API-Ressourcen für Veo 3.1 zu, um Ihren Integrationsprozess zu optimieren. Unsere detaillierte Dokumentation bietet schrittweise Anleitungen und hilft Ihnen dabei, das volle Potenzial von Veo 3.1 in Ihren Projekten zu nutzen.
POST
/v1/videos
Python
JavaScript
Curl
import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("
Step 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("
Step 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

Python Code Example

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("\nStep 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("\nStep 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

JavaScript Code Example

import fs from "fs";
import path from "path";
import os from "os";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

// ============================================================
// Step 1: Download Reference Image
// ============================================================
console.log("Step 1: Downloading reference image...");

const imageUrl = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280";
const imageResponse = await fetch(imageUrl);
const imageBuffer = Buffer.from(await imageResponse.arrayBuffer());
const imagePath = path.join(os.tmpdir(), "veo3.1_reference.jpg");
fs.writeFileSync(imagePath, imageBuffer);
console.log(`Reference image saved to: ${imagePath}`);

// ============================================================
// Step 2: Create Video Generation Task (form-data with image upload)
// ============================================================
console.log("\nStep 2: Creating video generation task...");

const formData = new FormData();
formData.append("prompt", "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot");
formData.append("model", "veo3.1");
formData.append("size", "16x9");
formData.append("input_reference", new Blob([fs.readFileSync(imagePath)], { type: "image/jpeg" }), "reference.jpg");

const createResponse = await fetch(`${base_url}/videos`, {
  method: "POST",
  headers: {
    "Authorization": api_key,
  },
  body: formData,
});

const createResult = await createResponse.json();
console.log("Create response:", JSON.stringify(createResult, null, 2));

const taskId = createResult?.id;
if (!taskId) {
  console.log("Error: Failed to get task_id from response");
  process.exit(1);
}
console.log(`Task ID: ${taskId}`);

// ============================================================
// Step 3: Query Task Status
// ============================================================
console.log("\nStep 3: Querying task status...");

const queryResponse = await fetch(`${base_url}/videos/${taskId}`, {
  method: "GET",
  headers: {
    "Authorization": api_key,
  },
});

const queryResult = await queryResponse.json();
console.log("Query response:", JSON.stringify(queryResult, null, 2));

const taskStatus = queryResult?.data?.status;
console.log(`Task status: ${taskStatus}`);

Curl Code Example

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

BASE_URL="https://api.cometapi.com/v1"
IMAGE_PATH="/tmp/veo3.1_reference.jpg"

# ============================================================
# Step 1: Download Reference Image
# ============================================================
echo "Step 1: Downloading reference image..."

curl -s -o "$IMAGE_PATH" "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
echo "Reference image saved to: $IMAGE_PATH"

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
echo ""
echo "Step 2: Creating video generation task..."

RESPONSE=$(curl -s -X POST "${BASE_URL}/videos" \
  -H "Authorization: $COMETAPI_KEY" \
  -F 'prompt=A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot' \
  -F 'model=veo3.1' \
  -F 'size=16x9' \
  -F "input_reference=@${IMAGE_PATH}")

echo "Create response:"
echo "$RESPONSE" | jq .

TASK_ID=$(echo "$RESPONSE" | jq -r '.id')

if [ "$TASK_ID" = "null" ] || [ -z "$TASK_ID" ]; then
  echo "Error: Failed to get task_id from response"
  exit 1
fi

echo "Task ID: $TASK_ID"

# ============================================================
# Step 3: Query Task Status
# ============================================================
echo ""
echo "Step 3: Querying task status..."

QUERY_RESPONSE=$(curl -s -X GET "${BASE_URL}/videos/${TASK_ID}" \
  -H "Authorization: $COMETAPI_KEY")

echo "Query response:"
echo "$QUERY_RESPONSE" | jq .

TASK_STATUS=$(echo "$QUERY_RESPONSE" | jq -r '.data.status')
echo "Task status: $TASK_STATUS"

Versionen von Veo 3.1

Der Grund, warum Veo 3.1 mehrere Snapshots hat, kann potenzielle Faktoren wie Änderungen der Ausgabe nach Updates umfassen, die ältere Snapshots für Konsistenz erfordern, Entwicklern eine Übergangszeit für Anpassung und Migration bieten und verschiedene Snapshots, die globalen oder regionalen Endpunkten entsprechen, um das Benutzererlebnis zu optimieren. Für detaillierte Unterschiede zwischen den Versionen lesen Sie bitte die offizielle Dokumentation.
Modell-IDBeschreibungVerfügbarkeitPreisAnfrage
veo3.1-allDie verwendete Technologie ist inoffiziell und die Generierung ist instabil usw.✅$0.2 / proChat Format
veo3.1Empfohlen, verweist auf das neueste Modell✅$0.4/ proAsynchrone Generierung

Weitere Modelle

D

Doubao-Seedance-2-0

Pro Sekunde:$0.07
Seedance 2.0 ist das multimodale Video‑Foundation‑Modell der nächsten Generation von ByteDance, das auf filmische, narrative Videogenerierung mit mehreren Einstellungen fokussiert ist. Im Unterschied zu Text‑zu‑Video‑Demos mit nur einer Einstellung betont Seedance 2.0 referenzbasierte Steuerung (Bilder, kurze Clips, Audio), kohärente Figuren‑ und Stilkonsistenz über Einstellungen hinweg sowie native Audio-/Video‑Synchronisation — mit dem Ziel, KI‑Video für professionelle Kreativ- und Previsualisierungs‑Workflows nutzbar zu machen.
O

Sora 2

Pro Sekunde:$0.08
Äußerst leistungsstarkes Modell zur Videogenerierung, mit Soundeffekten, unterstützt das Chat-Format.
M

mj_fast_video

Pro Anfrage:$0.6
Midjourney Videogenerierung
X

Grok Imagine Video

Pro Sekunde:$0.04
Generieren Sie Videos aus Text-Prompts, animieren Sie Standbilder oder bearbeiten Sie vorhandene Videos mit natürlicher Sprache. Die API unterstützt konfigurierbare Dauer, Seitenverhältnis und Auflösung für generierte Videos — das SDK übernimmt das asynchrone Polling automatisch.
G

Veo 3.1 Pro

Pro Sekunde:$0.25
Veo 3.1-Pro bezeichnet die leistungsstarke Zugangs-/Konfigurationsstufe der Veo 3.1 Familie von Google — eine Generation von Kurzform-Videomodellen mit Audiofunktion, die reichhaltigeres natives Audio, verbesserte Steuerungsmöglichkeiten für Erzählung und Schnitt sowie Werkzeuge zur Szenenerweiterung bieten.
G

Veo 3 Pro

G

Veo 3 Pro

Pro Sekunde:$0.25
Veo 3 pro bezeichnet das Veo 3-Videomodell-Erlebnis in Produktionsqualität (hohe Wiedergabetreue, nativer Ton und erweitertes Tooling)

Verwandte Blogs

Kling 3.0 gegen Veo 3.1: Das ultimative Duell der KI-Videogeneratoren 2026
Apr 20, 2026
veo-3-1
kling-3-0

Kling 3.0 gegen Veo 3.1: Das ultimative Duell der KI-Videogeneratoren 2026

Kling 3.0 liegt derzeit vorn mit nativem 4K-Multi-Shot-Storytelling und überlegener Kamerasteuerung. Veo 3.1 glänzt mit fotorealistischer Physik, nativer Audiosynchronisation und Integration in das Google-Ökosystem und ist damit ideal für filmische oder Unternehmensprojekte. Für die meisten Nutzer hängt der Sieger von den Prioritäten ab: Kling 3.0 für Geschwindigkeit, Konsistenz und Kosten; Veo 3.1 für erstklassigen Realismus und Audio.
Was ist Google Veo 3.1 Lite?
Apr 1, 2026
veo-3-1

Was ist Google Veo 3.1 Lite?

Was ist Veo 3.1 Lite? Veo 3.1 Lite ist Googles neuestes, kosteneffizientes Videogenerierungsmodell für Entwickler, veröffentlicht am 31. März 2026. Es unterstützt Text-zu-Video und Bild-zu-Video, erzeugt Videos mit Audio und ist für den Einsatz in großem Maßstab konzipiert. Laut Google kostet es weniger als die Hälfte von Veo 3.1 Fast bei gleicher Geschwindigkeit und unterstützt die Seitenverhältnisse 16:9 und 9:16 sowie Auflösungen in 720p/1080p.
So erhalten Sie Grok Imagine kostenlos: Zugriff, Preise und Alternativen
Mar 25, 2026
grok-imagine-video

So erhalten Sie Grok Imagine kostenlos: Zugriff, Preise und Alternativen

Grok Imagine Video ist auf den offiziellen xAI/Grok-Plattformen seit März 2026 nicht kostenlos (die kostenlose Stufe wurde aufgrund hoher Nachfrage und Bedenken wegen Missbrauchs entfernt), aber Sie können über Drittanbieter-Aggregatoren wie CometAPI kostengünstig — oder mit kostenlosen Startguthaben — darauf zugreifen. CometAPI bietet das Modell für nur $0.04 pro Sekunde (480p) an, wobei neue Nutzer bei der Registrierung häufig $1–$5 als kostenloses Guthaben erhalten.
So bearbeiten Sie Videos mit Veo 3.1
Mar 5, 2026
veo-3-1

So bearbeiten Sie Videos mit Veo 3.1

Google hat Veo 3.1 (und eine Variante namens Veo 3.1 Fast) Mitte Oktober 2025 öffentlich als verbessertes Text-zu-Video-Modell vorgestellt, das qualitativ hochwertigere kurze Videos erzeugt.
Was ist vidu Q3? Es ist vielleicht das beste KI-Videomodell im Jahr 2026.
Jan 31, 2026
vidu-q3

Was ist vidu Q3? Es ist vielleicht das beste KI-Videomodell im Jahr 2026.

Vidu Q3 trat Anfang 2026 als eines der deutlichsten Signale dafür auf, dass sich die KI-gestützte Videogenerierung von kurzen, als Spielerei empfundenen Clips hin zu wirklich narrativem Storytelling über mehrere Einstellungen entwickelt. In den Monaten seit seiner breiten Veröffentlichung ist Vidu Q3 zu einem festen Bestandteil in Creator-Workflows, Forschungspiloten und kommerziellen Piloten geworden — und das aus gutem Grund: Es treibt Dauer, audiovisuelle Integration und Kohärenz über mehrere Einstellungen weiter voran als die meisten früheren Modelle und bietet zugleich eine entwicklerorientierte API für die programmatische Nutzung.