ModelHargaPerusahaan
500+ API Model AI, Semua Dalam Satu API. Hanya Di CometAPI
API Model
Pengembang
Mulai CepatDokumentasiDasbor API
Perusahaan
Tentang kamiPerusahaan
Sumber Daya
Model AIBlogCatatan PerubahanDukungan
Syarat dan Ketentuan LayananKebijakan Privasi
© 2026 CometAPI · All rights reserved
Home/Models/Google/Veo 3.1
G

Veo 3.1

Per Detik:$0.05
Veo 3.1 adalah pembaruan dari Google yang bertahap namun signifikan untuk keluarga Veo teks-dan-gambar→video, menambahkan audio bawaan yang lebih kaya, keluaran video yang lebih panjang dan lebih dapat dikendalikan, serta pengeditan yang lebih presisi dan kontrol pada tingkat adegan.
Baru
Penggunaan komersial
Playground
Ikhtisar
Fitur
Harga
API
Versi

Fitur inti

Veo 3.1 berfokus pada fitur pembuatan konten yang praktis:

  • Pembuatan audio native (dialog, suara ambient, SFX) terintegrasi dalam keluaran. Veo 3.1 menghasilkan audio native (dialog + ambience + SFX) yang selaras dengan linimasa visual; model ini bertujuan menjaga sinkronisasi bibir dan keselarasan audio–visual untuk dialog dan isyarat adegan.
  • Keluaran lebih panjang (dukungan hingga ~60 detik / 1080p dibanding klip sangat pendek Veo 3, 8 detik), serta urutan multi-shot dengan multi-prompt untuk kesinambungan naratif.
  • Scene Extension dan mode First/Last Frame yang memperluas atau menginterpolasi cuplikan di antara keyframe.
  • Penyisipan objek dan (segera hadir) penghapusan objek serta primitif pengeditan di dalam Flow.

Setiap poin di atas dirancang untuk mengurangi pekerjaan VFX manual: audio dan kesinambungan adegan kini menjadi keluaran kelas utama, bukan lagi hal yang dipikirkan belakangan.

Rincian teknis (perilaku model & input)

Keluarga model & varian: Veo termasuk dalam keluarga Veo-3 milik Google; ID model pratinjau biasanya veo3.1-pro; veo3.1 (dokumen CometAPI). Model ini menerima prompt teks, referensi gambar (bingkai tunggal atau urutan), dan tata letak multi-prompt terstruktur untuk pembuatan multi-shot.

Resolusi & durasi: Dokumentasi pratinjau menjelaskan keluaran pada 720p/1080p dengan opsi durasi lebih panjang (hingga ~60 detik dalam pengaturan pratinjau tertentu) dan fidelitas lebih tinggi dibanding varian Veo sebelumnya.

Rasio aspek: 16:9 (didukung) dan 9:16 (didukung kecuali pada beberapa alur referensi gambar).

Bahasa prompt: Bahasa Inggris (pratinjau).

Batas API: batas pratinjau tipikal mencakup maks 10 permintaan API/menit per proyek, maks 4 video per permintaan, dan durasi video dapat dipilih di antara 4, 6, atau 8 detik (alur referensi gambar mendukung 8 detik).

Performa benchmark

Evaluasi internal Google dan ringkasan publik melaporkan preferensi kuat terhadap keluaran Veo 3.1 dalam perbandingan penilai manusia pada metrik seperti kesesuaian teks, kualitas visual, dan koherensi audio–visual (tugas teks→video dan gambar→video).

Veo 3.1 mencapai hasil state-of-the-art pada perbandingan penilai manusia internal di berbagai sumbu objektif — preferensi keseluruhan, keselarasan prompt (teks→video dan gambar→video), kualitas visual, keselarasan audio–video, serta “fisika yang tampak realistis” pada dataset benchmark seperti MovieGenBench dan VBench.

Keterbatasan & pertimbangan keamanan

Keterbatasan:

  • Artefak & inkonsistensi: meskipun ada peningkatan, pencahayaan tertentu, fisika yang sangat terperinci, dan oklusi kompleks masih dapat menghasilkan artefak; konsistensi gambar→video (terutama pada durasi panjang) meningkat tetapi belum sempurna.
  • Risiko misinformasi/deepfake: audio yang lebih kaya + penyisipan/penghapusan objek meningkatkan risiko penyalahgunaan (audio palsu realistis dan klip yang diperpanjang). Google mencatat mitigasi (kebijakan, perlindungan) dan peluncuran Veo sebelumnya merujuk watermarking/SynthID untuk membantu ketertelusuran; namun perlindungan teknis tidak menghilangkan risiko penyalahgunaan.
  • Kendala biaya & throughput: video beresolusi tinggi dan berdurasi panjang mahal secara komputasi dan saat ini dibatasi dalam pratinjau berbayar—antisipasi latensi dan biaya yang lebih tinggi dibanding model gambar. Postingan komunitas dan thread forum Google membahas jendela ketersediaan dan strategi fallback.

Kontrol keamanan: Veo3.1 memiliki kebijakan konten terintegrasi, pensinyalan watermarking/SynthID pada rilis Veo sebelumnya, dan kontrol akses pratinjau; pelanggan disarankan mengikuti kebijakan platform dan menerapkan tinjauan manusia untuk keluaran berisiko tinggi.

Kasus penggunaan praktis

  • Prototipe cepat untuk kreator: storyboard → klip multi-shot dan animatik dengan dialog native untuk tinjauan kreatif awal.
  • Marketing & konten format pendek: iklan produk 15–60 detik, klip sosial, dan teaser konsep di mana kecepatan lebih penting daripada fotorealisme sempurna.
  • Adaptasi gambar→video: mengubah ilustrasi, karakter, atau dua bingkai menjadi transisi halus atau adegan animasi melalui First/Last Frame dan Scene Extension.
  • Augmentasi alat: terintegrasi ke dalam Flow untuk pengeditan iteratif (penyisipan/penghapusan objek, preset pencahayaan) yang mengurangi proses VFX manual.

Perbandingan dengan model terkemuka lainnya

Veo 3.1 vs Veo 3 (pendahulu): Veo 3.1 berfokus pada kepatuhan prompt yang lebih baik, kualitas audio, dan konsistensi multi-shot — pembaruan bertahap namun berdampak, bertujuan mengurangi artefak dan meningkatkan kemampuan pengeditan.

Veo 3.1 vs OpenAI Sora 2: kompromi yang dilaporkan di media: Veo 3.1 menekankan kontrol narasi bentuk panjang, audio terintegrasi, dan integrasi pengeditan Flow; Sora 2 (ketika dibandingkan di media) berfokus pada kekuatan berbeda (kecepatan, pipeline pengeditan yang berbeda). TechRadar dan publikasi lain menggambarkan Veo 3.1 sebagai pesaing terarah Google untuk Sora 2 dalam dukungan narasi dan video yang lebih panjang. Pengujian berdampingan independen masih terbatas.

Fitur untuk Veo 3.1

Jelajahi fitur-fitur utama dari Veo 3.1, yang dirancang untuk meningkatkan performa dan kegunaan. Temukan bagaimana kemampuan-kemampuan ini dapat menguntungkan proyek Anda dan meningkatkan pengalaman pengguna.

Harga untuk Veo 3.1

Jelajahi harga kompetitif untuk Veo 3.1, dirancang untuk berbagai anggaran dan kebutuhan penggunaan. Paket fleksibel kami memastikan Anda hanya membayar untuk apa yang Anda gunakan, memudahkan untuk meningkatkan skala seiring berkembangnya kebutuhan Anda. Temukan bagaimana Veo 3.1 dapat meningkatkan proyek Anda sambil menjaga biaya tetap terkendali.

veo3.1(videos)

Model nameTagsCalculate price
veo3.1-allvideos$0.20000
veo3.1videos$0.40000

Kode contoh dan API untuk Veo 3.1

Akses kode sampel komprehensif dan sumber daya API untuk Veo 3.1 guna mempermudah proses integrasi Anda. Dokumentasi terperinci kami menyediakan panduan langkah demi langkah, membantu Anda memanfaatkan potensi penuh Veo 3.1 dalam proyek Anda.
POST
/v1/videos
Python
JavaScript
Curl
import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("
Step 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("
Step 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

Python Code Example

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("\nStep 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("\nStep 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

JavaScript Code Example

import fs from "fs";
import path from "path";
import os from "os";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

// ============================================================
// Step 1: Download Reference Image
// ============================================================
console.log("Step 1: Downloading reference image...");

const imageUrl = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280";
const imageResponse = await fetch(imageUrl);
const imageBuffer = Buffer.from(await imageResponse.arrayBuffer());
const imagePath = path.join(os.tmpdir(), "veo3.1_reference.jpg");
fs.writeFileSync(imagePath, imageBuffer);
console.log(`Reference image saved to: ${imagePath}`);

// ============================================================
// Step 2: Create Video Generation Task (form-data with image upload)
// ============================================================
console.log("\nStep 2: Creating video generation task...");

const formData = new FormData();
formData.append("prompt", "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot");
formData.append("model", "veo3.1");
formData.append("size", "16x9");
formData.append("input_reference", new Blob([fs.readFileSync(imagePath)], { type: "image/jpeg" }), "reference.jpg");

const createResponse = await fetch(`${base_url}/videos`, {
  method: "POST",
  headers: {
    "Authorization": api_key,
  },
  body: formData,
});

const createResult = await createResponse.json();
console.log("Create response:", JSON.stringify(createResult, null, 2));

const taskId = createResult?.id;
if (!taskId) {
  console.log("Error: Failed to get task_id from response");
  process.exit(1);
}
console.log(`Task ID: ${taskId}`);

// ============================================================
// Step 3: Query Task Status
// ============================================================
console.log("\nStep 3: Querying task status...");

const queryResponse = await fetch(`${base_url}/videos/${taskId}`, {
  method: "GET",
  headers: {
    "Authorization": api_key,
  },
});

const queryResult = await queryResponse.json();
console.log("Query response:", JSON.stringify(queryResult, null, 2));

const taskStatus = queryResult?.data?.status;
console.log(`Task status: ${taskStatus}`);

Curl Code Example

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

BASE_URL="https://api.cometapi.com/v1"
IMAGE_PATH="/tmp/veo3.1_reference.jpg"

# ============================================================
# Step 1: Download Reference Image
# ============================================================
echo "Step 1: Downloading reference image..."

curl -s -o "$IMAGE_PATH" "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
echo "Reference image saved to: $IMAGE_PATH"

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
echo ""
echo "Step 2: Creating video generation task..."

RESPONSE=$(curl -s -X POST "${BASE_URL}/videos" \
  -H "Authorization: $COMETAPI_KEY" \
  -F 'prompt=A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot' \
  -F 'model=veo3.1' \
  -F 'size=16x9' \
  -F "input_reference=@${IMAGE_PATH}")

echo "Create response:"
echo "$RESPONSE" | jq .

TASK_ID=$(echo "$RESPONSE" | jq -r '.id')

if [ "$TASK_ID" = "null" ] || [ -z "$TASK_ID" ]; then
  echo "Error: Failed to get task_id from response"
  exit 1
fi

echo "Task ID: $TASK_ID"

# ============================================================
# Step 3: Query Task Status
# ============================================================
echo ""
echo "Step 3: Querying task status..."

QUERY_RESPONSE=$(curl -s -X GET "${BASE_URL}/videos/${TASK_ID}" \
  -H "Authorization: $COMETAPI_KEY")

echo "Query response:"
echo "$QUERY_RESPONSE" | jq .

TASK_STATUS=$(echo "$QUERY_RESPONSE" | jq -r '.data.status')
echo "Task status: $TASK_STATUS"

Versi Veo 3.1

Alasan Veo 3.1 memiliki beberapa _snapshot_ mungkin mencakup faktor-faktor potensial seperti variasi keluaran setelah pembaruan yang memerlukan _snapshot_ lama untuk konsistensi, memberikan masa transisi bagi pengembang untuk beradaptasi dan bermigrasi, serta _snapshot_ berbeda yang sesuai dengan _endpoint_ global atau regional untuk mengoptimalkan pengalaman pengguna. Untuk perbedaan detail antar versi, silakan merujuk ke dokumentasi resmi.
ID modeldeskripsiKetersediaanHargaPermintaan
veo3.1-allTeknologi yang digunakan tidak resmi dan generasinya tidak stabil, dll✅$0.2 / perChat format
veo3.1Direkomendasikan, mengarah ke model terbaru✅$0.4/ perAsync Generation

Model Lainnya

D

Doubao-Seedance-2-0

Per Detik:$0.07
Seedance 2.0 adalah model fondasi video multimodal generasi berikutnya dari ByteDance yang berfokus pada pembuatan video naratif sinematik multi-shot. Berbeda dari demo teks-ke-video single-shot, Seedance 2.0 menekankan kontrol berbasis referensi (gambar, klip pendek, audio), konsistensi karakter/gaya yang koheren di seluruh shot, serta sinkronisasi audio/video bawaan — dengan tujuan menjadikan video AI berguna bagi alur kerja kreatif profesional dan pravisualisasi.
O

Sora 2

Per Detik:$0.08
Model generasi video yang sangat canggih, dengan efek suara, mendukung format chat.
M

mj_fast_video

Per Permintaan:$0.6
Pembuatan video Midjourney
X

Grok Imagine Video

Per Detik:$0.04
Hasilkan video dari prompt teks, animasikan gambar statis, atau sunting video yang sudah ada dengan bahasa alami. API mendukung durasi, rasio aspek, dan resolusi yang dapat dikonfigurasi untuk video yang dihasilkan — dengan SDK yang secara otomatis menangani polling asinkron.
G

Veo 3.1 Pro

Per Detik:$0.25
Veo 3.1-Pro mengacu pada akses/konfigurasi berkemampuan tinggi dari keluarga Veo 3.1 milik Google — sebuah generasi model video berformat pendek yang mendukung audio dan menambahkan audio bawaan yang lebih kaya, kontrol narasi/penyuntingan yang ditingkatkan, serta alat perluasan adegan.
G

Veo 3 Pro

G

Veo 3 Pro

Per Detik:$0.25
Veo 3 pro mengacu pada pengalaman model video Veo 3 kelas produksi (fidelitas tinggi, audio asli, dan perangkat alat yang diperluas)

Blog Terkait

Kling 3.0 vs Veo 3.1: Pertarungan Pamungkas Generator Video AI 2026
Apr 20, 2026
veo-3-1
kling-3-0

Kling 3.0 vs Veo 3.1: Pertarungan Pamungkas Generator Video AI 2026

Kling 3.0 saat ini memimpin dengan penceritaan multi-shot 4K native dan kontrol kamera yang unggul. Veo 3.1 unggul dalam fisika fotorealistis, sinkronisasi audio native, dan integrasi ekosistem Google, menjadikannya ideal untuk proyek sinematik atau kelas enterprise. Bagi sebagian besar pengguna, pemenang bergantung pada prioritas: Kling 3.0 untuk kecepatan, konsistensi, dan biaya; Veo 3.1 untuk realisme premium dan audio.
Apa itu Google Veo 3.1 Lite?
Apr 1, 2026
veo-3-1

Apa itu Google Veo 3.1 Lite?

Apa itu Veo 3.1 Lite? Veo 3.1 Lite adalah model pembuatan video terbaru dari Google yang hemat biaya untuk pengembang, dirilis pada 31 Maret 2026. Model ini mendukung teks ke video dan gambar ke video, menghasilkan video dengan audio, dan dirancang untuk aplikasi bervolume tinggi. Google mengatakan biayanya kurang dari setengah biaya Veo 3.1 Fast sambil mempertahankan kecepatan yang sama, dengan format keluaran 16:9 dan 9:16 serta dukungan resolusi 720p/1080p.
Cara Mendapatkan Grok Imagine Secara Gratis: Akses, Harga, dan Alternatif
Mar 25, 2026
grok-imagine-video

Cara Mendapatkan Grok Imagine Secara Gratis: Akses, Harga, dan Alternatif

Grok Imagine Video tidak gratis di platform resmi xAI/Grok per Maret 2026 (tingkat gratis dihapus karena tingginya permintaan dan kekhawatiran penyalahgunaan), tetapi Anda dapat mengaksesnya dengan biaya terjangkau — atau dengan kredit awal gratis — melalui agregator pihak ketiga seperti CometAPI. CometAPI menawarkan model tersebut hanya seharga $0.04 per detik (480p), dengan pengguna baru sering menerima kredit gratis $1–$5 saat mendaftar.
Cara mengedit video melalui veo 3.1
Mar 5, 2026
veo-3-1

Cara mengedit video melalui veo 3.1

Google secara publik memperkenalkan Veo 3.1 (dan varian Veo 3.1 Fast) pada pertengahan Oktober 2025 sebagai model teks-ke-video yang ditingkatkan yang menghasilkan video pendek dengan fidelitas lebih tinggi.
Apa itu vidu Q3? Ini mungkin model video AI terbaik pada tahun 2026
Jan 31, 2026
vidu-q3

Apa itu vidu Q3? Ini mungkin model video AI terbaik pada tahun 2026

Vidu Q3 muncul pada awal 2026 sebagai salah satu sinyal paling jelas sejauh ini bahwa pembuatan video berbasis AI bergerak dari klip pendek bernuansa novelty menuju penceritaan multi-shot yang benar-benar naratif. Dalam beberapa bulan sejak dirilis secara luas, Vidu Q3 telah menjadi andalan dalam alur kerja kreator, pilot penelitian, dan pilot komersial — dan bukan tanpa alasan: model ini mendorong durasi, integrasi audiovisual, dan koherensi multi-shot lebih jauh dibandingkan kebanyakan model terdahulu sekaligus menawarkan API yang berorientasi pada pengembang untuk penggunaan terprogram.