Veo 3.1

فی سیکنڈ:$0.05

Veo 3.1، Google کی اپنی Veo متن-اور-تصویر→ویڈیو فیملی کے لیے تدریجی مگر معنی خیز اپ ڈیٹ ہے، جس میں مزید بھرپور نیٹو آڈیو، طویل تر اور زیادہ قابلِ کنٹرول ویڈیو آؤٹ پٹس، اور مزید نفیس ایڈیٹنگ اور سین-لیول کنٹرولز شامل ہیں۔

نیا

تجارتی استعمال

Playground

خلاصہ

خصوصیات

قیمت

API

ورژن

بنیادی خصوصیات

Veo 3.1 عملی مواد کی تخلیق کی خصوصیات پر توجہ دیتا ہے:

نیٹیو آڈیو جنریشن (مکالمہ، ماحول کی آواز، SFX) آؤٹ پٹس میں مربوط۔ Veo 3.1 بصری ٹائم لائن کے ساتھ ہم آہنگ نیٹیو آڈیو (مکالمہ + ماحول کی آواز + SFX) بناتا ہے؛ ماڈل کا مقصد مکالمے اور منظر کے اشاروں کے لیے لب سنک اور آڈیو–ویژول ہم آہنگی کو برقرار رکھنا ہے۔
طویل آؤٹ پٹس (Veo 3 کے نہایت مختصر کلپس،8s، کے مقابلے میں ~60 سیکنڈ / 1080p تک کی حمایت)، اور کثیر پرامپٹ کثیر شاٹ سلسلے بیانیہ تسلسل کے لیے۔
Scene Extension اور First/Last Frame موڈز جو اہم فریمز کے درمیان فوٹیج کو توسیع دیتے یا انٹرپولیٹ کرتے ہیں۔
Flow کے اندر آبجیکٹ کی شمولیت اور (جلد آنے والا) آبجیکٹ ہٹانا اور بنیادی تدوینی اوزار۔

اوپر دیے گئے ہر نقطے کا مقصد دستی VFX کام کو کم کرنا ہے: اب آڈیو اور منظر کا تسلسل بعد از خیال نہیں بلکہ اوّل درجے کے آؤٹ پٹس ہیں۔

تکنیکی تفصیلات (ماڈل کا رویہ اور ان پٹس)

Model family & variants: Veo، Google کے Veo-3 خاندان سے تعلق رکھتا ہے؛ پری ویو ماڈل ID عموماً veo3.1-pro ہوتی ہے؛ veo3.1 (CometAPI دستاویز). یہ متنی پرامپٹس، تصویری حوالہ جات (واحد فریم یا سلسلے) اور کثیر شاٹ جنریشن کے لیے ساختہ کثیر پرامپٹ لے آؤٹس قبول کرتا ہے.

Resolution & duration: پری ویو دستاویزات آؤٹ پٹس کو 720p/1080p پر بیان کرتی ہیں، طویل دورانیے کے اختیارات کے ساتھ (کچھ پری ویو سیٹنگز میں ~60s تک) اور پہلے کے Veo ورژنز کے مقابلے میں زیادہ معیار۔

Aspect ratios: 16:9 (سپورٹڈ) اور 9:16 (کچھ ریفرنس امیج فلو کے سوا سپورٹڈ)۔

Prompt language: انگریزی (پری ویو)۔

API limits: عمومی پری ویو حدود میں شامل ہیں: فی پروجیکٹ زیادہ سے زیادہ 10 API درخواستیں/منٹ، فی درخواست زیادہ سے زیادہ 4 ویڈیوز، اور ویڈیو کی لمبائیاں 4، 6، یا 8 سیکنڈ میں منتخب کی جا سکتی ہیں (ریفرنس امیج فلو میں 8s سپورٹڈ)۔

بینچ مارک کارکردگی

Google کی داخلی اور عوامی خلاصہ جاتی جانچوں میں انسانی ریٹر موازنوں کے مطابق متن سے مطابقت، بصری معیار، اور آڈیو–ویژول ہم آہنگی (text→video اور image→video کام) جیسے پیمانوں پر Veo 3.1 کے آؤٹ پٹس کے لیے مضبوط ترجیح رپورٹ ہوئی ہے۔

Veo 3.1 نے متعدد معروضی جہتوں پر داخلی انسانی-ریٹر موازنوں میں جدید ترین نتائج حاصل کیے — مجموعی ترجیح، پرامپٹ الائنمنٹ (text→video اور image→video)، بصری معیار، آڈیو-ویڈیو الائنمنٹ، اور “بصری طور پر حقیقت پسندانہ طبیعیات” پر MovieGenBench اور VBench جیسے بینچ مارک ڈیٹاسیٹس میں۔

حدود اور حفاظتی غوروفکر

حدود:

آرٹی فیکٹس اور غیر یکسانی: بہتری کے باوجود، مخصوص روشنی، نہایت باریک طبیعیات، اور پیچیدہ اوکلوژن میں اب بھی آرٹی فیکٹس آ سکتے ہیں؛ image→video تسلسل (خصوصاً طویل دورانیوں میں) بہتر ہے مگر کامل نہیں۔
گمراہ کن معلومات/ڈیپ فیک کا خطرہ: زیادہ مالا مال آڈیو + آبجیکٹ شمولیت/ہٹانا غلط استعمال کے خدشات بڑھاتے ہیں (حقیقت نما جعلی آڈیو اور طویل کلپس)۔ Google نے تخفیفی اقدامات (پالیسی، حفاظتی بندوبست) نوٹ کیے ہیں اور پہلے Veo اجرا میں ماخذ شناسی کے لیے watermarking/SynthID کا حوالہ دیا گیا؛ تاہم تکنیکی حفاظتی اقدامات غلط استعمال کے خطرے کو ختم نہیں کرتے۔
لاگت اور تھروپٹ کی پابندیاں: ہائی ریزولوشن، طویل ویڈیوز کمپیوٹیشنل طور پر مہنگی ہیں اور فی الحال ادائیگی والے پری ویو میں محدود ہیں — امیج ماڈلز کے مقابلے میں زیادہ لیٹنسی اور لاگت متوقع ہے۔ کمیونٹی پوسٹس اور Google فورم تھریڈز دستیابی کے اوقات اور متبادل حکمتِ عملیوں پر بحث کرتے ہیں۔

سیفٹی کنٹرولز: Veo 3.1 میں انٹیگریٹڈ مواد پالیسیاں، پہلے Veo ریلیزز میں watermarking/synthID سگنلنگ، اور پری ویو ایکسس کنٹرولز شامل ہیں؛ صارفین کو پلیٹ فارم پالیسی پر عمل اور ہائی رسک آؤٹ پٹس کے لیے انسانی جائزہ نافذ کرنے کا مشورہ دیا جاتا ہے۔

عملی استعمالات

تخلیق کاروں کے لیے تیز رفتار پروٹوٹائپنگ: اسٹوری بورڈز → کثیر شاٹ کلپس اور اینیمیٹکس، ابتدائی تخلیقی جائزے کے لیے نیٹیو مکالمے کے ساتھ۔
مارکیٹنگ اور شارٹ فارم مواد: 15–60 سیکنڈ کے پراڈکٹ اسپاٹس، سوشل کلپس، اور کانسیپٹ ٹیزرز جہاں رفتار کامل فوٹو ریئلزم سے زیادہ اہم ہو۔
Image→video موافقت: First/Last Frame اور Scene Extension کے ذریعے تصاویر، کرداروں یا دو فریموں کو ہموار ٹرانزیشنز یا متحرک مناظر میں بدلنا۔
ٹولنگ آگمینٹیشن: Flow میں مربوط تدوین (آبجیکٹ شمولیت/ہٹانا، لائٹنگ پری سیٹس) جو دستی VFX پاسز کم کرتی ہے۔

دیگر نمایاں ماڈلز کے ساتھ تقابل

Veo 3.1 بمقابلہ Veo 3 (سابقہ): Veo 3.1 نے پرامپٹ پر بہتر عملداری، آڈیو کے معیار، اور کثیر شاٹ تسلسل میں بہتری پر توجہ دی — تدریجی مگر مؤثر اپ ڈیٹس جن کا مقصد آرٹی فیکٹس گھٹانا اور قابلیتِ تدوین بہتر کرنا ہے۔

Veo 3.1 بمقابلہ OpenAI Sora 2: پریس میں رپورٹ کیے گئے توازنات کے مطابق: Veo 3.1 طویل بیانیہ کنٹرول، مربوط آڈیو، اور Flow ایڈیٹنگ انضمام پر زور دیتا ہے؛ Sora 2 (پریس موازنوں میں) مختلف طاقتوں پر توجہ دیتا ہے (رفتار، مختلف ایڈیٹنگ پائپ لائنز)۔ TechRadar اور دیگر ذرائع Veo 3.1 کو Google کا Sora 2 کے لیے بیانیہ اور طویل ویڈیو سپورٹ میں ہدف بند حریف بتاتے ہیں۔ آزادانہ سائڈ بہ سائڈ جانچ اب بھی محدود ہے۔

Veo 3.1 کے لیے خصوصیات

[ماڈل کا نام] کی اہم خصوصیات دریافت کریں، جو کارکردگی اور قابل استعمال کو بہتر بنانے کے لیے ڈیزائن کی گئی ہیں۔ جانیں کہ یہ صلاحیتیں آپ کے منصوبوں کو کیسے فائدہ پہنچا سکتی ہیں اور صارف کے تجربے کو بہتر بنا سکتی ہیں۔

Veo 3.1 کی قیمتیں

[ماڈل کا نام] کے لیے مسابقتی قیمتوں کو دریافت کریں، جو مختلف بجٹ اور استعمال کی ضروریات کے مطابق ڈیزائن کیا گیا ہے۔ ہمارے لچکدار منصوبے اس بات کو یقینی بناتے ہیں کہ آپ صرف اسی کے لیے ادائیگی کریں جو آپ استعمال کرتے ہیں، جس سے آپ کی ضروریات بڑھنے کے ساتھ ساتھ اسکیل کرنا آسان ہو جاتا ہے۔ دریافت کریں کہ [ماڈل کا نام] کیسے آپ کے پروجیکٹس کو بہتر بنا سکتا ہے جبکہ اخراجات کو قابو میں رکھتا ہے۔

veo3.1（videos）

Model name	Tags	Calculate price
veo3.1-all	videos	$0.20000
veo3.1	videos	$0.40000

Veo 3.1 کے لیے نمونہ کوڈ اور API

Veo 3.1 کے لیے جامع نمونہ کوڈ اور API وسائل تک رسائی حاصل کریں تاکہ آپ کے انضمام کے عمل کو آسان بنایا جا سکے۔ ہماری تفصیلی دستاویزات قدم بہ قدم رہنمائی فراہم کرتی ہیں، جو آپ کو اپنے پروجیکٹس میں Veo 3.1 کی مکمل صلاحیت سے فائدہ اٹھانے میں مدد کرتی ہیں۔

POST

/v1/videos

Python
JavaScript
Curl

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("
Step 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("
Step 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

Python Code Example

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("\nStep 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("\nStep 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

JavaScript Code Example

import fs from "fs";
import path from "path";
import os from "os";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

// ============================================================
// Step 1: Download Reference Image
// ============================================================
console.log("Step 1: Downloading reference image...");

const imageUrl = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280";
const imageResponse = await fetch(imageUrl);
const imageBuffer = Buffer.from(await imageResponse.arrayBuffer());
const imagePath = path.join(os.tmpdir(), "veo3.1_reference.jpg");
fs.writeFileSync(imagePath, imageBuffer);
console.log(`Reference image saved to: ${imagePath}`);

// ============================================================
// Step 2: Create Video Generation Task (form-data with image upload)
// ============================================================
console.log("\nStep 2: Creating video generation task...");

const formData = new FormData();
formData.append("prompt", "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot");
formData.append("model", "veo3.1");
formData.append("size", "16x9");
formData.append("input_reference", new Blob([fs.readFileSync(imagePath)], { type: "image/jpeg" }), "reference.jpg");

const createResponse = await fetch(`${base_url}/videos`, {
  method: "POST",
  headers: {
    "Authorization": api_key,
  },
  body: formData,
});

const createResult = await createResponse.json();
console.log("Create response:", JSON.stringify(createResult, null, 2));

const taskId = createResult?.id;
if (!taskId) {
  console.log("Error: Failed to get task_id from response");
  process.exit(1);
}
console.log(`Task ID: ${taskId}`);

// ============================================================
// Step 3: Query Task Status
// ============================================================
console.log("\nStep 3: Querying task status...");

const queryResponse = await fetch(`${base_url}/videos/${taskId}`, {
  method: "GET",
  headers: {
    "Authorization": api_key,
  },
});

const queryResult = await queryResponse.json();
console.log("Query response:", JSON.stringify(queryResult, null, 2));

const taskStatus = queryResult?.data?.status;
console.log(`Task status: ${taskStatus}`);

Curl Code Example

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

BASE_URL="https://api.cometapi.com/v1"
IMAGE_PATH="/tmp/veo3.1_reference.jpg"

# ============================================================
# Step 1: Download Reference Image
# ============================================================
echo "Step 1: Downloading reference image..."

curl -s -o "$IMAGE_PATH" "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
echo "Reference image saved to: $IMAGE_PATH"

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
echo ""
echo "Step 2: Creating video generation task..."

RESPONSE=$(curl -s -X POST "${BASE_URL}/videos" \
  -H "Authorization: $COMETAPI_KEY" \
  -F 'prompt=A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot' \
  -F 'model=veo3.1' \
  -F 'size=16x9' \
  -F "input_reference=@${IMAGE_PATH}")

echo "Create response:"
echo "$RESPONSE" | jq .

TASK_ID=$(echo "$RESPONSE" | jq -r '.id')

if [ "$TASK_ID" = "null" ] || [ -z "$TASK_ID" ]; then
  echo "Error: Failed to get task_id from response"
  exit 1
fi

echo "Task ID: $TASK_ID"

# ============================================================
# Step 3: Query Task Status
# ============================================================
echo ""
echo "Step 3: Querying task status..."

QUERY_RESPONSE=$(curl -s -X GET "${BASE_URL}/videos/${TASK_ID}" \
  -H "Authorization: $COMETAPI_KEY")

echo "Query response:"
echo "$QUERY_RESPONSE" | jq .

TASK_STATUS=$(echo "$QUERY_RESPONSE" | jq -r '.data.status')
echo "Task status: $TASK_STATUS"

Veo 3.1 کے ورژن

Veo 3.1 کے متعدد سنیپ شاٹس کی وجوہات میں ممکنہ عوامل شامل ہوسکتے ہیں جیسے اپ ڈیٹس کے بعد آؤٹ پٹ میں تبدیلیاں جس کی وجہ سے مستقل مزاجی کے لیے پرانے سنیپ شاٹس کی ضرورت ہوتی ہے، ڈویلپرز کو ایڈاپٹیشن اور مائیگریشن کے لیے منتقلی کا وقت فراہم کرنا، اور عالمی یا علاقائی اینڈ پوائنٹس کے مطابق مختلف سنیپ شاٹس کا ہونا تاکہ صارف کے تجربے کو بہتر بنایا جاسکے۔ ورژنز کے درمیان تفصیلی فرق کے لیے براہ کرم سرکاری دستاویزات کا حوالہ دیں۔

ماڈل آئی ڈی	تفصیل	دستیابی	قیمت	درخواست
veo3.1-all	استعمال ہونے والی ٹیکنالوجی غیر رسمی ہے اور جنریشن غیر مستحکم ہے، وغیرہ	✅	$0.2 / فی	چیٹ فارمیٹ
veo3.1	سفارش کردہ، تازہ ترین ماڈل کی طرف اشارہ کرتی ہے	✅	$0.4/ فی	غیر ہم وقتی جنریشن

مزید ماڈلز