الميزات الأساسية

يركّز Veo 3.1 على ميزات عملية لـ إنشاء المحتوى:

توليد صوت أصلي (حوارات، صوت محيطي، مؤثرات صوتية) مُدمج في المخرجات. ينتج Veo 3.1 صوتًا أصليًا (حوارات + صوت محيطي + مؤثرات صوتية) متوافقًا مع المخطط الزمني البصري؛ ويهدف النموذج إلى الحفاظ على مزامنة حركة الشفاه والمواءمة السمعية–البصرية للحوارات وإشارات المشهد.
مخرجات أطول (دعم حتى ~60 seconds / 1080p مقارنةً بمقاطع Veo 3 القصيرة جدًا، 8s)، وتسلسلات متعددة اللقطات متعددة الموجهات لتحقيق استمرارية السرد.
Scene Extension وFirst/Last Frame أوضاع تمتد أو تستوفي اللقطات بين الإطارات الرئيسية.
إدراج الكائنات وإزالة الكائنات (قريبًا) وأساسيّات التحرير داخل Flow.

كل نقطة أعلاه مصمَّمة لتقليل العمل اليدوي في VFX: الصوت واستمرارية المشهد أصبحا الآن مخرجات من الدرجة الأولى بدلاً من أن يكونا أمرًا ثانويًا.

التفاصيل التقنية (سلوك النموذج والمدخلات)

عائلة النموذج والمتغيرات: ينتمي Veo إلى عائلة Google ‏Veo‑3؛ معرّف نموذج المعاينة عادةً هو veo3.1-pro؛ veo3.1 (CometAPI doc). يقبل موجهات نصية، ومراجع صور (إطار واحد أو تسلسلات)، وتخطيطات متعددة الموجهات منظّمة للتوليد متعدد اللقطات.

الدقة والمدة: توضح وثائق المعاينة مخرجات بدقة 720p/1080p مع خيارات لمدد أطول (حتى ~60s في بعض إعدادات المعاينة) وبجودة أعلى من إصدارات Veo السابقة.

نسب العرض إلى الارتفاع: 16:9 (مدعومة) و9:16 (مدعومة باستثناء بعض تدفقات مراجع الصور).

لغة الموجهات: الإنجليزية (معاينة).

قيود واجهة البرمجة: تتضمن قيود المعاينة المعتادة حد أقصى 10 API requests/min لكل مشروع، حد أقصى 4 videos لكل طلب، وأطوال الفيديو قابلة للاختيار من بين 4، 6، أو 8 seconds (تدفقات مراجع الصور تدعم 8s).

أداء المقاييس المرجعية

تشير تقييمات Google الداخلية والملخّصة علنًا إلى تفضيل قوي لمخرجات Veo 3.1 عبر مقارنات المقيمين البشريين على مقاييس مثل مواءمة النص، الجودة البصرية، والاتساق السمعي–البصري (مهام نص→فيديو وصورة→فيديو).

حقق Veo 3.1 نتائج بمستوى أحدث ما وصل إليه المجال في مقارنات المقيمين البشريين الداخلية عبر عدة محاور موضوعية — التفضيل العام، مواءمة الموجّه (نص→فيديو وصورة→فيديو), الجودة البصرية، مواءمة الصوت والفيديو، و«فيزياء واقعية بصريًا» على مجموعات بيانات معيارية مثل MovieGenBench وVBench.

القيود واعتبارات السلامة

القيود:

شوائب وعدم اتساق: رغم التحسينات، يمكن أن تؤدي بعض ظروف الإضاءة والفيزياء الدقيقة والحجب المعقّد إلى شوائب؛ الاتساق في تحويل صورة→فيديو (خصوصًا على مدد طويلة) تحسّن لكنه ليس مثاليًا.
مخاطر المعلومات المضللة/التزييف العميق: الصوت الأكثر ثراءً + إدراج/إزالة الكائنات يزيدان مخاطر سوء الاستخدام (صوت مزيف واقعي ومقاطع ممتدة). تشير Google إلى إجراءات تخفيف (سياسات، ضوابط) وأشارت إصدارات Veo السابقة إلى watermarking/SynthID لدعم التوثيق؛ لكن الضوابط التقنية لا تقضي على مخاطر سوء الاستخدام.
قيود التكلفة ومعدل المعالجة: الفيديوهات عالية الدقة والطويلة مكلفة حسابيًا ومقيّدة حاليًا ضمن معاينة مدفوعة — توقّع زمن استجابة وتكلفة أعلى مقارنةً بنماذج الصور. تناقش منشورات المجتمع ومواضيع منتديات Google نوافذ الإتاحة واستراتيجيات التراجع.

ضوابط السلامة: لدى Veo3.1 سياسات محتوى مدمجة، وإشارات watermarking/synthID في إصدارات Veo السابقة، وضوابط وصول للمعاينة؛ يُنصح العملاء باتّباع سياسات المنصة وتنفيذ مراجعة بشرية للمخرجات عالية المخاطر.

استخدامات عملية

نماذج أولية سريعة للمبدعين: لوحات القصص → مقاطع متعددة اللقطات ورسوم متحركة أولية مع حوار أصلي للمراجعة الإبداعية المبكرة.
التسويق والمحتوى القصير: إعلانات منتجات بطول 15–60s، مقاطع اجتماعية، ومقدمات مفاهيم حيث تكون السرعة أهم من الواقعية الفوتوغرافية المثالية.
تكييف صورة→فيديو: تحويل الرسوم التوضيحية أو الشخصيات أو إطارين إلى انتقالات سلسة أو مشاهد متحركة عبر First/Last Frame وScene Extension.
تعزيز الأدوات: مُدمج داخل Flow للتحرير التكراري (إدراج/إزالة الكائنات، إعدادات مسبقة للإضاءة) مما يقلل عمليات VFX اليدوية.

المقارنة مع نماذج رائدة أخرى

Veo 3.1 مقابل Veo 3 (السابق): يركّز Veo 3.1 على تحسّن الالتزام بالموجهات، جودة الصوت، واتساق متعدد اللقطات — تحديثات تدريجية لكنها مؤثرة تهدف إلى تقليل الشوائب وتحسين قابلية التحرير.

Veo 3.1 مقابل OpenAI Sora 2: مقايضات ذكرتها الصحافة: يؤكد Veo 3.1 على التحكم بالسرد الأطول، الصوت المدمج، وتكامل التحرير عبر Flow؛ بينما يركّز Sora 2 (عند المقارنة في الصحافة) على نقاط قوة مختلفة (السرعة، مسارات تحرير مختلفة). تصف TechRadar وغيرها Veo 3.1 بأنه منافس Google الموجّه لـ Sora 2 لدعم السرد والفيديوهات الأطول. يبقى الاختبار المقارن المستقل محدودًا.

التسعير لـ Veo 3.1

استكشف الأسعار التنافسية لـ Veo 3.1، المصمم ليناسب الميزانيات المختلفة واحتياجات الاستخدام المتنوعة. تضمن خططنا المرنة أن تدفع فقط مقابل ما تستخدمه، مما يجعل من السهل التوسع مع نمو متطلباتك. اكتشف كيف يمكن لـ Veo 3.1 تحسين مشاريعك مع الحفاظ على التكاليف قابلة للإدارة.

veo3.1（videos）

Model name	Tags	Calculate price
veo3.1-all	videos	$0.20000
veo3.1	videos	$0.40000

نموذج الكود وواجهة برمجة التطبيقات لـ Veo 3.1

احصل على أكواد نماذجية شاملة وموارد API لـ Veo 3.1 لتبسيط عملية التكامل الخاصة بك. توفر وثائقنا التفصيلية إرشادات خطوة بخطوة، مما يساعدك على الاستفادة من الإمكانات الكاملة لـ Veo 3.1 في مشاريعك.

Python
JavaScript
Curl

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("
Step 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("
Step 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

Python Code Example

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("\nStep 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("\nStep 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

JavaScript Code Example

import fs from "fs";
import path from "path";
import os from "os";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

// ============================================================
// Step 1: Download Reference Image
// ============================================================
console.log("Step 1: Downloading reference image...");

const imageUrl = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280";
const imageResponse = await fetch(imageUrl);
const imageBuffer = Buffer.from(await imageResponse.arrayBuffer());
const imagePath = path.join(os.tmpdir(), "veo3.1_reference.jpg");
fs.writeFileSync(imagePath, imageBuffer);
console.log(`Reference image saved to: ${imagePath}`);

// ============================================================
// Step 2: Create Video Generation Task (form-data with image upload)
// ============================================================
console.log("\nStep 2: Creating video generation task...");

const formData = new FormData();
formData.append("prompt", "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot");
formData.append("model", "veo3.1");
formData.append("size", "16x9");
formData.append("input_reference", new Blob([fs.readFileSync(imagePath)], { type: "image/jpeg" }), "reference.jpg");

const createResponse = await fetch(`${base_url}/videos`, {
  method: "POST",
  headers: {
    "Authorization": api_key,
  },
  body: formData,
});

const createResult = await createResponse.json();
console.log("Create response:", JSON.stringify(createResult, null, 2));

const taskId = createResult?.id;
if (!taskId) {
  console.log("Error: Failed to get task_id from response");
  process.exit(1);
}
console.log(`Task ID: ${taskId}`);

// ============================================================
// Step 3: Query Task Status
// ============================================================
console.log("\nStep 3: Querying task status...");

const queryResponse = await fetch(`${base_url}/videos/${taskId}`, {
  method: "GET",
  headers: {
    "Authorization": api_key,
  },
});

const queryResult = await queryResponse.json();
console.log("Query response:", JSON.stringify(queryResult, null, 2));

const taskStatus = queryResult?.data?.status;
console.log(`Task status: ${taskStatus}`);

Curl Code Example

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

BASE_URL="https://api.cometapi.com/v1"
IMAGE_PATH="/tmp/veo3.1_reference.jpg"

# ============================================================
# Step 1: Download Reference Image
# ============================================================
echo "Step 1: Downloading reference image..."

curl -s -o "$IMAGE_PATH" "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
echo "Reference image saved to: $IMAGE_PATH"

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
echo ""
echo "Step 2: Creating video generation task..."

RESPONSE=$(curl -s -X POST "${BASE_URL}/videos" \
  -H "Authorization: $COMETAPI_KEY" \
  -F 'prompt=A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot' \
  -F 'model=veo3.1' \
  -F 'size=16x9' \
  -F "input_reference=@${IMAGE_PATH}")

echo "Create response:"
echo "$RESPONSE" | jq .

TASK_ID=$(echo "$RESPONSE" | jq -r '.id')

if [ "$TASK_ID" = "null" ] || [ -z "$TASK_ID" ]; then
  echo "Error: Failed to get task_id from response"
  exit 1
fi

echo "Task ID: $TASK_ID"

# ============================================================
# Step 3: Query Task Status
# ============================================================
echo ""
echo "Step 3: Querying task status..."

QUERY_RESPONSE=$(curl -s -X GET "${BASE_URL}/videos/${TASK_ID}" \
  -H "Authorization: $COMETAPI_KEY")

echo "Query response:"
echo "$QUERY_RESPONSE" | jq .

TASK_STATUS=$(echo "$QUERY_RESPONSE" | jq -r '.data.status')
echo "Task status: $TASK_STATUS"

إصدارات Veo 3.1

قد تشمل الأسباب وراء احتواء Veo 3.1 على لقطات متعددة عوامل محتملة مثل اختلاف المخرجات بعد التحديثات التي تتطلب اللقطات القديمة لضمان الاتساق، وتوفير فترة انتقالية للمطورين للتكيف والهجرة، وارتباط اللقطات المختلفة بنقاط النهاية العالمية أو الإقليمية لتحسين تجربة المستخدم. للاطلاع على الاختلافات التفصيلية بين الإصدارات، يرجى الرجوع إلى الوثائق الرسمية.

معرف النموذج	الوصف	التوفر	السعر	الطلب
veo3.1-all	التقنية المستخدمة غير رسمية والتوليد غير مستقر وما إلى ذلك	✅	$0.2 / لكل	دردشة تنسيق
veo3.1	موصى به، يشير إلى أحدث نموذج	✅	$0.4/ لكل	التوليد غير المتزامن

الميزات الأساسية

يركّز Veo 3.1 على ميزات عملية لـ إنشاء المحتوى:

توليد صوت أصلي (حوارات، صوت محيطي، مؤثرات صوتية) مُدمج في المخرجات. ينتج Veo 3.1 صوتًا أصليًا (حوارات + صوت محيطي + مؤثرات صوتية) متوافقًا مع المخطط الزمني البصري؛ ويهدف النموذج إلى الحفاظ على مزامنة حركة الشفاه والمواءمة السمعية–البصرية للحوارات وإشارات المشهد.
مخرجات أطول (دعم حتى ~60 seconds / 1080p مقارنةً بمقاطع Veo 3 القصيرة جدًا، 8s)، وتسلسلات متعددة اللقطات متعددة الموجهات لتحقيق استمرارية السرد.
Scene Extension وFirst/Last Frame أوضاع تمتد أو تستوفي اللقطات بين الإطارات الرئيسية.
إدراج الكائنات وإزالة الكائنات (قريبًا) وأساسيّات التحرير داخل Flow.

التفاصيل التقنية (سلوك النموذج والمدخلات)

نسب العرض إلى الارتفاع: 16:9 (مدعومة) و9:16 (مدعومة باستثناء بعض تدفقات مراجع الصور).

لغة الموجهات: الإنجليزية (معاينة).

أداء المقاييس المرجعية

القيود واعتبارات السلامة

القيود:

شوائب وعدم اتساق: رغم التحسينات، يمكن أن تؤدي بعض ظروف الإضاءة والفيزياء الدقيقة والحجب المعقّد إلى شوائب؛ الاتساق في تحويل صورة→فيديو (خصوصًا على مدد طويلة) تحسّن لكنه ليس مثاليًا.
مخاطر المعلومات المضللة/التزييف العميق: الصوت الأكثر ثراءً + إدراج/إزالة الكائنات يزيدان مخاطر سوء الاستخدام (صوت مزيف واقعي ومقاطع ممتدة). تشير Google إلى إجراءات تخفيف (سياسات، ضوابط) وأشارت إصدارات Veo السابقة إلى watermarking/SynthID لدعم التوثيق؛ لكن الضوابط التقنية لا تقضي على مخاطر سوء الاستخدام.
قيود التكلفة ومعدل المعالجة: الفيديوهات عالية الدقة والطويلة مكلفة حسابيًا ومقيّدة حاليًا ضمن معاينة مدفوعة — توقّع زمن استجابة وتكلفة أعلى مقارنةً بنماذج الصور. تناقش منشورات المجتمع ومواضيع منتديات Google نوافذ الإتاحة واستراتيجيات التراجع.

استخدامات عملية

نماذج أولية سريعة للمبدعين: لوحات القصص → مقاطع متعددة اللقطات ورسوم متحركة أولية مع حوار أصلي للمراجعة الإبداعية المبكرة.
التسويق والمحتوى القصير: إعلانات منتجات بطول 15–60s، مقاطع اجتماعية، ومقدمات مفاهيم حيث تكون السرعة أهم من الواقعية الفوتوغرافية المثالية.
تكييف صورة→فيديو: تحويل الرسوم التوضيحية أو الشخصيات أو إطارين إلى انتقالات سلسة أو مشاهد متحركة عبر First/Last Frame وScene Extension.
تعزيز الأدوات: مُدمج داخل Flow للتحرير التكراري (إدراج/إزالة الكائنات، إعدادات مسبقة للإضاءة) مما يقلل عمليات VFX اليدوية.

Veo 3.1

المزيد من النماذج

Doubao-Seedance-2-0

Sora 2

mj_fast_video

Grok Imagine Video

Veo 3.1 Pro

Veo 3 Pro

Veo 3 Pro

مدونات ذات صلة

Kling 3.0 مقابل Veo 3.1: المواجهة الحاسمة لعام 2026 لمولدات الفيديو بالذكاء الاصطناعي

كيفية الحصول على Grok Imagine مجّانًا: الوصول، التسعير، والبدائل

كيفية تحرير الفيديوهات عبر Veo 3.1

ما هو vidu Q3؟ ربما يكون أفضل نموذج فيديو بالذكاء الاصطناعي في عام 2026

Veo 3.1

المزيد من النماذج

Doubao-Seedance-2-0

Sora 2

mj_fast_video

Grok Imagine Video

Veo 3.1 Pro

Veo 3 Pro

Veo 3 Pro

مدونات ذات صلة

Kling 3.0 مقابل Veo 3.1: المواجهة الحاسمة لعام 2026 لمولدات الفيديو بالذكاء الاصطناعي

كيفية الحصول على Grok Imagine مجّانًا: الوصول، التسعير، والبدائل

كيفية تحرير الفيديوهات عبر Veo 3.1

ما هو vidu Q3؟ ربما يكون أفضل نموذج فيديو بالذكاء الاصطناعي في عام 2026