گوگل نے عوامی طور پر متعارف کرایا Veo 3.1 (اور اے Veo 3.1 Fast ویریئنٹ) اکتوبر 2025 کے وسط میں ایک بہتر ٹیکسٹ ٹو ویڈیو ماڈل کے طور پر جو کہ اعلی فیڈیلیٹی مختصر کلپس تیار کرتا ہے۔ مقامی آڈیو، بہتر فوری عمل، اور نئی ترمیمی صلاحیتیں جیسے منظر/کلپ کی توسیع, فریم سے فریم انٹرپولیشن، اور تصویری رہنمائی نسل (تین حوالہ جات کی تصاویر تک استعمال کریں)۔ Veo 3.1 کے ذریعے دستیاب ہے۔ API، میں ظاہر ہوتا ہے۔ جیمنی ایپ اور روانی تخلیقی ٹول، اور اس کے ذریعے انٹرپرائز ڈویلپرز کے سامنے ہے۔ ورٹیکس AI اور گوگل اے آئی اسٹوڈیو (پلیٹ فارم اور پلان کے لحاظ سے دستیابی مختلف ہوتی ہے)۔ فلو کا انضمام مزید UI ایڈیٹنگ کنٹرولز لاتا ہے (لائٹنگ/شیڈو، آبجیکٹ داخل/ہٹائیں جلد آرہا ہے)، جبکہ APIs ڈویلپرز کے لیے پروگرامیٹک جنریشن اور ایکسٹینشن کی خصوصیات کو بے نقاب کرتے ہیں۔
میں Veo 3.1 (Flow, CometAPI/Gemini API — مرحلہ وار) کے ذریعے ویڈیوز میں ترمیم کرنے کے بارے میں ایک رہنما فراہم کروں گا۔
Veo 3.1 کیا کرتا ہے اور یہ کہاں سے آیا؟
Veo 3.1 گوگل کے جنریٹیو ویڈیو ماڈلز (Veo) کے خاندان کا تازہ ترین تکرار ہے، جو ٹیکسٹ پرامپٹس کو تبدیل کرنے کے لیے بنایا گیا ہے — اور اختیاری طور پر تصاویر یا موجودہ ویڈیو فریم — کو مختصر، مربوط، فوٹوریل یا اسٹائلائزڈ ویڈیو کلپس میں ترکیب شدہ آڈیو (مکالمہ، محیطی آواز، SFX) کے ساتھ۔ 3.1 اپ ڈیٹ پر زور دیتا ہے۔ بہتر حقیقت پسندی, امیر مقامی آڈیو، اور تسلسل کے اوزار (منظر میں توسیع اور فریم انٹرپولیشن)، Veo کو گوگل کے ٹیکسٹ اور امیج ماڈلز کے لیے ایک ویڈیو سینٹرک ہم منصب کے طور پر پوزیشن دینا۔
3.1 میں کلیدی اپ گریڈ میں شامل ہیں:
- تیار کردہ کلپس کے لیے مقامی آڈیو اور ڈائیلاگ کی ترکیب (کوئی الگ آواز کی پائپ لائن کی ضرورت نہیں ہے)۔
- فریم ٹو فریم انٹرپولیشن (پہلا اور آخری فریم ایک جنریٹڈ کلپ چلاتا ہے)۔
- تصویری رہنمائی والی نسل (کردار/انداز کی مستقل مزاجی کو برقرار رکھنے کے لیے تین حوالہ جات تک کی تصاویر استعمال کریں)۔
- منظر کی توسیع (پچھلے کلپس کے آخری سیکنڈ سے منسلک کنیکٹنگ کلپس تیار کرکے تسلسل کو محفوظ رکھیں)۔
- بہتر فوری عمل اور بہتر سنیما کنٹرول۔
Veo 3.1 کہاں چلتا ہے؟
Veo 3.1 گوگل میں دستیاب ہے۔ API (ادا شدہ پیش نظارہ) ورٹیکس اے آئی / ماڈل گارڈن, جیمنی موبائل/ویب ایپس، اور فلو اور ویو اسٹوڈیو ڈیمو میں ضم کیا گیا۔ CometAPI Veo کو بھی ضم کرنا شروع کر دیا ہے۔
میں فلو میں Veo 3.1 کے ذریعے ویڈیوز میں کیسے ترمیم کر سکتا ہوں؟ قدم بہ قدم
ذیل میں میں سب سے عام پروگرامیٹک اور UI ورک فلو کے ذریعے چلتا ہوں: Flow (creator UI) میں ترمیم کرنا، Gemini ایپ (فوری نسل) کا استعمال کرتے ہوئے، اور Gemini API / Vertex AI کو پروگرام کے لحاظ سے استعمال کرنا (پروڈکشن اور آٹومیشن کے لیے)۔
میں Flow (creator UI) کا استعمال کرتے ہوئے ویڈیوز میں کیسے ترمیم کروں؟
روانی فلم سازوں/ تخلیق کاروں کے لیے گوگل کا تخلیقی UI ہے جو نسل کے لیے Veo ماڈلز کو مربوط کرتا ہے اور ایڈیٹنگ کنٹرولز کا ایک سیٹ (لائٹنگ، شیڈونگ، سین کمپوزیشن، آبجیکٹ داخل کرنا/ ہٹانے کا ٹولنگ)۔ بہاؤ میں Veo 3.1 کے ساتھ آپ یہ کر سکتے ہیں:
- بہتر آڈیو کے ساتھ شاٹس بنائیں یا دوبارہ بنائیں۔
- "ویڈیو کے اجزاء" استعمال کریں (مسلسل حروف/اسٹائل کے لیے حوالہ جات کی تصاویر اپ لوڈ کریں)۔
- سین ایکسٹینشن کے ساتھ سینز کو بڑھا دیں یا ایک سے زیادہ شاٹس کو ایک ساتھ جوڑیں (نئے کلپس کو کلپ کے پہلے اختتام سے جوڑتا ہے)۔
- UI کے اندر بنیادی آبجیکٹ داخل کرنے اور (جلد) ہٹانے کا اطلاق کریں۔
میں فلو (عملی اقدامات) میں بنیادی ترمیم کیسے کر سکتا ہوں؟
- اپنا بیج کلپ بنائیں/جنریٹ کریں (ٹیکسٹ پرامپٹ یا امیج پرامپٹ)۔
- کلپ کے اختتام کو منتخب کرنے کے لیے ٹائم لائن کا استعمال کریں اور منتخب کریں۔ بڑھو (منظر کی توسیع) کارروائی جاری رکھنے یا حرکت شامل کرنے کے لیے ایک نئے پرامپٹ کے ساتھ۔ ہر ایکسٹینشن میں ایک چھوٹی سی ہاپ شامل ہوتی ہے جسے نظام تسلسل کو برقرار رکھنے کے لیے ملا دیتا ہے۔
- آبجیکٹ کی تبدیلیوں کے لیے، Insert ٹول استعمال کریں (اضافہ کرنے کے لیے آئٹم کی وضاحت کریں اور کہاں)۔ ہٹانے کے لیے، دستیاب ہونے پر Flow کے Remove ٹول کی پیروی کریں اور کمپوزٹنگ آرٹفیکٹس کی تصدیق کریں۔
- ایکسپورٹ کریں اور، اگر ضرورت ہو تو، کلر گریڈنگ، سب ٹائٹلز، یا قطعی کٹوتیوں کے لیے روایتی NLE (Premiere، DaVinci Resolve) میں پالش کریں۔
فلو کو دوبارہ تخلیقی ترامیم کو تیز کرنے کے لیے ڈیزائن کیا گیا ہے۔ ٹائم لائن ایڈیٹنگ اور تخلیقی تبدیلیوں کے درمیان ایک ہائبرڈ کی طرح سلوک کریں۔
میں Veo 3.1 API کے ذریعے پروگرام کے مطابق ویڈیوز میں ترمیم یا تخلیق کیسے کروں؟
پروگرام کے دو بنیادی راستے ہیں:
- Gemini API (generative language / Gemini SDK) — جنریشن اور ایکسٹینشن کے لیے براہ راست Veo ماڈلز کو کال کرنے کے لیے استعمال کیا جاتا ہے (مثالیں Google کے Gemini API دستاویزات میں فراہم کی گئی ہیں)۔
- CometAPI (اوپن اے آئی فارمیٹ/ چیٹ) - CometAPI تک رسائی فراہم کرتا ہے۔ جیمنی 3 پرو امیج (نینو کیلے پرو),Gemini 3 Pro اور چیٹ، امیج، میوزک اور ویڈیو جنریشن کے لیے 100 سے زیادہ AI ماڈلز تک آپ رسائی حاصل کر سکتے ہیں۔ Veo 3.1 OpenAI طرز کے چیٹ پوائنٹ کے ذریعے۔
Veo 3.1 کے ساتھ ترمیم کو چند الگ الگ بہاؤ کے طور پر سوچا جا سکتا ہے۔ پروڈکشن کے لیے تیار نتائج حاصل کرنے کے لیے ہر بہاؤ ماڈل ان پٹس (ٹیکسٹ/تصاویر/ویڈیو) اور پوسٹ پروسیسنگ مرحلہ کو یکجا کرتا ہے۔
Veo 3.1 APIs کے ذریعے سامنے آیا ہے۔ عام پیٹرن ایک طویل چل رہا ہے generateVideos آپریشن - آپ کام پوسٹ کرتے ہیں، آپریشن کو پول کرتے ہیں، اور ایک بار مکمل ہونے کے بعد آؤٹ پٹ فائل ڈاؤن لوڈ کرتے ہیں۔
ذیل میں آسان، چلانے کے قابل مثالیں ہیں — اپنی API کیز اور ماحول کے ساتھ موافقت کریں۔ ; اپنے ماحول کے SDK اور تصدیقی رہنمائی سے مشورہ کریں۔
جاوا اسکرپٹ (نوڈ) کی مثال — پیدا کریں اور پول کریں۔
مثال Gemini API طرز کے استعمال پر مبنی ہے۔
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
const prompt = "A cinematic shot of a majestic lion in the savannah. Add ambient wind and distant bird calls.";
let operation = await ai.models.generateVideos({
model: "veo-3.1-generate-preview",
prompt,
});
// Poll
while (!operation.done) {
console.log("Waiting...");
await new Promise(r => setTimeout(r, 10000));
operation = await ai.operations.getVideosOperation({ operation: operation });
}
// Download and save the generated video from operation.response.generated_videos
یہ پیٹرن (جمع کروائیں → پول → ڈاؤن لوڈ) جیمنی دستاویزات میں کینونیکل طریقہ ہے۔
کیا میں Python SDK کی بجائے curl/REST استعمال کر سکتا ہوں؟
ہاں — آفیشل ویب SDK دکھاتا ہے، لیکن بنیادی veo 3.1 REST کے ذریعے استعمال کیا جا سکتا ہے۔ تمام ماحول میں نفاذ مختلف ہوتے ہیں (Gemini API بمقابلہ CometAPI REST)۔ اگر آپ curl کو ترجیح دیتے ہیں، تو یقینی بنائیں کہ آپ درست تصدیق (Google Cloud یا cometAPIAPI کلید سے بیئرر ٹوکنز) کی پیروی کرتے ہیں اور اپنے پروڈکٹ کے لیے مخصوص ویڈیو جنریشن کے لیے اینڈ پوائنٹ کا استعمال کریں۔ CometAPI کے سیوڈو کرل کی مثال (آپ کی توثیق اور اختتامی نقطہ کے مطابق):
curl "https://api.cometapi.com/v1/chat/completions" \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "veo-3.1",
"prompt": "A simple prompt describing the action",
"config": {"aspect_ratio":"16:9","length_seconds":8}
}' --output generated_response.json
اہم: صحیح REST URL اور پے لوڈ ڈھانچہ اس بات پر منحصر ہے کہ آیا آپ استعمال کرتے ہیں۔ Gemini API or CometAPI اینڈ پوائنٹس - درخواستیں بھیجنے سے پہلے پروڈکٹ کے دستاویزات سے مشورہ کریں۔ SDKs آپ کے لیے بہت سی تصدیق اور پولنگ کی تفصیلات کو ہینڈل کرتے ہیں۔
Veo 3.1 کا استعمال کیسے کریں — کون سے ورک فلو سپورٹ ہیں؟
ذیل میں میں ان عملی بہاؤ کے ذریعے چلوں گا جو آپ Veo 3.1 کے ساتھ ترمیم کرتے وقت استعمال کریں گے: UX بہاؤ (فلو/جیمنی اسٹوڈیو)، اور پروگراماتی بہاؤ (جیمنی API / ورٹیکس API)۔ ہر بہاؤ کے لیے میں مثالیں، انتباہات، اور چھوٹے کوڈ کے ٹکڑوں کو دکھاؤں گا جنہیں آپ کاپی کر سکتے ہیں۔
Veo 3.1 کے ساتھ ترمیم کو چند الگ الگ بہاؤ کے طور پر سوچا جا سکتا ہے۔ پروڈکشن کے لیے تیار نتائج حاصل کرنے کے لیے ہر بہاؤ ماڈل ان پٹس (ٹیکسٹ/تصاویر/ویڈیو) اور پوسٹ پروسیسنگ مرحلہ کو یکجا کرتا ہے۔
مین ایڈیٹنگ ورک فلو
تدوین کے تین عملی بہاؤ ہیں جنہیں آپ کثرت سے استعمال کریں گے:
- متن پر مبنی ترامیم اور دوبارہ تخلیقات - پرامپٹ کو دوبارہ لکھ کر یا اسی منظر میں نئی ہدایات لگا کر شاٹ تبدیل کریں۔
- حوالہ امیج گائیڈ ایڈیٹنگ ("ویڈیو کے اجزاء") — آپ تیار کردہ فریموں میں کسی کردار یا چیز کو محفوظ رکھنے کے لیے 3 تصاویر تک فراہم کرتے ہیں۔
- فریم انٹرپولیشن (پہلا اور آخری فریم) - ایک آغاز اور اختتامی تصویر دیں اور Veo ان کے درمیان منتقلی کا سلسلہ تیار کرتا ہے (اگر درخواست کی گئی ہو تو آڈیو کے ساتھ)۔
- منظر کی توسیع - موجودہ ویو سے تیار کردہ (یا دیگر) کلپ کو ایک کنیکٹنگ کلپ بنا کر توسیع کریں جو پچھلے کلپ کے آخری سیکنڈ سے جاری ہے۔
- آبجیکٹ داخل کرنا/ ہٹانا اور دیگر فلو ایڈیٹنگ ٹولز - کچھ فلو UI خصوصیات (آبجیکٹ داخل کرنا/ ہٹانا، ڈوڈل پرامپٹنگ، کیمرہ اینگل ری شوٹس) Veo صلاحیتوں کے اوپر شامل کیے جا رہے ہیں اور GUI میں فریم لیول ری ٹچنگ میں مدد کر سکتے ہیں۔
نوٹس اور ٹپس: مناسب سند استعمال کریں (جیمنی API کلید / CometAPI API کلید)۔ مثال میں veo-3.1-generate-preview کا استعمال کیا گیا ہے—ماڈل IDs اور پیرامیٹر کے نام SDK ورژنز اور خطوں میں قدرے مختلف ہو سکتے ہیں۔ CometAPI کی veo 3.1 ماڈل id veo3.1-pro اور veo3.1 ہیں۔
1) متن → ویڈیو (نئی نسل)
کیس استعمال کریں: اسکرپٹ یا تخلیقی پرامپٹ سے بالکل نیا مختصر کلپ بنائیں۔
بہاؤ:
- منظر کی تفصیل، کیمرے کی سمت اور آڈیو اشارے (مکالمہ یا صوتی اثرات) سمیت ایک واضح ٹیکسٹ پرامپٹ تیار کریں۔
- جیمنی کو کال کریں۔ ویڈیوز بنائیں Veo 3.1 ماڈل کا استعمال کرتے ہوئے اختتامی نقطہ۔
- جنریشن ختم ہونے تک طویل عرصے سے چلنے والے آپریشن کو پول کریں، نتیجے میں آنے والا MP4 ڈاؤن لوڈ کریں، پھر جائزہ لیں اور اعادہ کریں۔
سادہ ازگر کی مثال (ٹیکسٹ → ویڈیو):
آفیشل گوگل استعمال کریں۔ جینئی Python کے لیے کلائنٹ یہ ٹکڑا Veo 3.1 کے ساتھ پرامپٹ سے ایک مختصر ویڈیو بنانے کا مظاہرہ کرتا ہے۔
# Requires google-genai Python client configured with credentials
import time
from google import genai
client = genai.Client()
prompt = """A cinematic close-up of a detective in a rainy alley, neon reflections on puddles.
He whispers, 'This is the clue we've been missing.' Add distant thunder and footsteps."""
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
prompt=prompt,
)
# Poll until done
while not operation.done:
print("Waiting for generation...")
time.sleep(8)
operation = client.operations.get(operation)
# Save video
generated = operation.response.generated_videos
client.files.download(file=generated.video)
generated.video.save("text_to_video.mp4")
print("Saved text_to_video.mp4")
2) تصویر → ویڈیو (ماخذ کی تصویر کو متحرک کریں)
کیس استعمال کریں: پروڈکٹ شاٹ، کریکٹر پورٹریٹ، یا ایک تصویر کو ایک مختصر کلپ میں متحرک کریں۔
بہاؤ:
- ایک ابتدائی تصویر تیار کریں یا منتخب کریں (نینو کیلے جیسے امیج ماڈل کے ذریعہ تیار کیا جاسکتا ہے)۔
- تصویر کو بطور اپ لوڈ کریں۔
imageپیرامیٹر اور کالgenerate_videos، اختیاری طور پر فراہمیreferenceImagesیا ایکlastFrameانٹرپولیشن کے لیے - بازیافت اور جائزہ لیں؛ اعادہ کرنے کے اشارے یا تصویری اثاثے
ازگر کی تصویر → ویڈیو کا ٹکڑا (تصویر الگ سے بنائی گئی):
Veo 3.1 کی سب سے زیادہ عملی خصوصیات میں سے ایک ہے۔ حوالہ تصاویر: 3 تصاویر (ایک شخص، ایک پروڈکٹ، ایک چیز) تک فراہم کریں تاکہ تیار کردہ ویڈیو فریموں میں اس ظاہری شکل کو محفوظ رکھے۔
# Python: use reference images with Veo 3.1
from google import genai
from google.genai import types
client = genai.Client()
prompt = "A product demo shot: the smartwatch rotates, displaying the UI and a glowing notification tone."
# reference_image_* can be binary content or file references depending on the SDK
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
prompt=prompt,
config=types.GenerateVideosConfig(
reference_images=, # up to 3
aspect_ratio="16:9",
length_seconds=8
),
)
# handle operation result and download as earlier example
عملی تجاویز:
- واضح، اچھی طرح سے روشن حوالہ جات کی تصاویر کو ترجیح دیں جو مفید زاویوں سے موضوع کو پکڑیں۔
- پروڈکٹ کی شناخت، لباس، یا کسی کردار کے چہرے کو ملٹی شاٹ سیکونسز میں برقرار رکھنے کے لیے حوالہ جات کا استعمال کریں۔
- اجازت کے بغیر کاپی رائٹ یا نجی شخص کی تصاویر سے پرہیز کریں۔
3) ویڈیو سے ویڈیو / ایکسٹینشن (جاری رکھیں یا دوبارہ شوٹ کریں)
کیس استعمال کریں: ایک موجودہ تیار کردہ کلپ کو بڑھا دیں یا کسی کارروائی کو اس کے اختتام سے آگے جاری رکھیں، یا دوبارہ ترمیم کرنے کے لیے پہلے سے تیار کردہ ویڈیو کا استعمال کریں۔
بہاؤ:
- تیار کردہ ویڈیو کو بطور فراہم کریں۔
videoایک پرامپٹ ان پٹ اور تیار کریں جس میں یہ بیان کیا جائے کہ ویڈیو کو کیسے جاری رہنا چاہیے (مثال کے طور پر، "توسیع کریں: مرکزی کردار دروازہ کھولتا ہے اور روشنی میں چلتا ہے")۔ - ایکسٹینشن موڈ استعمال کریں — Veo 3.1 آخری سیکنڈ کو حتمی شکل دیتا ہے اور حرکت کو جاری رکھتا ہے۔ نوٹ: آواز کی توسیع کم قابل اعتماد ہے جب تک کہ آخری سیکنڈ میں آڈیو موجود نہ ہو۔
ازگر کی مثال (موجودہ ویڈیو کو بڑھائیں):
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
video=previous_generated_video, # a Video object from previous generation
prompt="Extend: The paraglider slowly descends and lands by a meadow.",
config=types.GenerateVideosConfig(number_of_videos=1, resolution="720p")
)
# Poll and download...
ورک فلو نوٹ: لمبے سلسلے بنانے کے لیے بار بار کلپس (ہر نئے تیار کردہ کلپ کو پچھلے کے آخر تک سلائی) بڑھائیں۔ آرٹفیکٹ جمع کرنے کو ذہن میں رکھیں — وقتاً فوقتاً اعلیٰ معیار کے حوالہ جات کے فریموں پر دوبارہ اینکر کریں یا وفاداری کو برقرار رکھنے کے لیے حصوں کو دوبارہ تخلیق کریں۔
4) فریم مخصوص ترمیم (پہلے اور آخری فریم، حوالہ تصاویر)
آپ ایک ایسی ویڈیو تیار کر سکتے ہیں جو شروع کے فریم سے اختتامی فریم میں منتقل ہو جائے۔ پہلے ایک تصویر بنانا (مثال کے طور پر، جیمنی امیج ماڈل کے ساتھ)، پھر اس تصویر کو بطور تصویر پاس کریں اور انٹرپولیشن کو چلانے کے لیے ترتیب میں last_frame سیٹ کریں۔
کیس استعمال کریں: آپ سخت بصری تسلسل چاہتے ہیں یا دو مخصوص فریموں کے درمیان متحرک ہونا چاہتے ہیں۔
بہاؤ:
- پہلا فریم اور آخری فریم بنائیں یا اپ لوڈ کریں۔
- Veo 3.1 کے ساتھ کال کریں۔
image=first_frameاورconfig.last_frame=last_frame. - ماڈل آپ کے پرامپٹ سے ملنے کے لیے قابل فہم حرکت اور آڈیو تیار کرتے ہوئے، ان فریموں کے درمیان گڑبڑ کرتا ہے۔
یہ کیوں معاملہ ہے: تخلیقی کنٹرول کے لیے، پہلا/آخری فریم آپ کو کیمرہ فریمنگ اور کمپوزیشن کو بالکل شروع/اختتام کے لیے بیان کرنے دیتا ہے، جو VFX، تسلسل، یا بیانیہ کی دھڑکنوں کے لیے ضروری ہے۔
Python (تصویر → ویڈیو)
# Step 1: make an image (using a Gemini image model)
image_resp = client.models.generate_content(
model="gemini-2.5-flash-image",
contents="A stylized watercolor painting of a fox in a moonlit forest",
config={"response_modalities": }
)
first_image = image_resp.parts.as_image()
# Step 2: use the image as the first_frame and specify a last_frame image (optional)
operation = client.models.generate_videos(
model="veo-3.1-generate-preview",
prompt="Transition to a fox bounding across snow toward the camera.",
image=first_image,
config={"last_frame": some_last_image, "number_of_videos": 1}
)
# Poll and download as before...
یہ آپ کو دو متعین بصری اینکرز کے درمیان ایک ہموار انٹرپولیشن فراہم کرتا ہے۔
Veo 3.1 کے ساتھ کون سی فوری اور ان پٹ حکمت عملی بہترین کام کرتی ہے؟
Veo 3.1 سٹرکچرڈ پرامپٹس کا بہترین جواب دیتا ہے جو بصری ساخت، حرکت، آواز اور جذباتی لہجے کو واضح طور پر بیان کرتے ہیں۔ Veo 3.1 کے لیے گوگل "پرامٹنگ گائیڈ" مخصوص اجزاء کی تجویز کرتا ہے۔ یہاں ایک کنڈینسڈ چیک لسٹ ہے:
فوری اناٹومی (تجویز کردہ)
- بنیادی منظر - مختصر جملہ: کون/کیا، بنیادی کارروائی۔
- کیمرے کی تفصیل - کلوز اپ/ وائیڈ/ ڈولی/ سٹیڈی/ ہینڈ ہیلڈ، کیمرہ موشن اور فریمنگ۔
- ٹائمنگ اور پیسنگ - مختصر اشارے جیسے "آہستہ"، "سنیما 24fps محسوس"، یا اگر آپ کو درستگی کی ضرورت ہو تو فریم شمار۔
- آڈیو اشارے - پس منظر کا ماحول، مخصوص صوتی اثرات، یا مکالمے (اقتباسات میں) کی وضاحت کریں۔ Veo 3.1 مقامی آڈیو کی ترکیب کر سکتا ہے۔
- انداز اور حوالہ جات - شامل ہیں
referenceImagesیا فوٹو گرافی/فلم کے انداز کا ذکر کریں: "فلم نوئر، ہائی کنٹراسٹ، کوڈک 500 احساس"۔ - منفی اشارے - واضح کریں کہ آپ کیا ہیں۔ کیا ناپسندیدہ نتائج کو کم کرنا چاہتے ہیں (مثال کے طور پر، "کوئی لوگو، کوئی متن، کوئی کارٹون طرز نہیں")۔
حوالہ جاتی تصاویر کا استعمال
تصویری رہنمائی اور پہلا/آخری فریم انٹرپولیشن Veo 3.1 خصوصیات ہیں۔ ایک عام، اعلیٰ معیار کی پائپ لائن ہے:
- امیج ماڈل (نانو کیلے یا جیمنی امیج ماڈلز) کے ذریعے 1–3 حوالہ جات والی امیجز کے ساتھ اسٹیل اثاثے بنائیں یا ان کو بہتر بنائیں جو مستقل مضامین (لوگ، مصنوعات) کے لیے ظاہری شکل/انداز کی وضاحت کرتے ہیں۔ حوالہ اثاثوں کے ذریعہ رہنمائی کرنے پر Veo موضوع کی ظاہری شکل کو اچھی طرح سے محفوظ رکھتا ہے۔
- ان اثاثوں کو حوالہ تصاویر (یا پہلے/آخری فریموں) میں تحریر کریں۔
- ویڈیو جنریشن / انٹرپولیشن / ایکسٹینشن کے لیے Veo 3.1 پر کال کریں۔
- اختیاری طور پر پوسٹ پروسیس معیاری ویڈیو ٹولز کے ساتھ (کلر گریڈنگ، کمپریشن، مینوئل ایڈیٹس)
ٹوکن، لمبائی اور ریزولیوشن کے تحفظات
- Veo 3.1 ٹیکسٹ ان پٹس میں ٹوکن کی حد ہوتی ہے (مثال کے طور پر، کچھ پیش نظارہ مختلف حالتوں کے لیے ~1,024 ٹوکن) اور آؤٹ پٹ عام طور پر ایک مختصر ویڈیو ہے (مثالیں اکثر 8s دکھاتی ہیں)؛ مختصر اور تکراری ہو. طویل مواد کے لیے ایک سے زیادہ تیار کردہ کلپس کو سلائی کرنے کا منصوبہ بنائیں۔
نتیجہ — تخلیق کاروں اور ایڈیٹرز کے لیے Veo 3.1 کیا تبدیل کرتا ہے۔
Veo 3.1 مختصر شکل، آڈیو-مقامی AI ویڈیو جنریشن میں ایک عملی چھلانگ کی نمائندگی کرتا ہے۔ یہ صرف ایک جنریٹر نہیں ہے: یہ ایک بن رہا ہے۔ ایڈیٹنگ اسسٹنٹ فلو اور جیمنی اسٹوڈیو جیسے اندر کے ٹولز جو تخلیق کاروں کو وہی جنریٹو پرائمیٹوز کو دوبارہ استعمال کرتے ہوئے سرجیکل ایڈیٹس (آبجیکٹ داخل/ہٹانا، کیمرہ دوبارہ شوٹ) کرنے دیتے ہیں۔ ڈویلپرز اور پوسٹ ٹیموں کے لیے، تجویز کردہ طریقہ تکراری ہے: شارٹ ٹیک تیار کرنے اور بڑھانے کے لیے API کا استعمال کریں، تسلسل کے لیے ریفرنس فریم استعمال کریں، اور روایتی ٹولز کے ساتھ حتمی کمپوزٹنگ اور آڈیو مکسنگ انجام دیں۔
ڈویلپرز رسائی حاصل کر سکتے ہیں۔ Veo 3.1 API اور جیمنی 3 پرو امیج (نینو کیلے پرو) CometAPI کے ذریعے۔ شروع کرنے کے لیے، میں CometAPI کی ماڈل صلاحیتوں کو دریافت کریں۔ کھیل کے میدان اور مشورہ API گائیڈ تفصیلی ہدایات کے لیے۔ رسائی کرنے سے پہلے، براہ کرم یقینی بنائیں کہ آپ نے CometAPI میں لاگ ان کیا ہے اور API کلید حاصل کر لی ہے۔ ٹی ٹی کامeٹی اے پی آئی آپ کو انضمام میں مدد کے لیے سرکاری قیمت سے کہیں کم قیمت پیش کریں۔
جانے کے لیے تیار ہیں؟→ CometAPI کے لیے آج ہی سائن اپ کریں۔ !
اگر آپ AI پر مزید ٹپس، گائیڈز اور خبریں جاننا چاہتے ہیں تو ہمیں فالو کریں۔ VK, X اور Discord!
