Does Sora 2 Pro generate synchronized audio with video?

ہاں، Sora 2 Pro ویڈیو فریموں کے ساتھ ہم آہنگ آڈیو بھی تیار کرتا ہے، جس میں مکالمہ، ماحول کی آواز اور ساؤنڈ ایفیکٹس شامل ہوتے ہیں—انہیں الگ الگ نہیں بنایا جاتا بلکہ ایک متحد آؤٹ پٹ کے طور پر فراہم کیا جاتا ہے۔

What resolution and duration does Sora 2 Pro support?

Sora 2 Pro زیادہ سے زیادہ 1080p ریزولوشن تک سپورٹ کرتا ہے۔ یہ اعلیٰ معیار کے مختصر کلپس کے لیے بہتر بنایا گیا ہے، جو عموماً چند سیکنڈ سے لے کر دس کے اوائل سیکنڈز تک کی حد میں ہوتے ہیں، تاکہ زیادہ سے زیادہ وفاداری برقرار رہے۔

How does Sora 2 Pro differ from standard Sora 2?

Sora 2 Pro کو زیادہ بصری وفاداری کے لیے ٹیون کیا گیا ہے، یہ مشکل شاٹس (پیچیدہ حرکت، اوکلوژن، جسمانی تعاملات) کو بہتر طور پر سنبھالتا ہے، اور ہر منظر میں زیادہ دیر تک یکسانیت برقرار رکھتا ہے—لیکن اس کے بدلے رینڈرنگ کا وقت زیادہ ہو جاتا ہے۔

Can Sora 2 Pro use reference images to guide video generation?

ہاں، Sora 2 Pro input_reference ورک فلو کو سپورٹ کرتا ہے جہاں JPEG/PNG/WEBP تصاویر کمپوزیشن اینکرز کے طور پر کام کرتی ہیں تاکہ تیار کی گئی ویڈیو کے ابتدائی فریم یا انداز کی رہنمائی ہو۔

Does Sora 2 Pro support likeness injection (cameos)?

ہاں، Sora 2 Pro صارف کی ریکارڈ کی گئی شباہت کو تیار کردہ مناظر میں شامل کر سکتا ہے۔ OpenAI نے رازداری اور غلط استعمال کے خطرات سے نمٹنے کے لیے اندرونی رضامندی ورک فلو اور منسوخی کے طریقہ کار فراہم کیے ہیں۔

How long does Sora 2 Pro take to render a video?

بینچ مارک ٹیسٹس سے ظاہر ہوتا ہے کہ Sora 2 Pro اوسطاً 20-second 1080p کلپ کے لیے تقریباً 2.1 منٹ لیتا ہے۔ Pro رفتار کے مقابلے میں معیار کو ترجیح دیتا ہے، اس لیے standard Sora 2 کے مقابلے میں زیادہ رینڈر وقت کی توقع رکھیں۔

What physics improvements does Sora 2 Pro offer?

Sora 2 Pro آبجیکٹ پرمیننس اور حرکی وفاداری کو بہتر بناتا ہے—مومینٹم، بویانسی اور جسمانی تعاملات زیادہ حقیقت پسند محسوس ہوتے ہیں، اور پہلے کے ویڈیو ماڈلز میں عام 'teleporting' آرٹیفیکٹس نسبتاً کم دکھائی دیتے ہیں۔

When should I choose Sora 2 Pro over Google Veo 3?

OpenAI اکوسسٹم کے انضمام، likeness injection، اور پیچیدہ جسمانی مناظر کے لیے Sora 2 Pro کا انتخاب کریں۔ Veo 3 ممکن ہے تیز تر جنریشن اور مختلف قیمت کاری پیش کرے—اس لیے اپنی لیٹنسی اور بجٹ کی ضروریات کی بنیاد پر جائزہ لیں۔

سستی Sora 2 Pro API | text-to-video

Sora 2 Pro کے لیے Playground

Sora 2 Pro کا Playground دریافت کریں — ماڈلز کو ٹیسٹ کرنے اور حقیقی وقت میں سوالات چلانے کے لیے ایک متحرک ماحول۔ پرامپٹس آزمائیں، پیرامیٹرز ایڈجسٹ کریں، اور فوری طور پر دہرائیں تاکہ ترقی کو تیز کریں اور استعمال کے معاملات کی تصدیق کریں۔

کلیدی خصوصیات

ملٹی موڈل جنریشن (ویڈیو + آڈیو) — Sora-2-Pro ویڈیو فریمز کو ہم آہنگ آڈیو (مکالمہ، ماحول کی آواز، SFX) کے ساتھ ایک ساتھ تیار کرتا ہے، بجائے اس کے کہ ویڈیو اور آڈیو کو الگ الگ تیار کیے جائیں۔
اعلیٰ وفاداری / “Pro” ٹئیر — Sora-2 (نان پرو) کے مقابلے میں زیادہ بصری وفاداری، مشکل شاٹس (پیچیدہ حرکت، اوکلوژن، اور جسمانی تعاملات)، اور فی منظر زیادہ دیر تک تسلسل کے لیے ٹونڈ ہے۔ یہ معیاری Sora-2 ماڈل کے مقابلے میں رینڈر کرنے میں زیادہ وقت لے سکتا ہے۔
ان پٹ میں تنوع — خالص ٹیکسٹ پرامپٹس کی حمایت کرتا ہے، اور کمپوزیشن کی رہنمائی کے لیے امیج ان پٹ فریمز یا ریفرنس امیجز قبول کر سکتا ہے (input_reference ورک فلو)۔
Cameos / likeness انجیکشن — ایپ میں رضامندی کے ورک فلو کے ساتھ صارف کی ریکارڈ شدہ شباہت کو تیار کردہ مناظر میں داخل کر سکتا ہے۔
جسمانی معقولیت: آبجیکٹ پرمننس اور حرکت کی وفاداری میں بہتری (مثلاً مومنٹم، بویانسی)، پہلے کے نظاموں میں عام غیر حقیقی “ٹیلی پورٹنگ” آثار کو کم کرتی ہے۔
قابو پذیری: ساختہ پرامپٹس اور شاٹ سطح کی ہدایات کی حمایت کرتا ہے تاکہ تخلیق کار کیمرہ، لائٹنگ، اور ملٹی شاٹ سیکوئنسز متعین کر سکیں۔

تکنیکی تفصیلات اور انضمامی سطح

ماڈل فیملی: Sora 2 (بیس) اور Sora 2 Pro (اعلیٰ معیار کا ویرینٹ)۔
ان پٹ موڈالیٹیز: ٹیکسٹ پرامپٹس، امیج ریفرنس، اور لائکنس کے لیے مختصر ریکارڈ شدہ کیمیو ویڈیو/آڈیو۔
آؤٹ پٹ موڈالیٹیز: انکوڈڈ ویڈیو (آڈیو کے ساتھ) — پیرا میٹرز /v1/videos اینڈپوائنٹس کے ذریعے فراہم کیے جاتے ہیں (ماڈل کا انتخاب model: "sora-2-pro" کے ذریعے)۔ API سطح بنانا/حاصل کرنا/لسٹ کرنا/حذف کرنا آپریشنز کے لیے OpenAI کی ویڈیوز اینڈپوائنٹس فیملی کی پیروی کرتی ہے۔

ٹریننگ اور آرکیٹیکچر (عوامی خلاصہ): OpenAI کے مطابق Sora 2 کو بڑے پیمانے کی ویڈیو ڈیٹا پر ٹرین کیا گیا ہے اور ورلڈ سمیولیشن بہتر بنانے کے لیے پوسٹ ٹریننگ کی گئی ہے؛ مخصوص تفصیلات (ماڈل سائز، عین ڈیٹاسیٹس، اور ٹوکنائزیشن) لائن بہ لائن عوامی طور پر درج نہیں۔ بھاری کمپیوٹ، خصوصی ویڈیو ٹوکنائزرز/آرکیٹیکچرز اور ملٹی موڈل الائنمنٹ کمپوننٹس متوقع ہیں۔

API اینڈپوائنٹس اور ورک فلو: جاب پر مبنی ورک فلو دکھائیں: ایک POST تخلیقی درخواست جمع کریں (model="sora-2-pro")، جاب آئی ڈی یا لوکیشن حاصل کریں، پھر تکمیل کے لیے پول کریں یا انتظار کریں اور نتیجے میں ملنے والی فائل(ز) ڈاؤن لوڈ کریں۔ شائع شدہ مثالوں میں عام پیرا میٹرز میں prompt, seconds/duration, size/resolution, اور امیج گائیڈڈ آغاز کے لیے input_reference شامل ہوتے ہیں۔

عام پیرا میٹرز :

model: "sora-2-pro"
prompt: فطری زبان میں منظر کی وضاحت، اختیاری طور پر مکالمے کے اشاروں کے ساتھ
seconds / duration: ہدف کلپ کی طوالت (Pro دستیاب دورانیوں میں اعلیٰ ترین کوالٹی کی حمایت کرتا ہے)
size / resolution: کمیونٹی رپورٹس کے مطابق Pro کئی استعمالات میں زیادہ سے زیادہ 1080p تک سپورٹ کرتا ہے۔

مواد کی ان پٹس: امیج فائلیں (JPEG/PNG/WEBP) بطور فریم یا ریفرنس فراہم کی جا سکتی ہیں؛ استعمال کی صورت میں، امیج ہدف ریزولوشن سے مماثل ہو اور کمپوزیشن اینکر کا کردار ادا کرے۔

رینڈرنگ کا برتاؤ: Pro کو فریم بہ فریم ہم آہنگی اور حقیقی جسمانیات کو ترجیح دینے کے لیے ٹون کیا گیا ہے؛ اس کا مطلب عموماً زیادہ کمپیوٹ وقت اور نان پرو ویرینٹس کے مقابلے میں فی کلپ زیادہ لاگت ہوتا ہے۔

بینچ مارک کارکردگی

کیفیاتی مضبوطیاں: OpenAI نے پچھلے ویڈیو ماڈلز کے مقابلے میں حقیقت پذیری، جسمانی مطابقت، اور ہم آہنگ آڈیو** میں بہتری کی ہے۔ دیگر VBench نتائج سے ظاہر ہوتا ہے کہ Sora-2 اور اس کی مشتقات عصری کلوز سورس اور وقتی ہم آہنگی کے سرِفہرست کے قریب ہیں۔

آزاد ٹائمنگ/تھروپٹ (مثالی بینچ): Sora-2-Pro نے 20 سیکنڈ، 1080p کلپس کے لیے اوسطاً ~2.1 منٹ لیے، جبکہ ایک مقابل (Runway Gen-3 Alpha Turbo) اسی کام پر تیز تھا (~1.7 منٹ) — کوالٹی بمقابلہ رینڈر لیٹنسی اور پلیٹ فارم آپٹیمائزیشن کے مابین توازن۔

حدود (عملی اور حفاظتی)

ناقص نہ سہی مگر کامل بھی نہیں — جسمانیات/تسلسل بہتر مگر بے عیب نہیں؛ آثار، غیر فطری حرکت، یا آڈیو سنک کی غلطیاں اب بھی ہو سکتی ہیں۔
دورانیہ اور کمپیوٹ پابندیاں — طویل کلپس کمپیوٹ کے لحاظ سے بھاری ہوتی ہیں؛ عملی ورک فلو اکثر کلپس کو مختصر دورانیوں (مثلاً چند سے چند درجن سیکنڈز) تک محدود کرتے ہیں۔
پرائیویسی / رضامندی کے خدشات — likeness انجیکشن (“کیمیوز”) رضامندی اور غلط معلومات کے خطرات بڑھاتا ہے؛ OpenAI کے ایپ میں واضح حفاظتی کنٹرولز اور ری وکیشن میکانزم موجود ہیں، مگر ذمہ دارانہ انضمام ضروری ہے۔
لاگت اور تاخیر — Pro معیار کے رینڈر ہلکے ماڈلز یا حریفوں کے مقابلے میں مہنگے اور سست ہو سکتے ہیں؛ فی سیکنڈ/فی رینڈر بلنگ اور کیوئنگ کو پیشِ نظر رکھیں۔
حفاظتی مواد کی فلٹرنگ — مضر یا کاپی رائٹڈ مواد کی جنریشن محدود ہے؛ ماڈل اور پلیٹ فارم میں حفاظتی تہیں اور ماڈریشن شامل ہیں۔

عام اور تجویز کردہ استعمال کے کیسز

استعمالات:

مارکیٹنگ اور اشتہارات کے پروٹوٹائپس — سینیمیٹک پروف آف کانسیپٹ تیزی سے تیار کریں۔
پری ویژولائزیشن — اسٹوری بورڈز، کیمرہ بلاکنگ، شاٹ ویژولائزیشن۔
مختصر سوشل مواد — ہم آہنگ مکالمے اور SFX کے ساتھ اسٹائلائزڈ کلپس۔
Sora 2 Pro API تک کیسے رسائی حاصل کریں

مرحلہ 1: API کلید کے لیے سائن اپ کریں

cometapi.com میں لاگ ان کریں۔ اگر آپ ابھی تک ہمارے صارف نہیں ہیں تو پہلے رجسٹر کریں۔ اپنے CometAPI کنسول میں سائن ان کریں۔ انٹرفیس کی ایکسیس اسناد API کلید حاصل کریں۔ پرسنل سینٹر میں API ٹوکن پر “Add Token” پر کلک کریں، ٹوکن کلید حاصل کریں: sk-xxxxx اور جمع کرائیں۔

CometAPI کی کلید

مرحلہ 2: Sora 2 Pro API کو درخواستیں بھیجیں

API درخواست بھیجنے کے لیے “sora-2-pro” اینڈپوائنٹ منتخب کریں اور ریکویسٹ باڈی سیٹ کریں۔ درخواست کا طریقہ اور ریکویسٹ باڈی ہماری ویب سائٹ کی API ڈاک سے حاصل کیے جاتے ہیں۔ آپ کی سہولت کے لیے ہماری ویب سائٹ Apifox ٹیسٹ بھی فراہم کرتی ہے۔ <YOUR_API_KEY> کو اپنے اکاؤنٹ کی اصل CometAPI کلید سے بدلیں۔ بیس url is office ویڈیو بنائیں

اپنا سوال یا درخواست کنٹینٹ فیلڈ میں درج کریں—یہی وہ ہے جس کا ماڈل جواب دے گا ۔ جنریٹڈ جواب حاصل کرنے کے لیے API ریسپانس کو پراسیس کریں۔

مرحلہ 3: نتائج حاصل کریں اور توثیق کریں

جنریٹڈ جواب حاصل کرنے کے لیے API ریسپانس کو پراسیس کریں۔ پراسیسنگ کے بعد، API ٹاسک کا اسٹیٹس اور آؤٹ پٹ ڈیٹا کے ساتھ جواب دیتی ہے۔

اندرونی ٹریننگ / سمیولیشن — RL یا روبوٹکس تحقیق کے لیے منظرنامہ ویژولز تیار کریں (احتیاط کے ساتھ)۔
تخلیقی پروڈکشن — جب انسانی ایڈیٹنگ کے ساتھ ملایا جائے (مختصر کلپس جوڑنا، گریڈ، آڈیو تبدیل کرنا)۔

اکثر پوچھے جانے والے سوالات

Sora 2 Pro کی قیمتیں

[ماڈل کا نام] کے لیے مسابقتی قیمتوں کو دریافت کریں، جو مختلف بجٹ اور استعمال کی ضروریات کے مطابق ڈیزائن کیا گیا ہے۔ ہمارے لچکدار منصوبے اس بات کو یقینی بناتے ہیں کہ آپ صرف اسی کے لیے ادائیگی کریں جو آپ استعمال کرتے ہیں، جس سے آپ کی ضروریات بڑھنے کے ساتھ ساتھ اسکیل کرنا آسان ہو جاتا ہے۔ دریافت کریں کہ [ماڈل کا نام] کیسے آپ کے پروجیکٹس کو بہتر بنا سکتا ہے جبکہ اخراجات کو قابو میں رکھتا ہے۔

Model Name	Tags	Orientation	Resolution	Price
sora-2-pro	videos	Portrait	720x1280	$0.24 / sec
sora-2-pro	videos	Landscape	1280x720	$0.24 / sec
sora-2-pro	videos	Portrait (High Res)	1024x1792	$0.40 / sec
sora-2-pro	videos	Landscape (High Res)	1792x1024	$0.40 / sec
sora-2-pro-all	-	Universal / All	-	$0.80000

Sora 2 Pro کے لیے نمونہ کوڈ اور API

Sora-2-pro، OpenAI کا فلیگ شپ ویڈیو+آڈیو جنریشن ماڈل ہے، جو مختصر، انتہائی حقیقی نما ویڈیو کلپس تیار کرنے کے لیے ڈیزائن کیا گیا ہے جن میں ہم آہنگ مکالمہ اور ساؤنڈ ایفیکٹس شامل ہوں، اور جو پچھلے ویڈیو ماڈلز کی نسبت فزکس اور دنیا کی سمیولیشن کو زیادہ مضبوطی سے پیش کرتا ہے۔ اسے ادائیگی کرنے والے صارفین کے لیے، اور پروگرامی تخلیق کے لیے API کے ذریعے دستیاب، اعلیٰ معیار کے “Pro” ویریئنٹ کے طور پر پیش کیا گیا ہے۔ یہ ماڈل سنیماٹک اور سوشل استعمالات کے لیے قابو پذیری، وقتی ربط، اور آڈیو کی ہم آہنگی پر زور دیتا ہے۔

POST

/v1/videos

# Create a video with sora-2-pro
# Step 1: Submit the video generation request
echo "Submitting video generation request..."
response=$(curl -s https://api.cometapi.com/v1/videos \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -F "model=sora-2-pro" \
  -F "prompt=A calico cat playing a piano on stage")

echo "Response: $response"

# Extract video_id from response (handle JSON with spaces like "id": "xxx")
video_id=$(echo "$response" | tr -d '
' | sed 's/.*"id"[[:space:]]*:[[:space:]]*"\([^"]*\)".*/\1/')
echo "Video ID: $video_id"

# Step 2: Poll for progress until 100%
echo ""
echo "Checking video generation progress..."
while true; do
  status_response=$(curl -s "https://api.cometapi.com/v1/videos/$video_id" \
    -H "Authorization: Bearer $COMETAPI_KEY")

  # Parse progress from "progress": "0%" format
  progress=$(echo "$status_response" | grep -o '"progress":"[^"]*"' | head -1 | sed 's/"progress":"//;s/"$//')
  # Parse status from the outer level
  status=$(echo "$status_response" | grep -o '"status":"[^"]*"' | head -1 | sed 's/"status":"//;s/"$//')

  echo "Progress: $progress, Status: $status"

  if [ "$progress" = "100%" ]; then
    echo "Video generation completed!"
    break
  fi

  if [ "$status" = "FAILURE" ] || [ "$status" = "failed" ]; then
    echo "Video generation failed!"
    echo "$status_response"
    exit 1
  fi

  sleep 10
done

# Step 3: Download the video to output directory
echo ""
echo "Downloading video to ./output/$video_id.mp4..."
mkdir -p ./output
curl -s "https://api.cometapi.com/v1/videos/$video_id/content" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -o "./output/$video_id.mp4"

if [ -f "./output/$video_id.mp4" ]; then
  echo "Video saved to ./output/$video_id.mp4"
  ls -la "./output/$video_id.mp4"
else
  echo "Failed to download video"
  exit 1
fi

Curl Code Example

# Create a video with sora-2-pro
# Step 1: Submit the video generation request
echo "Submitting video generation request..."
response=$(curl -s https://api.cometapi.com/v1/videos \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -F "model=sora-2-pro" \
  -F "prompt=A calico cat playing a piano on stage")

echo "Response: $response"

# Extract video_id from response (handle JSON with spaces like "id": "xxx")
video_id=$(echo "$response" | tr -d '\n' | sed 's/.*"id"[[:space:]]*:[[:space:]]*"\([^"]*\)".*/\1/')
echo "Video ID: $video_id"

# Step 2: Poll for progress until 100%
echo ""
echo "Checking video generation progress..."
while true; do
  status_response=$(curl -s "https://api.cometapi.com/v1/videos/$video_id" \
    -H "Authorization: Bearer $COMETAPI_KEY")
  
  # Parse progress from "progress": "0%" format
  progress=$(echo "$status_response" | grep -o '"progress":"[^"]*"' | head -1 | sed 's/"progress":"//;s/"$//')
  # Parse status from the outer level
  status=$(echo "$status_response" | grep -o '"status":"[^"]*"' | head -1 | sed 's/"status":"//;s/"$//')
  
  echo "Progress: $progress, Status: $status"
  
  if [ "$progress" = "100%" ]; then
    echo "Video generation completed!"
    break
  fi
  
  if [ "$status" = "FAILURE" ] || [ "$status" = "failed" ]; then
    echo "Video generation failed!"
    echo "$status_response"
    exit 1
  fi
  
  sleep 10
done

# Step 3: Download the video to output directory
echo ""
echo "Downloading video to ./output/$video_id.mp4..."
mkdir -p ./output
curl -s "https://api.cometapi.com/v1/videos/$video_id/content" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -o "./output/$video_id.mp4"

if [ -f "./output/$video_id.mp4" ]; then
  echo "Video saved to ./output/$video_id.mp4"
  ls -la "./output/$video_id.mp4"
else
  echo "Failed to download video"
  exit 1
fi

Python Code Example

# Create a video with sora-2-pro using raw HTTP requests
import os
import time
import requests

api_key = os.environ.get("COMETAPI_KEY")
base_url = "https://api.cometapi.com/v1"

headers = {"Authorization": f"Bearer {api_key}"}

# Step 1: Submit the video generation request
print("Submitting video generation request...")
response = requests.post(
    f"{base_url}/videos",
    headers=headers,
    files={
        "model": (None, "sora-2-pro"),
        "prompt": (None, "A calico cat playing a piano on stage"),
    },
)

result = response.json()
print(f"Response: {result}")

video_id = result.get("id")
print(f"Video ID: {video_id}")

# Step 2: Poll for progress until 100%
print("\nChecking video generation progress...")
while True:
    try:
        status_response = requests.get(f"{base_url}/videos/{video_id}", headers=headers)
        status_result = status_response.json()

        # Parse progress and status from response
        data = status_result.get("data", {})
        if data is None:
            data = {}
        progress = data.get("progress", "0%")
        status = data.get("status", "unknown")

        print(f"Progress: {progress}, Status: {status}")

        if status in ["FAILURE", "failed"]:
            print("Video generation failed!")
            print(status_result)
            exit(1)

        if progress == "100%":
            print("Video generation completed!")
            break
    except Exception as e:
        print(f"Temporary error: {e}, retrying...")

    time.sleep(10)

# Step 3: Download the video to output directory
print(f"\nDownloading video to ./output/{video_id}.mp4...")
os.makedirs("./output", exist_ok=True)

video_response = requests.get(f"{base_url}/videos/{video_id}/content", headers=headers)

output_path = f"./output/{video_id}.mp4"
with open(output_path, "wb") as f:
    f.write(video_response.content)

if os.path.exists(output_path):
    file_size = os.path.getsize(output_path)
    print(f"Video saved to {output_path}")
    print(f"File size: {file_size} bytes")
else:
    print("Failed to download video")
    exit(1)

JavaScript Code Example

// Create a video with sora-2-pro using raw HTTP requests
import fs from "fs";
import path from "path";

const apiKey = process.env.COMETAPI_KEY;
const baseUrl = "https://api.cometapi.com/v1";

async function sleep(ms) {
  return new Promise((resolve) => setTimeout(resolve, ms));
}

async function main() {
  // Step 1: Submit the video generation request
  console.log("Submitting video generation request...");

  const formData = new FormData();
  formData.append("model", "sora-2-pro");
  formData.append("prompt", "A calico cat playing a piano on stage");

  const submitResponse = await fetch(`${baseUrl}/videos`, {
    method: "POST",
    headers: {
      Authorization: `Bearer ${apiKey}`,
    },
    body: formData,
  });

  const result = await submitResponse.json();
  console.log("Response:", JSON.stringify(result, null, 2));

  const videoId = result.id;
  console.log("Video ID:", videoId);

  // Step 2: Poll for progress until 100%
  console.log("\nChecking video generation progress...");

  while (true) {
    try {
      const statusResponse = await fetch(`${baseUrl}/videos/${videoId}`, {
        headers: {
          Authorization: `Bearer ${apiKey}`,
        },
      });

      const text = await statusResponse.text();
      if (text.startsWith("<")) {
        console.log("Temporary server error, retrying...");
        await sleep(10000);
        continue;
      }

      const statusResult = JSON.parse(text);

      // Parse progress and status from response
      const data = statusResult.data || {};
      const progress = data.progress || "0%";
      const status = data.status || "unknown";

      console.log(`Progress: ${progress}, Status: ${status}`);

      if (status === "FAILURE" || status === "failed") {
        console.log("Video generation failed!");
        console.log(JSON.stringify(statusResult, null, 2));
        process.exit(1);
      }

      if (progress === "100%") {
        console.log("Video generation completed!");
        break;
      }
    } catch (e) {
      console.log(`Temporary error: ${e.message}, retrying...`);
    }

    await sleep(10000);
  }

  // Step 3: Download the video to output directory
  console.log(`\nDownloading video to ./output/${videoId}.mp4...`);

  const outputDir = "./output";
  if (!fs.existsSync(outputDir)) {
    fs.mkdirSync(outputDir, { recursive: true });
  }

  const videoResponse = await fetch(`${baseUrl}/videos/${videoId}/content`, {
    headers: {
      Authorization: `Bearer ${apiKey}`,
    },
  });

  const outputPath = path.join(outputDir, `${videoId}.mp4`);
  const videoBuffer = Buffer.from(await videoResponse.arrayBuffer());
  fs.writeFileSync(outputPath, videoBuffer);

  if (fs.existsSync(outputPath)) {
    const stats = fs.statSync(outputPath);
    console.log(`Video saved to ${outputPath}`);
    console.log(`File size: ${stats.size} bytes`);
  } else {
    console.log("Failed to download video");
    process.exit(1);
  }
}

main().catch(console.error);