Does Sora 2 Pro generate synchronized audio with video?

ใช่ Sora 2 Pro สร้างเฟรมวิดีโอพร้อมเสียงที่ซิงโครไนซ์ รวมถึงบทสนทนา เสียงบรรยากาศ และเอฟเฟ็กต์เสียง—ไม่ผลิตแยกส่วน แต่เป็นเอาต์พุตแบบรวมเดียว.

What resolution and duration does Sora 2 Pro support?

Sora 2 Pro รองรับความละเอียดสูงสุด 1080p ได้รับการปรับแต่งเพื่อคลิปสั้นคุณภาพสูง โดยทั่วไปอยู่ในช่วงวินาทีหลักเดียวจนถึงช่วงสิบต้น ๆ ของวินาที เพื่อให้ได้ความเที่ยงตรงสูงสุด.

How does Sora 2 Pro differ from standard Sora 2?

Sora 2 Pro ถูกปรับจูนเพื่อความเที่ยงตรงด้านภาพที่สูงกว่า จัดการช็อตที่ซับซ้อนยิ่งขึ้น (การเคลื่อนไหวซับซ้อน การบังกัน การปฏิสัมพันธ์ทางกายภาพ) และรักษาความสอดคล้องต่อฉากได้นานกว่า—แลกมาด้วยเวลาการเรนเดอร์ที่ยาวขึ้น.

Can Sora 2 Pro use reference images to guide video generation?

ใช่ Sora 2 Pro รองรับเวิร์กโฟลว์ input_reference ซึ่งภาพ JPEG/PNG/WEBP ทำหน้าที่เป็นจุดยึดการจัดองค์ประกอบ เพื่อกำกับเฟรมเริ่มต้นหรือสไตล์ของวิดีโอที่สร้างขึ้น.

Does Sora 2 Pro support likeness injection (cameos)?

ใช่ Sora 2 Pro สามารถแทรกภาพลักษณ์ที่บันทึกของผู้ใช้ลงในฉากที่สร้างขึ้นได้ OpenAI มีเวิร์กโฟลว์การให้ความยินยอมและกลไกการเพิกถอนแบบฝังใน เพื่อรับมือกับความเสี่ยงด้านความเป็นส่วนตัวและการใช้ในทางที่ผิด.

How long does Sora 2 Pro take to render a video?

การทดสอบเกณฑ์มาตรฐานแสดงให้เห็นว่า Sora 2 Pro ใช้เวลาเฉลี่ยประมาณ 2.1 นาทีสำหรับคลิป 1080p ความยาว 20 วินาที รุ่น Pro ให้ความสำคัญกับคุณภาพมากกว่าความเร็ว ดังนั้นควรคาดว่าเวลาการเรนเดอร์จะยาวกว่า Sora 2 รุ่นมาตรฐาน.

What physics improvements does Sora 2 Pro offer?

Sora 2 Pro ปรับปรุงการคงอยู่ของวัตถุและความเที่ยงตรงของการเคลื่อนไหว—โมเมนตัม การลอยตัว และการปฏิสัมพันธ์ทางกายภาพดูสมจริงมากขึ้น พร้อมลดสิ่งผิดปกติแบบ 'teleporting' ที่พบได้บ่อยในโมเดลวิดีโอรุ่นก่อน.

When should I choose Sora 2 Pro over Google Veo 3?

เลือก Sora 2 Pro เมื่อต้องการการบูรณาการกับระบบนิเวศของ OpenAI การแทรกภาพลักษณ์ และฉากทางกายภาพที่ซับซ้อน ส่วน Veo 3 อาจให้การสร้างที่เร็วกว่าพร้อมการกำหนดราคาที่แตกต่าง—ประเมินตามความต้องการด้านความหน่วงและงบประมาณของคุณ.

API Sora 2 Pro ราคาประหยัด | text-to-video

Playground สำหรับ Sora 2 Pro

สำรวจ Playground ของ Sora 2 Pro — สภาพแวดล้อมแบบโต้ตอบสำหรับทดสอบโมเดลและรันคำถามแบบเรียลไทม์ ลองใช้ prompts ปรับพารามิเตอร์ และทำซ้ำทันทีเพื่อเร่งการพัฒนาและตรวจสอบกรณีการใช้งาน

คุณสมบัติหลัก

การสร้างแบบมัลติโหมด (วิดีโอ + เสียง) — Sora-2-Pro สร้างเฟรมวิดีโอพร้อมเสียงที่ซิงก์กัน (บทสนทนา เสียงบรรยากาศ SFX) แทนการสร้างวิดีโอและเสียงแยกกัน
ความเที่ยงตรงสูง / ระดับ “Pro” — ปรับจูนเพื่อความเที่ยงตรงด้านภาพที่สูงขึ้น รับมือช็อตยาก (การเคลื่อนไหวซับซ้อน การบัง การปฏิสัมพันธ์ทางกายภาพ) และคงความสม่ำเสมอต่อฉากได้นานกว่า Sora-2 (non-Pro) อาจใช้เวลาสร้างนานกว่ารุ่นมาตรฐาน Sora-2
ความยืดหยุ่นของอินพุต — รองรับพรอมต์ข้อความล้วน และรับเฟรมภาพหรือภาพอ้างอิงเพื่อกำหนดองค์ประกอบ (เวิร์กโฟลว์ input_reference)
คาเมโอ / การแทรกรูปลักษณ์ — สามารถแทรกรูปลักษณ์ของผู้ใช้ที่บันทึกไว้เข้าไปในฉากที่สร้างขึ้น โดยมีเวิร์กโฟลว์การให้ความยินยอมในแอป
ความสมจริงทางฟิสิกส์: ปรับปรุงการคงอยู่ของวัตถุและความเที่ยงตรงของการเคลื่อนไหว (เช่น โมเมนตัม แรงลอยตัว) ลดสิ่งประหลาดแบบ “เทเลพอร์ต” ที่ไม่สมจริงซึ่งพบได้ในระบบรุ่นก่อน
ความสามารถในการควบคุม: รองรับพรอมต์แบบมีโครงสร้างและคำสั่งระดับช็อต เพื่อให้ผู้สร้างระบุการกล้อง แสง และลำดับหลายช็อตได้

รายละเอียดทางเทคนิคและการผสานการทำงาน

ตระกูลโมเดล: Sora 2 (รุ่นพื้นฐาน) และ Sora 2 Pro (ตัวแปรคุณภาพสูง)
รูปแบบอินพุต: พรอมต์ข้อความ ภาพอ้างอิง และวิดีโอ/เสียงคาเมโอแบบสั้นที่บันทึกไว้สำหรับรูปลักษณ์
รูปแบบเอาต์พุต: วิดีโอเข้ารหัส (พร้อมเสียง) — พารามิเตอร์เปิดเผยผ่านเอ็นด์พอยต์ /v1/videos (เลือกโมเดลผ่าน model: "sora-2-pro"). พื้นผิว API ปฏิบัติตามตระกูลเอ็นด์พอยต์วิดีโอของ OpenAI สำหรับการสร้าง/ดึงข้อมูล/แสดงรายการ/ลบ

การฝึกและสถาปัตยกรรม (สรุปสาธารณะ): OpenAI ระบุว่า Sora 2 ถูกฝึกด้วยข้อมูลวิดีโอขนาดใหญ่ พร้อมการฝึกหลังเพื่อปรับปรุงการจำลองโลก; รายละเอียดเฉพาะ (ขนาดโมเดล ชุดข้อมูล และการโทเคไนซ์) ไม่ได้เปิดเผยแบบบรรทัดต่อบรรทัด คาดว่าจะใช้คอมพิวต์ระดับสูง โทเคไนเซอร์/สถาปัตยกรรมวิดีโอเฉพาะทาง และองค์ประกอบการจัดแนวแบบหลายโมดัล

API endpoints & workflow: แสดงเวิร์กโฟลว์แบบยึดตามงาน: ส่งคำขอสร้างแบบ POST (model="sora-2-pro") รับ job id หรือ location จากนั้นโพลหรือรอให้เสร็จและดาวน์โหลดไฟล์ผลลัพธ์ โดยตัวอย่างที่เผยแพร่มักมีพารามิเตอร์อย่าง prompt, seconds/duration, size/resolution และ input_reference สำหรับการเริ่มแบบมีภาพนำทาง

พารามิเตอร์ทั่วไป :

model: "sora-2-pro"
prompt: คำอธิบายฉากด้วยภาษาธรรมชาติ อาจมีคำใบ้บทสนทนา
seconds / duration: ความยาวคลิปเป้าหมาย (รุ่น Pro รองรับคุณภาพสูงสุดในช่วงความยาวที่มีให้)
size / resolution: รายงานจากชุมชนระบุว่า Pro รองรับสูงสุดถึง 1080p ในหลายกรณีใช้งาน

อินพุตเนื้อหา: สามารถส่งไฟล์ภาพ (JPEG/PNG/WEBP) เป็นเฟรมหรือภาพอ้างอิง; เมื่อใช้งาน ควรให้ภาพมีความละเอียดตรงกับเป้าหมายและทำหน้าที่เป็นจุดยึดองค์ประกอบ

พฤติกรรมการเรนเดอร์: รุ่น Pro ปรับจูนเพื่อให้ความสอดคล้องเฟรมต่อเฟรมและฟิสิกส์ที่สมจริง ซึ่งโดยทั่วไปหมายถึงเวลาคำนวณนานกว่าและต้นทุนต่อคลิปสูงกว่ารุ่นไม่ใช่ Pro

ผลการทดสอบมาตรฐาน

จุดเด่นเชิงคุณภาพ: OpenAI ปรับปรุงความสมจริง ความสอดคล้องทางฟิสิกส์ และเสียงที่ซิงก์กับภาพ audio** เมื่อเทียบกับโมเดลวิดีโอก่อนหน้า ผลลัพธ์ VBench อื่น ๆ บ่งชี้ว่า Sora-2 และสายพันธุ์อยู่ที่หรือใกล้จุดสูงสุดของระบบปิดร่วมสมัยและความสอดคล้องตามเวลา

เวลา/อัตราผ่านระบบแบบอิสระ (ตัวอย่างการทดสอบ): Sora-2-Pro มีค่าเฉลี่ยประมาณ ~2.1 นาที สำหรับคลิป 20 วินาทีที่ความละเอียด 1080p ในการเปรียบเทียบหนึ่งครั้ง ขณะที่คู่แข่ง (Runway Gen-3 Alpha Turbo) เร็วกว่า (ประมาณ ~1.7 นาที) ในงานเดียวกัน — ต้องแลกระหว่างคุณภาพกับเวลาเรนเดอร์และการปรับแต่งแพลตฟอร์ม

ข้อจำกัด (เชิงปฏิบัติ & ความปลอดภัย)

ฟิสิกส์/ความสม่ำเสมอไม่สมบูรณ์แบบ — แม้จะดีขึ้นแต่ยังไม่ไร้ที่ติ; อาจยังมีอาร์ติแฟกต์ การเคลื่อนไหวไม่เป็นธรรมชาติ หรือข้อผิดพลาดการซิงก์เสียง
ข้อจำกัดด้านความยาว & คอมพิวต์ — คลิปยาวใช้ทรัพยากรคอมพิวต์สูง; เวิร์กโฟลว์จริงจำนวนมากจำกัดคลิปให้สั้น (เช่น ระดับไม่กี่วินาทีถึงสิบกว่าวินาทีสำหรับงานคุณภาพสูง)
ความเป็นส่วนตัว / ความยินยอม — การแทรกรูปลักษณ์ (“cameos”) มีความเสี่ยงเรื่องความยินยอมและการบิดเบือนข้อมูล; OpenAI มีระบบควบคุมความปลอดภัยและกลไกเพิกถอนในแอป แต่ต้องบูรณาการอย่างรับผิดชอบ
ต้นทุน & ความหน่วง — การเรนเดอร์คุณภาพ Pro มีค่าใช้จ่ายสูงและช้ากว่ารุ่นที่เบากว่าหรือคู่แข่ง; ควรคำนึงถึงการคิดค่าบริการต่อต้นทุนต่อวินาที/ต่อการเรนเดอร์และคิว
การกรองเนื้อหาด้านความปลอดภัย — การสร้างเนื้อหาที่เป็นอันตรายหรือมีลิขสิทธิ์ถูกจำกัด; โมเดลและแพลตฟอร์มมีเลเยอร์ความปลอดภัยและระบบกลั่นกรอง

กรณีใช้งานทั่วไปและที่แนะนำ

กรณีใช้งาน:

ต้นแบบการตลาด & โฆษณา — สร้างพรูฟออฟคอนเซปต์เชิงภาพยนตร์อย่างรวดเร็ว
พรีวิชวลไลซ์เซชัน — สตอรีบอร์ด การวางกล้อง การมองเห็นภาพรวมของช็อต
คอนเทนต์สั้นสำหรับโซเชียล — คลิปสไตล์ต่าง ๆ พร้อมบทสนทนาและเอฟเฟกต์เสียงที่ซิงก์
วิธีเข้าถึง Sora 2 Pro API

ขั้นตอนที่ 1: สมัครรับ API Key

เข้าสู่ระบบที่ cometapi.com หากคุณยังไม่เป็นผู้ใช้ของเรา โปรดลงทะเบียนก่อน ลงชื่อเข้าใช้ CometAPI console รับ API key สำหรับการเข้าถึงอินเทอร์เฟซ คลิก “Add Token” ที่ API token ในศูนย์ผู้ใช้ รับ token key: sk-xxxxx แล้วส่ง

คีย์ CometAPI

ขั้นตอนที่ 2: ส่งคำขอไปยัง Sora 2 Pro API

เลือกเอ็นด์พอยต์ “sora-2-pro” เพื่อส่งคำขอ API และกำหนด request body วิธีการร้องขอและ request body สามารถดูได้จากเอกสาร API บนเว็บไซต์ของเรา เว็บไซต์ยังมีการทดสอบ Apifox เพื่อความสะดวก แทนที่ <YOUR_API_KEY> ด้วย CometAPI key จริงจากบัญชีของคุณ base url คือ office Create video

ใส่คำถามหรือคำขอของคุณลงในฟิลด์ content—นี่คือสิ่งที่โมเดลจะตอบสนอง ประมวลผลการตอบกลับของ API เพื่อดึงคำตอบที่สร้างขึ้น

ขั้นตอนที่ 3: ดึงและตรวจสอบผลลัพธ์

ประมวลผลการตอบกลับของ API เพื่อรับคำตอบที่สร้างขึ้น หลังการประมวลผล API จะส่งสถานะงานและข้อมูลเอาต์พุต

การฝึกภายใน / การจำลอง — สร้างภาพสถานการณ์สำหรับงาน RL หรือวิจัยหุ่นยนต์ (ต้องระมัดระวัง)
งานสร้างสรรค์เชิงโปรดักชัน — เมื่อผสานกับการตัดต่อของมนุษย์ (ต่อคลิปสั้น ๆ เกรดสี แทนที่เสียง)

คำถามที่พบบ่อย

ราคาสำหรับ Sora 2 Pro

สำรวจราคาที่แข่งขันได้สำหรับ Sora 2 Pro ที่ออกแบบมาให้เหมาะสมกับงบประมาณและความต้องการการใช้งานที่หลากหลาย แผนการบริการที่ยืดหยุ่นของเรารับประกันว่าคุณจะจ่ายเฉพาะสิ่งที่คุณใช้เท่านั้น ทำให้สามารถขยายขนาดได้ง่ายเมื่อความต้องการของคุณเพิ่มขึ้น ค้นพบว่า Sora 2 Pro สามารถยกระดับโปรเจกต์ของคุณได้อย่างไรในขณะที่ควบคุมต้นทุนให้อยู่ในระดับที่จัดการได้

Model Name	Tags	Orientation	Resolution	Price
sora-2-pro	videos	Portrait	720x1280	$0.24 / sec
sora-2-pro	videos	Landscape	1280x720	$0.24 / sec
sora-2-pro	videos	Portrait (High Res)	1024x1792	$0.40 / sec
sora-2-pro	videos	Landscape (High Res)	1792x1024	$0.40 / sec
sora-2-pro-all	-	Universal / All	-	$0.80000

โค้ดตัวอย่างและ API สำหรับ Sora 2 Pro

Sora-2-pro เป็นโมเดลการสร้างวิดีโอ+เสียงระดับเรือธงของ OpenAI ที่ออกแบบมาเพื่อสร้างคลิปวิดีโอสั้นที่สมจริงสูง พร้อมบทสนทนาที่ซิงโครไนซ์ เอฟเฟ็กต์เสียง และการจำลองทางกายภาพ/โลกที่แข็งแกร่งกว่าโมเดลวิดีโอรุ่นก่อนหน้า โมเดลนี้ถูกวางตำแหน่งให้เป็นรุ่นย่อย “Pro” คุณภาพสูงกว่า ซึ่งเปิดให้ผู้ใช้แบบชำระเงินใช้งาน และเข้าถึงได้ผ่าน API สำหรับการสร้างเชิงโปรแกรม โมเดลให้ความสำคัญกับความสามารถในการควบคุม ความสอดคล้องเชิงเวลา และการซิงโครไนซ์เสียง สำหรับกรณีใช้งานด้านภาพยนตร์และโซเชียลมีเดีย

POST

/v1/videos

# Create a video with sora-2-pro
# Step 1: Submit the video generation request
echo "Submitting video generation request..."
response=$(curl -s https://api.cometapi.com/v1/videos \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -F "model=sora-2-pro" \
  -F "prompt=A calico cat playing a piano on stage")

echo "Response: $response"

# Extract video_id from response (handle JSON with spaces like "id": "xxx")
video_id=$(echo "$response" | tr -d '
' | sed 's/.*"id"[[:space:]]*:[[:space:]]*"\([^"]*\)".*/\1/')
echo "Video ID: $video_id"

# Step 2: Poll for progress until 100%
echo ""
echo "Checking video generation progress..."
while true; do
  status_response=$(curl -s "https://api.cometapi.com/v1/videos/$video_id" \
    -H "Authorization: Bearer $COMETAPI_KEY")

  # Parse progress from "progress": "0%" format
  progress=$(echo "$status_response" | grep -o '"progress":"[^"]*"' | head -1 | sed 's/"progress":"//;s/"$//')
  # Parse status from the outer level
  status=$(echo "$status_response" | grep -o '"status":"[^"]*"' | head -1 | sed 's/"status":"//;s/"$//')

  echo "Progress: $progress, Status: $status"

  if [ "$progress" = "100%" ]; then
    echo "Video generation completed!"
    break
  fi

  if [ "$status" = "FAILURE" ] || [ "$status" = "failed" ]; then
    echo "Video generation failed!"
    echo "$status_response"
    exit 1
  fi

  sleep 10
done

# Step 3: Download the video to output directory
echo ""
echo "Downloading video to ./output/$video_id.mp4..."
mkdir -p ./output
curl -s "https://api.cometapi.com/v1/videos/$video_id/content" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -o "./output/$video_id.mp4"

if [ -f "./output/$video_id.mp4" ]; then
  echo "Video saved to ./output/$video_id.mp4"
  ls -la "./output/$video_id.mp4"
else
  echo "Failed to download video"
  exit 1
fi

Curl Code Example

# Create a video with sora-2-pro
# Step 1: Submit the video generation request
echo "Submitting video generation request..."
response=$(curl -s https://api.cometapi.com/v1/videos \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -F "model=sora-2-pro" \
  -F "prompt=A calico cat playing a piano on stage")

echo "Response: $response"

# Extract video_id from response (handle JSON with spaces like "id": "xxx")
video_id=$(echo "$response" | tr -d '\n' | sed 's/.*"id"[[:space:]]*:[[:space:]]*"\([^"]*\)".*/\1/')
echo "Video ID: $video_id"

# Step 2: Poll for progress until 100%
echo ""
echo "Checking video generation progress..."
while true; do
  status_response=$(curl -s "https://api.cometapi.com/v1/videos/$video_id" \
    -H "Authorization: Bearer $COMETAPI_KEY")
  
  # Parse progress from "progress": "0%" format
  progress=$(echo "$status_response" | grep -o '"progress":"[^"]*"' | head -1 | sed 's/"progress":"//;s/"$//')
  # Parse status from the outer level
  status=$(echo "$status_response" | grep -o '"status":"[^"]*"' | head -1 | sed 's/"status":"//;s/"$//')
  
  echo "Progress: $progress, Status: $status"
  
  if [ "$progress" = "100%" ]; then
    echo "Video generation completed!"
    break
  fi
  
  if [ "$status" = "FAILURE" ] || [ "$status" = "failed" ]; then
    echo "Video generation failed!"
    echo "$status_response"
    exit 1
  fi
  
  sleep 10
done

# Step 3: Download the video to output directory
echo ""
echo "Downloading video to ./output/$video_id.mp4..."
mkdir -p ./output
curl -s "https://api.cometapi.com/v1/videos/$video_id/content" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -o "./output/$video_id.mp4"

if [ -f "./output/$video_id.mp4" ]; then
  echo "Video saved to ./output/$video_id.mp4"
  ls -la "./output/$video_id.mp4"
else
  echo "Failed to download video"
  exit 1
fi

Python Code Example

# Create a video with sora-2-pro using raw HTTP requests
import os
import time
import requests

api_key = os.environ.get("COMETAPI_KEY")
base_url = "https://api.cometapi.com/v1"

headers = {"Authorization": f"Bearer {api_key}"}

# Step 1: Submit the video generation request
print("Submitting video generation request...")
response = requests.post(
    f"{base_url}/videos",
    headers=headers,
    files={
        "model": (None, "sora-2-pro"),
        "prompt": (None, "A calico cat playing a piano on stage"),
    },
)

result = response.json()
print(f"Response: {result}")

video_id = result.get("id")
print(f"Video ID: {video_id}")

# Step 2: Poll for progress until 100%
print("\nChecking video generation progress...")
while True:
    try:
        status_response = requests.get(f"{base_url}/videos/{video_id}", headers=headers)
        status_result = status_response.json()

        # Parse progress and status from response
        data = status_result.get("data", {})
        if data is None:
            data = {}
        progress = data.get("progress", "0%")
        status = data.get("status", "unknown")

        print(f"Progress: {progress}, Status: {status}")

        if status in ["FAILURE", "failed"]:
            print("Video generation failed!")
            print(status_result)
            exit(1)

        if progress == "100%":
            print("Video generation completed!")
            break
    except Exception as e:
        print(f"Temporary error: {e}, retrying...")

    time.sleep(10)

# Step 3: Download the video to output directory
print(f"\nDownloading video to ./output/{video_id}.mp4...")
os.makedirs("./output", exist_ok=True)

video_response = requests.get(f"{base_url}/videos/{video_id}/content", headers=headers)

output_path = f"./output/{video_id}.mp4"
with open(output_path, "wb") as f:
    f.write(video_response.content)

if os.path.exists(output_path):
    file_size = os.path.getsize(output_path)
    print(f"Video saved to {output_path}")
    print(f"File size: {file_size} bytes")
else:
    print("Failed to download video")
    exit(1)

JavaScript Code Example

// Create a video with sora-2-pro using raw HTTP requests
import fs from "fs";
import path from "path";

const apiKey = process.env.COMETAPI_KEY;
const baseUrl = "https://api.cometapi.com/v1";

async function sleep(ms) {
  return new Promise((resolve) => setTimeout(resolve, ms));
}

async function main() {
  // Step 1: Submit the video generation request
  console.log("Submitting video generation request...");

  const formData = new FormData();
  formData.append("model", "sora-2-pro");
  formData.append("prompt", "A calico cat playing a piano on stage");

  const submitResponse = await fetch(`${baseUrl}/videos`, {
    method: "POST",
    headers: {
      Authorization: `Bearer ${apiKey}`,
    },
    body: formData,
  });

  const result = await submitResponse.json();
  console.log("Response:", JSON.stringify(result, null, 2));

  const videoId = result.id;
  console.log("Video ID:", videoId);

  // Step 2: Poll for progress until 100%
  console.log("\nChecking video generation progress...");

  while (true) {
    try {
      const statusResponse = await fetch(`${baseUrl}/videos/${videoId}`, {
        headers: {
          Authorization: `Bearer ${apiKey}`,
        },
      });

      const text = await statusResponse.text();
      if (text.startsWith("<")) {
        console.log("Temporary server error, retrying...");
        await sleep(10000);
        continue;
      }

      const statusResult = JSON.parse(text);

      // Parse progress and status from response
      const data = statusResult.data || {};
      const progress = data.progress || "0%";
      const status = data.status || "unknown";

      console.log(`Progress: ${progress}, Status: ${status}`);

      if (status === "FAILURE" || status === "failed") {
        console.log("Video generation failed!");
        console.log(JSON.stringify(statusResult, null, 2));
        process.exit(1);
      }

      if (progress === "100%") {
        console.log("Video generation completed!");
        break;
      }
    } catch (e) {
      console.log(`Temporary error: ${e.message}, retrying...`);
    }

    await sleep(10000);
  }

  // Step 3: Download the video to output directory
  console.log(`\nDownloading video to ./output/${videoId}.mp4...`);

  const outputDir = "./output";
  if (!fs.existsSync(outputDir)) {
    fs.mkdirSync(outputDir, { recursive: true });
  }

  const videoResponse = await fetch(`${baseUrl}/videos/${videoId}/content`, {
    headers: {
      Authorization: `Bearer ${apiKey}`,
    },
  });

  const outputPath = path.join(outputDir, `${videoId}.mp4`);
  const videoBuffer = Buffer.from(await videoResponse.arrayBuffer());
  fs.writeFileSync(outputPath, videoBuffer);

  if (fs.existsSync(outputPath)) {
    const stats = fs.statSync(outputPath);
    console.log(`Video saved to ${outputPath}`);
    console.log(`File size: ${stats.size} bytes`);
  } else {
    console.log("Failed to download video");
    process.exit(1);
  }
}

main().catch(console.error);