Home/Models/Sora 2

Sora 2

OpenAI
sora-2
Mỗi Giây:$0.08
Mô hình tạo video siêu mạnh mẽ, kèm hiệu ứng âm thanh, hỗ trợ định dạng chat.
Tổng quan
Tính năng
Giá cả
API

Các tính năng chính

  • Tính hiện thực vật lý & tính liên tục: mô phỏng tốt hơn tính tồn tại của vật thể, chuyển động và vật lý để giảm tạo tác hình ảnh.
  • Âm thanh đồng bộ: tạo ra lời thoại và hiệu ứng âm thanh khớp với hành động trên màn hình.
  • Khả năng điều hướng & phạm vi phong cách: kiểm soát tinh vi hơn đối với bố cục khung hình, lựa chọn phong cách và điều kiện hóa prompt cho các thẩm mỹ khác nhau.
  • Các điều khiển sáng tạo: chuỗi nhiều cảnh nhất quán hơn, cải thiện tính hiện thực vật lý và chuyển động, và các điều khiển về phong cách và thời gian so với Sora 1.

Chi tiết kỹ thuật

OpenAI mô tả các mô hình thuộc họ Sora là tận dụng các quy trình khuếch tán video tiềm ẩn với các bộ khử nhiễu dựa trên transformer và điều kiện hóa đa phương thức để tạo ra các khung hình nhất quán theo thời gian và âm thanh được căn chỉnh. Sora 2 tập trung vào việc cải thiện tính vật lý của chuyển động (tuân theo động lượng, lực nổi), các cảnh quay dài hơn và nhất quán, cùng đồng bộ hóa rõ ràng giữa hình ảnh được tạo và lời nói/hiệu ứng âm thanh được tạo. Các tài liệu công khai nhấn mạnh an toàn ở cấp độ mô hình và các cơ chế kiểm duyệt nội dung (chặn cứng đối với một số nội dung bị cấm, ngưỡng nâng cao cho người vị thành niên, và quy trình xin đồng ý đối với hình ảnh/diện mạo).

Hạn chế & cân nhắc an toàn

  • Vẫn còn khiếm khuyết: Sora 2 có thể mắc lỗi (tạo tác theo thời gian, vật lý chưa hoàn hảo trong các trường hợp biên, lỗi giọng nói/phát âm) —Sora 2 đã cải thiện nhưng chưa hoàn hảo. OpenAI nêu rõ rằng mô hình vẫn có các dạng lỗi.
  • Rủi ro lạm dụng: tạo hình ảnh/diện mạo không có sự đồng ý, deepfake, lo ngại về bản quyền, và rủi ro đối với sức khỏe tinh thần/sự tham gia của thanh thiếu niên. OpenAI đang triển khai luồng xin đồng ý, quyền xuất hiện cameo nghiêm ngặt hơn, ngưỡng kiểm duyệt cho người vị thành niên, và các đội ngũ kiểm duyệt con người.
  • Giới hạn nội dung & pháp lý: Ứng dụng và mô hình chặn nội dung khiêu dâm/bạo lực và hạn chế việc tạo diện mạo nhân vật công chúng khi không có sự đồng ý; cũng có báo cáo cho biết OpenAI sử dụng cơ chế chọn không tham gia (opt-out) đối với các nguồn có bản quyền. Người triển khai nên đánh giá rủi ro SHTT và quyền riêng tư/pháp lý trước khi sử dụng trong sản xuất.
  • các triển khai hiện tại nhấn mạnh đoạn clip ngắn (tính năng ứng dụng đề cập các clip sáng tạo dài ~10 giây), và việc tải lên nội dung siêu thực nặng hoặc không hạn chế bị hạn chế trong

Trường hợp sử dụng chính và thực tiễn

  • Sáng tạo xã hội & clip lan truyền: tạo nhanh và phối lại các clip dọc ngắn cho các nguồn cấp mạng xã hội (trường hợp sử dụng ứng dụng Sora).
  • Dựng mẫu & tiền trực quan hóa: dựng nhanh mô phỏng cảnh, storyboard, hình ảnh ý tưởng với âm thanh tạm thời đồng bộ cho các đội ngũ sáng tạo.
  • Quảng cáo & nội dung ngắn: thử nghiệm sáng tạo dạng proof-of-concept và các tài sản chiến dịch nhỏ, trong đó quyền đạo đức/pháp lý được bảo đảm.
  • Nghiên cứu & tăng cường chuỗi công cụ: công cụ cho các phòng thí nghiệm truyền thông nghiên cứu mô hình hóa thế giới và căn chỉnh đa phương thức (tùy thuộc vào giấy phép và các biện pháp an toàn).

Tính năng cho Sora 2

Khám phá các tính năng chính của Sora 2, được thiết kế để nâng cao hiệu suất và khả năng sử dụng. Tìm hiểu cách các khả năng này có thể mang lại lợi ích cho dự án của bạn và cải thiện trải nghiệm người dùng.
text-to-text
text-to-music
speech-to-text
text-to-speech
text-to-image
image-to-image
image-editing
image-to-text
text-to-video
image-to-video
chat
video-to-text
pdf-to-text

Giá cả cho Sora 2

Khám phá mức giá cạnh tranh cho Sora 2, được thiết kế để phù hợp với nhiều ngân sách và nhu cầu sử dụng khác nhau. Các gói linh hoạt của chúng tôi đảm bảo bạn chỉ trả tiền cho những gì bạn sử dụng, giúp dễ dàng mở rộng quy mô khi yêu cầu của bạn tăng lên. Khám phá cách Sora 2 có thể nâng cao các dự án của bạn trong khi vẫn kiểm soát được chi phí.
Model NameTagsOrientationResolutionPrice
sora-2videosPortrait720x1280$0.08 / sec
sora-2videosLandscape1280x720$0.08 / sec
sora-2-all-Universal / All-$0.08000

Mã mẫu và API cho Sora 2

Sora 2 là hệ thống tạo sinh văn bản-thành-video và âm thanh chủ lực của OpenAI, được thiết kế để tạo ra các đoạn clip ngắn mang tính điện ảnh với lời thoại, hiệu ứng âm thanh được đồng bộ, trạng thái cảnh được duy trì và tính hiện thực vật lý được cải thiện rõ rệt. Sora 2 đánh dấu bước tiến của OpenAI trong việc tạo ra các video ngắn có thể kiểm soát với âm thanh đồng bộ (lời nói và hiệu ứng âm thanh), tính hợp lý về mặt vật lý được cải thiện (chuyển động, động lượng, lực nổi), và các cơ chế kiểm soát an toàn mạnh mẽ hơn so với các hệ thống văn bản-thành-video trước đây.
Curl
Python
JavaScript
# Create a video with sora-2
# Step 1: Submit the video generation request
echo "Submitting video generation request..."
response=$(curl -s https://api.cometapi.com/v1/videos \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -F "model=sora-2" \
  -F "prompt=A calico cat playing a piano on stage")

echo "Response: $response"

# Extract video_id from response (handle JSON with spaces like "id": "xxx")
video_id=$(echo "$response" | tr -d '
' | sed 's/.*"id"[[:space:]]*:[[:space:]]*"\([^"]*\)".*/\1/')
echo "Video ID: $video_id"

# Step 2: Poll for progress until 100%
echo ""
echo "Checking video generation progress..."
while true; do
  status_response=$(curl -s "https://api.cometapi.com/v1/videos/$video_id" \
    -H "Authorization: Bearer $COMETAPI_KEY")

  # Parse progress from "progress": "0%" format
  progress=$(echo "$status_response" | grep -o '"progress":"[^"]*"' | head -1 | sed 's/"progress":"//;s/"$//')
  # Parse status from the outer level
  status=$(echo "$status_response" | grep -o '"status":"[^"]*"' | head -1 | sed 's/"status":"//;s/"$//')

  echo "Progress: $progress, Status: $status"

  if [ "$progress" = "100%" ]; then
    echo "Video generation completed!"
    break
  fi

  if [ "$status" = "FAILURE" ] || [ "$status" = "failed" ]; then
    echo "Video generation failed!"
    echo "$status_response"
    exit 1
  fi

  sleep 10
done

# Step 3: Download the video to output directory
echo ""
echo "Downloading video to ./output/$video_id.mp4..."
mkdir -p ./output
curl -s "https://api.cometapi.com/v1/videos/$video_id/content" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -o "./output/$video_id.mp4"

if [ -f "./output/$video_id.mp4" ]; then
  echo "Video saved to ./output/$video_id.mp4"
  ls -la "./output/$video_id.mp4"
else
  echo "Failed to download video"
  exit 1
fi