Veo 3.1

초당:$0.05

Veo 3.1은 Google의 Veo 텍스트·이미지→비디오 제품군에 대한 점진적이지만 중요한 업데이트로, 더 풍부한 네이티브 오디오, 더 길고 더 세밀하게 제어 가능한 비디오 출력, 그리고 더 정교한 편집 및 장면 수준 제어를 추가합니다.

새로운

상업적 사용

Playground

개요

기능

가격

API

버전

핵심 기능

Veo 3.1은 실用적인 콘텐츠 제작 기능에中점을 둡니다:

네이티브 오디오 생성(대사, 배경음, SFX)을 출력에 통합. Veo 3.1은 시각적 타임라인에 맞춰 정렬된 네이티브 오디오(대사 + 배경 + SFX)를 생성하며, 대사와 장면 큐에 대해 립싱크와 오디오–비디오 정합성을 유지하는 것을 목표로 합니다.
더 긴 출력(~60 seconds / 1080p까지 지원; Veo 3의 매우 짧은 클립, 8s와 대비), 그리고 내러티브 연속성을 위한 멀티 프롬프트 멀티-샷 시퀀스.
키 프레임 사이의 영상을 확장하거나 보간하는 Scene Extension 및 First/Last Frame 모드.
객체 삽입 및(추가 예정) 객체 제거와 Flow 내 편집 기본 요소.

위의 각 항목은 수작업 VFX 작업을 줄이도록 설계되었습니다: 이제 오디오와 장면 연속성은 부차적 요소가 아닌 핵심 출력입니다.

기술 세부사항(모델 동작 및 입력)

모델 계열 및 변형: Veo는 Google의 Veo-3 패밀리에 속합니다; 프리뷰 모델 ID는 일반적으로 veo3.1-pro; veo3.1(CometAPI 문서)입니다. 텍스트 프롬프트, 이미지 참조(단일 프레임 또는 시퀀스), 그리고 멀티-샷 생성을 위한 구조화된 멀티 프롬프트 레이아웃을 입력으로 받습니다.

해상도 및 길이: 프리뷰 문서에는 720p/1080p 출력이 설명되어 있으며, 더 긴 길이 옵션(일부 프리뷰 설정에서 최대 ~60s)과 이전 Veo 변형보다 더 높은 충실도를 제공합니다.

화면비: 16:9(지원) 및 9:16(일부 이미지 참조 플로우에서는 지원 제외).

프롬프트 언어: English(프리뷰).

API 제한: 일반적인 프리뷰 제한에는 프로젝트당 분당 최대 10개의 API requests, 요청당 최대 4개의 videos, 그리고 비디오 길이를 4, 6, 또는 8 seconds 중에서 선택할 수 있음(이미지 참조 플로우는 8s 지원)이 포함됩니다.

벤치마크 성능

Google의 내부 및 공개 요약 평가에 따르면 텍스트 정렬, 시각적 품질, 오디오–비디오 정합성(텍스트→비디오 및 이미지→비디오 작업) 등의 지표에서 사람 평가자 비교 전반에 걸쳐 Veo 3.1 출력에 대한 강한 선호가 보고되었습니다.

Veo 3.1은 내부 사람-평가자 비교에서 여러 객관 축에 걸쳐 최첨단 성과를 달성했습니다 — 전반적 선호도, 프롬프트 정렬(텍스트→비디오 및 이미지→비디오), 시각적 품질, 오디오-비디오 정렬, 그리고 MovieGenBench 및 VBench와 같은 벤치마크 데이터셋에서 “시각적으로 현실적인 물리”.

제한사항 및 안전 고려사항

제한사항:

아티팩트 및 비일관성: 개선에도 불구하고 특정 조명, 미세한 물리, 복잡한 차폐에서 아티팩트가 발생할 수 있습니다; 이미지→비디오 일관성(특히 장시간)은 향상되었지만 완벽하진 않습니다.
허위정보/딥페이크 위험: 더 풍부한 오디오와 객체 삽입/제거는 오용 위험을 높입니다(현실적인 가짜 오디오와 확장된 클립). Google은 완화책(정책, 안전장치)을 언급하며, 이전 Veo 출시에서는 출처 확인을 돕기 위해 워터마킹/SynthID를 참조했습니다; 그러나 기술적 안전장치만으로 오용 위험을 제거할 수는 없습니다.
비용 및 처리량 제약: 고해상도, 장시간 비디오는 계산 비용이 높고 현재 유료 프리뷰로 제한되어 있습니다 — 이미지 모델 대비 더 높은 지연과 비용을 예상하세요. 커뮤니티 게시글과 Google 포럼 스레드에서는 가용 시간대와 폴백 전략을 논의합니다.

안전 제어: Veo3.1에는 통합 콘텐츠 정책, 이전 Veo 출시의 워터마킹/SynthID 신호, 그리고 프리뷰 액세스 제어가 포함됩니다; 고객에게는 플랫폼 정책을 준수하고 고위험 출력에 대해 사람 검토를 적용할 것을 권고합니다.

실무 활용 사례

크리에이터를 위한 신속한 프로토타이핑: 초기 크리에이티브 리뷰를 위해 네이티브 대사가 포함된 스토리보드 → 멀티-샷 클립과 애니매틱.
마케팅 및 숏폼 콘텐츠: 완벽한 포토리얼리즘보다 속도가 더 중요한 15–60s 제품 광고, 소셜 클립, 콘셉트 티저.
이미지→비디오 적응: First/Last Frame과 Scene Extension을 통해 일러스트, 캐릭터, 또는 두 프레임을 부드러운 전환이나 애니메이션 씬으로 변환.
도구 증강: Flow에 통합되어 반복 편집(객체 삽입/제거, 조명 프리셋)을 지원함으로써 수작업 VFX 공정을 줄입니다.

다른 주요 모델과의 비교

Veo 3.1 vs Veo 3(이전 모델): Veo 3.1은 프롬프트 준수성 향상, 오디오 품질, 멀티-샷 일관성에 집중합니다 — 아티팩트를 줄이고 편집성을 개선하기 위한 점진적이지만 의미 있는 업데이트입니다.

Veo 3.1 vs OpenAI Sora 2: 보도에서 언급된 트레이드오프: Veo 3.1은 장형 내러티브 제어, 통합 오디오, 그리고 Flow 편집 통합을 강조합니다; Sora 2(보도 비교 기준)는 다른 강점(속도, 상이한 편집 파이프라인)에 초점을 둡니다. TechRadar 등 매체는 내러티브 및 장시간 비디오 지원 측면에서 Veo 3.1을 Sora 2에 맞춘 Google의 경쟁작으로 평가합니다. 독립적 나란히 비교 테스트는 여전히 제한적입니다.

Veo 3.1 가격

[모델명]의 경쟁력 있는 가격을 살펴보세요. 다양한 예산과 사용 요구에 맞게 설계되었습니다. 유연한 요금제로 사용한 만큼만 지불하므로 요구사항이 증가함에 따라 쉽게 확장할 수 있습니다. [모델명]이 비용을 관리 가능한 수준으로 유지하면서 프로젝트를 어떻게 향상시킬 수 있는지 알아보세요.

veo3.1（videos）

Model name	Tags	Calculate price
veo3.1-all	videos	$0.20000
veo3.1	videos	$0.40000

Veo 3.1의 샘플 코드 및 API

[모델 이름]의 포괄적인 샘플 코드와 API 리소스에 액세스하여 통합 프로세스를 간소화하세요. 자세한 문서는 단계별 가이드를 제공하여 프로젝트에서 [모델 이름]의 모든 잠재력을 활용할 수 있도록 돕습니다.

POST

/v1/videos

Python
JavaScript
Curl

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("
Step 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("
Step 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

Python Code Example

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("\nStep 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("\nStep 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

JavaScript Code Example

import fs from "fs";
import path from "path";
import os from "os";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

// ============================================================
// Step 1: Download Reference Image
// ============================================================
console.log("Step 1: Downloading reference image...");

const imageUrl = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280";
const imageResponse = await fetch(imageUrl);
const imageBuffer = Buffer.from(await imageResponse.arrayBuffer());
const imagePath = path.join(os.tmpdir(), "veo3.1_reference.jpg");
fs.writeFileSync(imagePath, imageBuffer);
console.log(`Reference image saved to: ${imagePath}`);

// ============================================================
// Step 2: Create Video Generation Task (form-data with image upload)
// ============================================================
console.log("\nStep 2: Creating video generation task...");

const formData = new FormData();
formData.append("prompt", "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot");
formData.append("model", "veo3.1");
formData.append("size", "16x9");
formData.append("input_reference", new Blob([fs.readFileSync(imagePath)], { type: "image/jpeg" }), "reference.jpg");

const createResponse = await fetch(`${base_url}/videos`, {
  method: "POST",
  headers: {
    "Authorization": api_key,
  },
  body: formData,
});

const createResult = await createResponse.json();
console.log("Create response:", JSON.stringify(createResult, null, 2));

const taskId = createResult?.id;
if (!taskId) {
  console.log("Error: Failed to get task_id from response");
  process.exit(1);
}
console.log(`Task ID: ${taskId}`);

// ============================================================
// Step 3: Query Task Status
// ============================================================
console.log("\nStep 3: Querying task status...");

const queryResponse = await fetch(`${base_url}/videos/${taskId}`, {
  method: "GET",
  headers: {
    "Authorization": api_key,
  },
});

const queryResult = await queryResponse.json();
console.log("Query response:", JSON.stringify(queryResult, null, 2));

const taskStatus = queryResult?.data?.status;
console.log(`Task status: ${taskStatus}`);

Curl Code Example

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

BASE_URL="https://api.cometapi.com/v1"
IMAGE_PATH="/tmp/veo3.1_reference.jpg"

# ============================================================
# Step 1: Download Reference Image
# ============================================================
echo "Step 1: Downloading reference image..."

curl -s -o "$IMAGE_PATH" "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
echo "Reference image saved to: $IMAGE_PATH"

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
echo ""
echo "Step 2: Creating video generation task..."

RESPONSE=$(curl -s -X POST "${BASE_URL}/videos" \
  -H "Authorization: $COMETAPI_KEY" \
  -F 'prompt=A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot' \
  -F 'model=veo3.1' \
  -F 'size=16x9' \
  -F "input_reference=@${IMAGE_PATH}")

echo "Create response:"
echo "$RESPONSE" | jq .

TASK_ID=$(echo "$RESPONSE" | jq -r '.id')

if [ "$TASK_ID" = "null" ] || [ -z "$TASK_ID" ]; then
  echo "Error: Failed to get task_id from response"
  exit 1
fi

echo "Task ID: $TASK_ID"

# ============================================================
# Step 3: Query Task Status
# ============================================================
echo ""
echo "Step 3: Querying task status..."

QUERY_RESPONSE=$(curl -s -X GET "${BASE_URL}/videos/${TASK_ID}" \
  -H "Authorization: $COMETAPI_KEY")

echo "Query response:"
echo "$QUERY_RESPONSE" | jq .

TASK_STATUS=$(echo "$QUERY_RESPONSE" | jq -r '.data.status')
echo "Task status: $TASK_STATUS"

Veo 3.1의 버전

Veo 3.1에 여러 스냅샷이 존재하는 이유는 업데이트 후 출력 변동으로 인해 일관성을 유지하기 위해 이전 스냅샷을 보관하거나, 개발자에게 적응 및 마이그레이션을 위한 전환 기간을 제공하거나, 글로벌 또는 지역별 엔드포인트에 따라 다양한 스냅샷을 제공하여 사용자 경험을 최적화하기 위한 것 등이 포함될 수 있습니다. 버전 간 상세한 차이점은 공식 문서를 참고해 주시기 바랍니다.

모델 ID	설명	가용성	가격	요청
veo3.1-all	사용된 기술은 비공식이며 생성이 불안정합니다 등	✅	$0.2 / 당	채팅 형식
veo3.1	권장, 최신 모델을 가리킴	✅	$0.4/ 당	비동기 생성

더 많은 모델