모델가격엔터프라이즈
500개 이상의 AI 모델 API, 모든 것이 하나의 API로. CometAPI에서
Models API
개발자
빠른 시작문서API 대시보드
회사
회사 소개엔터프라이즈
리소스
AI 모델블로그변경 로그지원
서비스 이용약관개인정보 보호정책
© 2026 CometAPI · All rights reserved
Home/Models/Google/Veo 3.1
G

Veo 3.1

초당:$0.05
Veo 3.1은 Google의 Veo 텍스트·이미지→비디오 제품군에 대한 점진적이지만 중요한 업데이트로, 더 풍부한 네이티브 오디오, 더 길고 더 세밀하게 제어 가능한 비디오 출력, 그리고 더 정교한 편집 및 장면 수준 제어를 추가합니다.
새로운
상업적 사용
Playground
개요
기능
가격
API
버전

핵심 기능

Veo 3.1은 실用적인 콘텐츠 제작 기능에中점을 둡니다:

  • 네이티브 오디오 생성(대사, 배경음, SFX)을 출력에 통합. Veo 3.1은 시각적 타임라인에 맞춰 정렬된 네이티브 오디오(대사 + 배경 + SFX)를 생성하며, 대사와 장면 큐에 대해 립싱크와 오디오–비디오 정합성을 유지하는 것을 목표로 합니다.
  • 더 긴 출력(~60 seconds / 1080p까지 지원; Veo 3의 매우 짧은 클립, 8s와 대비), 그리고 내러티브 연속성을 위한 멀티 프롬프트 멀티-샷 시퀀스.
  • 키 프레임 사이의 영상을 확장하거나 보간하는 Scene Extension 및 First/Last Frame 모드.
  • 객체 삽입 및(추가 예정) 객체 제거와 Flow 내 편집 기본 요소.

위의 각 항목은 수작업 VFX 작업을 줄이도록 설계되었습니다: 이제 오디오와 장면 연속성은 부차적 요소가 아닌 핵심 출력입니다.

기술 세부사항(모델 동작 및 입력)

모델 계열 및 변형: Veo는 Google의 Veo-3 패밀리에 속합니다; 프리뷰 모델 ID는 일반적으로 veo3.1-pro; veo3.1(CometAPI 문서)입니다. 텍스트 프롬프트, 이미지 참조(단일 프레임 또는 시퀀스), 그리고 멀티-샷 생성을 위한 구조화된 멀티 프롬프트 레이아웃을 입력으로 받습니다.

해상도 및 길이: 프리뷰 문서에는 720p/1080p 출력이 설명되어 있으며, 더 긴 길이 옵션(일부 프리뷰 설정에서 최대 ~60s)과 이전 Veo 변형보다 더 높은 충실도를 제공합니다.

화면비: 16:9(지원) 및 9:16(일부 이미지 참조 플로우에서는 지원 제외).

프롬프트 언어: English(프리뷰).

API 제한: 일반적인 프리뷰 제한에는 프로젝트당 분당 최대 10개의 API requests, 요청당 최대 4개의 videos, 그리고 비디오 길이를 4, 6, 또는 8 seconds 중에서 선택할 수 있음(이미지 참조 플로우는 8s 지원)이 포함됩니다.

벤치마크 성능

Google의 내부 및 공개 요약 평가에 따르면 텍스트 정렬, 시각적 품질, 오디오–비디오 정합성(텍스트→비디오 및 이미지→비디오 작업) 등의 지표에서 사람 평가자 비교 전반에 걸쳐 Veo 3.1 출력에 대한 강한 선호가 보고되었습니다.

Veo 3.1은 내부 사람-평가자 비교에서 여러 객관 축에 걸쳐 최첨단 성과를 달성했습니다 — 전반적 선호도, 프롬프트 정렬(텍스트→비디오 및 이미지→비디오), 시각적 품질, 오디오-비디오 정렬, 그리고 MovieGenBench 및 VBench와 같은 벤치마크 데이터셋에서 “시각적으로 현실적인 물리”.

제한사항 및 안전 고려사항

제한사항:

  • 아티팩트 및 비일관성: 개선에도 불구하고 특정 조명, 미세한 물리, 복잡한 차폐에서 아티팩트가 발생할 수 있습니다; 이미지→비디오 일관성(특히 장시간)은 향상되었지만 완벽하진 않습니다.
  • 허위정보/딥페이크 위험: 더 풍부한 오디오와 객체 삽입/제거는 오용 위험을 높입니다(현실적인 가짜 오디오와 확장된 클립). Google은 완화책(정책, 안전장치)을 언급하며, 이전 Veo 출시에서는 출처 확인을 돕기 위해 워터마킹/SynthID를 참조했습니다; 그러나 기술적 안전장치만으로 오용 위험을 제거할 수는 없습니다.
  • 비용 및 처리량 제약: 고해상도, 장시간 비디오는 계산 비용이 높고 현재 유료 프리뷰로 제한되어 있습니다 — 이미지 모델 대비 더 높은 지연과 비용을 예상하세요. 커뮤니티 게시글과 Google 포럼 스레드에서는 가용 시간대와 폴백 전략을 논의합니다.

안전 제어: Veo3.1에는 통합 콘텐츠 정책, 이전 Veo 출시의 워터마킹/SynthID 신호, 그리고 프리뷰 액세스 제어가 포함됩니다; 고객에게는 플랫폼 정책을 준수하고 고위험 출력에 대해 사람 검토를 적용할 것을 권고합니다.

실무 활용 사례

  • 크리에이터를 위한 신속한 프로토타이핑: 초기 크리에이티브 리뷰를 위해 네이티브 대사가 포함된 스토리보드 → 멀티-샷 클립과 애니매틱.
  • 마케팅 및 숏폼 콘텐츠: 완벽한 포토리얼리즘보다 속도가 더 중요한 15–60s 제품 광고, 소셜 클립, 콘셉트 티저.
  • 이미지→비디오 적응: First/Last Frame과 Scene Extension을 통해 일러스트, 캐릭터, 또는 두 프레임을 부드러운 전환이나 애니메이션 씬으로 변환.
  • 도구 증강: Flow에 통합되어 반복 편집(객체 삽입/제거, 조명 프리셋)을 지원함으로써 수작업 VFX 공정을 줄입니다.

다른 주요 모델과의 비교

Veo 3.1 vs Veo 3(이전 모델): Veo 3.1은 프롬프트 준수성 향상, 오디오 품질, 멀티-샷 일관성에 집중합니다 — 아티팩트를 줄이고 편집성을 개선하기 위한 점진적이지만 의미 있는 업데이트입니다.

Veo 3.1 vs OpenAI Sora 2: 보도에서 언급된 트레이드오프: Veo 3.1은 장형 내러티브 제어, 통합 오디오, 그리고 Flow 편집 통합을 강조합니다; Sora 2(보도 비교 기준)는 다른 강점(속도, 상이한 편집 파이프라인)에 초점을 둡니다. TechRadar 등 매체는 내러티브 및 장시간 비디오 지원 측면에서 Veo 3.1을 Sora 2에 맞춘 Google의 경쟁작으로 평가합니다. 독립적 나란히 비교 테스트는 여전히 제한적입니다.

Veo 3.1의 기능

[모델 이름]의 성능과 사용성을 향상시키도록 설계된 주요 기능을 살펴보세요. 이러한 기능이 프로젝트에 어떻게 도움이 되고 사용자 경험을 개선할 수 있는지 알아보세요.

Veo 3.1 가격

[모델명]의 경쟁력 있는 가격을 살펴보세요. 다양한 예산과 사용 요구에 맞게 설계되었습니다. 유연한 요금제로 사용한 만큼만 지불하므로 요구사항이 증가함에 따라 쉽게 확장할 수 있습니다. [모델명]이 비용을 관리 가능한 수준으로 유지하면서 프로젝트를 어떻게 향상시킬 수 있는지 알아보세요.

veo3.1(videos)

Model nameTagsCalculate price
veo3.1-allvideos$0.20000
veo3.1videos$0.40000

Veo 3.1의 샘플 코드 및 API

[모델 이름]의 포괄적인 샘플 코드와 API 리소스에 액세스하여 통합 프로세스를 간소화하세요. 자세한 문서는 단계별 가이드를 제공하여 프로젝트에서 [모델 이름]의 모든 잠재력을 활용할 수 있도록 돕습니다.
POST
/v1/videos
Python
JavaScript
Curl
import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("
Step 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("
Step 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

Python Code Example

import os
import requests
import json

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

headers = {
    "Authorization": COMETAPI_KEY,
}

# ============================================================
# Step 1: Download Reference Image
# ============================================================
print("Step 1: Downloading reference image...")

image_url = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
image_response = requests.get(image_url)
image_path = "/tmp/veo3.1_reference.jpg"
with open(image_path, "wb") as f:
    f.write(image_response.content)
print(f"Reference image saved to: {image_path}")

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
print("\nStep 2: Creating video generation task...")

with open(image_path, "rb") as image_file:
    files = {
        "input_reference": ("reference.jpg", image_file, "image/jpeg"),
    }
    data = {
        "prompt": "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot",
        "model": "veo3.1",
        "size": "16x9",
    }
    create_response = requests.post(
        f"{BASE_URL}/videos", headers=headers, data=data, files=files
    )

create_result = create_response.json()
print("Create response:", json.dumps(create_result, indent=2))

task_id = create_result.get("id")
if not task_id:
    print("Error: Failed to get task_id from response")
    exit(1)
print(f"Task ID: {task_id}")

# ============================================================
# Step 3: Query Task Status
# ============================================================
print("\nStep 3: Querying task status...")

query_response = requests.get(f"{BASE_URL}/videos/{task_id}", headers=headers)
query_result = query_response.json()
print("Query response:", json.dumps(query_result, indent=2))

task_status = query_result.get("data", {}).get("status")
print(f"Task status: {task_status}")

JavaScript Code Example

import fs from "fs";
import path from "path";
import os from "os";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY || "<YOUR_COMETAPI_KEY>";
const base_url = "https://api.cometapi.com/v1";

// ============================================================
// Step 1: Download Reference Image
// ============================================================
console.log("Step 1: Downloading reference image...");

const imageUrl = "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280";
const imageResponse = await fetch(imageUrl);
const imageBuffer = Buffer.from(await imageResponse.arrayBuffer());
const imagePath = path.join(os.tmpdir(), "veo3.1_reference.jpg");
fs.writeFileSync(imagePath, imageBuffer);
console.log(`Reference image saved to: ${imagePath}`);

// ============================================================
// Step 2: Create Video Generation Task (form-data with image upload)
// ============================================================
console.log("\nStep 2: Creating video generation task...");

const formData = new FormData();
formData.append("prompt", "A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot");
formData.append("model", "veo3.1");
formData.append("size", "16x9");
formData.append("input_reference", new Blob([fs.readFileSync(imagePath)], { type: "image/jpeg" }), "reference.jpg");

const createResponse = await fetch(`${base_url}/videos`, {
  method: "POST",
  headers: {
    "Authorization": api_key,
  },
  body: formData,
});

const createResult = await createResponse.json();
console.log("Create response:", JSON.stringify(createResult, null, 2));

const taskId = createResult?.id;
if (!taskId) {
  console.log("Error: Failed to get task_id from response");
  process.exit(1);
}
console.log(`Task ID: ${taskId}`);

// ============================================================
// Step 3: Query Task Status
// ============================================================
console.log("\nStep 3: Querying task status...");

const queryResponse = await fetch(`${base_url}/videos/${taskId}`, {
  method: "GET",
  headers: {
    "Authorization": api_key,
  },
});

const queryResult = await queryResponse.json();
console.log("Query response:", JSON.stringify(queryResult, null, 2));

const taskStatus = queryResult?.data?.status;
console.log(`Task status: ${taskStatus}`);

Curl Code Example

#!/bin/bash
# Get your CometAPI key from https://api.cometapi.com/console/token
# Export it as: export COMETAPI_KEY="your-key-here"

BASE_URL="https://api.cometapi.com/v1"
IMAGE_PATH="/tmp/veo3.1_reference.jpg"

# ============================================================
# Step 1: Download Reference Image
# ============================================================
echo "Step 1: Downloading reference image..."

curl -s -o "$IMAGE_PATH" "https://images.unsplash.com/photo-1506905925346-21bda4d32df4?w=1280"
echo "Reference image saved to: $IMAGE_PATH"

# ============================================================
# Step 2: Create Video Generation Task (form-data with image upload)
# ============================================================
echo ""
echo "Step 2: Creating video generation task..."

RESPONSE=$(curl -s -X POST "${BASE_URL}/videos" \
  -H "Authorization: $COMETAPI_KEY" \
  -F 'prompt=A breathtaking mountain landscape with clouds flowing through valleys, cinematic aerial shot' \
  -F 'model=veo3.1' \
  -F 'size=16x9' \
  -F "input_reference=@${IMAGE_PATH}")

echo "Create response:"
echo "$RESPONSE" | jq .

TASK_ID=$(echo "$RESPONSE" | jq -r '.id')

if [ "$TASK_ID" = "null" ] || [ -z "$TASK_ID" ]; then
  echo "Error: Failed to get task_id from response"
  exit 1
fi

echo "Task ID: $TASK_ID"

# ============================================================
# Step 3: Query Task Status
# ============================================================
echo ""
echo "Step 3: Querying task status..."

QUERY_RESPONSE=$(curl -s -X GET "${BASE_URL}/videos/${TASK_ID}" \
  -H "Authorization: $COMETAPI_KEY")

echo "Query response:"
echo "$QUERY_RESPONSE" | jq .

TASK_STATUS=$(echo "$QUERY_RESPONSE" | jq -r '.data.status')
echo "Task status: $TASK_STATUS"

Veo 3.1의 버전

Veo 3.1에 여러 스냅샷이 존재하는 이유는 업데이트 후 출력 변동으로 인해 일관성을 유지하기 위해 이전 스냅샷을 보관하거나, 개발자에게 적응 및 마이그레이션을 위한 전환 기간을 제공하거나, 글로벌 또는 지역별 엔드포인트에 따라 다양한 스냅샷을 제공하여 사용자 경험을 최적화하기 위한 것 등이 포함될 수 있습니다. 버전 간 상세한 차이점은 공식 문서를 참고해 주시기 바랍니다.
모델 ID설명가용성가격요청
veo3.1-all사용된 기술은 비공식이며 생성이 불안정합니다 등✅$0.2 / 당채팅 형식
veo3.1권장, 최신 모델을 가리킴✅$0.4/ 당비동기 생성

더 많은 모델

D

Doubao-Seedance-2-0

초당:$0.07
Seedance 2.0은 시네마틱하고 멀티샷 내러티브 비디오 생성에 초점을 맞춘 ByteDance의 차세대 멀티모달 비디오 기반 모델입니다. 단일 샷 텍스트-투-비디오 데모와 달리, Seedance 2.0은 레퍼런스 기반 제어(이미지, 짧은 클립, 오디오), 샷 전반의 캐릭터/스타일 일관성, 그리고 네이티브 오디오/비디오 동기화를 강조합니다 — 전문 창작 및 프리비주얼라이제이션 워크플로우에서 AI 비디오가 유용하게 쓰이도록 하는 것을 목표로 합니다.
O

Sora 2

초당:$0.08
초강력 비디오 생성 모델, 효과음 지원, 채팅 형식 지원.
M

mj_fast_video

요청당:$0.6
Midjourney 영상 생성
X

Grok Imagine Video

초당:$0.04
텍스트 프롬프트로 동영상을 생성하거나, 정지 이미지를 애니메이션으로 만들거나, 자연어로 기존 동영상을 편집할 수 있습니다. API는 생성된 동영상의 길이, 종횡비, 해상도를 설정할 수 있도록 지원하며 — SDK가 비동기 폴링을 자동으로 처리합니다.
G

Veo 3.1 Pro

초당:$0.25
Veo 3.1-Pro는 Google의 Veo 3.1 제품군의 고급 기능 접근/구성을 의미합니다 — 숏폼, 오디오 지원 비디오 모델의 세대로서 더 풍부한 네이티브 오디오, 향상된 서사/편집 제어 및 장면 확장 도구를 추가합니다.
G

Veo 3 Pro

G

Veo 3 Pro

초당:$0.25
Veo 3 pro는 프로덕션급 Veo 3 비디오 모델 경험(고충실도, 네이티브 오디오 및 확장된 툴링)을 의미합니다.

관련 블로그

Kling 3.0 vs Veo 3.1: 2026년 궁극의 AI 동영상 생성기 맞대결
Apr 20, 2026
veo-3-1
kling-3-0

Kling 3.0 vs Veo 3.1: 2026년 궁극의 AI 동영상 생성기 맞대결

Kling 3.0은 네이티브 4K 멀티샷 스토리텔링과 우수한 카메라 제어로 현재 선도하고 있다. Veo 3.1은 포토리얼리스틱한 물리, 네이티브 오디오 동기화, Google 생태계 통합에 강점을 보이며, 시네마틱 또는 엔터프라이즈 프로젝트에 이상적이다. 대부분의 사용자에게 승자는 우선순위에 달려 있다: 속도, 일관性, 비용은 Kling 3.0; 프리미엄 현실감과 오디오는 Veo 3.1.
我未查到名为“Google Veo 3.1 Lite”的官方产品或版本信息(我的知识截止于 2024-10)。Google Veo 是 Google/DeepMind 的生成式视频模型,用于根据文本/图像提示生成高质量视频,已通过 VideoFX 与 Vertex AI 提供访问;但“3.1 Lite”这一具体命名未见官方发布记录。该称呼可能是非官方简称、内部版本标识,或指代某个轻量/低延迟推理配置。若能提供你看到该名称的来源或链接,我可以据此进一步核实并解释其功能与差异。建议同时查看 Google DeepMind 官方博客或 Google AI Studio/Vertex AI 的模型目录以获取最新信息。
Apr 1, 2026
veo-3-1

我未查到名为“Google Veo 3.1 Lite”的官方产品或版本信息(我的知识截止于 2024-10)。Google Veo 是 Google/DeepMind 的生成式视频模型,用于根据文本/图像提示生成高质量视频,已通过 VideoFX 与 Vertex AI 提供访问;但“3.1 Lite”这一具体命名未见官方发布记录。该称呼可能是非官方简称、内部版本标识,或指代某个轻量/低延迟推理配置。若能提供你看到该名称的来源或链接,我可以据此进一步核实并解释其功能与差异。建议同时查看 Google DeepMind 官方博客或 Google AI Studio/Vertex AI 的模型目录以获取最新信息。

Veo 3.1 Lite란 무엇인가요? Veo 3.1 Lite는 개발자를 위한 Google의 최신 비용 효율적인 비디오 생성 모델로, 2026년 3월 31일에 출시되었습니다. 텍스트-투-비디오와 이미지-투-비디오를 지원하고, 오디오가 포함된 비디오를 출력하며, 대규모 처리량의 애플리케이션을 위해 설계되었습니다. Google은 동일한 속도를 유지하면서 비용이 Veo 3.1 Fast의 절반 미만이며, 16:9와 9:16 출력 형식과 720p/1080p 해상도를 지원한다고 밝혔습니다.
Grok Imagine을 무료로 사용하는 방법: 접근 방법, 요금제 및 대안
Mar 25, 2026
grok-imagine-video

Grok Imagine을 무료로 사용하는 방법: 접근 방법, 요금제 및 대안

2026년 3월 기준으로 Grok Imagine Video는 공식 xAI/Grok 플랫폼에서 무료가 아닙니다(높은 수요와 오용 우려로 인해 무료 요금제가 제거됨). 하지만 CometAPI와 같은 서드파티 애그리게이터를 통해 저렴하게 또는 무료 시작 크레딧으로 이용할 수 있습니다. CometAPI는 이 모델을 초당 단 $0.04(480p)에 제공하며, 신규 사용자는 가입 시 보통 $1~$5의 무료 크레딧을 받는 경우가 많습니다.
Veo 3.1을 통해 비디오를 편집하는 방법
Mar 5, 2026
veo-3-1

Veo 3.1을 통해 비디오를 편집하는 방법

Google은 2025년 10월 중순에 더 높은 충실도의 단편 영상을 생성하는 개선된 텍스트-비디오 모델인 Veo 3.1(및 Veo 3.1 Fast 변형)을 공개적으로 출시했습니다.
vidu Q3는 무엇인가요? 어쩌면 2026년 최고의 AI 비디오 모델일지도 모릅니다.
Jan 31, 2026
vidu-q3

vidu Q3는 무엇인가요? 어쩌면 2026년 최고의 AI 비디오 모델일지도 모릅니다.

2026년 초 Vidu Q3는 AI 기반 영상 생성이 신기성 중심의 짧은 클립에서 본격적인 내러티브의 다중 샷 스토리텔링으로 옮겨가고 있음을 보여 주는 가장 분명한 신호 중 하나로 화두에 올랐다. 광범위한 공개 이후 몇 달 사이 Vidu Q3는 크리에이터 워크플로, 연구 파일럿, 상업 파일럿의 기본 도구가 되었고 — 그럴 만한 이유가 있다: 지속시간, 오디오·비주얼 통합, 다중 샷 일관성 면에서 대부분의 이전 모델을 뛰어넘고, 프로그램적으로 사용할 수 있는 개발자용 API도 제공한다.