Home/Models/Gemini 3 Pro Preview

Gemini 3 Pro Preview

Google
gemini-3-pro-preview
입력:$1.60/M
출력:$9.60/M
맥락:200.0k
최대 출력:200.0k
Gemini 3 Pro Preview는 Gemini 제품군의 범용 모델로, 평가와 프로토타이핑을 위해 프리뷰로 제공됩니다. 이 모델은 지시 사항 준수, 다중 턴 추론, 코드 및 데이터 작업을 지원하며, 워크플로 자동화를 위해 구조화된 출력과 도구/함수 호출을 제공합니다. 일반적인 사용 사례에는 챗 어시스턴트、요약 및 재작성、검색 증강형 QA、데이터 추출、그리고 앱과 서비스 전반에서의 경량 코딩 지원이 포함됩니다. 기술적 하이라이트로는 API 기반 배포、스트리밍 응답、안전성 제어、통합 준비가 있으며、멀티모달 기능은 프리뷰 구성에 따라 달라집니다。
개요
Playground
기능
가격
API
버전

Gemini 3 Pro (Preview) 는 Gemini 3 제품군에서 Google/DeepMind의 최신 플래그십 멀티모달 추論 모델입니다. 이 모델은 심층 추론, 에이전틱 워크플로, 고급 코딩, 긴 컨텍스트의 멀티모달 이해(텍스트, 이미지, 오디오, 비디오, 코드 및 도구 통합)를 위해 설계된, 그들의 “가장 지능적인 모델”로 포지셔닝되어 있습니다.

Key features

  • Modalities: 텍스트, 이미지, 비디오, 오디오, PDF(및 구조화된 도구 출력).
  • Agentic/tooling: 내장 함수 호출, 도구로서의 검색, 코드 실행, URL 컨텍스트, 다단계 에이전트 오케스트레이션 지원. Thought-signature 메커니즘은 호출 간 다단계 추론을 보존합니다.
  • Coding & “vibe coding”: 프런트엔드 생성, 인터랙티브 UI 생성, 에이전틱 코딩에 최적화(구글이 보고한 관련 리더보드에서 최상위). 지금까지 가장 강력한 “vibe-coding” 모델로 마케팅되고 있습니다.
  • New developer controls: thinking_level(low|high)을 통해 비용/지연 시간과 추론 깊이의 트레이드오프를 조절하고, media_resolution으로 이미지 또는 비디오 프레임별 멀티모달 충실도를 제어합니다. 이를 통해 성능, 지연 시간, 비용의 균형을 맞출 수 있습니다.

Benchmark performance

  • Gemini3Pro는 LMARE에서 1501점으로 1위를 차지하여 Grok-4.1-thinking의 1484점을 앞섰고, Claude Sonnet 4.5와 Opus 4.1도 선도했습니다.
  • WebDevArena 프로그래밍 아레나에서도 1487점으로 1위를 기록했습니다.
  • Humanity’s Last Exam 학술 추론에서는 37.5%(도구 미사용), GPQA Diamond 과학에서는 91.9%, MathArena Apex 수학 대회에서는 23.4%를 기록하며 신기록을 세웠습니다.
  • 멀티모달 역량에서는 MMMU-Pro 81%, Video-MMMU 비디오 이해에서는 87.6%를 달성했습니다.

이미지

Technical details & architecture

  • “Thinking level” parameter: Gemini 3는 thinking_level 제어를 제공하여 개발자가 내부 다단계 추론의 깊이와 지연/비용을 상호 조절할 수 있도록 합니다. 모델은 thinking_level을 엄격한 토큰 보장이 아닌 내부 다단계 추론에 대한 상대적 허용치로 취급합니다. 기본값은 보통 Pro에서 high입니다. 이는 개발자가 다단계 계획과 사고 연쇄의 깊이를 조정할 수 있도록 하는 새로운 명시적 제어입니다.
  • Structured outputs & tools: 모델은 구조화된 JSON 출력을 지원하며, 내장 도구(Google Search 그라운딩, URL 컨텍스트, 코드 실행 등)와 결합할 수 있습니다. 일부 structured-output+tools 기능은 gemini-3-pro-preview에서만 프리뷰로 제공됩니다.
  • Multimodal and agentic integrations: Gemini 3 Pro는 에이전틱 워크플로(코드/터미널/브라우저 상의 도구 + 다중 에이전트)를 위해 명시적으로 구축되었습니다.

Limitations & known caveats

  1. 완벽한 사실성은 아님 — 환각 가능성이 여전히 존재합니다. Google이 사실성 향상을 주장하지만, 고위험 환경(법률, 의료, 금융)에서는 근거 기반 검증과 인간 검토가 필요합니다.
  2. 긴 컨텍스트 성능은 과제별로 달라집니다. 1M 입력 윈도우 지원은 확실한 기능이지만, 극단적 길이에서는 일부 벤치마크에서 실증적 효과가 떨어질 수 있습니다(일부 장문 컨텍스트 테스트에서 1M에서 점별 하락 관찰).
  3. 비용과 지연 시간의 트레이드오프. 큰 컨텍스트와 더 높은 thinking_level 설정은 연산량, 지연, 비용을 증가시킵니다. 가격은 토큰 볼륨 기반으로 구간제가 적용됩니다. 비용 관리를 위해 thinking_level과 청크 분할(chunking) 전략을 사용하세요.
  4. 안전 및 콘텐츠 필터. Google은 안전 정책과 중재 레이어를 계속 적용합니다. 특정 콘텐츠와 동작은 제한되거나 거부 모드를 유발할 수 있습니다.

How Gemini 3 Pro Preview compares to other top models

상위 수준 비교(프리뷰 → 정성적):

Gemini 2.5 Pro 대비: 추론, 에이전틱 도구 사용, 멀티모달 통합에서 단계적 도약이 있었고, 훨씬 큰 컨텍스트 처리와 더 나은 장문 이해를 제공합니다. DeepMind는 학술 추론, 코딩, 멀티모달 과제 전반에서 일관된 향상을 보여줍니다.

GPT-5.1 및 Claude Sonnet 4.5 대비(보고 기준): Google/DeepMind의 벤치마크 묶음에서 Gemini 3 Pro는 여러 에이전틱, 멀티모달, 장문 컨텍스트 지표에서 선도하는 것으로 제시됩니다(Terminal-Bench, MMMU-Pro, AIME 참조). 과제에 따라 비교 결과는 달라질 수 있습니다.


Typical and high-value use cases

  • 대형 문서/서적 요약 및 Q&A: 긴 컨텍스트 지원으로 법무, 리서치, 컴플라이언스 팀에 매력적입니다.
  • 리포지토리 규모의 코드 이해 및 생성: 코딩 툴체인 통합과 향상된 추론은 대규모 코드베이스 리팩터링과 자동 코드 리뷰 워크플로에 도움을 줍니다.
  • 멀티모달 제품 어시스턴트: 이미지 + 텍스트 + 오디오 워크플로(스크린샷, 통화 스니펫, 문서를 수집하는 고객 지원).
  • 미디어 생성 및 편집(사진 → 비디오): 이전 Gemini 제품군 기능에 이제 Veo / Flow 스타일의 사진→비디오 기능이 포함되며, 프리뷰는 프로토타입 및 미디어 워크플로를 위한 더 깊은 멀티미디어 생성을 시사합니다.

Gemini 3 Pro Preview의 Playground

Gemini 3 Pro Preview의 Playground를 탐색하세요 — 모델을 테스트하고 실시간으로 쿼리를 실행하는 대화형 환경입니다. 프롬프트를 시도하고, 매개변수를 조정하며, 즉시 반복하여 개발을 가속화하고 사용 사례를 검증하세요.

Gemini 3 Pro Preview의 기능

* **모델 ID(프리뷰):** `gemini-3-pro-preview`. * **입력 유형:** 텍스트, 이미지, 동영상, 오디오, PDF. 출력: 텍스트 * **컨텍스트/토큰 한도:** 입력 ≈ 1,048,576 토큰; 출력 ≤ 65,536 토큰. * **지식 컷오프:** 2025년 1월 (최신 정보에는 Search Grounding 사용). * **기능(일부):** 함수 호출, 코드 실행, 파일 검색, 구조화된 출력, search grounding. 미지원: 오디오 생성, 이미지 생성, 라이브 API, 이미지 분할, Google Maps grounding (일부 기능은 Gemini 2.5와 다릅니다).
text-to-text
text-to-music
speech-to-text
text-to-speech
text-to-image
image-to-image
image-editing
image-to-text
text-to-video
image-to-video
chat
video-to-text
pdf-to-text

Gemini 3 Pro Preview 가격

[모델명]의 경쟁력 있는 가격을 살펴보세요. 다양한 예산과 사용 요구에 맞게 설계되었습니다. 유연한 요금제로 사용한 만큼만 지불하므로 요구사항이 증가함에 따라 쉽게 확장할 수 있습니다. [모델명]이 비용을 관리 가능한 수준으로 유지하면서 프로젝트를 어떻게 향상시킬 수 있는지 알아보세요.
코멧 가격 (USD / M Tokens)공식 가격 (USD / M Tokens)
입력:$1.60/M
출력:$9.60/M
입력:$2.00/M
출력:$12.00/M

Gemini 3 Pro Preview의 샘플 코드 및 API

Gemini 3 Pro는 Gemini 3 제품군에서 Google/DeepMind의 최신 플래그십 멀티모달 추론 모델입니다. 이 모델은 심층 추론, 에이전트 기반 워크플로, 고급 코딩, 그리고 긴 컨텍스트의 멀티모달 이해(텍스트, 이미지, 오디오, 비디오, 코드 및 도구 통합)를 위해 설계된, 그들의 “현재까지 가장 지능적인 모델”로 자리매김하고 있습니다.
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents="Explain how AI works in a few words",
)

print(response.text)

Gemini 3 Pro Preview의 버전

Gemini 3 Pro Preview에 여러 스냅샷이 존재하는 이유는 업데이트 후 출력 변동으로 인해 일관성을 유지하기 위해 이전 스냅샷을 보관하거나, 개발자에게 적응 및 마이그레이션을 위한 전환 기간을 제공하거나, 글로벌 또는 지역별 엔드포인트에 따라 다양한 스냅샷을 제공하여 사용자 경험을 최적화하기 위한 것 등이 포함될 수 있습니다. 버전 간 상세한 차이점은 공식 문서를 참고해 주시기 바랍니다.