Home/Models/Google/Gemini 3 Pro
G

Gemini 3 Pro

입력:$1.6/M
출력:$9.6/M
맥락:200.0k
최대 출력:200.0k
Gemini 3 Pro는 Gemini 제품군의 범용 모델로, 평가와 프로토타이핑을 위한 프리뷰로 제공됩니다. 지시사항 준수, 다중 턴 추론, 코드 및 데이터 작업을 지원하며, 구조화된 출력과 워크플로 자동화를 위한 도구/함수 호출 기능을 제공합니다. 일반적인 활용 사례로는 챗 어시스턴트, 요약 및 재작성, 검색 증강형 질의응답, 데이터 추출, 그리고 다양한 앱 및 서비스에서의 경량 코딩 지원이 포함됩니다. 기술적 특징으로는 API 기반 배포, 스트리밍 응답, 안전성 제어, 통합 준비성이 있으며, 프리뷰 구성에 따라 멀티모달 기능을 제공합니다.
새로운
상업적 사용
Playground
개요
기능
가격
API
버전

**Gemini 3 Pro (Preview)**는 Gemini 3 제품군에서 Google/DeepMind의 최신 플래그십 멀티모달 추론 모델입니다. 이 모델은 “지금까지 가장 지능적인 모델”로 포지셔닝되며, 심층 추론, 에이전트형 워크플로, 고급 코딩, 그리고 장문 컨텍스트 멀티모달 이해(텍스트, 이미지, 오디오, 비디오, 코드 및 도구 통합)를 위해 설계되었습니다.

Key features

  • Modalities: 텍스트, 이미지, 비디오, 오디오, PDF(및 구조화된 도구 출력).
  • Agentic/tooling: 내장 함수 호출, 도구로서의 검색, 코드 실행, URL 컨텍스트, 다단계 에이전트 오케스트레이션 지원. Thought-signature 메커니즘이 호출 간 다단계 추론을 보존합니다.
  • Coding & “vibe coding”: 프런트엔드 생성, 인터랙티브 UI 생성, 에이전트형 코딩에 최적화됨(구글이 보고한 관련 리더보드에서 최상위). 현 시점에서 가장 강력한 “vibe-coding” 모델로 소개됩니다.
  • New developer controls: thinking_level(low|high)을 통해 비용/지연 시간과 추론 깊이 간 트레이드오프를 조정하고, media_resolution은 이미지 또는 비디오 프레임별 멀티모달 충실도를 제어합니다. 이를 통해 성능, 지연 시간, 비용의 균형을 맞출 수 있습니다.

Benchmark performance

  • Gemini3Pro는 LMARE에서 1501점을 기록해 1위를 차지했으며, Grok-4.1-thinking의 1484점을 넘어섰고 Claude Sonnet 4.5와 Opus 4.1도 앞질렀습니다.
  • WebDevArena 프로그래밍 대회에서도 1487점으로 1위를 기록했습니다.
  • Humanity’s Last Exam 학술 추론에서 37.5%(툴 미사용), GPQA Diamond 과학에서 91.9%, MathArena Apex 수학 대회에서 23.4%를 기록해 신기록을 세웠습니다.
  • 멀티모달 능력에서는 MMMU-Pro 81%, Video-MMMU 비디오 이해에서 87.6%를 달성했습니다.

Technical details & architecture

  • “Thinking level” parameter: Gemini 3는 개발자가 내부 추론 깊이와 지연/비용 간의 균형을 조정할 수 있는 thinking_level 컨트롤을 제공합니다. 모델은 thinking_level을 엄격한 토큰 보장이 아닌 내부 다단계 추론을 위한 상대적 허용치로 취급합니다. Pro의 기본값은 일반적으로 high입니다. 이는 개발자가 다단계 계획과 연쇄 추론 깊이를 조정할 수 있는 명시적 새 컨트롤입니다.
  • Structured outputs & tools: 이 모델은 구조화된 JSON 출력을 지원하며, 내장 도구(Google Search 그라운딩, URL 컨텍스트, 코드 실행 등)와 결합할 수 있습니다. 일부 구조화된 출력+도구 기능은 gemini-3-pro-preview에서 프리뷰 전용입니다.
  • Multimodal and agentic integrations: Gemini 3 Pro는 명시적으로 에이전트형 워크플로(도구 + 코드/터미널/브라우저 상의 다중 에이전트)를 위해 구축되었습니다.

Limitations & known caveats

  1. 완전한 사실성이 아님 — 환각이 발생할 수 있습니다. 구글이 사실성 향상을 주장하더라도, 고위험 환경(법률, 의료, 금융)에서는 근거 검증과 휴먼 리뷰가 여전히 필요합니다.
  2. 장문 컨텍스트 성능은 작업에 따라 다릅니다. 1M 입력 윈도우를 지원하는 하드 캡빌리티가 있지만, 극단적 길이에서는 일부 벤치마크에서 효과가 저하되는 사례가 관찰됩니다(1M 지점에서의 포인트별 하락).
  3. 비용 및 지연 시간 트레이드오프. 큰 컨텍스트와 높은 thinking_level 설정은 연산량, 지연 시간, 비용을 증가시킵니다. 가격은 토큰 볼륨에 따라 계층화되므로 thinking_level과 청킹 전략으로 비용을 관리하세요.
  4. 안전 및 콘텐츠 필터. Google은 안전 정책과 모더레이션 레이어를 계속 적용하며, 특정 콘텐츠와 행동은 제한되거나 거부 모드를 유발할 수 있습니다.

How Gemini 3 Pro Preview compares to other top models

High level comparison (preview → qualitative):

Against Gemini 2.5 Pro: 추론, 에이전트형 도구 사용, 멀티모달 통합에서 단계적 향상; 훨씬 큰 컨텍스트 처리와 장문 이해 개선. DeepMind는 학술 추론, 코딩, 멀티모달 과제 전반에서 일관된 향상을 보여줍니다.

Against GPT-5.1 and Claude Sonnet 4.5 (as reported): Google/DeepMind의 벤치마크 묶음에서 Gemini 3 Pro는 여러 에이전트형, 멀티모달, 장문 컨텍스트 지표(예: Terminal-Bench, MMMU-Pro, AIME)에서 선도적으로 제시됩니다. 과제에 따라 비교 결과는 달라질 수 있습니다.


Typical and high-value use cases

  • 대형 문서/서적 요약 및 Q&A: 장문 컨텍스트 지원으로 법무, 연구, 컴플라이언스 팀에 적합.
  • 리포 규모의 코드 이해 및 생성: 코딩 툴체인 통합과 향상된 추론이 대규모 코드베이스 리팩터 및 자동 코드 리뷰 워크플로에 도움.
  • 멀티모달 제품 어시스턴트: 이미지 + 텍스트 + 오디오 워크플로(스크린샷, 통화 스니펫, 문서를 ingest하는 고객 지원).
  • 미디어 생성 및 편집(사진 → 비디오): 이전 Gemini 계열 기능에 Veo / Flow 스타일의 사진→비디오 역량이 포함; 프리뷰는 프로토타입 및 미디어 워크플로를 위한 더 심층적인 멀티미디어 생성을 시사.

How to access Gemini 3 Pro API

Step 1: Sign Up for API Key

cometapi.com에 로그인하세요. 아직 사용자가 아니라면 먼저 등록하세요. CometAPI 콘솔에 로그인합니다. 인터페이스의 액세스 자격 증명 API 키를 발급받으세요. 개인 센터에서 API 토큰의 “Add Token”을 클릭해 토큰 키: sk-xxxxx를 발급받아 제출하세요.

CometAPI 키

Step 2: Send Requests to Gemini 3 Pro API

“gemini-3-pro” 엔드포인트를 선택해 API 요청을 보내고 요청 본문을 설정하세요. 요청 메서드와 요청 본문은 당사 웹사이트의 API 문서에서 확인할 수 있습니다. 편의를 위해 웹사이트에서 Apifox 테스트도 제공합니다. <YOUR_API_KEY>를 계정의 실제 CometAPI 키로 바꾸세요. 기본 URL은 Gemini Generating Content 및 Chat입니다.

질문이나 요청을 content 필드에 입력하세요—모델이 응답할 내용입니다. 생성된 답변을 얻기 위해 API 응답을 처리하세요.

Step 3: Retrieve and Verify Results

API 응답을 처리하여 생성된 답변을 얻습니다. 처리 후, API는 작업 상태와 출력 데이터를 응답합니다.

자주 묻는 질문

What is the context window and output limit for Gemini 3 Pro?

Gemini 3 Pro는 1 million 토큰의 입력 컨텍스트 윈도우와 최대 64,000 토큰의 출력을 지원하여 전체 코드베이스나 길이가 긴 문서를 분석하는 데 이상적입니다.

How does the thinking_level parameter work in Gemini 3 Pro?

Gemini 3 Pro는 기본적으로 동적 사고를 사용합니다. 복잡한 추론이 필요하지 않을 때 더 빠른 응답을 원하면 thinking_level을 'low'로 설정하고, 복잡한 작업에서 추론 깊이를 최대화하려면 기본값인 'high'로 설정하세요.

Does Gemini 3 Pro support Google Search grounding?

예, Gemini 3 Pro는 Google Search grounding, File Search, Code Execution, URL Context 도구를 지원합니다. 다만 Google Maps grounding과 Computer Use는 Gemini 3에서 아직 지원되지 않습니다.

What makes Gemini 3 Pro different from Gemini 2.5 Pro?

Gemini 3 Pro는 에이전트형 워크플로와 자율 코딩에서 단계적 개선을 제공합니다. 또한 API 호출 전반에서 추론 컨텍스트를 위해 thought signatures를 사용하며, 지식 컷오프는 January 2025입니다.

Can Gemini 3 Pro combine structured outputs with built-in tools?

예, Gemini 3 모델은 동일한 요청에서 구조화된 출력(JSON schema)과 Google Search, URL Context, Code Execution 같은 기본 제공 도구를 결합할 수 있습니다.

Why should I keep temperature at 1.0 for Gemini 3 Pro?

Google은 temperature를 기본값인 1.0으로 유지할 것을 강력히 권장합니다. 더 낮은 값은 예기치 않은 루핑을 유발하거나 수학적 및 복잡한 추론 작업에서 성능 저하를 초래할 수 있습니다.

What are thought signatures and why are they important?

Thought signatures는 모델의 내부 추론을 암호화한 표현입니다. 함수 호출의 경우 엄격하게 적용되며, thought signatures가 누락되면 400 오류가 반환됩니다. 공식 SDK는 이를 자동으로 처리합니다.

Gemini 3 Pro 의 기능

모델 ID(미리보기): `gemini-3-pro-preview`. 입력 유형: 텍스트, 이미지, 비디오, 오디오, PDF. 출력: 텍스트 컨텍스트/토큰 제한: 입력 ≈ 1,048,576 tokens; 출력 ≤ 65,536 tokens. 지식 컷오프:2025년 1월(Search Grounding을 사용해 최신 정보를 보강). 기능(선택됨): 함수 호출, 코드 실행, 파일 검색, 구조화된 출력, 검색 그라운딩. 지원되지 않음: 오디오 생성, 이미지 생성, 라이브 API, 이미지 분할, Google 지도 그라운딩(일부 기능은 Gemini 2.5와 다릅니다).

Gemini 3 Pro 가격

[모델명]의 경쟁력 있는 가격을 살펴보세요. 다양한 예산과 사용 요구에 맞게 설계되었습니다. 유연한 요금제로 사용한 만큼만 지불하므로 요구사항이 증가함에 따라 쉽게 확장할 수 있습니다. [모델명]이 비용을 관리 가능한 수준으로 유지하면서 프로젝트를 어떻게 향상시킬 수 있는지 알아보세요.

gemini-3-pro (same price across variants shown)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-3-progemini-3-pro-preview$1.60$9.60
gemini-3-progemini-3-pro-preview-thinking$1.60$9.60
gemini-3-progemini-3-pro-all$1.60$9.60

Gemini 3 Pro 의 샘플 코드 및 API

Gemini 3 Pro는 Google/DeepMind의 Gemini 3 제품군에 속한 최신 플래그십 멀티모달 추론 모델입니다. 이 모델은 “지금까지 가장 지능적인 모델”로 자리매김하고 있으며, 심층 추론, 에이전트형 워크플로, 고급 코딩, 그리고 긴 컨텍스트의 멀티모달 이해(텍스트, 이미지, 오디오, 비디오, 코드 및 도구 통합)를 위해 설계되었습니다.
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-pro-preview",
    contents="Explain how AI works in a few words",
)

print(response.text)

Gemini 3 Pro 의 버전

Gemini 3 Pro 에 여러 스냅샷이 존재하는 이유는 업데이트 후 출력 변동으로 인해 일관성을 유지하기 위해 이전 스냅샷을 보관하거나, 개발자에게 적응 및 마이그레이션을 위한 전환 기간을 제공하거나, 글로벌 또는 지역별 엔드포인트에 따라 다양한 스냅샷을 제공하여 사용자 경험을 최적화하기 위한 것 등이 포함될 수 있습니다. 버전 간 상세한 차이점은 공식 문서를 참고해 주시기 바랍니다.
모델 ID설명사용 가능 여부:--------------------------------------------------------------------------------------------------------------
gemini-3-pro-all사용 기술은 비공식적이며, 생성이 불안정함 등✅채팅 형식
gemini-3-pro권장, 최신 모델을 가리킴❌Gemini 콘텐츠 생성
gemini-3-pro-preview공식 프리뷰❌Gemini 콘텐츠 생성

더 많은 모델