**Gemini 3 Pro (Preview)**는 Gemini 3 제품군에서 Google/DeepMind의 최신 플래그십 멀티모달 추론 모델입니다. 이 모델은 “지금까지 가장 지능적인 모델”로 포지셔닝되며, 심층 추론, 에이전트형 워크플로, 고급 코딩, 그리고 장문 컨텍스트 멀티모달 이해(텍스트, 이미지, 오디오, 비디오, 코드 및 도구 통합)를 위해 설계되었습니다.
Key features
- Modalities: 텍스트, 이미지, 비디오, 오디오, PDF(및 구조화된 도구 출력).
- Agentic/tooling: 내장 함수 호출, 도구로서의 검색, 코드 실행, URL 컨텍스트, 다단계 에이전트 오케스트레이션 지원. Thought-signature 메커니즘이 호출 간 다단계 추론을 보존합니다.
- Coding & “vibe coding”: 프런트엔드 생성, 인터랙티브 UI 생성, 에이전트형 코딩에 최적화됨(구글이 보고한 관련 리더보드에서 최상위). 현 시점에서 가장 강력한 “vibe-coding” 모델로 소개됩니다.
- New developer controls:
thinking_level(low|high)을 통해 비용/지연 시간과 추론 깊이 간 트레이드오프를 조정하고,media_resolution은 이미지 또는 비디오 프레임별 멀티모달 충실도를 제어합니다. 이를 통해 성능, 지연 시간, 비용의 균형을 맞출 수 있습니다.
Benchmark performance
- Gemini3Pro는 LMARE에서 1501점을 기록해 1위를 차지했으며, Grok-4.1-thinking의 1484점을 넘어섰고 Claude Sonnet 4.5와 Opus 4.1도 앞질렀습니다.
- WebDevArena 프로그래밍 대회에서도 1487점으로 1위를 기록했습니다.
- Humanity’s Last Exam 학술 추론에서 37.5%(툴 미사용), GPQA Diamond 과학에서 91.9%, MathArena Apex 수학 대회에서 23.4%를 기록해 신기록을 세웠습니다.
- 멀티모달 능력에서는 MMMU-Pro 81%, Video-MMMU 비디오 이해에서 87.6%를 달성했습니다.
Technical details & architecture
- “Thinking level” parameter: Gemini 3는 개발자가 내부 추론 깊이와 지연/비용 간의 균형을 조정할 수 있는
thinking_level컨트롤을 제공합니다. 모델은thinking_level을 엄격한 토큰 보장이 아닌 내부 다단계 추론을 위한 상대적 허용치로 취급합니다. Pro의 기본값은 일반적으로high입니다. 이는 개발자가 다단계 계획과 연쇄 추론 깊이를 조정할 수 있는 명시적 새 컨트롤입니다. - Structured outputs & tools: 이 모델은 구조화된 JSON 출력을 지원하며, 내장 도구(Google Search 그라운딩, URL 컨텍스트, 코드 실행 등)와 결합할 수 있습니다. 일부 구조화된 출력+도구 기능은
gemini-3-pro-preview에서 프리뷰 전용입니다. - Multimodal and agentic integrations: Gemini 3 Pro는 명시적으로 에이전트형 워크플로(도구 + 코드/터미널/브라우저 상의 다중 에이전트)를 위해 구축되었습니다.
Limitations & known caveats
- 완전한 사실성이 아님 — 환각이 발생할 수 있습니다. 구글이 사실성 향상을 주장하더라도, 고위험 환경(법률, 의료, 금융)에서는 근거 검증과 휴먼 리뷰가 여전히 필요합니다.
- 장문 컨텍스트 성능은 작업에 따라 다릅니다. 1M 입력 윈도우를 지원하는 하드 캡빌리티가 있지만, 극단적 길이에서는 일부 벤치마크에서 효과가 저하되는 사례가 관찰됩니다(1M 지점에서의 포인트별 하락).
- 비용 및 지연 시간 트레이드오프. 큰 컨텍스트와 높은
thinking_level설정은 연산량, 지연 시간, 비용을 증가시킵니다. 가격은 토큰 볼륨에 따라 계층화되므로thinking_level과 청킹 전략으로 비용을 관리하세요. - 안전 및 콘텐츠 필터. Google은 안전 정책과 모더레이션 레이어를 계속 적용하며, 특정 콘텐츠와 행동은 제한되거나 거부 모드를 유발할 수 있습니다.
How Gemini 3 Pro Preview compares to other top models
High level comparison (preview → qualitative):
Against Gemini 2.5 Pro: 추론, 에이전트형 도구 사용, 멀티모달 통합에서 단계적 향상; 훨씬 큰 컨텍스트 처리와 장문 이해 개선. DeepMind는 학술 추론, 코딩, 멀티모달 과제 전반에서 일관된 향상을 보여줍니다.
Against GPT-5.1 and Claude Sonnet 4.5 (as reported): Google/DeepMind의 벤치마크 묶음에서 Gemini 3 Pro는 여러 에이전트형, 멀티모달, 장문 컨텍스트 지표(예: Terminal-Bench, MMMU-Pro, AIME)에서 선도적으로 제시됩니다. 과제에 따라 비교 결과는 달라질 수 있습니다.
Typical and high-value use cases
- 대형 문서/서적 요약 및 Q&A: 장문 컨텍스트 지원으로 법무, 연구, 컴플라이언스 팀에 적합.
- 리포 규모의 코드 이해 및 생성: 코딩 툴체인 통합과 향상된 추론이 대규모 코드베이스 리팩터 및 자동 코드 리뷰 워크플로에 도움.
- 멀티모달 제품 어시스턴트: 이미지 + 텍스트 + 오디오 워크플로(스크린샷, 통화 스니펫, 문서를 ingest하는 고객 지원).
- 미디어 생성 및 편집(사진 → 비디오): 이전 Gemini 계열 기능에 Veo / Flow 스타일의 사진→비디오 역량이 포함; 프리뷰는 프로토타입 및 미디어 워크플로를 위한 더 심층적인 멀티미디어 생성을 시사.
How to access Gemini 3 Pro API
Step 1: Sign Up for API Key
cometapi.com에 로그인하세요. 아직 사용자가 아니라면 먼저 등록하세요. CometAPI 콘솔에 로그인합니다. 인터페이스의 액세스 자격 증명 API 키를 발급받으세요. 개인 센터에서 API 토큰의 “Add Token”을 클릭해 토큰 키: sk-xxxxx를 발급받아 제출하세요.
Step 2: Send Requests to Gemini 3 Pro API
“gemini-3-pro” 엔드포인트를 선택해 API 요청을 보내고 요청 본문을 설정하세요. 요청 메서드와 요청 본문은 당사 웹사이트의 API 문서에서 확인할 수 있습니다. 편의를 위해 웹사이트에서 Apifox 테스트도 제공합니다. <YOUR_API_KEY>를 계정의 실제 CometAPI 키로 바꾸세요. 기본 URL은 Gemini Generating Content 및 Chat입니다.
질문이나 요청을 content 필드에 입력하세요—모델이 응답할 내용입니다. 생성된 답변을 얻기 위해 API 응답을 처리하세요.
Step 3: Retrieve and Verify Results
API 응답을 처리하여 생성된 답변을 얻습니다. 처리 후, API는 작업 상태와 출력 데이터를 응답합니다.