**Gemini 3 Pro (Preview)**는 Gemini 3 제품군에 속한 Google/DeepMind의 최신 플래그십 멀티모달 추론 모델입니다. 이 모델은 그들의 “가장 지능적인 모델”로 자리매김했으며, 심층 추론, 에이전트형 워크플로, 고급 코딩, 긴 컨텍스트 멀티모달 이해(텍스트, 이미지, 오디오, 비디오, 코드 및 도구 통합)를 위해 설계되었습니다.
주요 기능
- 모달리티: 텍스트, 이미지, 비디오, 오디오, PDF(및 구조화된 도구 출력).
- 에이전트/도구: 내장 함수 호출, 도구로서의 검색, 코드 실행, URL 컨텍스트, 다단계 에이전트 오케스트레이션 지원. Thought-signature 메커니즘이 호출 간 다단계 추론을 보존합니다.
- 코딩 및 “vibe-coding”: 프런트엔드 생성, 인터랙티브 UI 생성, 에이전트형 코딩에 최적화되어 있습니다(Google이 보고한 관련 리더보드 상위권). 지금까지 가장 강력한 “vibe-coding” 모델로 홍보되고 있습니다.
- 새로운 개발자 제어:
thinking_level(low|high)을 통해 비용/지연 시간과 추론 깊이 간 트레이드오프를 설정하고,media_resolution으로 이미지 또는 비디오 프레임별 멀티모달 품질을 제어합니다. 이를 통해 성능, 지연 시간, 비용을 균형 있게 조정할 수 있습니다.
벤치마크 성능
- Gemini3Pro는 LMARE에서 1501점을 기록해 1484점의 Grok-4.1-thinking을 앞섰으며, Claude Sonnet 4.5와 Opus 4.1도 제쳤습니다.
- 또한 WebDevArena 프로그래밍 아레나에서 1487점으로 1위를 기록했습니다.
- Humanity’s Last Exam 학술 추론에서 37.5%(도구 없이), GPQA Diamond 과학 분야에서 91.9%, MathArena Apex 수학 대회에서 23.4%를 기록하며 신기록을 세웠습니다.
- 멀티모달 역량에서는 MMMU-Pro 81%, Video-MMMU 비디오 이해에서 87.6%를 달성했습니다.

기술 세부사항 및 아키텍처
- “Thinking level” 매개변수: Gemini 3는 개발자가 내부 추론 깊이와 지연/비용 간의 균형을 조정할 수 있는
thinking_level제어를 제공합니다. 모델은thinking_level을 엄격한 토큰 보장이 아닌 내부 다단계 추론에 대한 상대적 허용량으로 취급합니다. Pro의 기본값은 일반적으로high입니다. 이는 개발자가 다단계 계획과 사고 과정의 깊이를 조정할 수 있는 명시적 새 제어입니다. - 구조화된 출력 및 도구: 모델은 구조화된 JSON 출력을 지원하며 내장 도구(Google Search 그라운딩, URL 컨텍스트, 코드 실행 등)와 결합할 수 있습니다. 일부 구조화된 출력+도구 기능은
gemini-3-pro-preview에서 프리뷰로만 제공됩니다. - 멀티모달 및 에이전트형 통합: Gemini 3 Pro는 에이전트형 워크플로(코드/터미널/브라우저 상의 도구 및 다중 에이전트)를 위해 명시적으로 설계되었습니다.
- 텍스트, 이미지, 비디오, 오디오 및 PDF 입력을 지원하며, 출력은 텍스트입니다.
한계 및 유의사항
- 사실성은 완벽하지 않음 — 환각이 여전히 발생할 수 있습니다. Google이 주장하는 사실성 개선에도 불구하고, 고위험 환경(법률, 의료, 금융)에서는 근거 기반 검증과 인적 검토가 여전히 필요합니다.
- 긴 컨텍스트 성능은 과제별로 상이합니다. 1M 입력 윈도우 지원은 가능한 능력이지만, 극단적 길이에서 일부 벤치마크의 실효성은 떨어질 수 있습니다(일부 장문맥 테스트에서 1M 구간에서 점별 하락 관찰).
- 비용과 지연 시간의 트레이드오프. 큰 컨텍스트와 더 높은
thinking_level설정은 연산, 지연, 비용을 증가시킵니다; 토큰 볼륨에 따른 가격 티어가 적용됩니다. 비용 관리를 위해thinking_level과 청킹 전략을 활용합니다. - 안전 및 콘텐츠 필터. Google은 안전 정책과 모더레이션 레이어를 계속 적용하며, 특정 콘텐츠와 행동은 제한되거나 거부 모드가 트리거될 수 있습니다.
Gemini 3 Pro Preview와 다른 상위 모델 비교
상위 수준 비교(프리뷰 → 정성적):
Gemini 2.5 Pro 대비: 추론, 에이전트형 도구 사용, 멀티모달 통합에서 단계적 향상; 훨씬 더 큰 컨텍스트 처리와 장문 이해 향상. DeepMind는 학술 추론, 코딩, 멀티모달 과제 전반에서 일관된 향상을 보여줍니다.
GPT-5.1 및 Claude Sonnet 4.5 대비(보고 기준): Google/DeepMind의 벤치마크 묶음에서 Gemini 3 Pro는 에이전트형, 멀티모달, 긴 컨텍스트 지표에서 여러 우위를 보이는 것으로 제시됩니다(Terminal-Bench, MMMU-Pro, AIME 참조). 과제에 따라 비교 결과는 달라질 수 있습니다.
일반 및 고부가가치 사용 사례
- 대형 문서/도서 요약 및 질의응답: 긴 컨텍스트 지원으로 법무, 연구, 컴플라이언스 팀에 적합합니다.
- 리포지토리 규모의 코드 이해 및 생성: 코딩 툴체인 통합과 향상된 추론이 대규모 코드베이스 리팩터링 및 자동 코드 리뷰 워크플로에 도움을 줍니다.
- 멀티모달 제품 어시스턴트: 이미지 + 텍스트 + 오디오 워크플로(스크린샷, 통화 스니펫, 문서를 수집하는 고객 지원).
- 미디어 생성 및 편집(사진 → 비디오): 기존 Gemini 제품군 기능에 Veo/Flow 스타일의 사진→비디오 기능이 포함되었으며, 프리뷰에서는 프로토타입 및 미디어 워크플로를 위한 더 깊은 멀티미디어 생성을 시사합니다.
CometAPI에서 gemini-3-pro-preview API 호출 방법
CometAPI의 Gemini 3 Pro Preview 가격, 공식 가격 대비 20% 할인:
| 입력 토큰 | $1.60 |
| 출력 토큰 | $9.60 |
필수 단계
- cometapi.com에 로그인합니다. 아직 사용자가 아니면 먼저 가입하세요.
- CometAPI console에 로그인합니다.
- 인터페이스의 액세스 자격 증명 API 키를 가져옵니다. 개인 센터의 API 토큰에서 “Add Token”을 클릭하여 토큰 키: sk-xxxxx를 발급받아 제출합니다.

사용 방법
- “
gemini-3-pro-preview” 엔드포인트를 선택하여 API 요청을 보내고 요청 본문을 설정합니다. 요청 방식과 요청 본문은 웹사이트 API 문서에서 확인할 수 있습니다. 웹사이트는 편의를 위해 Apifox 테스트도 제공합니다. - 계정의 실제 CometAPI 키로 <YOUR_API_KEY>를 교체합니다.
- 모델이 응답할 질문이나 요청을 content 필드에 입력합니다.
- . 생성된 답변을 얻기 위해 API 응답을 처리합니다.
CometAPI는 완전 호환 REST API를 제공하여 무중단 마이그레이션을 지원합니다. Chat에 대한 핵심 정보:
- Base URL: v1/chat/completions
- Model Names:
gemini-3-pro-preview - Authentication:
Bearer YOUR_CometAPI_API_KEY헤더 - Content-Type:
application/json.
함께 보기 GPT-5.1 API
