Gemini 3 Pro(미리보기) 는 Google/DeepMind의 Gemini 3 제품군 중 최신 플래그십 멀티모달 추론 모델입니다. 심층 추론, 에이전트 워크플로, 고급 코딩, 그리고 장문 맥락 멀티모달 이해(텍스트, 이미지, 오디오, 비디오, 코드 및 도구 통합)를 위해 설계된 "지금까지 가장 지능적인 모델"로 자리매김했습니다.
주요 기능
- 양식: 텍스트, 이미지, 비디오, 오디오, PDF(및 구조화된 도구 출력).
- 에이전트/툴링: 내장 함수 호출, 검색 도구, 코드 실행, URL 컨텍스트, 그리고 다단계 에이전트 오케스트레이션 지원 기능을 제공합니다. 사고 서명 메커니즘은 호출 전반에 걸쳐 다단계 추론을 보존합니다.
- 코딩 및 "바이브 코딩": 프런트엔드 생성, 인터랙티브 UI 생성 및 에이전트 코딩에 최적화되어 있으며, Google에서 보고한 관련 순위표에서 1위를 차지했습니다. 지금까지 가장 강력한 "바이브 코딩" 모델로 홍보되고 있습니다.
- 새로운 개발자 컨트롤:
thinking_level(낮음|높음) 비용/대기 시간 대비 추론 깊이를 균형 있게 조절하고media_resolution이미지 또는 비디오 프레임별로 다중 모드 충실도를 제어합니다. 이를 통해 성능, 지연 시간, 비용의 균형을 맞출 수 있습니다.
벤치마크 성능
- Gemini3Pro는 LMARE에서 1501점을 받아 1위를 차지했으며, Grok-4.1-thinking의 1484점을 넘어섰고 Claude Sonnet 4.5와 Opus 4.1도 앞섰습니다.
- 또한 WebDevArena 프로그래밍 분야에서도 1487점을 기록하며 1위를 차지했습니다.
- Humanity's Last Exam 학업 추론에서 37.5%(도구 없음)를 달성했고, GPQA Diamond 과학에서는 91.9%를 달성했으며, MathArena Apex 수학 경시대회에서는 23.4%를 달성하여 새로운 기록을 세웠습니다.
- 다중 모드 기능에서 MMMU-Pro는 81%를 달성했고, 비디오-MMMU 비디오 이해에서는 87.6%를 달성했습니다.

기술 세부 사항 및 아키텍처
- "사고 수준" 매개변수: 쌍둥이자리 3은 다음을 노출합니다.
thinking_level개발자가 내부 추론의 깊이와 지연 시간/비용을 절충할 수 있도록 하는 제어 기능입니다. 이 모델은thinking_level엄격한 토큰 보장보다는 내부 다단계 추론에 대한 상대적 허용치로 사용됩니다. 기본값은 일반적으로highPro용입니다. 이는 개발자가 다단계 계획과 사고의 연결 고리를 세부적으로 조정할 수 있는 명시적인 새로운 제어 기능입니다. - 구조화된 출력 및 도구: 모델은 다음을 지원합니다. 구조화된 JSON 출력 내장 도구(Google 검색 기반, URL 컨텍스트, 코드 실행 등)와 결합할 수 있습니다. 일부 구조화된 출력+도구 기능은 미리 보기 전용입니다.
gemini-3-pro-preview. - 다중 모드 및 에이전트 통합: Gemini 3 Pro는 에이전트 워크플로(도구 + 코드/터미널/브라우저를 통한 여러 에이전트)를 위해 특별히 제작되었습니다.
- 텍스트, 이미지, 비디오, 오디오 및 PDF 입력을 허용하고 텍스트 출력을 제공합니다.
제한 사항 및 알려진 주의 사항
- 완벽한 사실은 아닙니다. 환각이 여전히 가능합니다. Google이 주장하는 사실성 개선에도 불구하고, 위험도가 높은 분야(법률, 의료, 금융)에서는 여전히 근거 있는 검증과 사람의 검토가 필요합니다.
- 장기 맥락에서의 성과는 작업마다 다릅니다. 1M 입력 창에 대한 지원은 어려운 기능이지만, 극단적인 길이에서는 일부 벤치마크에서 경험적 효과가 떨어질 수 있습니다(일부 장기 컨텍스트 테스트에서 1M에서 지점별 감소가 관찰됨).
- 비용 및 지연 시간의 균형. 대규모 컨텍스트 및 더 높은
thinking_level설정에 따라 컴퓨팅, 지연 시간 및 비용이 증가합니다. 가격 책정 등급은 토큰 볼륨에 따라 적용됩니다. 사용thinking_level그리고 비용을 관리하기 위한 청킹 전략. - 안전 및 콘텐츠 필터. Google에서는 안전 정책과 검토 계층을 계속 적용하고 있습니다. 특정 콘텐츠와 작업은 계속 제한되거나 거부 모드가 실행됩니다.
Gemini 3 Pro Preview가 다른 상위 모델과 비교되는 방식
높은 수준의 비교(미리보기 → 정성적):
Gemini 2.5 Pro에 대하여: 추론, 에이전트 도구 사용, 그리고 다중 모드 통합에서 단계적 개선이 이루어졌습니다. 훨씬 더 광범위한 맥락 처리와 더 나은 장문 이해 능력을 보여줍니다. DeepMind는 학문적 추론, 코딩, 그리고 다중 모드 작업 전반에서 일관된 성과를 보여줍니다.
GPT-5.1 및 Claude Sonnet 4.5에 대하여(보고된 바에 따르면): Google/DeepMind의 벤치마크 슬레이트에서 Gemini 3 Pro는 여러 에이전트, 멀티모달, 롱 컨텍스트 지표(Terminal-Bench, MMMU-Pro, AIME 참조)에서 선두를 달리고 있습니다. 비교 결과는 작업별로 다릅니다.
일반적이고 가치가 높은 사용 사례
- 대용량 문서/책 요약 및 Q&A: 긴 컨텍스트 지원 덕분에 법률, 연구 및 규정 준수 팀에게 매력적입니다.
- 저장소 규모에서의 코드 이해 및 생성: 코딩 툴체인과의 통합과 향상된 추론 기능은 대규모 코드베이스 리팩터링과 자동화된 코드 검토 워크플로에 도움이 됩니다.
- 멀티모달 제품 지원자: 이미지 + 텍스트 + 오디오 워크플로(스크린샷, 통화 스니펫, 문서를 수집하는 고객 지원)
- 미디어 생성 및 편집(사진 → 비디오): 이전 Gemini 제품군의 기능에는 이제 Veo/Flow 스타일의 사진→비디오 기능이 포함되었으며, 미리보기에서는 프로토타입과 미디어 워크플로를 위한 더욱 심층적인 멀티미디어 생성이 가능합니다.
CometAPI에서 gemini-3-pro-preview API를 호출하는 방법
CometAPI에서 Gemini 3 Pro 미리보기 가격, 공식 가격에서 20% 할인:
| 입력 토큰 | $1.60 |
| 출력 토큰 | $9.60 |
필수 단계
- 에 로그인 코메타피닷컴. 아직 당사 사용자가 아니시라면, 먼저 등록해 주시기 바랍니다.
- 에 로그인하여 CometAPI 콘솔.
- 인터페이스의 액세스 자격 증명 API 키를 받으세요. 개인 센터의 API 토큰에서 "토큰 추가"를 클릭하고 토큰 키(sk-xxxxx)를 받아 제출하세요.

사용 방법
- "**
gemini-3-pro-preview**API 요청을 전송하고 요청 본문을 설정하는 엔드포인트입니다. 요청 메서드와 요청 본문은 웹사이트 API 문서에서 확인할 수 있습니다. 웹사이트에서는 사용자의 편의를 위해 Apifox 테스트도 제공합니다. - 바꾸다 귀하 계정의 실제 CometAPI 키를 사용합니다.
- 질문이나 요청을 콘텐츠 필드에 입력하세요. 모델이 이에 응답합니다.
- . API 응답을 처리하여 생성된 답변을 얻습니다.
CometAPI는 완벽한 호환성을 갖춘 REST API를 제공하여 원활한 마이그레이션을 지원합니다. Chat 관련 주요 내용은 다음과 같습니다.
- 기본 URL: https://api.cometapi.com/v1/chat/completions
- 모델명 :
gemini-3-pro-preview - 입증:
Bearer YOUR_CometAPI_API_KEY머리글 - 컨텐츠 타입:
application/json.
참조 GPT-5.1 API


