Gemini 3 Pro 미리보기 API

CometAPI
AnnaDec 10, 2025
Gemini 3 Pro 미리보기 API

Gemini 3 Pro(미리보기) 는 Google/DeepMind의 Gemini 3 제품군 중 최신 플래그십 멀티모달 추론 모델입니다. 심층 추론, 에이전트 워크플로, 고급 코딩, 그리고 장문 맥락 멀티모달 이해(텍스트, 이미지, 오디오, 비디오, 코드 및 도구 통합)를 위해 설계된 "지금까지 가장 지능적인 모델"로 자리매김했습니다.

주요 기능

  • 양식: 텍스트, 이미지, 비디오, 오디오, PDF(및 구조화된 도구 출력).
  • 에이전트/툴링: 내장 함수 호출, 검색 도구, 코드 실행, URL 컨텍스트, 그리고 다단계 에이전트 오케스트레이션 지원 기능을 제공합니다. 사고 서명 메커니즘은 호출 전반에 걸쳐 다단계 추론을 보존합니다.
  • 코딩 및 "바이브 코딩": 프런트엔드 생성, 인터랙티브 UI 생성 및 에이전트 코딩에 최적화되어 있으며, Google에서 보고한 관련 순위표에서 1위를 차지했습니다. 지금까지 가장 강력한 "바이브 코딩" 모델로 홍보되고 있습니다.
  • 새로운 개발자 컨트롤: thinking_level (낮음|높음) 비용/대기 시간 대비 추론 깊이를 균형 있게 조절하고 media_resolution 이미지 또는 비디오 프레임별로 다중 모드 충실도를 제어합니다. 이를 통해 성능, 지연 시간, 비용의 균형을 맞출 수 있습니다.

벤치마크 성능

  • Gemini3Pro는 LMARE에서 1501점을 받아 1위를 차지했으며, Grok-4.1-thinking의 1484점을 넘어섰고 Claude Sonnet 4.5와 Opus 4.1도 앞섰습니다.
  • 또한 WebDevArena 프로그래밍 분야에서도 1487점을 기록하며 1위를 차지했습니다.
  • Humanity's Last Exam 학업 추론에서 37.5%(도구 없음)를 달성했고, GPQA Diamond 과학에서는 91.9%를 달성했으며, MathArena Apex 수학 경시대회에서는 23.4%를 달성하여 새로운 기록을 세웠습니다.
  • 다중 모드 기능에서 MMMU-Pro는 81%를 달성했고, 비디오-MMMU 비디오 이해에서는 87.6%를 달성했습니다.

Gemini 3 Pro 미리보기 API

기술 세부 사항 및 아키텍처

  • "사고 수준" 매개변수: 쌍둥이자리 3은 다음을 노출합니다. thinking_level 개발자가 내부 추론의 깊이와 지연 시간/비용을 절충할 수 있도록 하는 제어 기능입니다. 이 모델은 thinking_level 엄격한 토큰 보장보다는 내부 다단계 추론에 대한 상대적 허용치로 사용됩니다. 기본값은 일반적으로 high Pro용입니다. 이는 개발자가 다단계 계획과 사고의 연결 고리를 세부적으로 조정할 수 있는 명시적인 새로운 제어 기능입니다.
  • 구조화된 출력 및 도구: 모델은 다음을 지원합니다. 구조화된 JSON 출력 내장 도구(Google 검색 기반, URL 컨텍스트, 코드 실행 등)와 결합할 수 있습니다. 일부 구조화된 출력+도구 기능은 미리 보기 전용입니다. gemini-3-pro-preview.
  • 다중 모드 및 에이전트 통합: Gemini 3 Pro는 에이전트 워크플로(도구 + 코드/터미널/브라우저를 통한 여러 에이전트)를 위해 특별히 제작되었습니다.
  • 텍스트, 이미지, 비디오, 오디오 및 PDF 입력을 허용하고 텍스트 출력을 제공합니다.

제한 사항 및 알려진 주의 사항

  1. 완벽한 사실은 아닙니다. 환각이 여전히 가능합니다. Google이 주장하는 사실성 개선에도 불구하고, 위험도가 높은 분야(법률, 의료, 금융)에서는 여전히 근거 있는 검증과 사람의 검토가 필요합니다.
  2. 장기 맥락에서의 성과는 작업마다 다릅니다. 1M 입력 창에 대한 지원은 어려운 기능이지만, 극단적인 길이에서는 일부 벤치마크에서 경험적 효과가 떨어질 수 있습니다(일부 장기 컨텍스트 테스트에서 1M에서 지점별 감소가 관찰됨).
  3. 비용 및 지연 시간의 균형. 대규모 컨텍스트 및 더 높은 thinking_level 설정에 따라 컴퓨팅, 지연 시간 및 비용이 증가합니다. 가격 책정 등급은 토큰 볼륨에 따라 적용됩니다. 사용 thinking_level 그리고 비용을 관리하기 위한 청킹 전략.
  4. 안전 및 콘텐츠 필터. Google에서는 안전 정책과 검토 계층을 계속 적용하고 있습니다. 특정 콘텐츠와 작업은 계속 제한되거나 거부 모드가 실행됩니다.

Gemini 3 Pro Preview가 다른 상위 모델과 비교되는 방식

높은 수준의 비교(미리보기 → 정성적):

Gemini 2.5 Pro에 대하여: 추론, 에이전트 도구 사용, 그리고 다중 모드 통합에서 단계적 개선이 이루어졌습니다. 훨씬 더 광범위한 맥락 처리와 더 나은 장문 이해 능력을 보여줍니다. DeepMind는 학문적 추론, 코딩, 그리고 다중 모드 작업 전반에서 일관된 성과를 보여줍니다.

GPT-5.1 및 Claude Sonnet 4.5에 대하여(보고된 바에 따르면): Google/DeepMind의 벤치마크 슬레이트에서 Gemini 3 Pro는 여러 에이전트, 멀티모달, 롱 컨텍스트 지표(Terminal-Bench, MMMU-Pro, AIME 참조)에서 선두를 달리고 있습니다. 비교 결과는 작업별로 다릅니다.


일반적이고 가치가 높은 사용 사례

  • 대용량 문서/책 요약 및 Q&A: 긴 컨텍스트 지원 덕분에 법률, 연구 및 규정 준수 팀에게 매력적입니다.
  • 저장소 규모에서의 코드 이해 및 생성: 코딩 툴체인과의 통합과 향상된 추론 기능은 대규모 코드베이스 리팩터링과 자동화된 코드 검토 워크플로에 도움이 됩니다.
  • 멀티모달 제품 지원자: 이미지 + 텍스트 + 오디오 워크플로(스크린샷, 통화 스니펫, 문서를 수집하는 고객 지원)
  • 미디어 생성 및 편집(사진 → 비디오): 이전 Gemini 제품군의 기능에는 이제 Veo/Flow 스타일의 사진→비디오 기능이 포함되었으며, 미리보기에서는 프로토타입과 미디어 워크플로를 위한 더욱 심층적인 멀티미디어 생성이 가능합니다.

CometAPI에서 gemini-3-pro-preview API를 호출하는 방법

CometAPI에서 Gemini 3 Pro 미리보기 가격, 공식 가격에서 20% 할인:

입력 토큰$1.60
출력 토큰$9.60

필수 단계

  • 에 로그인 코메타피닷컴. 아직 당사 사용자가 아니시라면, 먼저 등록해 주시기 바랍니다.
  • 에 로그인하여 CometAPI 콘솔.
  • 인터페이스의 액세스 자격 증명 API 키를 받으세요. 개인 센터의 API 토큰에서 "토큰 추가"를 클릭하고 토큰 키(sk-xxxxx)를 받아 제출하세요.

Gemini 3 Pro 미리보기 API

사용 방법

  1. "**gemini-3-pro-preview**API 요청을 전송하고 요청 본문을 설정하는 엔드포인트입니다. 요청 메서드와 요청 본문은 웹사이트 API 문서에서 확인할 수 있습니다. 웹사이트에서는 사용자의 편의를 위해 Apifox 테스트도 제공합니다.
  2. 바꾸다 귀하 계정의 실제 CometAPI 키를 사용합니다.
  3. 질문이나 요청을 콘텐츠 필드에 입력하세요. 모델이 이에 응답합니다.
  4. . API 응답을 처리하여 생성된 답변을 얻습니다.

CometAPI는 완벽한 호환성을 갖춘 REST API를 제공하여 원활한 마이그레이션을 지원합니다. Chat 관련 주요 내용은 다음과 같습니다.

참조 GPT-5.1 API

SHARE THIS BLOG

하나의 API로 500개 이상의 모델

최대 20% 할인