Home/Models/Google/Gemini 3 Flash
G

Gemini 3 Flash

입력:$0.4/M
출력:$2.4/M
맥락:1,048,576
최대 출력:65.5k
Gemini 3 Flash는 Google의 경량이고 효율적인 대규모 멀티모달 모델로, 빠른 응답과 낮은 지연 시간이 필요한 현실 세계의 시나리오에 맞춰 설계되었습니다.
새로운
상업적 사용
Playground
개요
기능
가격
API
버전

Gemini 3 Flash란 무엇인가

“Gemini 3 Flash”는 Gemini‑3 패밀리의 Flash/fast 멤버로, Google의 Gemini‑3 모델을 기반으로 한 경량·저지연·비용 효율 변형이며 고처리량, 실시간, 대규모 애플리케이션을 위해 설계되었습니다. 개발자가 CometAPI의 API(다른 Gemini 모델과 동일한 API 표면)로 저지연·비용 최적화된 Gemini 3 스타일 모델을 호출할 수 있게 하는 Gemini API 모델 계열의 변형입니다. 동일한 멀티모달 입력과 구조화된 출력 도구를 제공하지만, 추론 속도와 처리량을 우선합니다.

주요 기능 :

  • 낮은 지연 / 높은 처리량: 빠른 응답과 비용 효율을 위해 튜닝됨(Flash 설계 기준).
  • 멀티모달 입력 지원: 텍스트, 이미지, 동영상 스니펫 및 오디오를 다수의 Flash 변형에서 지원(각 변형별 지원 입력 유형은 API 모델 항목에 기재).
  • 함수 호출 및 구조화된 출력: 도구와 에이전트 통합을 위한 JSON/구조화 출력 강제 적용.
  • 에이전트/툴링 지원: Gemini 생태계의 Google Search grounding, 함수/도구 호출, 에이전트 프레임워크와 통합.

Gemini 3 Flash와 다른 모델의 비교

  • Gemini‑3 Pro(동일 패밀리) 대비: Flash = 속도/비용 최적화; Pro = 더 높은 추론 능력, 멀티모달 충실도, Deep Think. 실시간 UI에는 Flash를, 정확도 민감 작업에는 Pro를 선택.
  • 이전 Gemini(2.5 Flash) 대비: Gemini‑3 패밀리는 추론 및 멀티모달 성능을 개선; Flash 설계 기준은 여전히 가격/성능을 목표. 현재 2.5 Flash를 사용 중이라면, Gemini‑3 Fast/Flash는 유사한 지연/비용에서 더 나은 품질을 제공하도록 설계됨.

실용적 사용 사례(Flash가 강점인 영역)

  • 실시간 챗봇 및 보이스 에이전트: 대화형 UI와 스트리밍 오디오 애플리케이션을 위한 낮은 지연.
  • 고객 지원 및 대용량 요약: 대규모 긴 전사본 요약을 비용 효율적으로 수행.
  • 응답 시간이 중요한 엣지 또는 임베디드 추론: 엄격한 SLA에 flash/lite 스타일 변형 사용.
  • 대량 문서 파싱/수집 파이프라인: 인덱싱과 전처리는 Flash, 고가치 추출/분석은 Pro로 상향.
  • 실시간 코드 도우미/IDE 플러그인: 낮은 비용으로 빠른 코드 완성(복잡한 리팩터링은 Pro로 검증).

Gemini 3 Flash API 접근 방법

Step 1: Sign Up for API Key

cometapi.com에 로그인하세요. 아직 저희 사용자가 아니라면 먼저 등록하세요. CometAPI console에 로그인하세요. 인터페이스에 대한 액세스 자격인 API 키를 발급받으세요. 개인 센터의 API token에서 “Add Token”을 클릭하여 토큰 키: sk-xxxxx를 발급받고 제출하세요.

Step 2: Send Requests to Gemini 3 flash API

“gemini-3-flash” 엔드포인트를 선택하여 API 요청을 보내고 요청 본문을 설정하세요. 요청 메서드와 요청 본문은 당사 웹사이트의 API 문서에서 확인할 수 있습니다. 편의를 위해 Apifox 테스트도 제공합니다. <YOUR_API_KEY>를 계정의 실제 CometAPI 키로 교체하세요. 기본 URL은 Gemini Generating Content 및 Chat입니다.

content 필드에 질문이나 요청을 입력하세요—모델이 응답하는 대상입니다. API 응답을 처리하여 생성된 답변을 얻으세요.

Step 3: Retrieve and Verify Results

API 응답을 처리하여 생성된 답변을 얻으세요. 처리 후 API는 작업 상태와 출력 데이터를 반환합니다.

함께 보기 Gemini 3 Pro Preview API

자주 묻는 질문

How does Gemini 3 Flash deliver Pro-level intelligence at Flash pricing?

Gemini 3 Flash is Google's most balanced model, offering frontier-level reasoning capabilities at $0.50/$3 per million tokens—approximately 4x cheaper than Gemini 3 Pro while maintaining comparable intelligence for most tasks.

What thinking levels does Gemini 3 Flash support?

Gemini 3 Flash supports four thinking levels: minimal (near-zero latency), low, medium, and high—giving developers granular control over the reasoning depth vs. speed tradeoff that Gemini 3 Pro doesn't offer.

Does Gemini 3 Flash have a free tier in the API?

Yes, Gemini 3 Flash (gemini-3-flash-preview) has a free tier in the Gemini API, unlike Gemini 3 Pro which currently requires paid usage for API access.

What are Thought Signatures and why are they required for Gemini 3 Flash?

Thought Signatures are encrypted representations of the model's internal reasoning that must be circulated back in multi-turn conversations—required even at minimal thinking level for Gemini 3 Flash to maintain reasoning context and enable function calling.

Can Gemini 3 Flash combine structured outputs with Google Search grounding?

Yes, Gemini 3 Flash uniquely supports combining structured outputs (JSON schema) with built-in tools like Google Search, URL Context, and Code Execution in the same request—enabling grounded, type-safe responses.

How does media_resolution affect Gemini 3 Flash performance?

The media_resolution parameter controls token usage per image/video frame: low (280 tokens), medium (560), high (1120), or ultra_high for images. For video, low and medium are both capped at 70 tokens per frame to optimize context usage.

What tools does Gemini 3 Flash support?

Gemini 3 Flash supports Google Search, File Search, Code Execution, URL Context, and standard function calling. However, Google Maps grounding and Computer Use are not yet supported in Gemini 3 models.

Gemini 3 Flash의 기능

[모델 이름]의 성능과 사용성을 향상시키도록 설계된 주요 기능을 살펴보세요. 이러한 기능이 프로젝트에 어떻게 도움이 되고 사용자 경험을 개선할 수 있는지 알아보세요.

Gemini 3 Flash 가격

[모델명]의 경쟁력 있는 가격을 살펴보세요. 다양한 예산과 사용 요구에 맞게 설계되었습니다. 유연한 요금제로 사용한 만큼만 지불하므로 요구사항이 증가함에 따라 쉽게 확장할 수 있습니다. [모델명]이 비용을 관리 가능한 수준으로 유지하면서 프로젝트를 어떻게 향상시킬 수 있는지 알아보세요.

Correction: gemini-3-flash variants (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-3-flashgemini-3-flash$0.40$2.40
gemini-3-flashgemini-3-flash-preview$0.40$2.40
gemini-3-flashgemini-3-flash-all$0.40$2.40
gemini-3-flashgemini-3-flash-thinking$0.40$2.40
gemini-3-flashgemini-3-flash-preview-thinking$0.40$2.40

Gemini 3 Flash의 샘플 코드 및 API

Gemini 3 Flash는 CometAPI가 호스팅하는 API를 통해 제공되는 텍스트 전용 대규모 언어 모델(LLM)입니다(벤더 추론 레이어에서 미러링됨). 이 API는 표준 채팅/컴플리션 패턴, 스트리밍 응답, 함수/도구 호출, 구조화된 JSON 출력, 에이전트형 워크플로를 위해 설계된 여러 "사고" 모드(교차/보존/턴 단위 사고)를 지원합니다.
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-flash",
    contents="Explain how AI works in a few words",
)

print(response.text)

Gemini 3 Flash의 버전

Gemini 3 Flash에 여러 스냅샷이 존재하는 이유는 업데이트 후 출력 변동으로 인해 일관성을 유지하기 위해 이전 스냅샷을 보관하거나, 개발자에게 적응 및 마이그레이션을 위한 전환 기간을 제공하거나, 글로벌 또는 지역별 엔드포인트에 따라 다양한 스냅샷을 제공하여 사용자 경험을 최적화하기 위한 것 등이 포함될 수 있습니다. 버전 간 상세한 차이점은 공식 문서를 참고해 주시기 바랍니다.
모델 ID설명가용성요청
gemini-3-flash-all사용된 기술은 비공식이며 생성이 불안정하지만 Direct Internet 등, Chat 형식✅Chat 형식
gemini-3-flash자동으로 최신 모델을 가리킵니다✅Gemini 콘텐츠 생성
gemini-3-flash-preview공식 프리뷰✅Gemini 콘텐츠 생성

더 많은 모델