모델가격엔터프라이즈
500개 이상의 AI 모델 API, 모든 것이 하나의 API로. CometAPI에서
Models API
개발자
빠른 시작문서API 대시보드
회사
회사 소개엔터프라이즈
리소스
AI 모델블로그변경 로그지원
서비스 이용약관개인정보 보호정책
© 2026 CometAPI · All rights reserved
Home/Models/Google/Gemini 3 Flash
G

Gemini 3 Flash

입력:$0.4/M
출력:$2.4/M
맥락:1,048,576
최대 출력:65.5k
Gemini 3 Flash는 Google의 경량이고 효율적인 대규모 멀티모달 모델로, 빠른 응답과 낮은 지연 시간이 필요한 현실 세계의 시나리오에 맞춰 설계되었습니다.
새로운
상업적 사용
Playground
개요
기능
가격
API
버전

Gemini 3 flash란 무엇인가

“Gemini 3 Flash”는 Gemini-3 패밀리의 Flash/fast 멤버로, 고처리량·실시간·대규모 민감형 애플리케이션을 위해 설계된 더 가볍고 지연이 낮으며 비용 효율적인 Google의 Gemini-3 모델 변형입니다. 개발자가 CometAPI의 API(다른 Gemini 모델과 동일한 API 표면)를 통해 지연이 낮고 비용이 최적화된 Gemini 3 스타일 모델을 호출할 수 있게 하는 Gemini API 모델 패밀리의 변형입니다. 동일한 멀티모달 입력과 구조화된 출력 도구를 제공하지만 추론 속도와 처리량을 우선시합니다.

주요 기능 :

  • 낮은 지연/높은 처리량: 빠른 응답과 비용 효율에 맞게 튜닝됨(Flash 디자인 포인트).
  • 멀티모달 입력 지원: 많은 Flash 변형에서 텍스트, 이미지, 비디오 스니펫 및 오디오 지원(각 변형별로 지원 입력 유형은 API 모델 항목에 나열됨).
  • 함수 호출 및 구조화된 출력: 도구와 에이전트 통합을 위한 JSON/구조화 출력 강제 적용.
  • 에이전트/도구 지원: Gemini 생태계의 Google Search 그라운딩, 함수/도구 호출 및 에이전트 프레임워크와 통합.

Gemini 3 Flash가 다른 모델과 비교되는 방식

  • Gemini-3 Pro(동일 패밀리) 대비: Flash = 속도/비용 최적화; Pro = 더 높은 추론, 멀티모달 충실도, Deep Think. 실시간 UI에는 Flash를, 정확도 민감 작업에는 Pro를 선택하세요.
  • 이전 Gemini(2.5 Flash) 대비: Gemini-3 패밀리는 추론 및 멀티모달 성능이 향상되었고, Flash 디자인 포인트는 가격/성능 지향을 지속합니다. 현재 2.5 Flash를 사용 중이라면, Gemini-3 Fast/Flash는 유사한 지연/비용에서 더 나은 품질을 제공하도록 설계되었습니다.

실용적 활용 사례(Flash가 강점을 보이는 영역)

  • 실시간 챗봇 및 보이스 에이전트: 대화형 UI와 스트리밍 오디오 애플리케이션을 위한 낮은 지연.
  • 고객 지원 및 대량 요약: 대규모 긴 대화록을 비용 효율적으로 요약.
  • 응답 시간이 중요한 엣지/임베디드 추론: 엄격한 SLA를 위해 flash/lite 스타일 변형 사용.
  • 대규모 문서 파싱/인제스트 파이프라인: 인덱싱과 전처리는 Flash, 고가치 추출/분석은 Pro로 전환.
  • 실시간 코드 어시스턴트/IDE 플러그인: 더 낮은 비용으로 빠른 코드 자동완성(복잡한 리팩터링은 Pro로 검증).

Gemini 3 flash API에 접근하는 방법

1단계: API 키 신청

cometapi.com에 로그인하세요. 아직 사용자(회원)가 아니라면 먼저 등록하세요. CometAPI 콘솔에 로그인합니다. 인터페이스의 액세스 자격 증명(API 키)을 받으세요. 개인 센터의 API 토큰에서 “Add Token”을 클릭하고 토큰 키: sk-xxxxx를 발급받아 제출합니다.

Step 2: Send Requests to Gemini 3 flash API

“gemini-3-flash” 엔드포인트를 선택해 API 요청을 보내고 요청 본문을 설정하세요. 요청 메서드와 요청 본문은 당사 웹사이트의 API 문서에서 확인할 수 있습니다. 편의를 위해 웹사이트에서 Apifox 테스트도 제공합니다. <YOUR_API_KEY>를 계정의 실제 CometAPI 키로 바꾸세요. 베이스 URL은 Gemini Generating Content 및 Chat입니다.

질문이나 요청을 content 필드에 입력하세요—모델이 응답하는 내용입니다. API 응답을 처리하여 생성된 답변을 얻으세요.

3단계: 결과 수신 및 검증

API 응답을 처리하여 생성된 답변을 얻습니다. 처리 후, API는 작업 상태와 출력 데이터를 반환합니다.

함께 보기 Gemini 3 Pro Preview API

자주 묻는 질문

Gemini 3 Flash deliver Pro-level intelligence at Flash pricing?

Gemini 3 Flash는 Google의 가장 균형 잡힌 모델로, 백만 토큰당 $0.50/$3의 가격으로 최첨단 수준의 추론 기능을 제공하며, 대부분의 작업에서 비슷한 지능을 유지하면서 Gemini 3 Pro보다 약 4배 저렴합니다.

Gemini 3 Flash support?

Gemini 3 Flash는 네 가지 사고 수준을 지원합니다: minimal(거의 0에 가까운 지연 시간), low, medium, high — 이를 통해 개발자는 Gemini 3 Pro가 제공하지 않는 추론 깊이와 속도 간의 절충을 세밀하게 제어할 수 있습니다.

Gemini 3 Flash have a free tier in the API?

예, Gemini 3 Flash(gemini-3-flash-preview)는 Gemini API에서 무료 등급을 제공하며, 현재 API 액세스를 위해 유료 사용이 필요한 Gemini 3 Pro와는 다릅니다.

Thought Signatures and why are they required for Gemini 3 Flash?

Thought Signatures는 모델의 내부 추론을 암호화한 표현으로, 멀티턴 대화에서 다시 전달되어야 합니다. 이는 Gemini 3 Flash가 minimal 사고 수준에서도 추론 컨텍스트를 유지하고 함수 호출을 가능하게 하기 위해 필요합니다.

Gemini 3 Flash combine structured outputs with Google Search grounding?

예, Gemini 3 Flash는 구조화된 출력(JSON schema)을 Google Search, URL Context, Code Execution과 같은 내장 도구와 동일한 요청에서 결합하는 것을 고유하게 지원하여, 근거가 있는 타입 안전 응답을 가능하게 합니다.

media_resolution affect Gemini 3 Flash performance?

media_resolution 매개변수는 이미지/비디오 프레임당 토큰 사용량을 제어합니다: low(280토큰), medium(560), high(1120), 또는 이미지의 경우 ultra_high. 비디오의 경우 컨텍스트 사용을 최적화하기 위해 low와 medium이 모두 프레임당 70토큰으로 제한됩니다.

tools does Gemini 3 Flash support?

Gemini 3 Flash는 Google Search, File Search, Code Execution, URL Context, 그리고 표준 함수 호출을 지원합니다. 그러나 Google Maps grounding과 Computer Use는 아직 Gemini 3 모델에서 지원되지 않습니다.

Gemini 3 Flash 가격

[모델명]의 경쟁력 있는 가격을 살펴보세요. 다양한 예산과 사용 요구에 맞게 설계되었습니다. 유연한 요금제로 사용한 만큼만 지불하므로 요구사항이 증가함에 따라 쉽게 확장할 수 있습니다. [모델명]이 비용을 관리 가능한 수준으로 유지하면서 프로젝트를 어떻게 향상시킬 수 있는지 알아보세요.

Correction: gemini-3-flash variants (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-3-flashgemini-3-flash$0.40$2.40
gemini-3-flashgemini-3-flash-preview$0.40$2.40
gemini-3-flashgemini-3-flash-all$0.40$2.40
gemini-3-flashgemini-3-flash-thinking$0.40$2.40
gemini-3-flashgemini-3-flash-preview-thinking$0.40$2.40

Gemini 3 Flash의 샘플 코드 및 API

Gemini 3 Flash는 CometAPI의 호스팅 API(및 벤더 추론 레이어에 미러링됨)를 통해 제공되는 텍스트 전용 대규모 언어 모델(LLM)입니다. 이 API는 표준 채팅/완성 패턴, 스트리밍 응답, 함수/도구 호출, 구조화된 JSON 출력, 그리고 에이전트 스타일 워크플로를 위해 설계된 여러 “thinking” 모드(인터리브 / 보존 / 턴 수준 thinking)를 지원합니다.
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-flash",
    contents="Explain how AI works in a few words",
)

print(response.text)

Python Code Example

from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-flash",
    contents="Explain how AI works in a few words",
)

print(response.text)

JavaScript Code Example

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-3-flash";
const operator = "generateContent";

async function main() {
  const response = await fetch(`${base_url}/models/${model}:${operator}`, {
    method: "POST",
    headers: {
      "Content-Type": "application/json",
      Authorization: api_key,
    },
    body: JSON.stringify({
      contents: [
        {
          parts: [{ text: "Explain how AI works in a few words" }],
        },
      ],
    }),
  });

  const data = await response.json();
  console.log(data.candidates[0].content.parts[0].text);
}

await main();

Curl Code Example

#!/bin/bash

curl "https://api.cometapi.com/v1beta/models/gemini-3-flash:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Explain how AI works in a few words"
          }
        ]
      }
    ]
  }'

Gemini 3 Flash의 버전

Gemini 3 Flash에 여러 스냅샷이 존재하는 이유는 업데이트 후 출력 변동으로 인해 일관성을 유지하기 위해 이전 스냅샷을 보관하거나, 개발자에게 적응 및 마이그레이션을 위한 전환 기간을 제공하거나, 글로벌 또는 지역별 엔드포인트에 따라 다양한 스냅샷을 제공하여 사용자 경험을 최적화하기 위한 것 등이 포함될 수 있습니다. 버전 간 상세한 차이점은 공식 문서를 참고해 주시기 바랍니다.
모델 ID설명가용성요청
gemini-3-flash-all사용하는 기술은 비공식이며 생성이 불안정하지만 Direct Internet 등 기능을 지원하며, 채팅 형식✅채팅 형식
gemini-3-flash최신 모델로 자동 연결✅Gemini 콘텐츠 생성
gemini-3-flash-preview공식 프리뷰✅Gemini 콘텐츠 생성