모델가격엔터프라이즈
500개 이상의 AI 모델 API, 모든 것이 하나의 API로. CometAPI에서
Models API
개발자
빠른 시작문서API 대시보드
회사
회사 소개엔터프라이즈
리소스
AI 모델블로그변경 로그지원
서비스 이용약관개인정보 보호정책
© 2026 CometAPI · All rights reserved
Home/Models/Google/Gemini 3.5 Flash
G

Gemini 3.5 Flash

입력:$1.2/M
출력:$7.2/M
The smartest model, built for speed, combines cutting-edge intelligence with outstanding search and factual evidence.
새로운
상업적 사용
Playground
개요
기능
가격
API
버전

Gemini 3.5 Flash의 기술 사양

항목Gemini 3.5 Flash
제공자Google
모델 계열Gemini 3.5
공식 모델 IDgemini-3.5-flash
입력 유형Text, image, video, audio, PDF
출력 유형Text
컨텍스트 윈도우1 million tokens
최대 출력 토큰~65K output tokens
주요 강점에이전트형 워크플로, 코딩, 멀티모달 추론
도구 지원함수 호출, 코드 실행, 검색 그라운딩, 구조화된 출력, URL 컨텍스트, 파일 검색
사고 지원조절 가능한 사고/추론 수준
안전 프레임워크Google Frontier Safety Framework

Gemini 3.5 Flash란 무엇인가?

Google Gemini 3.5 Flash는 에이전트 실행, 코딩, 장기 워크플로에 최적화된 Google의 플래그십 고속 멀티모달 추론 모델입니다. 낮은 지연의 추론 특성을 유지하면서, Gemini Flash 시리즈를 확장하여 추론 및 소프트웨어 엔지니어링 역량을 대폭 강화했습니다.

경량 추론에 초점을 맞췄던 이전 Flash 모델과 달리, Gemini 3.5 Flash는 지속적으로 동작하는 AI 에이전트, 다단계 코딩 시스템, 엔터프라이즈 자동화 파이프라인을 위해 설계되었습니다. Google은 이를 현재까지 가장 강력한 에이전트형 Flash 티어 모델로 자리매김하고 있습니다.

Gemini 3.5 Flash의 주요 기능

  • 1M 토큰 장기 컨텍스트 지원: 매우 큰 리포지토리, 방대한 문서, PDF, 대화 기록, 다중 세션 워크플로를 단일 프롬프트 컨텍스트에서 처리합니다.
  • 강력한 에이전트형 실행: 다단계 자율 워크플로, 도구 오케스트레이션, 터미널 작업, 장시간 실행되는 AI 에이전트에 최적화되어 있습니다.
  • 고급 코딩 성능: Terminal-Bench 및 MCP Atlas를 포함한 여러 코딩/에이전트 벤치마크에서 Gemini 3.1 Pro를 능가합니다.
  • 네이티브 멀티모달 추론: 텍스트, 이미지, 오디오, 비디오, PDF를 수용하여 통합 추론 작업을 수행합니다.
  • 프로덕션급 도구 지원: 구조화된 출력, 함수 호출, 코드 실행, Google 검색 및 지도와의 그라운딩, 파일 검색을 지원합니다.
  • 구성 가능한 추론/사고 모드: 개발자는 사고 수준 컨트롤을 통해 지연 시간과 추론 심도의 균형을 조정할 수 있습니다.

Gemini 3.5 Flash의 벤치마크 성능

Google이 보고한 벤치마크 결과에 따르면, Gemini 3.5 Flash는 현재 이용 가능한 에이전트형 Flash 티어 모델 중에서도 가장 강력한 수준에 속합니다:

벤치마크Gemini 3.5 Flash
Terminal-Bench 2.176.2%
GDPval-AA1656 Elo
MCP Atlas83.6%
CharXiv Reasoning84.2%

이러한 점수는 이전 Gemini Flash 변형 대비 자율 실행, 멀티모달 추론, 소프트웨어 엔지니어링 안정성에서 큰 향상을 보여줍니다.

Gemini 3.5 Flash와 다른 모델 비교

기능Gemini 3.5 FlashGemini 3.1 ProClaude Sonnet 4
컨텍스트 윈도우1M tokensLarge-contextLarge-context
에이전트형 워크플로ExcellentStrongStrong
코딩 성능Very strongStrongExcellent
추론 속도Optimized Flash latencySlowerModerate
멀티모달 입력Native multimodalNative multimodalVision + text
도구 생태계Extensive Google toolingExtensiveStrong API tooling

주요 차이점

  • vs Gemini 3.1 Pro: Gemini 3.5 Flash는 더 나은 코딩 및 자율 작업 실행 성능을 제공하면서도 훨씬 빠른 추론 속도를 유지합니다.
  • vs Claude Sonnet 4: Claude는 섬세한 장문 추론 및 글쓰기 품질에서 종종 우위를 보이는 반면, Gemini 3.5 Flash는 속도, 에이전트 실행, Google 생태계 통합에 중점을 둡니다.
  • vs GPT 시리즈 추론 모델: Gemini 3.5 Flash는 특히 엔터프라이즈 자동화를 위한 멀티모달 에이전트 워크플로와 대규모 컨텍스트 오케스트레이션에서 경쟁력이 높습니다.

Gemini 3.5 Flash의 알려진 한계

  • 현재 이미지나 오디오의 네이티브 생성 출력은 지원하지 않습니다.
  • 이 모델 티어에서는 라이브 대화형 API를 지원하지 않습니다.
  • 커뮤니티 벤치마크에서는 일부 특수한 평가 작업(특히 비전 중심의 틈새 워크플로)에서 혼재된 성능이 보고됩니다.

Gemini 3.5 Flash API 접근 방법

Step 1: Get API Access

cometAPI에 로그인하세요. 아직 사용자라면 먼저 회원가입을 해주세요. CometAPI 콘솔에 로그인합니다. 인터페이스의 액세스 자격 API 키를 받습니다. 개인센터의 API 토큰에서 “Add Token”을 클릭해 토큰 키: sk-xxxxx를 발급받아 제출합니다.

cometapi-key

Step 2: Send Requests to Gemini 3.5 Flash API

“` gemini-3.5-flash” 엔드포인트를 선택하여 API 요청을 보내고 요청 본문을 설정합니다. 요청 메서드와 요청 본문은 당사 웹사이트 API 문서에서 확인할 수 있습니다. 또한 편의를 위해 Apifox 테스트도 제공합니다. 계정의 실제 CometAPI 키로 <YOUR_API_KEY>를 교체하세요. 기본 URL은 Gemini Generating Content입니다.

질문이나 요청을 content 필드에 입력하세요—모델은 여기에 응답합니다. 생성된 답변을 얻기 위해 API 응답을 처리합니다.

Step 3: Process Responses

API는 생성된 텍스트, 인용, 안전성 메타데이터, 선택적 도구 출력 등을 포함하는 구조화된 후보 응답을 반환합니다.

자주 묻는 질문

Can Gemini 3.5 Flash handle million-token contexts?

Yes. Gemini 3.5 Flash supports a 1 million token context window, making it suitable for repository-scale reasoning, long PDFs, and multi-document workflows.

How does Gemini 3.5 Flash compare to Gemini 3.1 Pro for coding?

Google reports that Gemini 3.5 Flash outperforms Gemini 3.1 Pro on agentic and coding benchmarks including Terminal-Bench 2.1 and MCP Atlas.

Does the Gemini 3.5 Flash API support multimodal inputs?

Yes. Gemini 3.5 Flash accepts text, images, audio, video, and PDF inputs through the Gemini API.

What tools and integrations are available in the Gemini 3.5 Flash API?

The model supports function calling, code execution, structured outputs, Google Search grounding, Maps grounding, file search, and URL context support.

Is Gemini 3.5 Flash suitable for AI agents and autonomous workflows?

Yes. Google specifically optimized Gemini 3.5 Flash for long-horizon agentic execution, tool orchestration, and persistent AI assistant workflows.

What are the current limitations of Gemini 3.5 Flash?

Gemini 3.5 Flash currently does not support native image generation, audio generation, or Live API conversational streaming.

When should developers choose Gemini 3.5 Flash instead of Claude Sonnet 4?

Gemini 3.5 Flash is a strong choice when low-latency multimodal reasoning, large context handling, and Google ecosystem integration are more important than premium long-form writing quality.

What benchmark scores has Gemini 3.5 Flash achieved?

Google reports benchmark results including 76.2% on Terminal-Bench 2.1, 83.6% on MCP Atlas, and 84.2% on CharXiv Reasoning.

Gemini 3.5 Flash 가격

[모델명]의 경쟁력 있는 가격을 살펴보세요. 다양한 예산과 사용 요구에 맞게 설계되었습니다. 유연한 요금제로 사용한 만큼만 지불하므로 요구사항이 증가함에 따라 쉽게 확장할 수 있습니다. [모델명]이 비용을 관리 가능한 수준으로 유지하면서 프로젝트를 어떻게 향상시킬 수 있는지 알아보세요.
코멧 가격 (USD / M Tokens)공식 가격 (USD / M Tokens)할인
입력:$1.2/M
출력:$7.2/M
입력:$1.5/M
출력:$9/M
-20%

Gemini 3.5 Flash의 샘플 코드 및 API

[모델 이름]의 포괄적인 샘플 코드와 API 리소스에 액세스하여 통합 프로세스를 간소화하세요. 자세한 문서는 단계별 가이드를 제공하여 프로젝트에서 [모델 이름]의 모든 잠재력을 활용할 수 있도록 돕습니다.
POST
/v1/chat/completions
POST
/v1beta/models/{model}:generateContent
Python
JavaScript
Curl
from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Explain how parallel agentic execution works in three sentences.",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_level="minimal"),
    ),
)

print(response.text)

Python Code Example

from google import genai
from google.genai import types
import os

# Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Explain how parallel agentic execution works in three sentences.",
    config=types.GenerateContentConfig(
        thinking_config=types.ThinkingConfig(thinking_level="minimal"),
    ),
)

print(response.text)

JavaScript Code Example

// Get your CometAPI key from https://www.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-3.5-flash";
const operator = "generateContent";

async function main() {
  const response = await fetch(`${base_url}/models/${model}:${operator}`, {
    method: "POST",
    headers: {
      "Content-Type": "application/json",
      Authorization: api_key,
    },
    body: JSON.stringify({
      contents: [
        {
          parts: [
            {
              text: "Explain how parallel agentic execution works in three sentences.",
            },
          ],
        },
      ],
      generationConfig: {
        thinkingConfig: {
          thinkingLevel: "MINIMAL",
        },
      },
    }),
  });

  const data = await response.json();
  console.log(data.candidates[0].content.parts[0].text);
}

await main();

Curl Code Example

#!/bin/bash

curl "https://api.cometapi.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Explain how parallel agentic execution works in three sentences."
          }
        ]
      }
    ],
    "generationConfig": {
      "thinkingConfig": {
        "thinkingLevel": "MINIMAL"
      }
    }
  }'

Gemini 3.5 Flash의 버전

Gemini 3.5 Flash에 여러 스냅샷이 존재하는 이유는 업데이트 후 출력 변동으로 인해 일관성을 유지하기 위해 이전 스냅샷을 보관하거나, 개발자에게 적응 및 마이그레이션을 위한 전환 기간을 제공하거나, 글로벌 또는 지역별 엔드포인트에 따라 다양한 스냅샷을 제공하여 사용자 경험을 최적화하기 위한 것 등이 포함될 수 있습니다. 버전 간 상세한 차이점은 공식 문서를 참고해 주시기 바랍니다.
version
gemini-3.5-flash