Gemini 3.5 Flash의 기술 사양
| 항목 | Gemini 3.5 Flash |
|---|---|
| 제공자 | |
| 모델 계열 | Gemini 3.5 |
| 공식 모델 ID | gemini-3.5-flash |
| 입력 유형 | Text, image, video, audio, PDF |
| 출력 유형 | Text |
| 컨텍스트 윈도우 | 1 million tokens |
| 최대 출력 토큰 | ~65K output tokens |
| 주요 강점 | 에이전트형 워크플로, 코딩, 멀티모달 추론 |
| 도구 지원 | 함수 호출, 코드 실행, 검색 그라운딩, 구조화된 출력, URL 컨텍스트, 파일 검색 |
| 사고 지원 | 조절 가능한 사고/추론 수준 |
| 안전 프레임워크 | Google Frontier Safety Framework |
Gemini 3.5 Flash란 무엇인가?
Google Gemini 3.5 Flash는 에이전트 실행, 코딩, 장기 워크플로에 최적화된 Google의 플래그십 고속 멀티모달 추론 모델입니다. 낮은 지연의 추론 특성을 유지하면서, Gemini Flash 시리즈를 확장하여 추론 및 소프트웨어 엔지니어링 역량을 대폭 강화했습니다.
경량 추론에 초점을 맞췄던 이전 Flash 모델과 달리, Gemini 3.5 Flash는 지속적으로 동작하는 AI 에이전트, 다단계 코딩 시스템, 엔터프라이즈 자동화 파이프라인을 위해 설계되었습니다. Google은 이를 현재까지 가장 강력한 에이전트형 Flash 티어 모델로 자리매김하고 있습니다.
Gemini 3.5 Flash의 주요 기능
- 1M 토큰 장기 컨텍스트 지원: 매우 큰 리포지토리, 방대한 문서, PDF, 대화 기록, 다중 세션 워크플로를 단일 프롬프트 컨텍스트에서 처리합니다.
- 강력한 에이전트형 실행: 다단계 자율 워크플로, 도구 오케스트레이션, 터미널 작업, 장시간 실행되는 AI 에이전트에 최적화되어 있습니다.
- 고급 코딩 성능: Terminal-Bench 및 MCP Atlas를 포함한 여러 코딩/에이전트 벤치마크에서 Gemini 3.1 Pro를 능가합니다.
- 네이티브 멀티모달 추론: 텍스트, 이미지, 오디오, 비디오, PDF를 수용하여 통합 추론 작업을 수행합니다.
- 프로덕션급 도구 지원: 구조화된 출력, 함수 호출, 코드 실행, Google 검색 및 지도와의 그라운딩, 파일 검색을 지원합니다.
- 구성 가능한 추론/사고 모드: 개발자는 사고 수준 컨트롤을 통해 지연 시간과 추론 심도의 균형을 조정할 수 있습니다.
Gemini 3.5 Flash의 벤치마크 성능
Google이 보고한 벤치마크 결과에 따르면, Gemini 3.5 Flash는 현재 이용 가능한 에이전트형 Flash 티어 모델 중에서도 가장 강력한 수준에 속합니다:
| 벤치마크 | Gemini 3.5 Flash |
|---|---|
| Terminal-Bench 2.1 | 76.2% |
| GDPval-AA | 1656 Elo |
| MCP Atlas | 83.6% |
| CharXiv Reasoning | 84.2% |
이러한 점수는 이전 Gemini Flash 변형 대비 자율 실행, 멀티모달 추론, 소프트웨어 엔지니어링 안정성에서 큰 향상을 보여줍니다.
Gemini 3.5 Flash와 다른 모델 비교
| 기능 | Gemini 3.5 Flash | Gemini 3.1 Pro | Claude Sonnet 4 |
|---|---|---|---|
| 컨텍스트 윈도우 | 1M tokens | Large-context | Large-context |
| 에이전트형 워크플로 | Excellent | Strong | Strong |
| 코딩 성능 | Very strong | Strong | Excellent |
| 추론 속도 | Optimized Flash latency | Slower | Moderate |
| 멀티모달 입력 | Native multimodal | Native multimodal | Vision + text |
| 도구 생태계 | Extensive Google tooling | Extensive | Strong API tooling |
주요 차이점
- vs Gemini 3.1 Pro: Gemini 3.5 Flash는 더 나은 코딩 및 자율 작업 실행 성능을 제공하면서도 훨씬 빠른 추론 속도를 유지합니다.
- vs Claude Sonnet 4: Claude는 섬세한 장문 추론 및 글쓰기 품질에서 종종 우위를 보이는 반면, Gemini 3.5 Flash는 속도, 에이전트 실행, Google 생태계 통합에 중점을 둡니다.
- vs GPT 시리즈 추론 모델: Gemini 3.5 Flash는 특히 엔터프라이즈 자동화를 위한 멀티모달 에이전트 워크플로와 대규모 컨텍스트 오케스트레이션에서 경쟁력이 높습니다.
Gemini 3.5 Flash의 알려진 한계
- 현재 이미지나 오디오의 네이티브 생성 출력은 지원하지 않습니다.
- 이 모델 티어에서는 라이브 대화형 API를 지원하지 않습니다.
- 커뮤니티 벤치마크에서는 일부 특수한 평가 작업(특히 비전 중심의 틈새 워크플로)에서 혼재된 성능이 보고됩니다.
Gemini 3.5 Flash API 접근 방법
Step 1: Get API Access
cometAPI에 로그인하세요. 아직 사용자라면 먼저 회원가입을 해주세요. CometAPI 콘솔에 로그인합니다. 인터페이스의 액세스 자격 API 키를 받습니다. 개인센터의 API 토큰에서 “Add Token”을 클릭해 토큰 키: sk-xxxxx를 발급받아 제출합니다.

Step 2: Send Requests to Gemini 3.5 Flash API
“` gemini-3.5-flash” 엔드포인트를 선택하여 API 요청을 보내고 요청 본문을 설정합니다. 요청 메서드와 요청 본문은 당사 웹사이트 API 문서에서 확인할 수 있습니다. 또한 편의를 위해 Apifox 테스트도 제공합니다. 계정의 실제 CometAPI 키로 <YOUR_API_KEY>를 교체하세요. 기본 URL은 Gemini Generating Content입니다.
질문이나 요청을 content 필드에 입력하세요—모델은 여기에 응답합니다. 생성된 답변을 얻기 위해 API 응답을 처리합니다.
Step 3: Process Responses
API는 생성된 텍스트, 인용, 안전성 메타데이터, 선택적 도구 출력 등을 포함하는 구조화된 후보 응답을 반환합니다.