Gemini 3.5 Flash의 기술 사양
| 항목 | Gemini 3.5 Flash |
|---|---|
| 제공자 | |
| 모델 계열 | Gemini 3.5 |
| 공식 모델 ID | gemini-3.5-flash |
| 입력 유형 | Text, image, video, audio, PDF |
| 출력 유형 | Text |
| 컨텍스트 윈도 | 1 million 토큰 |
| 최대 출력 토큰 | ~65K 출력 토큰 |
| 주요 강점 | 에이전트형 워크플로, 코딩, 멀티모달 추론 |
| 도구 지원 | 함수 호출, 코드 실행, 검색 그라운딩, 구조화된 출력, URL 컨텍스트, 파일 검색 |
| 사고 지원 | 조절 가능한 사고/추론 수준 |
| 안전 프레임워크 | Google Frontier Safety Framework |
Gemini 3.5 Flash란?
Google Gemini 3.5 Flash는 에이전트 실행, 코딩, 장기 워크플로에 최적화된 Google의 플래그십 초고속 멀티모달 추론 모델입니다. 저지연 추론 특성을 유지하면서도 추론 및 소프트웨어 엔지니어링 역량을 대폭 강화해 Gemini Flash 시리즈를 확장했습니다.
이전의 경량 추론 중심 Flash 모델과 달리, Gemini 3.5 Flash는 상시 동작하는 AI 에이전트, 다단계 코딩 시스템, 엔터프라이즈 자동화 파이프라인을 위해 설계되었습니다. Google은 이를 현재까지 가장 강력한 에이전트형 Flash 티어 모델로 위치시킵니다.
Gemini 3.5 Flash의 주요 기능
- 1M 토큰 장기 컨텍스트 지원: 매우 큰 리포지토리, 방대한 문서, PDF, 대화 기록, 멀티 세션 워크플로를 단일 프롬프트 컨텍스트에서 처리
- 강력한 에이전트형 실행: 다단계 자율 워크플로, 도구 오케스트레이션, 터미널 작업, 장시간 실행 에이전트에 최적화
- 향상된 코딩 성능: Terminal-Bench 및 MCP Atlas 등 여러 코딩/에이전트 벤치마크에서 Gemini 3.1 Pro 대비 우수
- 네이티브 멀티모달 추론: 텍스트, 이미지, 오디오, 비디오, PDF를 수용하는 통합 추론
- 프로덕션급 도구 체계: 구조화된 출력, 함수 호출, 코드 실행, Google Search 및 Maps 기반 그라운딩, 파일 검색 지원
- 구성 가능한 사고/추론 모드: 개발자가 지연시간과 추론 깊이 간 트레이드오프를 조정 가능
Gemini 3.5 Flash의 벤치마크 성능
Google이 보고한 벤치마크 결과에 따르면, Gemini 3.5 Flash는 현재 이용 가능한 에이전트형 Flash 티어 모델 가운데 상위권에 위치합니다:
| 벤치마크 | Gemini 3.5 Flash |
|---|---|
| Terminal-Bench 2.1 | 76.2% |
| GDPval-AA | 1656 Elo |
| MCP Atlas | 83.6% |
| CharXiv Reasoning | 84.2% |
이 점수들은 이전 Gemini Flash 변형 대비 자율 실행, 멀티모달 추론, 소프트웨어 엔지니어링 신뢰성에서의 큰 향상을 보여줍니다.
Gemini 3.5 Flash vs 기타 모델
| 역량 | Gemini 3.5 Flash | Gemini 3.1 Pro | Claude Sonnet 4 |
|---|---|---|---|
| 컨텍스트 윈도 | 1M tokens | 대규모 컨텍스트 | 대규모 컨텍스트 |
| 에이전트형 워크플로 | 탁월 | 강함 | 강함 |
| 코딩 성능 | 매우 강함 | 강함 | 탁월 |
| 추론 속도 | 최적화된 Flash 지연시간 | 더 느림 | 보통 |
| 멀티모달 입력 | 네이티브 멀티모달 | 네이티브 멀티모달 | 비전 + 텍스트 |
| 도구 생태계 | 광범위한 Google 도구 | 광범위 | 강력한 API 도구 |
주요 차이점
- vs Gemini 3.1 Pro: Gemini 3.5 Flash는 훨씬 더 빠른 추론 속도를 유지하면서 코딩과 자율 작업 실행에서 더 뛰어난 성능을 제공합니다.
- vs Claude Sonnet 4: Claude는 미묘한 장문 추론과 글쓰기 품질에서 강세인 반면, Gemini 3.5 Flash는 속도, 에이전트 실행, Google 생태계 통합에 중점을 둡니다.
- vs GPT 계열 추론 모델: Gemini 3.5 Flash는 특히 엔터프라이즈 자동화 사용 사례에서 멀티모달 에이전트 워크플로와 대규모 컨텍스트 오케스트레이션에 경쟁력이 있습니다.
Gemini 3.5 Flash의 알려진 한계
- 현재 네이티브 이미지 또는 오디오 생성 출력은 지원하지 않습니다.
- 이 모델 티어에서는 라이브 대화형 API가 지원되지 않습니다.
- 커뮤니티 벤치마크에 따르면, 특히 시각 중심의 특수 워크플로 등 일부 전문 평가 과제에서 성능이 엇갈립니다.
Gemini 3.5 Flash API에 접근하는 방법
1단계: API 액세스 획득
cometAPI에 로그인하세요. 아직 사용자가 아니라면 먼저 등록하십시오. CometAPI 콘솔에 로그인합니다. 인터페이스의 액세스 자격 API 키를 가져옵니다. 개인 센터의 API 토큰에서 “Add Token”을 클릭하여 토큰 키: sk-xxxxx를 받고 제출하세요.

2단계: Gemini 3.5 Flash API로 요청 보내기
“` gemini-3.5-flash” 엔드포인트를 선택하여 API 요청을 보내고 요청 본문을 설정합니다. 요청 메서드와 요청 본문은 당사 웹사이트의 API 문서에서 확인할 수 있습니다. 편의를 위해 웹사이트에서 Apifox 테스트도 제공합니다. <YOUR_API_KEY>를 계정의 실제 CometAPI 키로 바꾸세요. base url은 Gemini Generating Content입니다.
질문이나 요청을 content 필드에 입력하세요—모델이 응답할 내용입니다 . API 응답을 처리하여 생성된 답변을 얻습니다.
3단계: 응답 처리
API는 생성된 텍스트, 인용, 안전 메타데이터, 선택적 도구 출력 등을 포함한 구조화된 후보 응답을 반환합니다.