모델지원엔터프라이즈블로그
500개 이상의 AI 모델 API, 모든 것이 하나의 API로. CometAPI에서
Models API
개발자
빠른 시작문서API 대시보드
리소스
AI 모델블로그엔터프라이즈변경 로그소개
2025 CometAPI. 모든 권리 보유.개인정보 보호정책서비스 이용약관
Home/Models/Google/Gemini 2.5 Flash Lite
G

Gemini 2.5 Flash Lite

입력:$0.08/M
출력:$0.32/M
맥락:1M
최대 출력:65K
높은 비용 효율성과 높은 처리량을 위해 최적화된 Gemini 2.5 Flash 모델입니다. 대규모 사용을 위해 설계된 가장 작고 가장 비용 효율적인 모델입니다.
새로운
상업적 사용
Playground
개요
기능
가격
API
버전

기술 세부사항

  • Adaptive Reasoning: **Gemini 2.5 Flash-Lite**는 온디맨드 thinking을 지원하여, 더 깊은 추론이 필요할 때에만 개발자가 연산 자원을 할당할 수 있게 합니다.
  • Tool Integrations: Grounding with Google Search, Code Execution, URL Context, Function Calling 등을 포함한 Gemini 2.5의 기본 도구와 완전 호환되어 원활한 멀티모달 워크플로를 제공합니다.
  • Model Context Protocol (MCP): Google의 MCP를 활용해 실시간 웹 데이터를 가져와 응답이 최신이며 문맥적으로 적절하도록 보장합니다.
  • Deployment Options: CometAPI, Gemini API, Vertex AI, Google AI Studio를 통해 이용 가능하며, 얼리 어답터가 실험하고 피드백을 제공할 수 있는 프리뷰 트랙을 제공합니다.

**Gemini 2.5 Flash-Lite**의 벤치마크 성능

  • Latency: Gemini 2.5 Flash 대비 중앙 응답 시간이 최대 50% 낮으며, 표준 분류 및 요약 벤치마크에서 일반적으로 100 ms 미만의 지연 시간을 보입니다.
  • Throughput: 대용량 워크로드에 최적화되어 분당 수만 건의 요청을 성능 저하 없이 처리합니다.
  • Price-Performance: Flash 대비 1,000 토큰당 비용이 25% 절감되어, 비용에 민감한 배포에서 파레토 최적의 선택지입니다.
  • Industry Adoption: 초기 사용자들은 프로덕션 파이프라인에 원활히 통합되었고, 성능 지표가 초기 예상과 일치하거나 이를 상회한다고 보고합니다.

Gemini 2.5 Flash Lite


적합한 사용 사례

  • High-Frequency, Low-Complexity Tasks: 자동 태깅, 감성 분석, 대량 번역
  • Cost-Sensitive Pipelines: 대규모 문서 코퍼스에서의 데이터 추출, 주기적 일괄 요약
  • Edge and Mobile Scenarios: 지연 시간이 중요하지만 리소스 예산이 제한적인 경우

**Gemini 2.5 Flash-Lite**의 한계

  • Preview Status: GA 이전에 API가 변경될 수 있으므로, 통합 시 버전 업 가능성을 고려해야 합니다.
  • No On-the-Fly Fine-Tuning: 커스텀 가중치를 업로드할 수 없으며, 프롬프트 엔지니어링과 시스템 메시지에 의존해야 합니다.
  • Reduced Creativity: 결정적이고 고처리량 작업에 맞춰 튜닝되어 있어, 개방형 생성이나 “창의적” 글쓰기에는 덜 적합합니다.
  • Resource Ceiling: ~16 vCPUs까지 선형적으로 확장되며, 이를 넘어서면 처리량 향상 폭이 줄어듭니다.
  • Multimodal Constraints: 이미지/오디오 입력을 지원하지만 충실도가 제한적이어서, 고강도 비전 처리나 오디오 전사 작업에는 적합하지 않습니다.
  • Context-Window Trade-Off: 최대 1 M 토큰까지 수용하지만, 그 규모에서의 실제 추론은 처리량이 저하될 수 있습니다.

Gemini 2.5 Flash Lite의 기능

[모델 이름]의 성능과 사용성을 향상시키도록 설계된 주요 기능을 살펴보세요. 이러한 기능이 프로젝트에 어떻게 도움이 되고 사용자 경험을 개선할 수 있는지 알아보세요.

Gemini 2.5 Flash Lite 가격

[모델명]의 경쟁력 있는 가격을 살펴보세요. 다양한 예산과 사용 요구에 맞게 설계되었습니다. 유연한 요금제로 사용한 만큼만 지불하므로 요구사항이 증가함에 따라 쉽게 확장할 수 있습니다. [모델명]이 비용을 관리 가능한 수준으로 유지하면서 프로젝트를 어떻게 향상시킬 수 있는지 알아보세요.
model nameInput ($/1M)Output ($/1M)
gemini-2.5-flash-lite0.080.32
gemini-2.5-flash-lite-preview-06-170.080.32
gemini-2.5-flash-lite-thinking0.080.32
gemini-2.5-flash-lite-preview-06-17-thinking0.080.32
gemini-2.5-flash-lite-preview-09-20250.080.32

Gemini 2.5 Flash Lite의 샘플 코드 및 API

[모델 이름]의 포괄적인 샘플 코드와 API 리소스에 액세스하여 통합 프로세스를 간소화하세요. 자세한 문서는 단계별 가이드를 제공하여 프로젝트에서 [모델 이름]의 모든 잠재력을 활용할 수 있도록 돕습니다.
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions

Gemini 2.5 Flash Lite의 버전

Gemini 2.5 Flash Lite에 여러 스냅샷이 존재하는 이유는 업데이트 후 출력 변동으로 인해 일관성을 유지하기 위해 이전 스냅샷을 보관하거나, 개발자에게 적응 및 마이그레이션을 위한 전환 기간을 제공하거나, 글로벌 또는 지역별 엔드포인트에 따라 다양한 스냅샷을 제공하여 사용자 경험을 최적화하기 위한 것 등이 포함될 수 있습니다. 버전 간 상세한 차이점은 공식 문서를 참고해 주시기 바랍니다.
version
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-thinking

더 많은 모델

A

Claude Opus 4.6

입력:$4/M
출력:$20/M
Claude Opus 4.6는 Anthropic의 “Opus”급 대규모 언어 모델로, 2026년 2월에 출시되었습니다. 지식 업무와 연구 워크플로를 위한 주력 모델로 자리매김했으며 — 긴 컨텍스트 추론, 다단계 계획, 도구 사용(에이전트형 소프트웨어 워크플로 포함), 그리고 슬라이드와 스프레드시트 자동 생성과 같은 컴퓨터 활용 작업을 개선합니다.
A

Claude Sonnet 4.6

입력:$2.4/M
출력:$12/M
Claude Sonnet 4.6은 지금까지 가장 역량이 뛰어난 Sonnet 모델입니다. 코딩, 컴퓨터 사용, 장문맥 추론, 에이전트 계획, 지식 업무, 디자인 전반에 걸쳐 모델의 역량을 전면 업그레이드한 버전입니다. Sonnet 4.6은 베타 단계의 1M 토큰 컨텍스트 윈도우도 제공합니다.
O

GPT-5.4 nano

입력:$0.16/M
출력:$1/M
GPT-5.4 nano는 속도와 비용이 최우선인 분류, 데이터 추출, 순위화, 하위 에이전트 등의 작업을 위해 설계되었습니다.
O

GPT-5.4 mini

입력:$0.6/M
출력:$3.6/M
GPT-5.4 mini는 대규모 워크로드를 위해 설계된 더 빠르고 더 효율적인 모델에 GPT-5.4의 강점을 접목합니다.
A

Claude Mythos Preview

A

Claude Mythos Preview

곧 출시 예정
입력:$60/M
출력:$240/M
Claude Mythos Preview는 현재까지 우리의 가장 강력한 프런티어 모델이며, 이전 프런티어 모델인 Claude Opus 4.6과 비교해 여러 평가 벤치마크 점수에서 놀라운 도약을 보여줍니다.
X

mimo-v2-pro

입력:$0.8/M
출력:$2.4/M
MiMo-V2-Pro는 Xiaomi의 플래그십 파운데이션 모델로, 총 1T 파라미터와 1M 컨텍스트 길이를 갖추고 있으며, 에이전트 중심 시나리오에 맞춰 깊이 최적화되었습니다. OpenClaw와 같은 범용 에이전트 프레임워크와의 호환성이 뛰어납니다. 표준 PinchBench 및 ClawBench 벤치마크에서 글로벌 최상위권에 속하며, 체감 성능은 Opus 4.6에 근접합니다. MiMo-V2-Pro는 에이전트 시스템의 두뇌로 기능하도록 설계되어 복잡한 워크플로를 오케스트레이션하고, 프로덕션 엔지니어링 작업을 추진하며, 신뢰할 수 있는 결과를 제공합니다.

관련 블로그

무료 Gemini 2.5 Pro API가 작동하지 않나요? 2025년 무료 할당량 변경 사항
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

무료 Gemini 2.5 Pro API가 작동하지 않나요? 2025년 무료 할당량 변경 사항

Google가 Gemini API의 무료 티어를 대폭 축소했습니다: Gemini 2.5 Pro는 무료 티어에서 제거되었고 Gemini 2.5 Flash의 일일 무료 요청 한도가 크게 줄었습니다(보고: ~250 → ~20/일). 이는 모델이 실험용으로 영구적으로 "죽었다"는 뜻은 아니지만, 많은 현실 세계의 사용 사례에서 무료 접근성이 사실상 무력화되었다는 의미입니다.