Gemini 2.5 Flash는 출력 품질을 훼손하지 않으면서 신속한 응답을 제공하도록 설계되었습니다. 텍스트, 이미지, 오디오, 비디오를 포함한 멀티모달 입력을 지원하여 다양한 애플리케이션에 적합합니다. 이 모델은 Google AI Studio와 Vertex AI 같은 플랫폼을 통해 액세스할 수 있어, 다양한 시스템에 원활히 통합하는 데 필요한 도구를 개발자에게 제공합니다.
Gemini 2.5 Flash는 Gemini 2.5 제품군 내에서 돋보이게 만드는 여러 가지 핵심 기능을 도입합니다:
Gemini 2.5 Flash는 다음의 주요 버전을 거치며 발전해 왔습니다:
2025년 7월 현재, Gemini 2.5 Flash는 공개적으로 사용 가능하며 안정화되었습니다( gemini-2.5-flash-preview-05-20 대비 변경 없음). gemini-2.5-flash-preview-04-17을 사용 중이라면, 기존 프리뷰 가격은 2025년 7월 15일 모델 엔드포인트가 종료될 때까지 유지됩니다. 일반 공급 모델 "gemini-2.5-flash"로 마이그레이션할 수 있습니다.
더 빠르고, 더 저렴하고, 더 스마트하게:
입력 컨텍스트 윈도: 최대 1 million 토큰으로, 광범위한 컨텍스트 유지가 가능합니다.
출력 토큰: 응답당 최대 8,192 토큰을 생성할 수 있습니다.
지원 모달리티: 텍스트, 이미지, 오디오, 비디오.
통합 플랫폼: Google AI Studio 및 Vertex AI를 통해 제공.
가격: 경쟁력 있는 토큰 기반 요금 모델로, 비용 효율적인 배포를 지원합니다.
내부적으로, Gemini 2.5 Flash는 웹, 코드, 이미지, 비디오 데이터의 혼합으로 학습된 트랜스포머 기반 대규모 언어 모델입니다. 주요 기술 사양은 다음과 같습니다:
멀티모달 학습: 여러 모달리티를 정합하도록 학습되어, 텍스트를 이미지, 비디오, 오디오와 매끄럽게 혼합할 수 있어 비디오 요약이나 오디오 캡셔닝 같은 작업에 유용합니다.
동적 사고 프로세스: 최종 출력을 내기 전에 모델이 계획을 수립하고 복잡한 프롬프트를 분해하는 내부 추론 루프를 구현합니다.
구성 가능한 사고 예산: thinking_budget는 0(추론 없음)부터 24,576 토큰까지 설정할 수 있어, 지연 시간과 답변 품질 간의 균형을 조정할 수 있습니다.
도구 통합: Grounding with Google Search, Code Execution, URL Context, Function Calling을 지원하여 자연어 프롬프트만으로 실제 작업을 직접 수행할 수 있습니다.
엄격한 평가에서, Gemini 2.5 Flash는 업계 선도적 성능을 보여줍니다:
이러한 결과는 Gemini 2.5 Flash가 추론, 과학적 이해, 수학적 문제 해결, 코딩, 시각적 해석, 다국어 기능에서 경쟁 우위를 지님을 보여줍니다:

강력함에도 불구하고, Gemini 2.5 Flash에는 몇 가지 제한 사항이 있습니다:
| 코멧 가격 (USD / M Tokens) | 공식 가격 (USD / M Tokens) |
|---|---|
입력:$0.24/M 출력:$2.00/M | 입력:$0.30/M 출력:$2.50/M |
from google import genai
import os
# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"
client = genai.Client(
http_options={"api_version": "v1beta", "base_url": BASE_URL},
api_key=COMETAPI_KEY,
)
response = client.models.generate_content(
model="gemini-2.5-flash",
contents="Tell me a three sentence bedtime story about a unicorn.",
)
print(response.text)