Gemini 2.5 Flash は、出力品質を損なうことなく迅速な応答を実現するよう設計されています。テキスト、画像、音声、動画を含むマルチモーダル入力をサポートし、幅広い用途に適しています。Google AI Studio や Vertex AI などのプラットフォームを通じて利用でき、さまざまなシステムへのシームレスな統合に必要なツールを開発者に提供します。
Gemini 2.5 Flash は、Gemini 2.5 ファミリーの中で差別化される際立った機能をいくつか導入しています:
Gemini 2.5 Flash は、以下の主要なバージョンを経て移行しました:
2025年7月時点で、Gemini 2.5 Flash は一般公開され安定版です(gemini-2.5-flash-preview-05-20 からの変更はありません)。gemini-2.5-flash-preview-04-17 を使用している場合、モデルエンドポイントが 2025年7月15日に廃止・停止されるまで既存のプレビュープライシングが継続します。一般提供モデル "gemini-2.5-flash" へ移行できます。
より高速、低コスト、よりスマート:
入力コンテキストウィンドウ: 最大 100万トークンで、広範なコンテキスト保持が可能。
出力トークン: 応答あたり最大 8,192 トークンを生成可能。
対応モダリティ: テキスト、画像、音声、動画。
統合プラットフォーム: Google AI Studio と Vertex AI で利用可能。
価格: 競争力のあるトークンベースの料金モデルで、費用対効果の高い導入を実現。
内部的には、Gemini 2.5 Flash は transformer-based 大規模言語モデルで、web、コード、画像、動画データの混成で学習されています。主要な技術仕様は以下のとおりです:
マルチモーダルトレーニング: 複数のモダリティを整合させるように学習されており、Flash はテキストと画像、動画、音声をシームレスに組み合わせ、動画要約や音声キャプション生成のようなタスクに有用。
動的な思考プロセス: 出力の前にモデルが計画し、複雑なプロンプトを分解する内部推論ループを実装。
思考バジェットの設定可能性: thinking_budget は 0(推論なし)から 24,576 トークンまで設定でき、レイテンシと回答品質のトレードオフを調整可能。
ツール統合: Grounding with Google Search、Code Execution、URL Context、Function Calling をサポートし、自然言語プロンプトから直接、実世界のアクションを実行可能。
厳密な評価において、Gemini 2.5 Flash は業界最先端の性能を示しています:
これらの結果は、推論、科学的理解、数学的問題解決、コーディング、視覚解釈、多言語能力における Gemini 2.5 Flash の競争優位性を示しています:

強力である一方、Gemini 2.5 Flash にはいくつかの制限があります:
| コメット価格 (USD / M Tokens) | 公式価格 (USD / M Tokens) |
|---|---|
入力:$0.24/M 出力:$2.00/M | 入力:$0.30/M 出力:$2.50/M |
from google import genai
import os
# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"
client = genai.Client(
http_options={"api_version": "v1beta", "base_url": BASE_URL},
api_key=COMETAPI_KEY,
)
response = client.models.generate_content(
model="gemini-2.5-flash",
contents="Tell me a three sentence bedtime story about a unicorn.",
)
print(response.text)