Name: Gemini 2.5 Flash Lite
Price: 0.08 USD
Availability: InStock

技術詳細

適応型推論: Gemini 2.5 Flash-Lite はオンデマンドの思考をサポートし、より深い推論が必要なときにのみ開発者が計算リソースを割り当てられるようにします。
ツール統合: Gemini 2.5 のネイティブツールと完全互換。Grounding with Google Search、Code Execution、URL Context、Function Calling を含み、シームレスなマルチモーダルワークフローを実現します。
Model Context Protocol (MCP): Google の MCP を活用してリアルタイムのウェブデータを取得し、応答が最新で文脈に即したものとなるよう保証します。
デプロイオプション: CometAPI、Gemini API、Vertex AI、Google AI Studio を通じて利用可能。早期導入者向けのプレビュートラックにより、試用とフィードバックが可能です。

`Gemini 2.5 Flash-Lite` のベンチマーク性能

レイテンシ: Gemini 2.5 Flash と比べ、中央値の応答時間を最大 50% 短縮。標準的な分類および要約ベンチマークで、一般的に100 ms 未満のレイテンシを達成。
スループット: 高ボリュームのワークロード向けに最適化され、性能の劣化なしに毎分数万リクエストを持続的に処理可能。
価格性能: Flash 同等モデル比で1,000 トークンあたりのコストを 25% 削減し、コスト重視のデプロイにおけるパレート最適な選択となります。
業界での採用: 早期ユーザーは本番パイプラインへのシームレスな統合を報告しており、パフォーマンス指標は当初の予測に一致、もしくはそれを上回っています。

Gemini 2.5 Flash Lite

model name	Input ($/1M)	Output ($/1M)
gemini-2.5-flash-lite	0.08	0.32
gemini-2.5-flash-lite-preview-06-17	0.08	0.32
gemini-2.5-flash-lite-thinking	0.08	0.32
gemini-2.5-flash-lite-preview-06-17-thinking	0.08	0.32
gemini-2.5-flash-lite-preview-09-2025	0.08	0.32