モデルサポートエンタープライズブログ
500以上のAI Model API、オールインワンAPI。CometAPIで。
モデルAPI
開発者
クイックスタートドキュメントAPI ダッシュボード
リソース
AIモデルブログエンタープライズ変更履歴概要
2025 CometAPI. 全著作権所有。プライバシーポリシー利用規約
Home/Models/Google/Gemini 2.5 Flash Lite
G

Gemini 2.5 Flash Lite

入力:$0.08/M
出力:$0.32/M
文脈:1M
最大出力:65K
高い費用対効果と高スループットに最適化された Gemini 2.5 Flash モデル。 大規模利用向けに設計された、最小で最も費用対効果の高いモデル。
新着
商用利用
Playground
概要
機能
料金プラン
API
バージョン

技術詳細

  • 適応型推論: Gemini 2.5 Flash-Lite はオンデマンドの思考をサポートし、より深い推論が必要なときにのみ開発者が計算リソースを割り当てられるようにします。
  • ツール統合: Gemini 2.5 のネイティブツールと完全互換。Grounding with Google Search、Code Execution、URL Context、Function Calling を含み、シームレスなマルチモーダルワークフローを実現します。
  • Model Context Protocol (MCP): Google の MCP を活用してリアルタイムのウェブデータを取得し、応答が最新で文脈に即したものとなるよう保証します。
  • デプロイオプション: CometAPI、Gemini API、Vertex AI、Google AI Studio を通じて利用可能。早期導入者向けのプレビュートラックにより、試用とフィードバックが可能です。

Gemini 2.5 Flash-Lite のベンチマーク性能

  • レイテンシ: Gemini 2.5 Flash と比べ、中央値の応答時間を最大 50% 短縮。標準的な分類および要約ベンチマークで、一般的に100 ms 未満のレイテンシを達成。
  • スループット: 高ボリュームのワークロード向けに最適化され、性能の劣化なしに毎分数万リクエストを持続的に処理可能。
  • 価格性能: Flash 同等モデル比で1,000 トークンあたりのコストを 25% 削減し、コスト重視のデプロイにおけるパレート最適な選択となります。
  • 業界での採用: 早期ユーザーは本番パイプラインへのシームレスな統合を報告しており、パフォーマンス指標は当初の予測に一致、もしくはそれを上回っています。

Gemini 2.5 Flash Lite


適したユースケース

  • 高頻度・低複雑度のタスク: 自動タグ付け、感情分析、一括翻訳
  • コスト重視のパイプライン: 大規模文書コーパスからのデータ抽出、定期的なバッチ要約
  • エッジおよびモバイルのシナリオ: レイテンシが重要でリソース予算が限られる場合

Gemini 2.5 Flash-Lite の制限事項

  • プレビュー段階: GA 前に API 変更が入る可能性があり、連携はバージョン更新の可能性を考慮する必要があります。
  • オンザフライのファインチューニングなし: カスタム重みのアップロードは不可。プロンプトエンジニアリングとシステムメッセージに依存。
  • 創造性の抑制: 決定論的で高スループットなタスク向けにチューニングされており、自由形式の生成や「創作的」なライティングには不向き。
  • リソース上限: 線形スケールは ~16 vCPUs まで。それ以上ではスループットの伸びが鈍化。
  • マルチモーダルの制約: 画像/音声入力をサポートするものの忠実度は限定的。大規模なビジョン処理や音声転写タスクには最適ではありません。
  • コンテキストウィンドウのトレードオフ : 最大 1 M トークンを受け付けるものの、その規模での実推論ではスループット低下が生じる可能性があります。

Gemini 2.5 Flash Liteの機能

Gemini 2.5 Flash Liteのパフォーマンスと使いやすさを向上させるために設計された主要機能をご紹介します。これらの機能がプロジェクトにどのようなメリットをもたらし、ユーザーエクスペリエンスを改善するかをご確認ください。

Gemini 2.5 Flash Liteの料金

Gemini 2.5 Flash Liteの競争力のある価格設定をご確認ください。さまざまな予算や利用ニーズに対応できるよう設計されています。柔軟なプランにより、使用した分だけお支払いいただけるため、要件の拡大に合わせて簡単にスケールアップできます。Gemini 2.5 Flash Liteがコストを管理しながら、お客様のプロジェクトをどのように強化できるかをご覧ください。
model nameInput ($/1M)Output ($/1M)
gemini-2.5-flash-lite0.080.32
gemini-2.5-flash-lite-preview-06-170.080.32
gemini-2.5-flash-lite-thinking0.080.32
gemini-2.5-flash-lite-preview-06-17-thinking0.080.32
gemini-2.5-flash-lite-preview-09-20250.080.32

Gemini 2.5 Flash LiteのサンプルコードとAPI

Gemini 2.5 Flash Liteの包括的なサンプルコードとAPIリソースにアクセスして、統合プロセスを効率化しましょう。詳細なドキュメントでは段階的なガイダンスを提供し、プロジェクトでGemini 2.5 Flash Liteの潜在能力を最大限に活用できるよう支援します。
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions

Gemini 2.5 Flash Liteのバージョン

Gemini 2.5 Flash Liteに複数のスナップショットが存在する理由としては、アップデート後の出力変動により旧版スナップショットの一貫性維持が必要な場合、開発者に適応・移行期間を提供するため、グローバル/リージョナルエンドポイントに対応する異なるスナップショットによるユーザー体験最適化などが考えられます。各バージョンの詳細な差異については、公式ドキュメントをご参照ください。
version
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite-thinking
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025

その他のモデル

A

Claude Opus 4.6

入力:$4/M
出力:$20/M
Claude Opus 4.6 は、Anthropic の「Opus」クラスの大規模言語モデルで、2026年2月にリリースされた。ナレッジワークや研究ワークフローの主力として位置づけられており、長文脈での推論、多段階の計画立案、ツールの利用(エージェント型ソフトウェアワークフローを含む)、およびスライドやスプレッドシートの自動生成といったコンピュータ操作タスクを強化する。
A

Claude Sonnet 4.6

入力:$2.4/M
出力:$12/M
Claude Sonnet 4.6 は、これまでで最も高性能な Sonnet モデルです。コーディング、コンピューターの利用、長文脈推論、エージェントの計画立案、ナレッジワーク、デザインにわたってモデルのスキルを全面的にアップグレードしました。Sonnet 4.6 は、ベータ版で 1M トークンのコンテキストウィンドウも備えています。
O

GPT-5.4 nano

入力:$0.16/M
出力:$1/M
GPT-5.4 nano は、分類、データ抽出、ランキング、サブエージェントなど、速度とコストが最も重要となるタスク向けに設計されています。
O

GPT-5.4 mini

入力:$0.6/M
出力:$3.6/M
GPT-5.4 mini は、GPT-5.4 の強みを、高スループットのワークロード向けに設計された、より高速で効率的なモデルにもたらします。
A

Claude Mythos Preview

A

Claude Mythos Preview

近日公開
入力:$60/M
出力:$240/M
Claude Mythos Preview は、当社のこれまでで最も高性能なフロンティアモデルであり、 従来のフロンティアモデルである Claude Opus 4.6 と比べ、多くの評価ベンチマークでスコアが顕著に向上していることを示しています。
X

mimo-v2-pro

入力:$0.8/M
出力:$2.4/M
MiMo-V2-Pro は Xiaomi のフラッグシップ基盤モデルで、総パラメータ数は 1T 超、コンテキスト長は 1M で、エージェント志向のシナリオ向けに徹底的に最適化されています。OpenClaw のような汎用エージェントフレームワークに高い適応性を備えており、標準的な PinchBench および ClawBench ベンチマークで世界トップクラスに位置し、体感パフォーマンスは Opus 4.6 に迫ります。MiMo-V2-Pro はエージェントシステムの頭脳として、複雑なワークフローをオーケストレーションし、本番環境のエンジニアリングタスクを推進し、確実に成果を提供するよう設計されています。

関連ブログ

Free Gemini 2.5 Pro API は壊れていますか? 2025年の無料枠の変更
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

Free Gemini 2.5 Pro API は壊れていますか? 2025年の無料枠の変更

GoogleはGemini APIの無料枠を大幅に引き締めました。Gemini 2.5 Proは無料枠から削除され、Gemini 2.5 Flashの1日あたりの無料リクエスト数は劇的に削減されました(報告: ~250 → ~20/day)。これは、実験用途においてモデルが恒久的に“dead”になったことを意味するわけではありませんが、多くの現実世界のユースケースに対する無料アクセスが事実上大幅に縮小されたことは意味します。