当学校区の Gemini 2.5 Flash-Lite API これは、Googleのハイブリッド推論モデルファミリーの最新製品であり、 比類のないコスト効率 および 超低レイテンシー 大容量でレイテンシに敏感なアプリケーション向け。
基本情報と機能
17年2025月2.5日にプレビューリリースで発表されたFlash-Liteは、FlashとProとともにGemini XNUMXのラインナップに加わり、開発者に最適化したオプションを提供します。 スピード, 価格性能比, 適応的思考 機能。
コード内で「gemini-2.5-flash-lite」を指定することで、Gemini 2.5 Flash-Lite を使い始めることができます。プレビュー版をご利用の場合は、プレビュー版と同じ「gemini-2.5-flash-lite」に切り替えることができます。Google は、Flash-Lite のプレビューエイリアスを 25 月 XNUMX 日に削除する予定です。
| 安定性 | モデル | 日付 |
| 安定版(GA) | gemini-2.5-flash-lite | 22年2025月XNUMX日 |
| 実験的なプレビュー | gemini-2.5-flash-lite-06-17 | 利用可能期間: 17年25月2025日~XNUMX月XNUMX日 |
| 最新バージョン | gemini-2.5-flash-lite-preview-09-2025 | 09-2025 |
- 思考コントロール: 実装 ダイナミック思考予算 APIパラメータ経由で、考えながら デフォルトでは無効 速度を最大化し、コストを削減します。
- 低レイテンシ: のために設計 最初のトークンまでの時間が短いFlash-Lite は起動のオーバーヘッドを最小限に抑え、標準の Google Cloud インフラストラクチャで 100 ミリ秒未満のレイテンシを実現します。
- ハイスループット: 強力なデコードパイプラインにより、 毎秒数百トークンチャットボットやストリーミング アプリケーションでリアルタイムのユーザー エクスペリエンスを実現します。
- マルチモーダルサポート: Flash-Liteは主にテキスト用に最適化されていますが、 画像, オーディオ, ビデオ Gemini API を介して入力することで、ドキュメントの要約から軽い視覚タスクまで、多様なユースケースが可能になります。
技術的詳細
- 適応推論:
Gemini 2.5 Flash-Liteオンデマンドをサポート 思考これにより、開発者はより深い推論が必要な場合にのみコンピューティング リソースを割り当てることができます。 - ツールの統合: Gemini 2.5のネイティブツールとの完全な互換性。 Google検索でグラウンディング, コード実行, URLコンテキスト, 関数呼び出し シームレスなマルチモーダルワークフローを実現します。
- モデルコンテキストプロトコル (MCP): GoogleのMCPを活用してリアルタイムのウェブデータを取得し、レスポンスが 最新 および 文脈的に関連性のある.
- 展開オプション: から入手可能 コメットAPI, ジェミニ API, 頂点AI, Google AIスタジオ早期導入者が実験し、フィードバックを提供できるプレビュー トラックも用意されています。
ベンチマークパフォーマンス Gemini 2.5 Flash-Lite
- レイテンシ:最大 平均応答時間が50%短縮 ジェミニ2.5フラッシュと比較して、典型的な 100ミリ秒未満 標準的な分類および要約ベンチマークにおける遅延。
- スループット: 最適化 大音量 パフォーマンスを低下させることなく、1 分あたり数万件のリクエストを維持できるワークロードを実現します。
- 価格性能比: 実証する 25トークンあたりのコストが1,000%削減 Flash版と比較して、 パレート最適 コスト重視の導入に最適です。
- 業界での採用: 初期のユーザーからは、生産パイプラインへのシームレスな統合が報告されており、パフォーマンス メトリックは当初の予測と一致しているか、それを上回っています。

理想的な使用例
- 高頻度、低複雑性のタスク: 自動タグ付け、感情分析、一括翻訳
- コスト重視のパイプライン: 大規模文書コーパスからのデータ抽出、定期的なバッチ要約
- エッジとモバイルのシナリオ: レイテンシが重要だがリソース予算が限られている場合
の制限 Gemini 2.5 Flash-Lite
- プレビューステータス: GA 前に API が変更される可能性があります。統合ではバージョンの増加を考慮する必要があります。
- オンザフライでの微調整は不要: カスタムの重みをアップロードできません。プロンプトのエンジニアリング メッセージとシステム メッセージに依存します。
- 創造性の低下: 決定論的、高スループットのタスク向けに調整されています。オープンエンドの生成や「創造的な」書き込みにはあまり適していません。
- リソース上限: 約 16 個の vCPU までのみ線形に拡張され、これを超えるとスループットの向上は減少します。
- マルチモーダル制約: 画像/音声入力をサポートしますが、忠実度が制限されるため、大量の画像や音声の転写タスクには適していません。
- コンテキストとウィンドウのトレードオフ : 最大 1 万トークンを受け入れますが、その規模での実際の推論ではスループットが低下する可能性があります。
電話方法 Gemini 2.5 Flash-Lite CometAPI からの API
ジェミニ 2.5 フラッシュライト CometAPI の API 価格、公式価格より 20% オフ:
- 入力トークン: $0.08/Mトークン
- 出力トークン: $0.32/Mトークン
必要な手順
- ログインする コムタピまだユーザーでない場合は、まず登録してください
- インターフェースのアクセス認証情報APIキーを取得します。パーソナルセンターのAPIトークンで「トークンを追加」をクリックし、トークンキー(sk-xxxxx)を取得して送信します。
- このサイトの URL を取得します: https://api.cometapi.com/
使用方法
- "を選択します。
gemini-2.5-flash-lite” エンドポイントを使用してAPIリクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは、弊社ウェブサイトのAPIドキュメントから取得できます。また、お客様の便宜を図るため、弊社ウェブサイトではApifoxテストも提供しています。 - 交換するアカウントの実際の CometAPI キーを使用します。
- コンテンツ フィールドに質問またはリクエストを入力します。モデルはこれに応答します。
- API 応答を処理して、生成された回答を取得します。
CometAPIは、シームレスな移行のために完全に互換性のあるREST APIを提供します。 APIドキュメント:
- ベースURL: https://api.cometapi.com/v1/chat/completions
- モデル名: 「
gemini-2.5-flash-lite「 - 認証:
Bearer YOUR_CometAPI_API_KEYヘッダ
も参照してください ジェミニ 2.5 プロ
