Gemini 2.5 Flash-Lite API

CometAPI
AnnaJun 26, 2025
Gemini 2.5 Flash-Lite API

当学校区の Gemini 2.5 Flash-Lite API これは、Googleのハイブリッド推論モデルファミリーの最新製品であり、 比類のないコスト効率 および 超低レイテンシー 大容量でレイテンシに敏感なアプリケーション向け。


基本情報と機能

17年2025月2.5日にプレビューリリースで発表されたFlash-Liteは、FlashとProとともにGemini XNUMXのラインナップに加わり、開発者に最適化したオプションを提供します。 スピード, 価格性能比, 適応的思考 機能。

コード内で「gemini-2.5-flash-lite」を指定することで、Gemini 2.5 Flash-Lite を使い始めることができます。プレビュー版をご利用の場合は、プレビュー版と同じ「gemini-2.5-flash-lite」に切り替えることができます。Google は、Flash-Lite のプレビューエイリアスを 25 月 XNUMX 日に削除する予定です。

安定性モデル日付
安定版(GA)gemini-2.5-flash-lite22年2025月XNUMX日
実験的なプレビューgemini-2.5-flash-lite-06-17利用可能期間: 17年25月2025日~XNUMX月XNUMX日
最新バージョンgemini-2.5-flash-lite-preview-09-202509-2025
  • 思考コントロール: 実装 ダイナミック思考予算 APIパラメータ経由で、考えながら デフォルトでは無効 速度を最大化し、コストを削減します。
  • 低レイテンシ: のために設計 最初のトークンまでの時間が短いFlash-Lite は起動のオーバーヘッドを最小限に抑え、標準の Google Cloud インフラストラクチャで 100 ミリ秒未満のレイテンシを実現します。
  • ハイスループット: 強力なデコードパイプラインにより、 毎秒数百トークンチャットボットやストリーミング アプリケーションでリアルタイムのユーザー エクスペリエンスを実現します。
  • マルチモーダルサポート: Flash-Liteは主にテキスト用に最適化されていますが、 画像, オーディオ, ビデオ Gemini API を介して入力することで、ドキュメントの要約から軽い視覚タスクまで、多様なユースケースが可能になります。

技術的詳細

  • 適応推論: Gemini 2.5 Flash-Lite オンデマンドをサポート 思考これにより、開発者はより深い推論が必要な場合にのみコンピューティング リソースを割り当てることができます。
  • ツールの統合: Gemini 2.5のネイティブツールとの完全な互換性。 Google検索でグラウンディング, コード実行, URLコンテキスト, 関数呼び出し シームレスなマルチモーダルワークフローを実現します。
  • モデルコンテキストプロトコル (MCP): GoogleのMCPを活用してリアルタイムのウェブデータを取得し、レスポンスが 最新 および 文脈的に関連性のある.
  • 展開オプション: から入手可能 コメットAPI, ジェミニ API, 頂点AI, Google AIスタジオ早期導入者が実験し、フィードバックを提供できるプレビュー トラックも用意されています。

ベンチマークパフォーマンス Gemini 2.5 Flash-Lite

  • レイテンシ:最大 平均応答時間が50%短縮 ジェミニ2.5フラッシュと比較して、典型的な 100ミリ秒未満 標準的な分類および要約ベンチマークにおける遅延。
  • スループット: 最適化 大音量 パフォーマンスを低下させることなく、1 分あたり数万件のリクエストを維持できるワークロードを実現します。
  • 価格性能比: 実証する 25トークンあたりのコストが1,000%削減 Flash版と比較して、 パレート最適 コスト重視の導入に最適です。
  • 業界での採用: 初期のユーザーからは、生産パイプラインへのシームレスな統合が報告されており、パフォーマンス メトリックは当初の予測と一致しているか、それを上回っています。

Gemini 2.5 Flash-Lite API


理想的な使用例

  • 高頻度、低複雑性のタスク: 自動タグ付け、感情分析、一括翻訳
  • コスト重視のパイプライン: 大規模文書コーパスからのデータ抽出、定期的なバッチ要約
  • エッジとモバイルのシナリオ: レイテンシが重要だがリソース予算が限られている場合

の制限 Gemini 2.5 Flash-Lite

  • プレビューステータス: GA 前に API が変更される可能性があります。統合ではバージョンの増加を考慮する必要があります。
  • オンザフライでの微調整は不要: カスタムの重みをアップロードできません。プロンプトのエンジニアリング メッセージとシステム メッセージに依存します。
  • 創造性の低下: 決定論的、高スループットのタスク向けに調整されています。オープンエンドの生成や「創造的な」書き込みにはあまり適していません。
  • リソース上限: 約 16 個の vCPU までのみ線形に拡張され、これを超えるとスループットの向上は減少します。
  • マルチモーダル制約: 画像/音声入力をサポートしますが、忠実度が制限されるため、大量の画像や音声の転写タスクには適していません。
  • コンテキストとウィンドウのトレードオフ : 最大 1 万トークンを受け入れますが、その規模での実際の推論ではスループットが低下する可能性があります。

電話方法 Gemini 2.5 Flash-Lite CometAPI からの API

ジェミニ 2.5 フラッシュライト CometAPI の API 価格、公式価格より 20% オフ:

  • 入力トークン: $0.08/Mトークン
  • 出力トークン: $0.32/Mトークン

必要な手順

  • ログインする コムタピまだユーザーでない場合は、まず登録してください
  • インターフェースのアクセス認証情報APIキーを取得します。パーソナルセンターのAPIトークンで「トークンを追加」をクリックし、トークンキー(sk-xxxxx)を取得して送信します。
  • このサイトの URL を取得します: https://api.cometapi.com/

使用方法

  1. "を選択します。gemini-2.5-flash-lite” エンドポイントを使用してAPIリクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは、弊社ウェブサイトのAPIドキュメントから取得できます。また、お客様の便宜を図るため、弊社ウェブサイトではApifoxテストも提供しています。
  2. 交換するアカウントの実際の CometAPI キーを使用します。
  3. コンテンツ フィールドに質問またはリクエストを入力します。モデルはこれに応答します。
  4. API 応答を処理して、生成された回答を取得します。

CometAPIは、シームレスな移行のために完全に互換性のあるREST APIを提供します。 APIドキュメント:

も参照してください ジェミニ 2.5 プロ

もっと読む

1つのAPIで500以上のモデル

最大20%オフ