モデル料金エンタープライズ
500以上のAI Model API、オールインワンAPI。CometAPIで。
モデルAPI
開発者
クイックスタートドキュメントAPI ダッシュボード
会社
会社概要エンタープライズ
リソース
AIモデルブログ変更履歴サポート
利用規約プライバシーポリシー
© 2026 CometAPI · All rights reserved
Home/Models/Google/Gemini 2.5 Flash
G

Gemini 2.5 Flash

入力:$0.24/M
出力:$2/M
文脈:1M
最大出力:65K
Gemini 2.5 Flash は Google が開発した AI モデルで、特に強化された推論機能を必要とするアプリケーション向けに、開発者に高速かつコスト効率の高いソリューションを提供するよう設計されています。Gemini 2.5 Flash のプレビュー発表によれば、このモデルは 2025年4月17日にプレビューとしてリリースされ、マルチモーダル入力をサポートし、コンテキストウィンドウは100万トークンです。このモデルは最大コンテキスト長として65,536トークンをサポートします。
新着
商用利用
Playground
概要
機能
料金プラン
API
バージョン

Gemini 2.5 Flash は、出力品質を損なうことなく迅速に応答するよう設計されています。テキスト、画像、音声、動画を含むマルチモーダル入力に対応しており、幅広い用途に適しています。Google AI Studio や Vertex AI などのプラットフォームを通じて利用可能で、開発者がさまざまなシステムへシームレスに統合するためのツールを提供します。


基本情報(機能)

Gemini 2.5 Flash は、Gemini 2.5 ファミリーの中で際立たせるいくつかの注目すべき機能を導入しています:

  • ハイブリッド推論: 出力前の内部推論にモデルがどれだけのトークンを割り当てるかを細かく制御するために、開発者は thinking_budget パラメータを設定できます。
  • パレート・フロンティア: 最適なコスト・パフォーマンス点に位置づけられ、Flash は 2.5 モデルの中で最高の価格対知能比を提供します。
  • マルチモーダル対応: テキスト、画像、動画、音声をネイティブに処理し、より豊かな対話と分析を可能にします。
  • 100万トークンのコンテキスト: 比類ないコンテキスト長により、単一リクエストでの深い分析と長文ドキュメントの理解が可能です。

モデルのバージョニング

Gemini 2.5 Flash は、以下の主要なバージョンを経て移行してきました:

  • gemini-2.5-flash-lite-preview-09-2025: ツールの使いやすさを向上: 複雑な多段タスクでの性能が向上し、SWE-Bench Verified スコアが 5% 改善(48.9% から 54%)。効率性の向上: 推論を有効化した場合、より少ないトークンで高品質な出力を達成し、レイテンシとコストを削減。
  • Preview 04-17: “thinking” 機能を備えた早期アクセス版。gemini-2.5-flash-preview-04-17 経由で利用可能。
  • Stable General Availability (GA): 2025 年 6 月 17 日時点で、安定版エンドポイント gemini-2.5-flash がプレビューを置き換え、5 月 20 日のプレビューから API の変更なしに本番レベルの信頼性を確保。
  • Deprecation of Preview: プレビューのエンドポイントは 2025 年 7 月 15 日にシャットダウン予定で、この日までに GA エンドポイントへ移行する必要があります。

2025 年 7 月時点で、Gemini 2.5 Flash は一般公開かつ安定版です(gemini-2.5-flash-preview-05-20 からの変更はありません)。gemini-2.5-flash-preview-04-17 を使用している場合、モデルのエンドポイントは 2025 年 7 月 15 日に廃止予定で、その日まで既存のプレビュー料金が適用され、当日シャットダウンされます。一般提供のモデル gemini-2.5-flash へ移行できます。

より高速、低コスト、スマートに:

  • 設計目標: 低レイテンシ + 高スループット + 低コスト;
  • 推論、マルチモーダル処理、長文タスクにおける全体的な高速化;
  • トークン使用量を 20–30% 削減し、推論コストを大幅に低減。

技術仕様

入力コンテキストウィンドウ: 最大 100 万トークンで、広範なコンテキスト保持が可能。

出力トークン: 応答あたり最大 8,192 トークンを生成可能。

対応モダリティ: テキスト、画像、音声、動画。

統合プラットフォーム: Google AI Studio と Vertex AI を通じて利用可能。

価格: 競争力のあるトークンベースの料金体系で、コスト効率の高い導入を支援。


技術詳細

内部的には、Gemini 2.5 Flash は Web、コード、画像、動画データの混合で訓練されたtransformer-based 大規模言語モデルです。主要な技術仕様には次が含まれます:

マルチモーダル学習: 複数のモダリティを整合させるように訓練されており、Flash はテキストと画像、動画、音声をシームレスに組み合わせ、動画の要約や音声キャプション作成などに有用。

動的な思考プロセス: 最終出力の前に、モデルが計画し、複雑なプロンプトを分解する内部推論ループを実装。

調整可能な思考バジェット: thinking_budget は 0(推論なし)から 24,576 tokens まで設定でき、レイテンシと回答品質のトレードオフが可能。

ツール統合: Grounding with Google Search、Code Execution、URL Context、Function Calling をサポートし、自然言語プロンプトから現実世界のアクションを直接実行可能。


ベンチマーク性能

厳密な評価において、Gemini 2.5 Flash は業界最先端の性能を示します:

  • LMArena Hard Prompts: 困難な Hard Prompts ベンチマークで、2.5 Pro に次ぐ第 2 位のスコアを記録し、強力な多段推論能力を示しました。
  • MMLU スコア 0.809: 0.809 の MMLU 精度で平均的なモデル性能を上回り、広範なドメイン知識と推論力を反映。
  • レイテンシとスループット: 271.4 tokens/sec のデコード速度と 0.29 s Time-to-First-Token を達成し、レイテンシに敏感なワークロードに最適。
  • 価格対性能のリーダー: \$0.26/1 M tokens で、主要なベンチマークで同等またはそれ以上の結果を示しつつ、多くの競合よりも低価格。

これらの結果は、推論、科学的理解、数学的問題解決、コーディング、視覚的解釈、多言語能力における Gemini 2.5 Flash の競争力を示しています:


制限事項

強力である一方で、Gemini 2.5 Flash にはいくつかの制限があります:

  • 安全性リスク: 特にエッジケースのクエリにおいて、モデルが**“preachy” な口調**を示したり、もっともらしく聞こえるが誤っていたり偏っている出力(幻覚)を生成する可能性があります。厳格な人による監督が依然として不可欠です。
  • レート制限: API の使用はレート制限(デフォルト階層で 10 RPM、250,000 TPM、250 RPD)により制約され、バッチ処理や大規模アプリケーションに影響する可能性があります。
  • 知能の下限: flash モデルとして非常に高性能ではあるものの、高度なコーディングやマルチエージェント協調といった最も要求の高いエージェント的タスクでは 2.5 Pro より正確性が劣ります。
  • コストのトレードオフ: price-performance に優れる一方で、thinking モードを多用すると全体のトークン消費が増加し、深い推論を要するプロンプトではコストが上昇します。

Gemini 2.5 Flashの機能

Gemini 2.5 Flashのパフォーマンスと使いやすさを向上させるために設計された主要機能をご紹介します。これらの機能がプロジェクトにどのようなメリットをもたらし、ユーザーエクスペリエンスを改善するかをご確認ください。

Gemini 2.5 Flashの料金

Gemini 2.5 Flashの競争力のある価格設定をご確認ください。さまざまな予算や利用ニーズに対応できるよう設計されています。柔軟なプランにより、使用した分だけお支払いいただけるため、要件の拡大に合わせて簡単にスケールアップできます。Gemini 2.5 Flashがコストを管理しながら、お客様のプロジェクトをどのように強化できるかをご覧ください。

gemini-2.5-flash (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-2.5-flashgemini-2.5-flash-thinking$0.24$2.00
gemini-2.5-flashgemini-2.5-flash-all$0.24$2.00
gemini-2.5-flashgemini-2.5-flash$0.24$2.00

Gemini 2.5 FlashのサンプルコードとAPI

Gemini 2.5 Flash API は、Google の最新のマルチモーダルAIモデルであり、高速かつコスト効率の高いタスク向けに設計され、推論機能を制御可能で、開発者は Gemini API 経由で高度な「思考」機能のオン/オフを切り替えることができます。
POST
/v1beta/models/{model}:{operator}
POST
/v1/chat/completions
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

Python Code Example

from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="Tell me a three sentence bedtime story about a unicorn.",
)

print(response.text)

JavaScript Code Example

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1beta";
const model = "gemini-2.5-flash";
const operator = "generateContent";

async function main() {
  const response = await fetch(`${base_url}/models/${model}:${operator}`, {
    method: "POST",
    headers: {
      "Content-Type": "application/json",
      Authorization: api_key,
    },
    body: JSON.stringify({
      contents: [
        {
          parts: [
            { text: "Tell me a three sentence bedtime story about a unicorn." },
          ],
        },
      ],
    }),
  });

  const data = await response.json();
  console.log(data.candidates[0].content.parts[0].text);
}

await main();

Curl Code Example

curl "https://api.cometapi.com/v1beta/models/gemini-2.5-flash:generateContent" \
  -H "Authorization: $COMETAPI_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [
      {
        "parts": [
          {
            "text": "Tell me a three sentence bedtime story about a unicorn."
          }
        ]
      }
    ]
  }'

Gemini 2.5 Flashのバージョン

Gemini 2.5 Flashに複数のスナップショットが存在する理由としては、アップデート後の出力変動により旧版スナップショットの一貫性維持が必要な場合、開発者に適応・移行期間を提供するため、グローバル/リージョナルエンドポイントに対応する異なるスナップショットによるユーザー体験最適化などが考えられます。各バージョンの詳細な差異については、公式ドキュメントをご参照ください。
version
gemini-2.5-flash-lite-thinking
gemini-2.5-flash
gemini-2.5-flash-image
gemini-2.5-flash-lite-preview-06-17
gemini-2.5-flash-thinking
gemini-2.5-flash-all
gemini-2.5-flash-deepsearch
gemini-2.5-flash-lite-preview-06-17-thinking
gemini-2.5-flash-lite
gemini-2.5-flash-lite-preview-09-2025
gemini-2.5-flash-image-preview
gemini-2.5-flash-preview-04-17
gemini-2.5-flash-preview-05-20
gemini-2.5-flash-preview-09-2025

その他のモデル

C

Claude Opus 4.7

入力:$3/M
出力:$15/M
エージェントやコーディング向けの最も高知能なモデル
A

Claude Sonnet 4.6

入力:$2.4/M
出力:$12/M
Claude Sonnet 4.6 は、これまでで最も高性能な Sonnet モデルです。コーディング、コンピューターの利用、長文脈推論、エージェントの計画立案、ナレッジワーク、デザインにわたってモデルのスキルを全面的にアップグレードしました。Sonnet 4.6 は、ベータ版で 1M トークンのコンテキストウィンドウも備えています。
O

GPT 5.5 Pro

入力:$24/M
出力:$144/M
極めて複雑なロジックと専門的要件に対応するよう設計された先進的なモデルであり、深い推論と精緻な分析能力において最高水準を体現します。
O

GPT 5.5

入力:$4/M
出力:$24/M
卓越した性能と効率的な応答を両立し、包括的で安定した汎用AIサービスの提供に特化した、次世代マルチモーダル・フラッグシップモデル。
O

GPT Image 2 ALL

リクエストごと:$0.04
GPT Image 2 は、高速かつ高品質な画像生成および編集のための、openai の最先端の画像生成モデルです。柔軟な画像サイズと高忠実度の画像入力に対応しています。
O

GPT 5.5 ALL

入力:$4/M
出力:$24/M
GPT-5.5は、コーディング、オンラインリサーチ、データ分析、ツール横断での操作に優れています。本モデルは、複雑なマルチステップタスクの処理における自律性を高めただけでなく、先行モデルと同等のレイテンシを維持しつつ、推論能力と実行効率も大幅に向上させており、AIによるオフィスオートメーションの実現に向けた重要な一歩となります。

関連ブログ

Nano Banana 2 Flash まもなく登場 – AI画像生成の高速進化
Jan 6, 2026
nano-banana-2

Nano Banana 2 Flash まもなく登場 – AI画像生成の高速進化

Google は、広く高い評価を受けている「Nano Banana」画像生成ファミリーの最新作 Nano Banana 2 Flash の近日登場により、生成AIの情勢を再び揺さぶっている。昨年末に Nano Banana Pro (Gemini 3 Pro Image) が大成功を収めたのに続き、この新たなイテレーションは、Gemini 3 アーキテクチャの最先端の知能と前例のない速度と効率を組み合わせることで、プロフェッショナル級のビジュアル合成の民主化を約束する。
Nano Bananaの割引: 2026年、開発者向けの真のコスト削減策
Dec 25, 2025
nano-banana-pro

Nano Bananaの割引: 2026年、開発者向けの真のコスト削減策

結論:公式の Nano Banana API は、クリスマス、新年、その他の祝日に関する割引を一切提供していません。 これは、2026年に画像生成、コンテンツ制作、または製品統合のために Nano Banana(Nano Banana Pro を含む)を利用する予定のすべての開発者が理解しておくべき事実です。Google は、クリスマス、ブラックフライデー、あるいは新年であっても、Nano Banana API に対する季節的な割引を提供していません。公式 API の料金体系は一貫して安定しており透明性が高く、割引の余地はほとんどありません。 では、質問です:あなたが開発者で、クリスマスや新年の期間に大規模な画像生成、モデルテスト、または製品の反復を行う予定がある場合、Nano Banana の利用コストを削減する方法はありますか?
Free Gemini 2.5 Pro API は壊れていますか? 2025年の無料枠の変更
Dec 11, 2025
gemini-2-5-pro
gemini-2-5-flash

Free Gemini 2.5 Pro API は壊れていますか? 2025年の無料枠の変更

GoogleはGemini APIの無料枠を大幅に引き締めました。Gemini 2.5 Proは無料枠から削除され、Gemini 2.5 Flashの1日あたりの無料リクエスト数は劇的に削減されました(報告: ~250 → ~20/day)。これは、実験用途においてモデルが恒久的に“dead”になったことを意味するわけではありませんが、多くの現実世界のユースケースに対する無料アクセスが事実上大幅に縮小されたことは意味します。
ナノバナナの究極ガイド:使い方と最適な方法
Sep 8, 2025
gemini-2-5-flash-image

ナノバナナの究極ガイド:使い方と最適な方法

Googleが最近リリースしたGemini 2.5 Flash Image(「ナノバナナ」の愛称)は、会話型画像編集の定番となり、肖像画を美しく保ちます。
API経由でNano Bananaを使用する方法(Gemini-2-5-flash-image)
Aug 28, 2025
gemini-2-5-flash-image

API経由でNano Bananaを使用する方法(Gemini-2-5-flash-image)

Nano Banana は、Google の Gemini 2.5 Flash Image のコミュニティ内でのニックネーム(および社内略称)です。これは、高品質で低遅延のマルチモーダル画像生成技術です。