Home/Models/Google/Gemini 3 Flash
G

Gemini 3 Flash

入力:$0.4/M
出力:$2.4/M
文脈:1,048,576
最大出力:65.5k
Gemini 3 Flash は、Google による軽量で効率的な多モーダル大規模モデルで、迅速な応答と低遅延を必要とする実世界のシナリオに特化しています。
新着
商用利用
Playground
概要
機能
料金プラン
API
バージョン

Gemini 3 Flash とは

「Gemini 3 Flash」は Gemini-3 ファミリーの Flash/fast メンバーであり、高スループット、リアルタイム、スケールに敏感なアプリケーション向けに設計された、より軽量・低レイテンシでコスト効率に優れた Google の Gemini-3 モデルのバリアントです。CometAPI の API 経由で(他の Gemini モデルと同じ API サーフェス)低レイテンシかつコスト最適化された Gemini 3 スタイルのモデルを呼び出せる、Gemini API モデルファミリーの一種です。マルチモーダル入力と構造化出力ツールは同等に提供しつつ、推論速度とスループットを優先します。

主な機能 :

  • 低レイテンシ/高スループット:高速応答とコスト効率に最適化(Flash の設計ポイント)。
  • マルチモーダル入力対応:多数の Flash バリアントでテキスト、画像、動画スニペット、音声に対応(各バリアントの対応入力タイプは API モデル項目で確認可能)。
  • 関数呼び出しと構造化出力:ツールやエージェント統合のための JSON/構造化出力の強制。
  • エージェント/ツール連携:Gemini エコシステムにおける Google Search grounding、関数/ツール呼び出し、エージェントフレームワークと統合。

Gemini 3 Flash と他モデルの比較

  • Gemini-3 Pro(同ファミリー)との比較:Flash = 速度/コスト最適化、Pro = より高い推論力・マルチモーダル忠実度・Deep Think。リアルタイム UI には Flash、精度重視のタスクには Pro を選択。
  • 旧世代の Gemini(2.5 Flash)との比較:Gemini-3 ファミリーは推論力とマルチモーダル性能が向上。Flash の設計ポイントは引き続き価格/性能比を重視。現在 2.5 Flash を使用している場合、Gemini-3 Fast/Flash は同等のレイテンシ/コストでより高い品質を提供することを目指しています。

実運用でのユースケース(Flash が得意な領域)

  • リアルタイムのチャットボット/音声エージェント:会話 UI やストリーミング音声アプリに低レイテンシ。
  • カスタマーサポート/大量要約:大規模な長文トランスクリプトをコスト効率よく要約。
  • 応答時間が重要なエッジ/組み込み推論:厳しい SLA には flash/lite 系バリアントを活用。
  • 大量ドキュメントの解析/取り込みパイプライン:インデックス作成や前処理は Flash、高価値の抽出/分析は Pro にエスカレーション。
  • リアルタイムのコードアシスタント/IDE プラグイン:低コストで高速なコード補完(複雑なリファクタは Pro で検証)。

Gemini 3 Flash API の利用方法

ステップ 1: API キーの取得

cometapi.com にログインします。まだユーザーでない場合は、まず登録してください。 CometAPI console にサインインします。インターフェースのアクセス認証 API キーを取得します。パーソナルセンターの API トークンで "Add Token" をクリックし、トークンキー: sk-xxxxx を取得して送信します。

ステップ 2: Gemini 3 Flash API にリクエストを送る

“gemini-3-flash” エンドポイントを選択して API リクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは当社サイトの API ドキュメントから取得できます。当社サイトでは利便性のため Apifox テストも提供しています。<YOUR_API_KEY> をアカウントの実際の CometAPI キーに置き換えてください。ベース URL は Gemini Generating Content と Chat です。

質問やリクエストを content フィールドに挿入します—モデルはその内容に応答します。API レスポンスを処理して生成された回答を取得します。

ステップ 3: 結果の取得と検証

API レスポンスを処理して生成された回答を取得します。処理後、API はタスクのステータスと出力データを返します。

関連情報 Gemini 3 Pro Preview API

よくある質問

How does Gemini 3 Flash deliver Pro-level intelligence at Flash pricing?

Gemini 3 Flash is Google's most balanced model, offering frontier-level reasoning capabilities at $0.50/$3 per million tokens—approximately 4x cheaper than Gemini 3 Pro while maintaining comparable intelligence for most tasks.

What thinking levels does Gemini 3 Flash support?

Gemini 3 Flash supports four thinking levels: minimal (near-zero latency), low, medium, and high—giving developers granular control over the reasoning depth vs. speed tradeoff that Gemini 3 Pro doesn't offer.

Does Gemini 3 Flash have a free tier in the API?

Yes, Gemini 3 Flash (gemini-3-flash-preview) has a free tier in the Gemini API, unlike Gemini 3 Pro which currently requires paid usage for API access.

What are Thought Signatures and why are they required for Gemini 3 Flash?

Thought Signatures are encrypted representations of the model's internal reasoning that must be circulated back in multi-turn conversations—required even at minimal thinking level for Gemini 3 Flash to maintain reasoning context and enable function calling.

Can Gemini 3 Flash combine structured outputs with Google Search grounding?

Yes, Gemini 3 Flash uniquely supports combining structured outputs (JSON schema) with built-in tools like Google Search, URL Context, and Code Execution in the same request—enabling grounded, type-safe responses.

How does media_resolution affect Gemini 3 Flash performance?

The media_resolution parameter controls token usage per image/video frame: low (280 tokens), medium (560), high (1120), or ultra_high for images. For video, low and medium are both capped at 70 tokens per frame to optimize context usage.

What tools does Gemini 3 Flash support?

Gemini 3 Flash supports Google Search, File Search, Code Execution, URL Context, and standard function calling. However, Google Maps grounding and Computer Use are not yet supported in Gemini 3 models.

Gemini 3 Flashの機能

Gemini 3 Flashのパフォーマンスと使いやすさを向上させるために設計された主要機能をご紹介します。これらの機能がプロジェクトにどのようなメリットをもたらし、ユーザーエクスペリエンスを改善するかをご確認ください。

Gemini 3 Flashの料金

Gemini 3 Flashの競争力のある価格設定をご確認ください。さまざまな予算や利用ニーズに対応できるよう設計されています。柔軟なプランにより、使用した分だけお支払いいただけるため、要件の拡大に合わせて簡単にスケールアップできます。Gemini 3 Flashがコストを管理しながら、お客様のプロジェクトをどのように強化できるかをご覧ください。

Correction: gemini-3-flash variants (same price across variants)

Model familyVariant (model name)Input price (USD / 1M tokens)Output price (USD / 1M tokens)
gemini-3-flashgemini-3-flash$0.40$2.40
gemini-3-flashgemini-3-flash-preview$0.40$2.40
gemini-3-flashgemini-3-flash-all$0.40$2.40
gemini-3-flashgemini-3-flash-thinking$0.40$2.40
gemini-3-flashgemini-3-flash-preview-thinking$0.40$2.40

Gemini 3 FlashのサンプルコードとAPI

Gemini 3 Flash は、CometAPI のホステッド API を通じて公開される(ベンダーの推論レイヤーでもミラー提供される)、テキスト専用の大規模言語モデル(LLM)です。API は標準的なチャット/補完パターン、ストリーミング応答、関数/ツールの呼び出し、構造化 JSON 出力、およびエージェント型ワークフロー向けに設計された複数の“thinking”モード(インターリーブ/保持/ターンレベル思考)をサポートします。
Python
JavaScript
Curl
from google import genai
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com"

client = genai.Client(
    http_options={"api_version": "v1beta", "base_url": BASE_URL},
    api_key=COMETAPI_KEY,
)

response = client.models.generate_content(
    model="gemini-3-flash",
    contents="Explain how AI works in a few words",
)

print(response.text)

Gemini 3 Flashのバージョン

Gemini 3 Flashに複数のスナップショットが存在する理由としては、アップデート後の出力変動により旧版スナップショットの一貫性維持が必要な場合、開発者に適応・移行期間を提供するため、グローバル/リージョナルエンドポイントに対応する異なるスナップショットによるユーザー体験最適化などが考えられます。各バージョンの詳細な差異については、公式ドキュメントをご参照ください。
モデルID説明提供状況リクエスト
gemini-3-flash-all使用技術は非公式で、生成は不安定ですが、Direct Internet などに対応し、Chat 形式です✅Chat 形式
gemini-3-flash自動的に最新のモデルを指します✅Gemini コンテンツ生成
gemini-3-flash-preview公式プレビュー✅Gemini コンテンツ生成

その他のモデル