モデルサポートエンタープライズブログ
500以上のAI Model API、オールインワンAPI。CometAPIで。
モデルAPI
開発者
クイックスタートドキュメントAPI ダッシュボード
リソース
AIモデルブログエンタープライズ変更履歴概要
2025 CometAPI. 全著作権所有。プライバシーポリシー利用規約
Home/Models/OpenAI/GPT-5 mini
O

GPT-5 mini

入力:$0.2/M
出力:$1.6/M
文脈:400K
最大出力:128K
GPT-5 mini は、OpenAI の GPT-5 ファミリーに属する、コストとレイテンシを最適化したモデルであり、大規模な本番運用において、GPT-5 のマルチモーダル能力と指示追従の強みの多くを大幅に低いコストで提供することを目的としています。スループット、予測可能なトークン単価、そして高速な応答が主な制約となる環境を対象としつつ、強力な汎用能力も備えています。
新着
商用利用
Playground
概要
機能
料金プラン
API

基本情報と主な特長

GPT-5 mini は、OpenAI の コストとレイテンシに最適化された GPT-5 ファミリーのメンバーで、大幅に低コストで大規模な本番運用において GPT-5 のマルチモーダル性と指示追従の強みの多くを提供します。スループット、トークン単価の予測可能性、高速応答が主要制約となる環境をターゲットにしつつ、汎用性の高い能力を備えています。

  • モデル名: gpt-5-mini
  • コンテキストウィンドウ: 400 000 トークン
  • 最大出力トークン数: 128 000
  • 主な特長: 速度、スループット、コスト効率、簡潔なプロンプトに対する決定論的な出力

gpt-5-miniはどのように動作しますか?

最適化された推論パスとデプロイ。 実用的な高速化は、カーネル融合、より小さなグラフに調整されたテンソル並列、そして開発者がより深い推論を要求しない限り、より短い内部の「思考」ループを優先する推論ランタイムによって実現されます。これにより、呼び出しあたりの計算量が目に見えて減り、高トラフィックでもレイテンシが予測可能になります。このトレードオフは意図的なものです: フォワードパスあたりの計算量を低減 → コスト低下と平均レイテンシ低下。

開発者向けコントロール。 GPT-5 mini は、verbosity(詳細度/長さの制御)や**reasoning_effort(速度と深さのトレードオフ)といったパラメータに加え、堅牢なツール呼び出し**(関数呼び出し、並列ツールチェーン、構造化エラー処理)を提供し、本番システムが精度とコストのバランスを正確にチューニングできるようにします。

ベンチマーク性能 — 主要数値と解釈

GPT-5 mini は、一般的なベンチマークにおいて GPT-5 high の**約 85–95%**の位置にありつつ、レイテンシ/価格を大幅に改善します。プラットフォームのローンチ資料では、GPT-5 high が非常に高い絶対スコア(トップバリアントで AIME ≈ 94.6%)を示し、mini はやや低いものの、この価格帯としては依然として業界最高水準であると示されています。

さまざまな標準化ベンチマークおよび社内ベンチマークにおいて、GPT-5 mini は次を達成しています:

  • 知能(AIME ’25): 91.1%(GPT-5 high は 94.6%)
  • マルチモーダル(MMMU): 81.6%(GPT-5 high は 84.2%)
  • コーディング(SWE-bench Verified): 71.0%(GPT-5 high は 74.9%)
  • 指示追従(Scale MultiChallenge): 62.3%(vs. 69.6%)
  • 関数呼び出し(τ²-bench telecom): 74.1%(vs. 96.7%)
  • 幻覚率(LongFact-Concepts): 0.7%(低いほど良い)([OpenAI][4])

これらの結果は、パフォーマンス、コスト、速度の間で GPT-5 mini が堅牢なトレードオフを実現していることを示しています。

制限事項

既知の制限: GPT-5 mini は、完全版 GPT-5 と比べて深い推論能力が低下し、あいまいなプロンプトに対する感度が高く、幻覚のリスクが残っています。

  • 深い推論の低下: 複数ステップで長期的な推論が必要なタスクでは、フルの推論モデルまたは「thinking」バリアントの方が mini を上回ります。
  • 幻覚と過信: Mini は非常に小型のモデルと比べて幻覚を減らしていますが、排除はできていません。高リスクの業務(法務、医療、コンプライアンス)では出力の検証が必要です。
  • 文脈感度: 非常に長く相互依存性の高いコンテキスト連鎖には、より大きなコンテキストウィンドウを持つ完全版 GPT-5 バリアントまたは「thinking」モデルが適しています。
  • 安全性とポリシー制限: 他の GPT-5 モデルに適用されるのと同じ安全ガードレールおよびレート/使用制限が mini にも適用されます。センシティブなタスクには人による監督が必要です。

gpt-5-mini は何ができるか?

  • 大規模会話エージェント: 低レイテンシ、予測可能なコスト。
  • ドキュメント&マルチモーダル要約: 長文脈の要約、画像+テキストのレポート。
  • 大規模な開発者向けツール: CI コードチェック、自動レビュー、軽量なコード生成。
  • エージェントのオーケストレーション: 深い推論が不要な場合の並列チェーンによるツール呼び出し。

gpt-5-mini API の使い始め方

必要な手順

  • cometapi.com にログインしてください。まだユーザーでない場合は、まず登録してください
  • インターフェースのアクセス認証 API キーを取得します。パーソナルセンターの API トークンで「Add Token」をクリックし、トークンキー: sk-xxxxx を取得して送信します。
  • このサイトの URL を取得します: https://api.cometapi.com/

使用方法

  1. “gpt-5-mini“ / "gpt-5-mini-2025-08-07" エンドポイントを選択して API リクエストを送信し、リクエストボディを設定します。リクエスト方法とリクエストボディは当社サイトの API ドキュメントから取得できます。当社サイトは利便性のために Apifox テストも提供しています。
  2. <YOUR_API_KEY> を、アカウントの実際の CometAPI キーに置き換えてください。
  3. content フィールドに質問やリクエストを挿入します—モデルはこの内容に応答します。
  4. . API レスポンスを処理して生成された回答を取得します。

CometAPI は完全互換の REST API を提供します—シームレスな移行が可能です。主な詳細は API ドキュメント を参照してください:

  • コアパラメータ: prompt, max_tokens_to_sample, temperature, stop_sequences
  • エンドポイント: https://api.cometapi.com/v1/chat/completions
  • モデルパラメータ: “gpt-5-mini“ / "gpt-5-mini-2025-08-07"
  • 認証: Bearer YOUR_CometAPI_API_KEY
  • Content-Type: application/json .

API 呼び出し手順: gpt-5-chat-latest は標準の /v1/chat/completions format を使用して呼び出す必要があります。他のモデル(gpt-5、gpt-5-mini、gpt-5-nano、およびその日付付きバージョン)では、the /v1/responses format の使用が推奨です。現在は 2 つのモードが利用可能です。

GPT-5 miniの機能

GPT-5 miniのパフォーマンスと使いやすさを向上させるために設計された主要機能をご紹介します。これらの機能がプロジェクトにどのようなメリットをもたらし、ユーザーエクスペリエンスを改善するかをご確認ください。

GPT-5 miniの料金

GPT-5 miniの競争力のある価格設定をご確認ください。さまざまな予算や利用ニーズに対応できるよう設計されています。柔軟なプランにより、使用した分だけお支払いいただけるため、要件の拡大に合わせて簡単にスケールアップできます。GPT-5 miniがコストを管理しながら、お客様のプロジェクトをどのように強化できるかをご覧ください。
コメット価格 (USD / M Tokens)公式価格 (USD / M Tokens)割引
入力:$0.2/M
出力:$1.6/M
入力:$0.25/M
出力:$2/M
-20%

GPT-5 miniのサンプルコードとAPI

GPT-5 mini は、OpenAI の主力モデル GPT-5 の軽量でコスト最適化されたバリアントであり、高品質な推論能力とマルチモーダル機能を、より低いレイテンシーとコストで提供するよう設計されています。
Python
JavaScript
Curl
from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

Python Code Example

from openai import OpenAI
import os

# Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
COMETAPI_KEY = os.environ.get("COMETAPI_KEY") or "<YOUR_COMETAPI_KEY>"
BASE_URL = "https://api.cometapi.com/v1"

client = OpenAI(base_url=BASE_URL, api_key=COMETAPI_KEY)
response = client.responses.create(
    model="gpt-5-mini", input="Tell me a three sentence bedtime story about a unicorn."
)

print(response)

JavaScript Code Example

import OpenAI from "openai";

// Get your CometAPI key from https://api.cometapi.com/console/token, and paste it here
const api_key = process.env.COMETAPI_KEY;
const base_url = "https://api.cometapi.com/v1";

const openai = new OpenAI({
  apiKey: api_key,
  baseURL: base_url,
});

const response = await openai.responses.create({
  model: "gpt-5-mini",
  input: "Tell me a three sentence bedtime story about a unicorn.",
});

console.log(response);

Curl Code Example

curl https://api.cometapi.com/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $COMETAPI_KEY" \
  -d '{
    "model": "gpt-5-mini",
    "input": "Tell me a three sentence bedtime story about a unicorn."
  }'

その他のモデル

A

Claude Opus 4.6

入力:$4/M
出力:$20/M
Claude Opus 4.6 は、Anthropic の「Opus」クラスの大規模言語モデルで、2026年2月にリリースされた。ナレッジワークや研究ワークフローの主力として位置づけられており、長文脈での推論、多段階の計画立案、ツールの利用(エージェント型ソフトウェアワークフローを含む)、およびスライドやスプレッドシートの自動生成といったコンピュータ操作タスクを強化する。
A

Claude Sonnet 4.6

入力:$2.4/M
出力:$12/M
Claude Sonnet 4.6 は、これまでで最も高性能な Sonnet モデルです。コーディング、コンピューターの利用、長文脈推論、エージェントの計画立案、ナレッジワーク、デザインにわたってモデルのスキルを全面的にアップグレードしました。Sonnet 4.6 は、ベータ版で 1M トークンのコンテキストウィンドウも備えています。
O

GPT-5.4 nano

入力:$0.16/M
出力:$1/M
GPT-5.4 nano は、分類、データ抽出、ランキング、サブエージェントなど、速度とコストが最も重要となるタスク向けに設計されています。
O

GPT-5.4 mini

入力:$0.6/M
出力:$3.6/M
GPT-5.4 mini は、GPT-5.4 の強みを、高スループットのワークロード向けに設計された、より高速で効率的なモデルにもたらします。
A

Claude Mythos Preview

A

Claude Mythos Preview

近日公開
入力:$60/M
出力:$240/M
Claude Mythos Preview は、当社のこれまでで最も高性能なフロンティアモデルであり、 従来のフロンティアモデルである Claude Opus 4.6 と比べ、多くの評価ベンチマークでスコアが顕著に向上していることを示しています。
X

mimo-v2-pro

入力:$0.8/M
出力:$2.4/M
MiMo-V2-Pro は Xiaomi のフラッグシップ基盤モデルで、総パラメータ数は 1T 超、コンテキスト長は 1M で、エージェント志向のシナリオ向けに徹底的に最適化されています。OpenClaw のような汎用エージェントフレームワークに高い適応性を備えており、標準的な PinchBench および ClawBench ベンチマークで世界トップクラスに位置し、体感パフォーマンスは Opus 4.6 に迫ります。MiMo-V2-Pro はエージェントシステムの頭脳として、複雑なワークフローをオーケストレーションし、本番環境のエンジニアリングタスクを推進し、確実に成果を提供するよう設計されています。