GPT-5 ミニ API

CometAPI
AnnaAug 8, 2025

GPT-5 miniは 軽量OpenAIの主力モデルGPT-5のコスト最適化版であり、 高品質 レイテンシとコストを削減しながら推論とマルチモーダル機能を実現します。

基本情報と主な機能

GPT-5 ミニ OpenAIの コストとレイテンシを最適化 GPT-5ファミリーの一員であり、GPT-5のマルチモーダル性と指示追従性の強みの多くを 大幅にコストが低い 大規模な生産用途向け。 スループット, 予測可能なトークンごとの価格設定, 迅速な対応 強力な汎用機能を提供しながらも、主な制約となります。

  • モデル名: gpt-5-mini
  • コンテキストウィンドウ: 400万トークン
  • 最大出力トークン:128 000
  • 主な特徴: スピード、スループット、コスト効率、簡潔なプロンプトのための決定論的な出力

技術的な詳細 - アーキテクチャ、推論、制御

最適化された推論パスと展開。 実用的なスピードアップは カーネル融合, より小さなグラフに合わせて調整されたテンソル並列性、および推論ランタイムを好む 内部の「思考」ループが短くなる 開発者がより深い推論を要求しない限り、これは起こりません。そのため、miniは呼び出しあたりの計算量を大幅に削減し、高トラフィック時のレイテンシを予測可能にしています。このトレードオフは意図的なものです。 フォワードパスあたりの計算量が少ない → コストが下がり、平均レイテンシが下がる.

開発者コントロール。 GPT-5 miniは次のようなパラメータを公開します。 verbosity (詳細/長さをコントロール)と reasoning_effort (取引速度と深さ)、そして堅牢な ツール呼び出し サポート (関数呼び出し、並列ツール チェーン、構造化エラー処理) により、生産システムで精度とコストを正確に調整できます。

ベンチマークパフォーマンス - 見出しの数字とその解釈

GPT-5 miniは通常 85~95%以内 GPT-5は一般的なベンチマークで高い評価を得ており、レイテンシと価格を大幅に改善しています。プラットフォームの発表資料には、 非常に高い絶対スコア GPT-5高(AIME ≈ 94.6% (最上位モデルについては報告済み)、ミニは若干低いものの、その価格帯では依然として業界をリードしています。

標準化された内部ベンチマークの範囲にわたって、 GPT-5 ミニ 達成:

  • インテリジェンス (AIME '25):91.1%(GPT-94.6高では5%)
  • マルチモーダル (MMMU): 81.6% (対 GPT-84.2 高値の場合は 5%)
  • コーディング (SWEベンチ検証済み):71.0%(GPT-74.9高では5%)
  • 次の指示 (スケールマルチチャレンジ):62.3%(69.6%に対して)
  • 関数呼び出し (τ²ベンチ通信):74.1%(96.7%に対して)
  • 幻覚率 (LongFact-Concepts):0.7%(低いほど良い)()

これらの結果はGPT-5 miniの 堅牢な パフォーマンス、コスト、速度の間のトレードオフ。

製品制限

既知の制限: GPT-5 ミニ 完全な GPT-5 と比較して深い推論能力が低下し、曖昧なプロンプトに対する感受性が高くなり、幻覚のリスクが残ります。

  • 深い推論の削減: 複数ステップの長期的推論タスクの場合、完全な推論モデルまたは「思考」バリアントが mini よりも優れています。
  • 幻覚と自信過剰: Mini は、非常に小さなモデルに比べて幻覚を軽減しますが、幻覚を完全に排除するわけではありません。出力は、重要なフロー (法的、臨床的、コンプライアンス) で検証する必要があります。
  • コンテキストの感度: 非常に長く、相互依存性が高いコンテキスト チェーンの場合は、より大きなコンテキスト ウィンドウまたは「思考」モデルを備えた完全な GPT-5 バリアントの方が適しています。
  • 安全性とポリシーの制限: 他の GPT-5 モデルに適用されるのと同じ安全ガードレールとレート/使用制限が mini にも適用されます。機密性の高いタスクには人間による監視が必要です。

推奨される使用例(mini が優れている点)

  • 大容量会話エージェント: 低レイテンシ、予測可能なコスト。 キーワード: スループット.
  • ドキュメントとマルチモーダル要約: 長いコンテキストの要約、画像 + テキスト レポート。 キーワード: 長い文脈.
  • 大規模な開発者ツール: CI コード チェック、自動レビュー、軽量コード生成。 キーワード: コスト効率の高いコーディング.
  • エージェントオーケストレーション: 深い推論が必要ない場合の並列チェーンによるツール呼び出し。 キーワード: ツール呼び出し.

電話方法 gpt-5-mini CometAPI からの API

gpt-5-mini CometAPI の API 価格、公式価格より 20% オフ:

入力トークン$0.20
出力トークン$1.60

必要な手順

  • ログインする コムタピまだユーザーでない場合は、まず登録してください
  • インターフェースのアクセス認証情報APIキーを取得します。パーソナルセンターのAPIトークンで「トークンを追加」をクリックし、トークンキー(sk-xxxxx)を取得して送信します。
  • このサイトの URL を取得します: https://api.cometapi.com/

使用方法

  1. "を選択します。gpt-5-mini「/」gpt-5-mini-2025-08-07” エンドポイントを使用してAPIリクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは、弊社ウェブサイトのAPIドキュメントから取得できます。また、お客様の便宜を図るため、弊社ウェブサイトではApifoxテストも提供しています。
  2. 交換するアカウントの実際の CometAPI キーを使用します。
  3. コンテンツ フィールドに質問またはリクエストを入力します。モデルはこれに応答します。
  4. API 応答を処理して、生成された回答を取得します。

CometAPIは、シームレスな移行のために完全に互換性のあるREST APIを提供します。  APIドキュメント:

  • コアパラメータpromptmax_tokens_to_sampletemperaturestop_sequences
  • 終点: https://api.cometapi.com/v1/chat/completions
  • モデルパラメータ: 「gpt-5-mini「/」gpt-5-mini-2025-08-07
  • 認証: Bearer YOUR_CometAPI_API_KEY
  • コンテンツタイプ: application/json .

API呼び出し手順: gpt-5-chat-latestは標準の /v1/chat/completions format. 他のモデル(gpt-5、gpt-5-mini、gpt-5-nano、およびそれらの旧バージョン)の場合は、 the /v1/responses format がおすすめ現在2つのモードが利用可能です。

も参照してください GPT-5 モデル

SHARE THIS BLOG

もっと読む

1つのAPIで500以上のモデル

最大20%オフ