GPT-5 miniは 軽量OpenAIの主力モデルGPT-5のコスト最適化版であり、 高品質 レイテンシとコストを削減しながら推論とマルチモーダル機能を実現します。
基本情報と主な機能
GPT-5 ミニ OpenAIの コストとレイテンシを最適化 GPT-5ファミリーの一員であり、GPT-5のマルチモーダル性と指示追従性の強みの多くを 大幅にコストが低い 大規模な生産用途向け。 スループット, 予測可能なトークンごとの価格設定, 迅速な対応 強力な汎用機能を提供しながらも、主な制約となります。
- モデル名:
gpt-5-mini - コンテキストウィンドウ: 400万トークン
- 最大出力トークン:128 000
- 主な特徴: スピード、スループット、コスト効率、簡潔なプロンプトのための決定論的な出力
技術的な詳細 - アーキテクチャ、推論、制御
最適化された推論パスと展開。 実用的なスピードアップは カーネル融合, より小さなグラフに合わせて調整されたテンソル並列性、および推論ランタイムを好む 内部の「思考」ループが短くなる 開発者がより深い推論を要求しない限り、これは起こりません。そのため、miniは呼び出しあたりの計算量を大幅に削減し、高トラフィック時のレイテンシを予測可能にしています。このトレードオフは意図的なものです。 フォワードパスあたりの計算量が少ない → コストが下がり、平均レイテンシが下がる.
開発者コントロール。 GPT-5 miniは次のようなパラメータを公開します。 verbosity (詳細/長さをコントロール)と reasoning_effort (取引速度と深さ)、そして堅牢な ツール呼び出し サポート (関数呼び出し、並列ツール チェーン、構造化エラー処理) により、生産システムで精度とコストを正確に調整できます。
ベンチマークパフォーマンス - 見出しの数字とその解釈
GPT-5 miniは通常 85~95%以内 GPT-5は一般的なベンチマークで高い評価を得ており、レイテンシと価格を大幅に改善しています。プラットフォームの発表資料には、 非常に高い絶対スコア GPT-5高(AIME ≈ 94.6% (最上位モデルについては報告済み)、ミニは若干低いものの、その価格帯では依然として業界をリードしています。
標準化された内部ベンチマークの範囲にわたって、 GPT-5 ミニ 達成:
- インテリジェンス (AIME '25):91.1%(GPT-94.6高では5%)
- マルチモーダル (MMMU): 81.6% (対 GPT-84.2 高値の場合は 5%)
- コーディング (SWEベンチ検証済み):71.0%(GPT-74.9高では5%)
- 次の指示 (スケールマルチチャレンジ):62.3%(69.6%に対して)
- 関数呼び出し (τ²ベンチ通信):74.1%(96.7%に対して)
- 幻覚率 (LongFact-Concepts):0.7%(低いほど良い)()
これらの結果はGPT-5 miniの 堅牢な パフォーマンス、コスト、速度の間のトレードオフ。
製品制限
既知の制限: GPT-5 ミニ 完全な GPT-5 と比較して深い推論能力が低下し、曖昧なプロンプトに対する感受性が高くなり、幻覚のリスクが残ります。
- 深い推論の削減: 複数ステップの長期的推論タスクの場合、完全な推論モデルまたは「思考」バリアントが mini よりも優れています。
- 幻覚と自信過剰: Mini は、非常に小さなモデルに比べて幻覚を軽減しますが、幻覚を完全に排除するわけではありません。出力は、重要なフロー (法的、臨床的、コンプライアンス) で検証する必要があります。
- コンテキストの感度: 非常に長く、相互依存性が高いコンテキスト チェーンの場合は、より大きなコンテキスト ウィンドウまたは「思考」モデルを備えた完全な GPT-5 バリアントの方が適しています。
- 安全性とポリシーの制限: 他の GPT-5 モデルに適用されるのと同じ安全ガードレールとレート/使用制限が mini にも適用されます。機密性の高いタスクには人間による監視が必要です。
推奨される使用例(mini が優れている点)
- 大容量会話エージェント: 低レイテンシ、予測可能なコスト。 キーワード: スループット.
- ドキュメントとマルチモーダル要約: 長いコンテキストの要約、画像 + テキスト レポート。 キーワード: 長い文脈.
- 大規模な開発者ツール: CI コード チェック、自動レビュー、軽量コード生成。 キーワード: コスト効率の高いコーディング.
- エージェントオーケストレーション: 深い推論が必要ない場合の並列チェーンによるツール呼び出し。 キーワード: ツール呼び出し.
電話方法 gpt-5-mini CometAPI からの API
gpt-5-mini CometAPI の API 価格、公式価格より 20% オフ:
| 入力トークン | $0.20 |
| 出力トークン | $1.60 |
必要な手順
- ログインする コムタピまだユーザーでない場合は、まず登録してください
- インターフェースのアクセス認証情報APIキーを取得します。パーソナルセンターのAPIトークンで「トークンを追加」をクリックし、トークンキー(sk-xxxxx)を取得して送信します。
- このサイトの URL を取得します: https://api.cometapi.com/
使用方法
- "を選択します。
gpt-5-mini「/」gpt-5-mini-2025-08-07” エンドポイントを使用してAPIリクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは、弊社ウェブサイトのAPIドキュメントから取得できます。また、お客様の便宜を図るため、弊社ウェブサイトではApifoxテストも提供しています。 - 交換するアカウントの実際の CometAPI キーを使用します。
- コンテンツ フィールドに質問またはリクエストを入力します。モデルはこれに応答します。
- API 応答を処理して、生成された回答を取得します。
CometAPIは、シームレスな移行のために完全に互換性のあるREST APIを提供します。 APIドキュメント:
- コアパラメータ:
prompt,max_tokens_to_sample,temperature,stop_sequences - 終点: https://api.cometapi.com/v1/chat/completions
- モデルパラメータ: 「
gpt-5-mini「/」gpt-5-mini-2025-08-07「 - 認証:
Bearer YOUR_CometAPI_API_KEY - コンテンツタイプ:
application/json.
API呼び出し手順: gpt-5-chat-latestは標準の /v1/chat/completions format. 他のモデル(gpt-5、gpt-5-mini、gpt-5-nano、およびそれらの旧バージョン)の場合は、 the /v1/responses format がおすすめ現在2つのモードが利用可能です。
も参照してください GPT-5 モデル


