GPT-5ナノ OpenAIのGPT-5ファミリーの超軽量、低レイテンシ版であり、 コストに敏感な, への、そして、深い多段階推論よりも速度と価格が重視される高スループットアプリケーション向けです。GPT-5の命令追従機能と安全性の向上を維持しながら、推論の深さと一部のロングコンテキスト機能を犠牲にして、 非常に低いレイテンシー および 非常に低いトークンコスト.
基本情報と機能
- モデル名:
gpt-5-nano - マルチモーダルサポート: テキストとビジョン(最大400万コンテキストトークン)
- コンテキストウィンドウ: 400,000入力トークン; 128,000出力トークン
- 価格:
- 入力: 0.05万トークンあたり1ドル
- 出力: 0.40万トークンあたり1ドル
GPT-5メインと比較して、GPT-5ナノはトレードオフとなる。 生の力 の 超低レイテンシー および コストの削減に最適です。 インタラクティブアプリケーション スピードと予算が重要な場合。
技術的詳細
GPT-5ナノは同じ トランスアーキテクチャ 大型の兄弟機と同様だが、高度な 量子化 および パラメータの削減 フットプリントを縮小する技術を採用しています。特徴:
- 最小限の推論: 単一ターン推論用に最適化された合理化された推論経路で、削減された計算で GPT-5 の「組み込み思考」をエミュレートします。
- 冗長性制御: 応答の長さと詳細を微調整するための調整可能な詳細度パラメータ。
- 効率的な注意: 長いシーケンスを処理するモデルの能力を犠牲にすることなく、低メモリ展開用のカスタム アテンション カーネル。
GPT-4 o miniと比較した場合、GPT-5 nanoは最大 2倍高速 同一のハードウェア上でスループットを実現 軽量 デザイン 。
ベンチマークパフォーマンス
GPT-5メインは絶対的なパフォーマンスではリードしているが、GPT-5ナノは 競争力のある精度 主要なベンチマークについて:
- SWE-Bench(ソフトウェアエンジニアリング): GPT-75 main のコード生成精度の約 5% を達成しながら、推論時間を約 50% 削減します。
- ヘルスベンチ: GPT-80 メインの臨床推論パフォーマンスの約 5% を維持し、基本的なトリアージおよび要約タスクに適しています。
- 多言語テスト: 12 の言語にわたって堅牢なサポートを維持し、GPT-10 メインと比較して翻訳品質が 5% 未満低下します。
これらの結果はGPT-5ナノが コストに敏感な および レイテンシが重要 精度の若干のトレードオフが許容される環境。
モデルのバージョンと系統
- モデルカード名:
gpt-5-nano - 知識カットオフ: ナノ変異株については30年2024月XNUMX日
- 家族内での立場:
- エントリーレベルの製品としてGPT-4.1 nanoを置き換える
- パフォーマンス階層ではGPT-5 miniとGPT-5 mainの下位に位置する
ナノバリアントはGPT-5メインのトレーニングから改良点を継承しており、 幻覚の軽減 および 構造的推論ただし規模は小さいです。
製品制限
GPT-5ナノは スピード および コストただし、固有の欠点があります。
- 深さの減少: 容量制限あり 多段階推論 GPT-5 メインと比較すると、複雑な計画タスクには適していません。
- 幻覚率の上昇: 不正確な詳細を生成するリスクがわずかに増加 曖昧なプロンプト.
- 文脈想起の低下: 生のトークンウィンドウは大きいが、内部メカニズムは 最近 文脈によっては、非常に長い会話の中で前の詳細を見落とす可能性があります。
開発者は、GPT-5 nanoを選択する際に、これらの制約を考慮する必要があります。 事実の誠実性が高い.
ユースケース
GPT-5ナノは次のようなシナリオで活躍します。 への 回答と 原価管理 最も重要です:
- モバイルアシスタント: メッセージングアプリ用のデバイス内チャットボット、配信 インスタント返信 雲の上空なし。
- IoTインターフェース: スマートホームデバイスにおける音声対応コントロール、 低遅延推論.
- エッジ分析: アップロードを一括処理する前にセンサー データをローカルで要約し、帯域幅の使用量を削減します。
- 教育ツール: ブラウザ内または低スペックのハードウェア上で動作する軽量の個別指導ボット。 インタラクティブラーニング.
重いクラウド環境でGPT-5メインを実行する場合と比較して、nanoでは 分散展開 大規模に 予測可能なトークンあたりのコスト.
電話方法 gpt-5-nano CometAPI からの API
gpt-5-nano CometAPI の API 価格、公式価格より 20% オフ:
| 入力トークン | $0.04 |
| 出力トークン | $0.32 |
も参照してください 価格
必要な手順
- ログインする コムタピまだユーザーでない場合は、まず登録してください
- インターフェースのアクセス認証情報APIキーを取得します。パーソナルセンターのAPIトークンで「トークンを追加」をクリックし、トークンキー(sk-xxxxx)を取得して送信します。
- このサイトの URL を取得します: https://api.cometapi.com/
使用方法
- "を選択します。
gpt-5-nano」/「gpt-5-nano-2025-08-07” エンドポイントを使用してAPIリクエストを送信し、リクエストボディを設定します。リクエストメソッドとリクエストボディは、弊社ウェブサイトのAPIドキュメントから取得できます。また、お客様の便宜を図るため、弊社ウェブサイトではApifoxテストも提供しています。 - 交換するアカウントの実際の CometAPI キーを使用します。
- コンテンツ フィールドに質問またはリクエストを入力します。モデルはこれに応答します。
- API 応答を処理して、生成された回答を取得します。
CometAPIは、シームレスな移行のために完全に互換性のあるREST APIを提供します。 APIドキュメント:
- コアパラメータ:
prompt,max_tokens_to_sample,temperature,stop_sequences - 終点: https://api.cometapi.com/v1/chat/completions
- モデルパラメータ: 「
gpt-5-nano」/「gpt-5-nano-2025-08-07「 - 認証:
Bearer YOUR_CometAPI_API_KEY - コンテンツタイプ:
application/json.
API呼び出し手順: gpt-5-chat-latestは標準の /v1/chat/completions format. 他のモデル(gpt-5、gpt-5-mini、gpt-5-nano、およびそれらの旧バージョン)の場合は、 the /v1/responses format がおすすめ現在、2つのモードが利用可能です。
も参照してください GPT-5 モデル