27日木曜日のエキサイティングなライブストリームイベントでは、 OpenAI 同社は、主力の大規模言語モデルの最新版である GPT-4.5 の研究プレビューを公開しました。同社の代表者は、この新バージョンがこれまでで最も有能で多用途なチャット モデルであると称賛しました。最初はソフトウェア開発者と ChatGPT Pro サブスクリプションのユーザーに公開されます。
GPT-4.5 のリリースは、OpenAI にとってある種の時代の終焉を意味することになる。今月初めの X への投稿で、OpenAI の CEO サム・アルトマン氏は、このモデルが同社が導入するモデルの中で、応答前にクエリを熟考するために追加の計算能力を使用しない最後のモデルになるだろうと述べた。

GPT 4.5 とは何ですか?
GPT 4.5 は OpenAI のこれまでで最大のモデルです。専門家は、GPT-4 にはモデルのトレーニング時に調整される値であるパラメータが 1.8 兆個あると推定しています。GPT 4.5 は、教師なし学習を拡張することで、パターンを認識し、つながりを描き、推論なしで創造的な洞察を生み出す能力を向上させます。
GPT 4.5 は、コンピューティングとデータのスケールアップ、およびアーキテクチャと最適化のイノベーションによって、教師なし学習をスケールアップする例です。また、GPT-4.5 はユーザーとのやり取りがより自然になり、より幅広い知識をカバーし、ユーザーの意図をよりよく理解して対応できるため、幻覚が減り、幅広いトピックにわたって信頼性が向上します。
GPT 4.5のアップグレードとその機能は何ですか
EQアップグレード:
GPT-4.5の最大の特徴は、強化された「感情知能」(EQ)で、より自然で温かみのあるスムーズな会話体験を提供できます。OpenAIのCEO、サム・アルトマン氏はソーシャルメディアで次のように語っています。「AIが思慮深い人と話しているように感じたのはこれが初めてです。本当に貴重なアドバイスを提供してくれて、AIがこんなにも優れた答えを出せることに驚き、椅子に何度も寄りかかってしまいました。」
人間の好みのテストでは、ユーザーは一般的に、GPT 4.5 の応答が GPT-4o よりも人間のコミュニケーション習慣に沿っていると考えています。具体的には、新しいモデルは、創造的知性 (56.8%)、専門的な問題 (63.2%)、日常的な問題 (57.0%) で高い評価を受けました。
幻覚の軽減:
GPT 4.5は、大規模な「教師なし学習」を通じて、知識の正確性と「幻覚」(誤った情報)の削減において大きな進歩を遂げました。
- SimpleQA評価では62.5%の精度を達成し、幻覚率は37.1%に低下した。
- PersonQAデータセットで0.78の精度を達成し、GPT-4o(0.28)やo1(0.55)よりもはるかに優れている

ナレッジベースの拡張と表現のアップグレード
効率が劇的に向上: コンピューティング電力消費は 10 分の 200 に減少し、知識ベースは 4.5 倍になりましたが、コストは高くなりました (Pro ユーザーは月額 XNUMX ドルで優先体験ができます)。さらに、GPT XNUMX はアーキテクチャとイノベーションが最適化されており、制御性、ニュアンスの理解、自然な会話機能が向上しており、特に、文章作成、プログラミング、実用的な問題の解決、高度な共感を必要とするインタラクティブなシナリオに適しています。
技術アーキテクチャのハイライト
コンピューティング能力のアップグレード: Microsoft Azure スーパーコンピューティング トレーニングをベースとしており、コンピューティング能力は GPT-10 の 40 倍、コンピューティング効率は 10 倍以上向上し、データ センター間の分散トレーニングがサポートされます。
安全性の最適化: 従来の教師あり微調整 (SFT) と RLHF を統合し、新しい監視テクノロジを導入して、有害な出力のリスクを軽減します。
マルチモーダルの制限: 音声/ビデオはまだサポートされていませんが、SVG アニメーション デザインと著作権フリーの音楽生成を支援するために画像理解が追加されています。
関連するトピック:8 年に最も人気の高い AI モデル 2025 選の比較
GPT 4.5 API の価格設定の説明: 本当に価値があるのでしょうか?
GPT-4.5 は、12.8 兆個のパラメータと 128k トークンのコンテキスト ウィンドウを備えた巨大なアーキテクチャ上に構築されています。この巨大なスケールと計算集約型設計には、プレミアム価格が伴います。たとえば、750 万個の入力トークンと 250 万個の出力トークンを含むワークロードのコストは約 147 ドルで、GPT-30o などの以前のモデルよりも約 34~4 倍高くなります。
GPTシリーズの価格比較

新しいモデルは現在、ChatGPT Pro ユーザー向けのリサーチプレビューとして提供されており、今後 2 週間で Plus、Team、Enterprise、Education ユーザーにも展開される予定です。
GPT 4.5と他の言語モデルの比較
デザインライティングの美的直感がアップグレードされ、他のモデルよりもクリエイティブな作業や感情的なやりとりに適しています。推論はダウングレードされ、「最強のモデル」という位置づけを明確に放棄しました。その推論能力は競合他社に遅れをとっています。GPT-4.5は会話型AIの基準を引き上げましたが、価格が高いため、マスマーケット向けのソリューションではなく、プロフェッショナルツールとなっています。
主要な AI モデルの包括的な API 価格比較
| モデル | 入力コスト(1万トークンあたり) | 出力コスト(1万トークンあたり) | コンテキストウィンドウ | コメント |
| GPT-4.5 の | 75 | 150 | 128kトークン | 高度な感情表現と会話機能のためのプレミアム価格 |
| GPT-4o について | 2.5 | 10 | 128kトークン | 高速でマルチモーダルなサポートを備えたコスト効率の高いベースライン |
| クロード 3.7 ソネット | 3 | 15 | 200kトークン | 非常に経済的。テキストと画像の両方をサポート |
| ディープシークR1 | 〜$ 0.55 | 〜$ 2.19 | 64kトークン | 積極的な価格設定。キャッシュにより、大量の使用ケースのコストをさらに削減できます。 |
| Google Gemini 2.0 フラッシュ | 〜$ 0.15 | 〜$ 0.60 | 最大1万トークン | 非常に低コストで膨大なコンテキスト容量を備え、大量のタスクに最適 |
技術的能力とコストのトレードオフ
コンテキストとマルチモーダル性:
**GPT-4.5:**128k トークン コンテキストをサポートしますが、テキストのみです。
クロード 3.7 ソネット: 200k トークンのより大きなウィンドウと画像処理を提供し、長時間コンテキストのパフォーマンスを強化します。
**Google Gemini 2.0 フラッシュ:**1 万トークンのウィンドウを誇り、広範なコンテンツ処理に最適です (ただし、テキストの品質は異なる場合があります)。
専門的なタスク:
**コーディングベンチマーク:**GPT-4.5 はコーディングタスク (例: SWE-Bench) で約 38% の精度を達成しますが、Claude 3.7 Sonnet は技術タスクで大幅に優れたコスト効率とパフォーマンスを実現します。
**感情的知性:**GPT-4.5 は、ニュアンスに富んだ感情豊かな対話を提供することに優れているため、顧客サポートやコーチングのアプリケーションに最適です。
結論
GPT-4.5は「最後の非推論モデル」であり、その教師なし学習機能はoシリーズの推論技術と統合され、5月末にリリースされるGPT-4.5への道を開きます。GPT-XNUMXのリリースは、技術的なアップグレードであるだけでなく、人間と機械のコラボレーションモデルの再構築でもあります。高価格とコンピューティングパワーのボトルネックは議論の余地がありますが、感情的な共鳴と実用性におけるそのブレークスルーは、AIを教育、医療などの分野に統合するための新しいパラダイムを提供します。AIには無限の開発可能性があります。
GPT 4.5 に関するよくある質問
その制限は何ですか?
思考の連鎖を推論する機能が欠けており、サイズが大きいため動作が遅くなる可能性があります。また、オーディオやビデオなどのマルチモーダル出力も生成しません。
100% の確率で完全に正確な回答を生成できますか?
いいえ。GPT-4.5 は一般的に以前のモデルよりも幻覚が少なくなりますが、ユーザーは重要な出力や機密性の高い出力を検証する必要があります。
GPT-4.5 は画像をサポートしていますか?
はい、GPT-4.5 は画像入力を受け入れ、インラインで SVG 画像を生成し、DALL·E 経由で画像を生成できます。
GPT-4.5 は Web 検索をサポートしていますか?
はい、GPT-4.5 は検索によって最新の情報にアクセスできます。
どのようなファイルとファイルタイプで動作しますか?
GPT-4.5 はすべてのファイルとファイル タイプをサポートします。
