在 27 日(周四)的一场令人振奋的直播活动中,OpenAI发布了其旗舰大语言模型的最新迭代——GPT‑4.5 的研究预览。该公司代表称赞这一新版本是迄今为止最强大、最灵活的聊天模型。它将优先向软件开发者和拥有 ChatGPT Pro 订阅的用户开放。
GPT‑4.5 的发布将标志着 OpenAI 某种意义上的一个时代结束。本月早些时候,OpenAI CEO Sam Altman 在 X 上发帖表示,这将是公司最后一次推出在回答前不使用额外算力进行“思考”的模型。

什么是 GPT 4.5?
GPT 4.5 是 OpenAI 迄今为止规模最大的模型——有专家估计,GPT‑4 可能拥有多达 1.8 万亿参数(模型训练时会调整的取值)。通过扩展无监督学习,GPT 4.5 在无需推理的情况下提升了对模式的识别、关联的建立以及生成创造性洞见的能力。
GPT 4.5 体现了通过扩大算力与数据来扩展无监督学习,并辅以架构与优化方面的创新。GPT‑4.5 在用户交互上更自然,覆盖更广的知识范围,能更好地理解并响应用户意图,从而降低幻觉并在广泛主题上更可靠。
GPT 4.5 的升级与特性
EQ 升级:
GPT‑4.5 最大的特性是其增强的“情感智能”(EQ),可提供更自然、温暖、顺畅的对话体验。OpenAI CEO Sam Altman 在社交媒体分享道:“这是第一次让我感觉 AI 像是在与一位深思熟虑的人对话。它真的能给出有价值的建议,甚至让我不止一次向后一靠,惊讶于 AI 能给出如此出色的答案。”
在人类偏好测试中,用户普遍认为 GPT 4.5 的回答比 GPT‑4o 更符合人类的沟通习惯。具体而言,新模型在创造性智能(56.8%)、专业问题(63.2%)和日常问题(57.0%)方面获得了更高评分。
幻觉减少:
通过大规模“无监督学习”,GPT 4.5 在知识准确性和降低“幻觉”(虚假信息)方面取得了显著进展:
- 在 SimpleQA 评估中达到 62.5% 的准确率,幻觉率降至 37.1%
- 在 PersonQA 数据集上取得 0.78 的准确率,远高于 GPT‑4o(0.28)和 o1(0.55)

知识库扩展与表达升级
效率显著提高:算力消耗降低 10 倍,知识库扩大一倍,但成本更高(Pro 用户优先体验,$200/月)。此外,GPT 4.5 在架构与创新方面进行了优化,提升了可控性、对细微差异的理解以及自然对话能力,特别适用于写作、编程、解决实际问题,以及需要高同理心的交互场景。
技术架构亮点
**算力升级:**基于 Microsoft Azure 超级计算平台训练,算力是 GPT‑40 的 10 倍,计算效率提升超过 10 倍,并支持跨数据中心的分布式训练。
**安全优化:**整合传统的监督式微调(SFT)与 RLHF,引入新的监督技术,降低有害输出风险。
**多模态限制:**尚不支持语音/视频,但新增了图像理解,可辅助 SVG 动画设计和免版权音乐生成。
GPT 4.5 API 定价解析:真的值得吗?
GPT‑4.5 构建在拥有 12.8 万亿参数和 128k token 上下文窗口的庞大架构之上。如此巨大的规模与高算力设计对应的是高端定价。例如,包含 75 万输入 tokens 和 25 万输出 tokens 的工作负载,费用约为 $147——大约比早期模型(如 GPT‑4o)贵 30–34 倍。
GPT 系列价格对比

该新模型现已向 ChatGPT Pro 用户提供研究预览,并将在接下来的两周内逐步面向 Plus、Team、Enterprise 和 Education 用户推出。
GPT 4.5 与其他语言模型对比
设计写作的审美直觉得到升级,使其较其他模型更适合创意工作与情感互动。推理能力被下调,明确放弃了“最强模型”的定位,其推理能力落后于竞争对手。GPT‑4.5 提升了对话式 AI 的标准,但其高价使之更像是专业工具,而非面向大众的解决方案。
领先 AI 模型的综合 API 定价对比
| 模型 | 输入成本(每 100 万 tokens) | 输出成本(每 100 万 tokens) | 上下文窗口 | 备注 |
| GPT‑4.5 | 75 | 150 | 128k tokens | 为高级情感与对话能力提供的高端定价 |
| GPT‑4o | 2.5 | 10 | 128k tokens | 具备快速、多模态支持的高性价比基础款 |
| Claude 3.7 Sonnet | 3 | 15 | 200k tokens | 极具经济性;同时支持文本与图像 |
| DeepSeek R1 | ~$0.55 | ~$2.19 | 64k tokens | 激进定价;缓存可进一步降低高吞吐场景的成本 |
| Google Gemini 2.0 Flash | ~$0.15 | ~$0.60 | 最多 1M tokens | 超低成本且具备超大上下文容量;适合高批量任务 |
技术能力与成本权衡
上下文与多模态:
**GPT‑4.5:**支持 128k token 上下文,但仅限文本。
**Claude 3.7 Sonnet:**提供更大的 200k token 窗口与图像处理,增强长上下文性能。
**Google Gemini 2.0 Flash:**拥有令人印象深刻的 1M token 窗口,适合大规模内容处理(但文本质量可能有所波动)。
专项任务:
**编码基准:**GPT‑4.5 在编码任务(如 SWE‑Bench)上约为 38% 的准确率,而 Claude 3.7 Sonnet 在技术任务中的成本效率与性能显著更佳。
**情感智能:**GPT‑4.5 擅长提供细腻、富有情感的对话,非常适合客服与教练类应用。
结论
GPT‑4.5 是“最后的非推理模型”。其无监督学习能力将与 o 系列的推理技术整合,为在 5 月底发布的 GPT‑5 铺平道路。GPT‑4.5 的发布不仅是一次技术升级,也是对人机协作模式的重构。尽管高价格与算力瓶颈存在争议,但其在情感共鸣与实用性上的突破,为 AI 融入教育、医疗等领域提供了新的范式。AI 拥有无限发展潜力!
GPT 4.5 常见问答
它有哪些限制?
它缺乏链式思维推理,并且由于规模较大可能更慢。它也不生成诸如音频或视频等多模态输出。
它能 100% 始终生成完全准确的答案吗?
不能。尽管 GPT‑4.5 的幻觉通常少于以往模型,用户仍应核查重要或敏感的输出。
GPT‑4.5 支持图像吗?
是的,GPT‑4.5 接受图像输入,可内联生成 SVG 图像,并可通过 DALL·E 生成图像。
GPT‑4.5 支持网页搜索吗?
是的,GPT‑4.5 可通过搜索获取最新的实时信息。
它支持哪些文件及类型?
GPT‑4.5 支持所有文件与文件类型。
