GPT 4.5 深度评测：功能、价格与对比

在 27 日（周四）的一场令人振奋的直播活动中，OpenAI发布了其旗舰大语言模型的最新迭代——GPT‑4.5 的研究预览。该公司代表称赞这一新版本是迄今为止最强大、最灵活的聊天模型。它将优先向软件开发者和拥有 ChatGPT Pro 订阅的用户开放。

GPT‑4.5 的发布将标志着 OpenAI 某种意义上的一个时代结束。本月早些时候，OpenAI CEO Sam Altman 在 X 上发帖表示，这将是公司最后一次推出在回答前不使用额外算力进行“思考”的模型。

GPT 4.5

什么是 GPT 4.5？

GPT 4.5 是 OpenAI 迄今为止规模最大的模型——有专家估计，GPT‑4 可能拥有多达 1.8 万亿参数（模型训练时会调整的取值）。通过扩展无监督学习，GPT 4.5 在无需推理的情况下提升了对模式的识别、关联的建立以及生成创造性洞见的能力。

GPT 4.5 体现了通过扩大算力与数据来扩展无监督学习，并辅以架构与优化方面的创新。GPT‑4.5 在用户交互上更自然，覆盖更广的知识范围，能更好地理解并响应用户意图，从而降低幻觉并在广泛主题上更可靠。

GPT 4.5 的升级与特性

EQ 升级：

GPT‑4.5 最大的特性是其增强的“情感智能”（EQ），可提供更自然、温暖、顺畅的对话体验。OpenAI CEO Sam Altman 在社交媒体分享道：“这是第一次让我感觉 AI 像是在与一位深思熟虑的人对话。它真的能给出有价值的建议，甚至让我不止一次向后一靠，惊讶于 AI 能给出如此出色的答案。”

在人类偏好测试中，用户普遍认为 GPT 4.5 的回答比 GPT‑4o 更符合人类的沟通习惯。具体而言，新模型在创造性智能（56.8%）、专业问题（63.2%）和日常问题（57.0%）方面获得了更高评分。

幻觉减少：

通过大规模“无监督学习”，GPT 4.5 在知识准确性和降低“幻觉”（虚假信息）方面取得了显著进展：

在 SimpleQA 评估中达到 62.5% 的准确率，幻觉率降至 37.1%
在 PersonQA 数据集上取得 0.78 的准确率，远高于 GPT‑4o（0.28）和 o1（0.55）

GPT 4.5 深度评测：功能、价格与对比

知识库扩展与表达升级

效率显著提高：算力消耗降低 10 倍，知识库扩大一倍，但成本更高（Pro 用户优先体验，$200/月）。此外，GPT 4.5 在架构与创新方面进行了优化，提升了可控性、对细微差异的理解以及自然对话能力，特别适用于写作、编程、解决实际问题，以及需要高同理心的交互场景。

技术架构亮点

**算力升级：**基于 Microsoft Azure 超级计算平台训练，算力是 GPT‑40 的 10 倍，计算效率提升超过 10 倍，并支持跨数据中心的分布式训练。

**安全优化：**整合传统的监督式微调（SFT）与 RLHF，引入新的监督技术，降低有害输出风险。

**多模态限制：**尚不支持语音/视频，但新增了图像理解，可辅助 SVG 动画设计和免版权音乐生成。

相关主题：2025 年最受欢迎的 8 款 AI 模型对比

GPT 4.5 API 定价解析：真的值得吗？

GPT‑4.5 构建在拥有 12.8 万亿参数和 128k token 上下文窗口的庞大架构之上。如此巨大的规模与高算力设计对应的是高端定价。例如，包含 75 万输入 tokens 和 25 万输出 tokens 的工作负载，费用约为 $147——大约比早期模型（如 GPT‑4o）贵 30–34 倍。

GPT 系列价格对比

GPT 4.5 深度评测：功能、价格与对比

该新模型现已向 ChatGPT Pro 用户提供研究预览，并将在接下来的两周内逐步面向 Plus、Team、Enterprise 和 Education 用户推出。

GPT 4.5 与其他语言模型对比

设计写作的审美直觉得到升级，使其较其他模型更适合创意工作与情感互动。推理能力被下调，明确放弃了“最强模型”的定位，其推理能力落后于竞争对手。GPT‑4.5 提升了对话式 AI 的标准，但其高价使之更像是专业工具，而非面向大众的解决方案。

领先 AI 模型的综合 API 定价对比


模型	输入成本（每 100 万 tokens）	输出成本（每 100 万 tokens）	上下文窗口	备注
GPT‑4.5	75	150	128k tokens	为高级情感与对话能力提供的高端定价
GPT‑4o	2.5	10	128k tokens	具备快速、多模态支持的高性价比基础款
Claude 3.7 Sonnet	3	15	200k tokens	极具经济性；同时支持文本与图像
DeepSeek R1	~$0.55	~$2.19	64k tokens	激进定价；缓存可进一步降低高吞吐场景的成本
Google Gemini 2.0 Flash	~$0.15	~$0.60	最多 1M tokens	超低成本且具备超大上下文容量；适合高批量任务

技术能力与成本权衡

上下文与多模态：

**GPT‑4.5：**支持 128k token 上下文，但仅限文本。

**Claude 3.7 Sonnet：**提供更大的 200k token 窗口与图像处理，增强长上下文性能。

**Google Gemini 2.0 Flash：**拥有令人印象深刻的 1M token 窗口，适合大规模内容处理（但文本质量可能有所波动）。

专项任务：

**编码基准：**GPT‑4.5 在编码任务（如 SWE‑Bench）上约为 38% 的准确率，而 Claude 3.7 Sonnet 在技术任务中的成本效率与性能显著更佳。

**情感智能：**GPT‑4.5 擅长提供细腻、富有情感的对话，非常适合客服与教练类应用。

结论

GPT‑4.5 是“最后的非推理模型”。其无监督学习能力将与 o 系列的推理技术整合，为在 5 月底发布的 GPT‑5 铺平道路。GPT‑4.5 的发布不仅是一次技术升级，也是对人机协作模式的重构。尽管高价格与算力瓶颈存在争议，但其在情感共鸣与实用性上的突破，为 AI 融入教育、医疗等领域提供了新的范式。AI 拥有无限发展潜力！

GPT 4.5 常见问答

它有哪些限制？

它缺乏链式思维推理，并且由于规模较大可能更慢。它也不生成诸如音频或视频等多模态输出。

它能 100% 始终生成完全准确的答案吗？

不能。尽管 GPT‑4.5 的幻觉通常少于以往模型，用户仍应核查重要或敏感的输出。

GPT‑4.5 支持图像吗？

是的，GPT‑4.5 接受图像输入，可内联生成 SVG 图像，并可通过 DALL·E 生成图像。

GPT‑4.5 支持网页搜索吗？

是的，GPT‑4.5 可通过搜索获取最新的实时信息。

它支持哪些文件及类型？

GPT‑4.5 支持所有文件与文件类型。

什么是 GPT 4.5？

GPT 4.5 的升级与特性

EQ 升级：

幻觉减少：

知识库扩展与表达升级

技术架构亮点

GPT 4.5 API 定价解析：真的值得吗？

GPT 系列价格对比

GPT 4.5 与其他语言模型对比

领先 AI 模型的综合 API 定价对比

技术能力与成本权衡

上下文与多模态：

专项任务：

结论

GPT 4.5 常见问答

它有哪些限制？

它能 100% 始终生成完全准确的答案吗？

GPT‑4.5 支持图像吗？

GPT‑4.5 支持网页搜索吗？

它支持哪些文件及类型？

以低成本获取顶级模型

阅读更多

GPT 4.5 深度评测：功能、价格与对比

什么是 GPT 4.5？

GPT 4.5 的升级与特性

EQ 升级：

幻觉减少：

知识库扩展与表达升级

技术架构亮点

GPT 4.5 API 定价解析：真的值得吗？

GPT 系列价格对比

GPT 4.5 与其他语言模型对比

领先 AI 模型的综合 API 定价对比

技术能力与成本权衡

上下文与多模态：

专项任务：

结论

GPT 4.5 常见问答

它有哪些限制？

它能 100% 始终生成完全准确的答案吗？

GPT‑4.5 支持图像吗？

GPT‑4.5 支持网页搜索吗？

它支持哪些文件及类型？

以低成本 获取顶级模型

阅读更多

以低成本获取顶级模型