Gemini 3 Pro 预览版 API

CometAPI
AnnaNov 17, 2025
Gemini 3 Pro 预览版 API

Gemini 3 Pro (Preview) 是 Google/DeepMind 的最新旗舰级多模态推理模型,属于 Gemini 3 家族。它被定位为他们“迄今为止最智能的模型”,专为深度推理、智能体工作流、高级编码,以及长上下文的多模态理解(文本、图像、音频、视频、代码和工具集成)而设计。

关键特性

  • 模态: 文本、图像、视频、音频、PDF(以及结构化工具输出)。
  • 智能体/工具: 内置函数调用、搜索工具化、代码执行、URL 上下文,以及对多步智能体编排的支持。思维签名机制可在多次调用间保留多步推理过程。
  • 编码与“vibe coding”:针对前端生成、交互式 UI 生成与智能体编码进行了优化(在 Google 报告的相关榜单中名列前茅)。被宣传为他们迄今最强的“vibe-coding”模型。
  • 新的开发者控制项: thinking_level(low|high)用于在成本/延迟与推理深度之间取舍,media_resolution 控制每张图或视频帧的多模态保真度。这些有助于平衡性能、延迟与成本。

基准测试表现

  • 在 LMARE 中以 1501 分获得第一名,超过 Grok-4.1-thinking 的 1484 分,并领先 Claude Sonnet 4.5 和 Opus 4.1。
  • 在 WebDevArena 编程赛场中获得第一名,得分 1487。
  • 在 Humanity’s Last Exam 学术推理中取得 37.5%(不使用工具);在 GPQA Diamond 科学中达到 91.9%;在 MathArena Apex 数学竞赛中为 23.4%,创下新纪录。
  • 在多模态能力方面,MMMU-Pro 达到 81%;在 Video-MMMU 视频理解上达到 87.6%。

Gemini 3 Pro 预览版 API

技术细节与架构

  • “Thinking level” 参数: Gemini 3 暴露了一个 thinking_level 控制项,让开发者在内部推理深度与延迟/成本之间进行取舍。模型将 thinking_level 视为对内部多步推理的相对许可,而非严格的令牌保证。Pro 的默认值通常为 high。这是供开发者调优多步规划与思维链深度的明确新控制。
  • 结构化输出与工具: 模型支持结构化 JSON 输出,并可结合内置工具(Google Search grounding、URL 上下文、代码执行等)。部分结构化输出 + 工具功能在 gemini-3-pro-preview 上仅限预览。
  • 多模态与智能体集成: Gemini 3 Pro 明确面向智能体工作流(工具 + 多智能体覆盖代码/终端/浏览器)。
  • 接受文本、图像、视频、音频与 PDF 输入;输出为文本。

限制与已知注意事项

  1. 事实性并非完美——仍可能出现幻觉。 尽管 Google 宣称事实性有所提升,但在高风险场景(法律、医疗、金融)仍需基于证据的核验与人工审查。
  2. 长上下文性能因任务而异。 支持 1M 输入窗口是硬性能力,但在极端长度下的部分基准上,实证效果会下降(在 1M 上观察到逐点下降)。
  3. 成本与延迟的权衡。 大上下文与较高的 thinking_level 设置会增加计算、延迟与成本;定价层级会根据 token 量适用。可使用 thinking_level 与分块策略来管理成本。
  4. 安全与内容过滤。 Google 继续应用安全政策与审核层;某些内容与操作仍受限或会触发拒绝模式。

Gemini 3 Pro Preview 与其他顶级模型的比较

高层对比(预览版→定性):

相较 Gemini 2.5 Pro: 在推理、智能体工具使用与多模态集成方面实现台阶式提升;上下文处理更大,并改善了长文理解。DeepMind 在学术推理、编码与多模态任务上显示出持续增益。

相较 GPT-5.1 与 Claude Sonnet 4.5(据报道): 在 Google/DeepMind 的基准套件上,Gemini 3 Pro 在多项智能体、多模态与长上下文指标上被呈现为领先(见 Terminal-Bench、MMMU-Pro、AIME)。对比结果因任务而异。


典型与高价值用例

  • 长文档/书籍的摘要与问答: 长上下文支持使其对法律、研究与合规团队具有吸引力。
  • 代码理解与仓库级生成: 与编码工具链的集成与改进的推理,有助于大型代码库重构与自动化代码审查工作流。
  • 多模态产品助手: 图像 + 文本 + 音频工作流(客服可摄取截图、通话片段与文档)。
  • 媒体生成与编辑(photo → video): 早期 Gemini 系列功能现含 Veo / Flow 风格的照片→视频能力;预览显示更深入的多媒体生成,适用于原型与媒体工作流。

如何从 CometAPI 调用 gemini-3-pro-preview API

Gemini 3 Pro Preview 在 CometAPI 的定价,较官方价格优惠 20%:

输入令牌$1.60
输出令牌$9.60

必需步骤

  • 登录到 cometapi.com。如果您还不是我们的用户,请先注册。
  • 登录您的 CometAPI 控制台
  • 获取接口的访问凭证 API Key。在个人中心的 API token 处点击“Add Token”,获得令牌密钥:sk-xxxxx 并提交。

Gemini 3 Pro 预览版 API

使用方法

  1. 选择“gemini-3-pro-preview”端点发送 API 请求,并设置请求体。请求方法与请求体请参考我们网站的 API 文档。我们的网站也提供 Apifox 测试以供方便使用。
  2. 将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI Key。
  3. 在 content 字段中插入您的问题或请求——模型将对此进行响应。
  4. . 处理 API 响应以获得生成的答案。

CometAPI 提供完全兼容的 REST API——支持平滑迁移。Chat 的关键细节:

另请参阅 GPT-5.1 API

阅读更多

一个 API 中超 500 个模型

最高 20% 折扣