Gemini 3 Pro 预览版 API

CometAPI
AnnaNov 17, 2025
Gemini 3 Pro 预览版 API

Gemini 3 Pro (Preview) 是 Google/DeepMind 在 Gemini 3 系列中的最新旗舰多模态推理模型。其定位为“迄今最智能的模型”,面向深度推理、Agent 化工作流、高级编码,以及长上下文的多模态理解(文本、图像、音频、视频、代码与工具集成)。

关键特性

  • **模态:**文本、图像、视频、音频、PDF(以及结构化工具输出)。
  • **Agentic/tooling:**内置函数调用、搜索即工具、代码执行、URL 上下文,并支持编排多步 Agent。Thought-signature 机制可在多次调用间保留多步推理。
  • 编码与“vibe coding”:针对前端生成、交互式 UI 生成以及 Agent 化编码进行了优化(据 Google 报告,相关排行榜名列前茅)。被宣传为其迄今最强的“vibe-coding”模型。
  • 新的开发者控制项thinking_level(low|high)用于在成本/延迟与推理深度之间权衡,media_resolution 控制每张图像或每帧视频的多模态保真度。这些有助于在性能、延迟与成本间取得平衡。

基准测试表现

  • Gemini3Pro 在 LMARE 中以 1501 分获得第一名,超过 Grok-4.1-thinking 的 1484 分,同时领先 Claude Sonnet 4.5 和 Opus 4.1。
  • 在 WebDevArena 编程竞技场中也以 1487 分获得第一。
  • 在 Humanity’s Last Exam 学术推理中取得 37.5%(无工具);在 GPQA Diamond 科学测试中取得 91.9%;在 MathArena Apex 数学竞赛中取得 23.4%,创下新纪录。
  • 在多模态能力方面,MMMU-Pro 达到 81%;在 Video-MMMU 视频理解中达到 87.6%。

Gemini 3 Pro 预览版 API

技术细节与架构

  • **“Thinking level” 参数:**Gemini 3 暴露了一个 thinking_level 控制项,使开发者可在内部推理深度与延迟/成本之间权衡。模型将 thinking_level 视为对内部多步推理的相对配额,而非严格的 token 保证。默认通常为 Pro 的 high。这是一个明确的新控制项,用于调节多步规划与 chain-of-thought 深度。
  • 结构化输出与工具:该模型支持结构化 JSON 输出,并可与内置工具结合使用(Google Search grounding、URL 上下文、代码执行等)。部分结构化输出 + 工具特性仅在 gemini-3-pro-preview 提供预览。
  • **多模态与 Agent 集成:**Gemini 3 Pro 明确面向 Agent 化工作流构建(工具 + 多个 Agent 跨代码/终端/浏览器)。
  • 支持文本、图像、视频、音频与 PDF 输入;文本输出。

限制与已知注意事项

  1. 事实准确性并非完美——仍可能出现幻觉。尽管 Google 声称事实性有显著提升,但在高风险场景(法律、医疗、金融)仍需进行有依据的核验与人工复核。
  2. 长上下文表现因任务而异。虽然支持 1M 输入窗口是硬能力,但在极端长度下的某些基准上,经验有效性可能下降(在某些长上下文测试的 1M 点位观察到逐点下降)。
  3. 成本与延迟权衡。较大的上下文与更高的 thinking_level 设置会增加计算、延迟与成本;定价按 token 量分层。可通过 thinking_level 与分块策略管理成本。
  4. 安全与内容过滤。Google 继续应用安全政策与审核层;某些内容与操作仍受限,或会触发拒绝模式。

Gemini 3 Pro Preview 与其他顶级模型对比

高层对比(预览版 → 定性):

**相较 Gemini 2.5 Pro:**在推理、Agent 工具使用与多模态集成上实现阶跃式提升;更大的上下文处理与更好的长文理解。DeepMind 在学术推理、编码与多模态任务上呈现持续增益。

**相较 GPT-5.1 与 Claude Sonnet 4.5(据报道):**在 Google/DeepMind 的基准套件上,Gemini 3 Pro 在多项 Agent 化、多模态与长上下文指标上领先(参见 Terminal-Bench、MMMU-Pro、AIME)。横向结果因任务而异。


典型与高价值用例

  • 大体量文档/书籍的摘要与问答:长上下文支持使其对法律、研究与合规团队具有吸引力。
  • 仓库规模的代码理解与生成:与编码工具链集成与改进的推理,有助于大代码库重构与自动化代码审查工作流。
  • 多模态产品助理:图像 + 文本 + 音频工作流(可处理截图、通话片段与文档的客服场景)。
  • 媒体生成与编辑(照片 → 视频):早期 Gemini 系列特性现包含 Veo/Flow 风格的照片 → 视频能力;预览显示用于原型与媒体工作流的更深入多媒体生成。

如何通过 CometAPI 调用 gemini-3-pro-preview API

CometAPI 中的 Gemini 3 Pro Preview 定价,较官方价优惠 20%:

输入 Token$1.60
输出 Token$9.60

必要步骤

  • 登录 cometapi.com。如果您还不是我们的用户,请先注册。
  • 登录您的 CometAPI 控制台
  • 获取接口的访问凭据 API key。在个人中心的 API token 处点击“Add Token”,获取令牌密钥:sk-xxxxx 并提交。

Gemini 3 Pro 预览版 API

使用方法

  1. 选择“gemini-3-pro-preview”端点发送 API 请求并设置请求体。请求方法与请求体可从我们的网站 API 文档获取。我们的网站也提供 Apifox 测试以便您使用。
  2. 将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI key。
  3. 将您的问题或请求填入 content 字段——模型会对其作出响应。
  4. . 处理 API 响应以获取生成的答案。

CometAPI 提供完全兼容的 REST API——实现无缝迁移。Chat 的关键信息:

  • Base URL: v1/chat/completions
  • Model Names: gemini-3-pro-preview
  • Authentication: Bearer YOUR_CometAPI_API_KEY header
  • Content-Type: application/json .

另见 GPT-5.1 API

准备好将AI开发成本降低20%了吗?

几分钟内免费开始。包含免费试用额度。无需信用卡。

阅读更多