Gemini 3 Pro (Preview) 是 Google/DeepMind 的最新旗舰级多模态推理模型,属于 Gemini 3 家族。它被定位为他们“迄今为止最智能的模型”,专为深度推理、智能体工作流、高级编码,以及长上下文的多模态理解(文本、图像、音频、视频、代码和工具集成)而设计。
关键特性
- 模态: 文本、图像、视频、音频、PDF(以及结构化工具输出)。
- 智能体/工具: 内置函数调用、搜索工具化、代码执行、URL 上下文,以及对多步智能体编排的支持。思维签名机制可在多次调用间保留多步推理过程。
- 编码与“vibe coding”:针对前端生成、交互式 UI 生成与智能体编码进行了优化(在 Google 报告的相关榜单中名列前茅)。被宣传为他们迄今最强的“vibe-coding”模型。
- 新的开发者控制项:
thinking_level(low|high)用于在成本/延迟与推理深度之间取舍,media_resolution控制每张图或视频帧的多模态保真度。这些有助于平衡性能、延迟与成本。
基准测试表现
- 在 LMARE 中以 1501 分获得第一名,超过 Grok-4.1-thinking 的 1484 分,并领先 Claude Sonnet 4.5 和 Opus 4.1。
- 在 WebDevArena 编程赛场中获得第一名,得分 1487。
- 在 Humanity’s Last Exam 学术推理中取得 37.5%(不使用工具);在 GPQA Diamond 科学中达到 91.9%;在 MathArena Apex 数学竞赛中为 23.4%,创下新纪录。
- 在多模态能力方面,MMMU-Pro 达到 81%;在 Video-MMMU 视频理解上达到 87.6%。

技术细节与架构
- “Thinking level” 参数: Gemini 3 暴露了一个
thinking_level控制项,让开发者在内部推理深度与延迟/成本之间进行取舍。模型将thinking_level视为对内部多步推理的相对许可,而非严格的令牌保证。Pro 的默认值通常为high。这是供开发者调优多步规划与思维链深度的明确新控制。 - 结构化输出与工具: 模型支持结构化 JSON 输出,并可结合内置工具(Google Search grounding、URL 上下文、代码执行等)。部分结构化输出 + 工具功能在
gemini-3-pro-preview上仅限预览。 - 多模态与智能体集成: Gemini 3 Pro 明确面向智能体工作流(工具 + 多智能体覆盖代码/终端/浏览器)。
- 接受文本、图像、视频、音频与 PDF 输入;输出为文本。
限制与已知注意事项
- 事实性并非完美——仍可能出现幻觉。 尽管 Google 宣称事实性有所提升,但在高风险场景(法律、医疗、金融)仍需基于证据的核验与人工审查。
- 长上下文性能因任务而异。 支持 1M 输入窗口是硬性能力,但在极端长度下的部分基准上,实证效果会下降(在 1M 上观察到逐点下降)。
- 成本与延迟的权衡。 大上下文与较高的
thinking_level设置会增加计算、延迟与成本;定价层级会根据 token 量适用。可使用thinking_level与分块策略来管理成本。 - 安全与内容过滤。 Google 继续应用安全政策与审核层;某些内容与操作仍受限或会触发拒绝模式。
Gemini 3 Pro Preview 与其他顶级模型的比较
高层对比(预览版→定性):
相较 Gemini 2.5 Pro: 在推理、智能体工具使用与多模态集成方面实现台阶式提升;上下文处理更大,并改善了长文理解。DeepMind 在学术推理、编码与多模态任务上显示出持续增益。
相较 GPT-5.1 与 Claude Sonnet 4.5(据报道): 在 Google/DeepMind 的基准套件上,Gemini 3 Pro 在多项智能体、多模态与长上下文指标上被呈现为领先(见 Terminal-Bench、MMMU-Pro、AIME)。对比结果因任务而异。
典型与高价值用例
- 长文档/书籍的摘要与问答: 长上下文支持使其对法律、研究与合规团队具有吸引力。
- 代码理解与仓库级生成: 与编码工具链的集成与改进的推理,有助于大型代码库重构与自动化代码审查工作流。
- 多模态产品助手: 图像 + 文本 + 音频工作流(客服可摄取截图、通话片段与文档)。
- 媒体生成与编辑(photo → video): 早期 Gemini 系列功能现含 Veo / Flow 风格的照片→视频能力;预览显示更深入的多媒体生成,适用于原型与媒体工作流。
如何从 CometAPI 调用 gemini-3-pro-preview API
Gemini 3 Pro Preview 在 CometAPI 的定价,较官方价格优惠 20%:
| 输入令牌 | $1.60 |
| 输出令牌 | $9.60 |
必需步骤
- 登录到 cometapi.com。如果您还不是我们的用户,请先注册。
- 登录您的 CometAPI 控制台。
- 获取接口的访问凭证 API Key。在个人中心的 API token 处点击“Add Token”,获得令牌密钥:sk-xxxxx 并提交。

使用方法
- 选择“
gemini-3-pro-preview”端点发送 API 请求,并设置请求体。请求方法与请求体请参考我们网站的 API 文档。我们的网站也提供 Apifox 测试以供方便使用。 - 将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI Key。
- 在 content 字段中插入您的问题或请求——模型将对此进行响应。
- . 处理 API 响应以获得生成的答案。
CometAPI 提供完全兼容的 REST API——支持平滑迁移。Chat 的关键细节:
- 基础 URL: https://api.cometapi.com/v1/chat/completions
- 模型名称:
gemini-3-pro-preview - 认证:
Bearer YOUR_CometAPI_API_KEY请求头 - Content-Type:
application/json。
另请参阅 GPT-5.1 API
