Gemini 3 Pro (Preview) 是 Google/DeepMind 在 Gemini 3 系列中的最新旗舰多模态推理模型。其定位为“迄今最智能的模型”,面向深度推理、Agent 化工作流、高级编码,以及长上下文的多模态理解(文本、图像、音频、视频、代码与工具集成)。
关键特性
- **模态:**文本、图像、视频、音频、PDF(以及结构化工具输出)。
- **Agentic/tooling:**内置函数调用、搜索即工具、代码执行、URL 上下文,并支持编排多步 Agent。Thought-signature 机制可在多次调用间保留多步推理。
- 编码与“vibe coding”:针对前端生成、交互式 UI 生成以及 Agent 化编码进行了优化(据 Google 报告,相关排行榜名列前茅)。被宣传为其迄今最强的“vibe-coding”模型。
- 新的开发者控制项:
thinking_level(low|high)用于在成本/延迟与推理深度之间权衡,media_resolution控制每张图像或每帧视频的多模态保真度。这些有助于在性能、延迟与成本间取得平衡。
基准测试表现
- Gemini3Pro 在 LMARE 中以 1501 分获得第一名,超过 Grok-4.1-thinking 的 1484 分,同时领先 Claude Sonnet 4.5 和 Opus 4.1。
- 在 WebDevArena 编程竞技场中也以 1487 分获得第一。
- 在 Humanity’s Last Exam 学术推理中取得 37.5%(无工具);在 GPQA Diamond 科学测试中取得 91.9%;在 MathArena Apex 数学竞赛中取得 23.4%,创下新纪录。
- 在多模态能力方面,MMMU-Pro 达到 81%;在 Video-MMMU 视频理解中达到 87.6%。

技术细节与架构
- **“Thinking level” 参数:**Gemini 3 暴露了一个
thinking_level控制项,使开发者可在内部推理深度与延迟/成本之间权衡。模型将thinking_level视为对内部多步推理的相对配额,而非严格的 token 保证。默认通常为 Pro 的high。这是一个明确的新控制项,用于调节多步规划与 chain-of-thought 深度。 - 结构化输出与工具:该模型支持结构化 JSON 输出,并可与内置工具结合使用(Google Search grounding、URL 上下文、代码执行等)。部分结构化输出 + 工具特性仅在
gemini-3-pro-preview提供预览。 - **多模态与 Agent 集成:**Gemini 3 Pro 明确面向 Agent 化工作流构建(工具 + 多个 Agent 跨代码/终端/浏览器)。
- 支持文本、图像、视频、音频与 PDF 输入;文本输出。
限制与已知注意事项
- 事实准确性并非完美——仍可能出现幻觉。尽管 Google 声称事实性有显著提升,但在高风险场景(法律、医疗、金融)仍需进行有依据的核验与人工复核。
- 长上下文表现因任务而异。虽然支持 1M 输入窗口是硬能力,但在极端长度下的某些基准上,经验有效性可能下降(在某些长上下文测试的 1M 点位观察到逐点下降)。
- 成本与延迟权衡。较大的上下文与更高的
thinking_level设置会增加计算、延迟与成本;定价按 token 量分层。可通过thinking_level与分块策略管理成本。 - 安全与内容过滤。Google 继续应用安全政策与审核层;某些内容与操作仍受限,或会触发拒绝模式。
Gemini 3 Pro Preview 与其他顶级模型对比
高层对比(预览版 → 定性):
**相较 Gemini 2.5 Pro:**在推理、Agent 工具使用与多模态集成上实现阶跃式提升;更大的上下文处理与更好的长文理解。DeepMind 在学术推理、编码与多模态任务上呈现持续增益。
**相较 GPT-5.1 与 Claude Sonnet 4.5(据报道):**在 Google/DeepMind 的基准套件上,Gemini 3 Pro 在多项 Agent 化、多模态与长上下文指标上领先(参见 Terminal-Bench、MMMU-Pro、AIME)。横向结果因任务而异。
典型与高价值用例
- 大体量文档/书籍的摘要与问答:长上下文支持使其对法律、研究与合规团队具有吸引力。
- 仓库规模的代码理解与生成:与编码工具链集成与改进的推理,有助于大代码库重构与自动化代码审查工作流。
- 多模态产品助理:图像 + 文本 + 音频工作流(可处理截图、通话片段与文档的客服场景)。
- 媒体生成与编辑(照片 → 视频):早期 Gemini 系列特性现包含 Veo/Flow 风格的照片 → 视频能力;预览显示用于原型与媒体工作流的更深入多媒体生成。
如何通过 CometAPI 调用 gemini-3-pro-preview API
CometAPI 中的 Gemini 3 Pro Preview 定价,较官方价优惠 20%:
| 输入 Token | $1.60 |
| 输出 Token | $9.60 |
必要步骤
- 登录 cometapi.com。如果您还不是我们的用户,请先注册。
- 登录您的 CometAPI 控制台。
- 获取接口的访问凭据 API key。在个人中心的 API token 处点击“Add Token”,获取令牌密钥:sk-xxxxx 并提交。

使用方法
- 选择“
gemini-3-pro-preview”端点发送 API 请求并设置请求体。请求方法与请求体可从我们的网站 API 文档获取。我们的网站也提供 Apifox 测试以便您使用。 - 将 <YOUR_API_KEY> 替换为您账户中的实际 CometAPI key。
- 将您的问题或请求填入 content 字段——模型会对其作出响应。
- . 处理 API 响应以获取生成的答案。
CometAPI 提供完全兼容的 REST API——实现无缝迁移。Chat 的关键信息:
- Base URL: v1/chat/completions
- Model Names:
gemini-3-pro-preview - Authentication:
Bearer YOUR_CometAPI_API_KEYheader - Content-Type:
application/json.
另见 GPT-5.1 API
